Вы находитесь на странице: 1из 59

CAPTULO

8
ANLISISESTADSTICO:
SEGUNDAPARTE

INTRODUCCIN
Conestecaptulosecomplementael10deMetodologadelainvestigacin,5edicin,
adems de que se actualiz su contenido. Se presentan primero las hiptesis
estadsticas, las puntuaciones z, clculos inferenciales o estimaciones de parmetros y
luego el clculo del coeficiente alfaCronbach y el sustento del anlisis de varianza
unidireccional.Finalmentelosanlisismultivariadosyalgunasfrmulas,ascomouna
secuencia de anlisis en Minitab y otra en SPSS. Los autores asumimos que se revis
previamenteelcaptuloencuestin.

HIPTESISESTADSTICAS
Enelcaptulo10sesealquecadapruebaestadsticaobedeceauntipodehiptesis
de investigacin e hiptesis estadstica distinta. Las hiptesis estadsticas son la

transformacin de las hiptesis de investigacin, nulas y alternativas en smbolos


estadsticos. Algunas revistas acadmicas solicitan que se incluyan estas hiptesis y
ayudanaconceptualizarciertaspruebasrevisadasenelcaptulo10deltextoimpreso.
Enocasiones,elinvestigadortraducesuhiptesisdeinvestigacinynula(ycuando
se formulan hiptesis alternativas, tambin stas) en trminos estadsticos.
Bsicamentehaytrestiposdehiptesisestadsticas,quecorrespondenaclasificaciones
de las hiptesis de investigacin y nula: 1) de estimacin, 2) de correlacin y 3) de
diferenciasdemedias.Acontinuacinmencionaremosydaremosejemplosdecadauna
deellas.

Hiptesisestadsticasdeestimacin
Corresponden a las que, al hablar de hiptesis de investigacin, se les denomina
hiptesisdescriptivasdeundatoquesepronostica.Sirvenparaevaluarlasuposicinde
un investigador respecto del valor de alguna caracterstica en una muestra de
individuos,otrosseresvivos,sucesosuobjetos,yenunapoblacin.Sefundamentanen
informacin previa. Supongamos que, basndose en ciertos datos, un investigador
plantea la siguiente hiptesis: el promedio mensual de casos de trastorno
psiconeurtico caracterizados por reaccin astnica, que sern atendidos en los
hospitales de la ciudad de Linderbuck, resultar mayor a 20. Adems, desea
transformarestahiptesisdeinvestigacinenunahiptesisestadstica.Loprimeroque
debe hacer es analizar cul es la estadstica a que su hiptesis hace referencia (en el
ejemplosetratadeunpromedioomediamensualdecasosatendidos).Elsegundopaso
consiste en encontrar cmo se simboliza esa estadstica (promedio se simboliza como
). El tercer paso consiste en traducir la hiptesis de investigacin a una forma
estadstica:

Hi:

>20(elpromediomensualdecasosatendidossermayora20.)

Lahiptesisestadsticanulaseralanegacindelahiptesisanterior:

Ho:

<20(elpromediomensualdecasosatendidossermenora20.)

ylahiptesisalternativapodraser:

Ha:

=20(elpromediomensualdecasosesiguala20.)

Despus, el investigador comparar el promedio estimado por la hiptesis con el


promedioactualdelamuestraqueseleccion.Laexactituddesuestimacinseevala
con esta comparacin. Y como sealan Black y Champion (1976), algunos
investigadores consideran las hiptesis estadsticas de estimacin como hiptesis de
diferencia, pues en ltima instancia lo que se evala es la diferencia entre un valor
planteadoenlahiptesisyunvalorobservadoenunamuestra.
La estimacin de estas hiptesis no se limita a promedios, ya que puede incluirse
cualquierestadstica:porcentajes,medianas,modas,etc.(Crosbyetal.,2006).

Hiptesisestadsticasdecorrelacin
Estas hiptesis tienen por objetivo traducir en trminos estadsticos una correlacin
entre dos o ms variables. El smbolo de una correlacin entre dos variables es r
(minscula), y entre ms de dos variables R (mayscula). La siguiente hiptesis: a
mayor cohesin en un grupo, mayor eficacia en el logro de sus metas primarias, se
traduciratalcomosemuestraenelesquema.

0(noesigualaceroo,loqueeslomismo,ambas
variablesestncorrelacionadas)

Lacorrelacin
entredosvariables(cohesinyeficacia)
Hi:rxy

Lahiptesisnulasetraducira:

Ho:rxy=0(Lasdosvariablesnoestncorrelacionadas;sucorrelacinescero.)

Otroejemplo:

Hi:Rxyz0(Lacorrelacinentrelasvariablesautonoma,variedadymotivacin
intrnseca no es igual a cero. Es decir, las tres variables x, y, z estn
asociadas).

Ho:Rxyz=0

(Nohaycorrelacin)

Hiptesisestadsticasdeladiferenciademediasuotrosvalores
Enestashiptesissecomparaunaestadsticaentredosomsgrupos.Supongamosque
uninvestigadorplantealasiguientepreguntadeestudio:difierenlosperidicosTlexy
Noticias en cuanto al promedio de editoriales mensuales que dedicaron, durante el

ltimoao,altemadelterrorismointernacional?1Suhiptesisdeinvestigacinpodra
ser: existe una diferencia entre el promedio de editoriales mensuales que dedic,
durante el ltimo ao, al tema del terrorismo internacional el diario Tlex, y el que
dediceldiarioNoticias.Laestadsticaquesecomparaentrelosgrupos(editorialesde
Tlex,ungrupo,yeditorialesdeNoticias,otrogrupo)eselpromediomensual(

).La

hiptesisestadsticaseformularaas:

esdiferente

Hi:

2(promediodelgrupo2:editorialesdeNoticias)

(promedio del grupo uno: editoriales de

Tlex)
Lahiptesisnula:
Ho:

1 =

2 (No hay diferencia entre los promedios de los dos grupos de

editoriales.)
Conotraestadstica(porcentaje)ytresgrupos,seobtendranhiptesisestadsticas
comolassiguientes:

Hi:%1%2%3(Losporcentajesdelostresgrupossondistintos.)
Ho:%1=%2=%3(Nohaydiferencias.)

PUNTUACIONESz
Las puntuaciones z son transformaciones que se pueden
hacer a los valores o las puntuaciones obtenidas, con el
propsito de analizar su distancia respecto a la media, en
unidadesdedesviacinestndar.Unapuntuacinznosindica
la direccin y el grado en que un valor individual obtenido se

PuntuacinzMedida
queindicaladirecciny
elgradoenqueunvalor
individualsealejadela
media,enunaescalade
unidadesdedesviacin
estndar.

1Nombrescompletamenteficticios

alejadelamedia,enunaescaladeunidadesdedesviacinestndar.Comomencionan
Nie et al. (1975), las puntuaciones z son el mtodo ms comnmente utilizado para
estandarizarlaescaladeunavariablemedidaenunnivelporintervalos.

Sufrmulaes:

dondeXeslapuntuacinoelvaloratransformar,

eslamediadeladistribucinysla

desviacin estndar de sta. El resultado z es la puntuacin transformada en unidades


dedesviacinestndar.
Supongamosqueenunadistribucindefrecuenciasobtuvimosunamediade60y
una desviacin estndar de 10, y deseamos comparar una puntuacin de 50 con el
resto de la distribucin. Entonces, transformamos esta puntuacin o tal valor en una
puntuacinz.Tenemosque:

X = 50
= 60
s = 10

Lapuntuacinzcorrespondienteaunvalorde50es:

Podemosdecirqueelvalor50selocalizaaunadesviacinestndarpordebajode
lamediadeladistribucin(elvalor30estatresdesviacionesestndarpordebajode
lamedia).
Estandarizar los valores permite comparar puntuaciones de dos distribuciones
diferentes (la forma de medicin es la misma, aunque se trata de distribuciones
distintas). Por ejemplo, podemos contrastar una distribucin obtenida en una

preprueba con otra obtenida en una posprueba (en un contexto experimental).


Supongamos que se trata de un estmulo que incrementa la productividad. Un
trabajadorobtuvoenlaprepruebaunaproductividadde130(lamediadelgrupofuede
122.5yladesviacinestndarde10).Yenlapospruebaobtuvo135(lamediadelgrupo
fuede140yladesviacinestndarde9.8).Mejorlaproductividaddeltrabajador?En
apariencia, la mejora no es considerable. Sin transformar las dos calificaciones en
puntuacionesz,noesposibleasegurarloporquelosvaloresnopertenecenalamisma
distribucin. Entonces transformamos ambos valores a puntuaciones z, los pasamos a
unaescalacomndondelacomparacinesvlida.Elvalorde130enproductividaden
trminosdeunidadesdedesviacinestndaresiguala:

z=

130 122.5
= 0.75
10.0

Yelvalorde135correspondeaunapuntuacinzde:

z=

135 140
= 0.51
9.8

Como observamos, en trminos absolutos 135 es una mejor puntuacin que 130,
peronoentrminosrelativos(enrelacinconsusrespectivasdistribuciones).
La distribucin de puntuaciones z no cambia la forma de la distribucin original,
pero s modifica las unidades originales a unidades de desviacin estndar (Wright,
1979).Ladistribucindepuntuacionesztieneunamediade0(cero)yunadesviacin
estndarde1(uno).Lafigura8.1muestraladistribucindepuntuacionesz.

Figura8.1Distribucindepuntuacionesz

Laspuntuacionesztambinsirvenparacompararmedicionesdedistintaspruebas
oescalasaplicadasalosmismosparticipantes(losvaloresobtenidosencadaescalase
transforman en puntuaciones z y se comparan) (Delbaere et al., 2007). No debe
olvidarsequeloselementosdelafrmulaespecficamentesonlamediayladesviacin
estndarquecorrespondenalvaloratransformar(desumismadistribucin).Tambin,
las puntuaciones z sirven para analizar distancias entre puntuaciones de una misma
distribucin y reas de la curva que abarcan tales distancias, o para sopesar el
desempeodeungrupodeparticipantesenvariaspruebas.Laspuntuacioneszsonun
elementodescriptivoadicionalqueseagregaparaanalizarnuestrosdatos.

ESTIMACINDEPARMETROS:
UNEJEMPLOCONLAMEDIAPOBLACIONAL

En el captulo 10 del texto impreso se mencion que una de las funciones de la


estadsticainferencialeslaestimacindeparmetros,puesbien,alcalcularlamediade
nuestramuestraysinoestamosmuysegurosdesurepresentatividadpodemosseguir
un procedimiento para ver si nuestra hiptesis respecto a la media poblacional es

aceptada o rechazada.2 Lo anterior es para responder a la siguiente pregunta: qu


hacemos para ver si nuestra hiptesis sobre la media poblacional es aceptada o
rechazada? Pero antes de estudiar el procedimiento, es necesario hacer las siguientes
consideraciones:
a) La distribucin muestral es una distribucin normal de puntuaciones z, es
decir,labasedelacurvasonunidadesdedesviacinestndar.
b) Las puntuaciones z son distancias que indican reas bajo la distribucin
normal.Enestecaso,reasdeprobabilidad.
c) El rea de riesgo es tomada como el rea de rechazo de la hiptesis; por el
contrario,elreadeconfianza,comoelreadeaceptacindelahiptesis.
d) Sehabladeunahiptesisacercadelparmetro(enestecaso,media
poblacional).
Sipartimosdeestasconsideraciones,elprocedimientoes:
1. Sobre bases firmes (revisin de la literatura e informacin disponible),
establecer una hiptesis acerca del parmetro poblacional. Por ejemplo: el
promediodehorasdiariasqueseexponenlosniosdelaciudaddeValladolid
alatelevisinenfindesemanaesde3.0horas.
2. Definirelniveldesignificancia.Porejemplo,.05.
3. Recolectar los datos en una muestra representativa. Vamos a suponer que
obtuvimosunamediade2.9horasyunadesviacinestndarde1.2horas;la
muestraincluy312nios.
4. Estimar la desviacin estndar de la distribucin muestral de la media
utilizandolasiguientefrmula:

2Enesteejemploseutilizalamedia,talvezelcasomsconocido,peropuedesercualquierotroparmetro
poblacional.

Donde

es la desviacin estndar de la distribucin muestral de la media, s

representaladesviacinestndardelamuestrayneseltamaodelamuestra.
Enelejemplo:

5. Transformar la media de la muestra en una puntuacin z, en el contexto de la


distribucin muestral, con una variacin de la frmula ya conocida para obtener
puntuacionesz:

dondeXeslamediadelamuestra(recordemosqueladistribucinmuestralesde
mediasynodepuntuaciones), eslamediahipotticadeladistribucinmuestral
(parmetro poblacional),

es la desviacin estndar de la distribucin

muestraldemedias.As,tenemos:

z=

2.9 3.0
= 1.47
0.0679

6. Enlatabladereasbajolacurvanormal(verapndice,4tabla1deesteCD),buscar
aquellapuntuacinzquedejea25%porencimadeella,quees1.96.Enlatabladel
apndice 4 se presenta la distribucin de puntuaciones z, slo la mitad, pues
debemos recordar que es una distribucin simtrica y se aplica igual para ambos
ladosdelamedia.Asseincluyeenlostextosdeestadstica.Sebusca2.5%,porque
latablasloabarcalamitaddeladistribucinyelriesgoqueestamosafrontandoes
de 5% (2.5% del extremo de cada lado). La tabla mencionada contiene cuatro
columnas: la primera indica puntuaciones z, la segunda expresa la distancia de la
puntuacinzalamedia.Latercera,elreaqueestpordebajodeesapuntuacin

desdeelcomienzodeladistribucin,comosemuestraenlagrfica:

Ylacuarta,delreaqueestporencimadeesapuntuacin:

Las reas se expresan en proporciones. Lo que buscamos es una puntuacinz


quedejeporencimaunreade0.0250o2.5%(laencontramosenlacuartacolumna
delatabla);estapuntuacinzesde1.96.Siemprequenuestroniveldesignificancia
sea0.05,tomamoslapuntuacinzde1.96.

7. Compararlamediadelamuestratransformadaapuntuacinzconelvalor1.96;si
esmenor,aceptarlahiptesis;siesmayor,rechazarla.Veamoselejemplo:

Mediadelamuestratransformadaaz

1.47

Niveldesignificanciadel0.05

1.96

Decisin:Aceptarlahiptesisaunniveldesignificanciade0.05(95%afavory5%de
riesgodecometerunerror).

Silamediaobtenida
altransformarseenz,
Hubierasido3.25,

7.46 ounvalormayorRechazarlahiptesis

Porejemplo:
Mediadelamuestra=2.0

Desviacinestndardelamuestra=0.65

n=700
S =0.0246

z=40.65

Lamediaestsituadaamsde40desviacionesestndardealmedia;selocalizaenla
zonacrtica(msallde1.96desviacionesestndar).Rechazarlahiptesis.

PORQUESIMPORTANTEOTROCONCEPTOPARALA
ESTIMACINDEPARMETROS:ELINTERVALODECONFIANZA?

Sehahabladodeladistribucinmuestralporloquerespectaalapruebadehiptesis,
perootroprocedimientodelaestadsticainferencialesconstruirunintervalodondese
localiza un parmetro (Wiersma y Jurs, 2008). Por ejemplo, en lugar de pretender
probarunahiptesisacercadelamediapoblacional,puedebuscarseunintervalodonde
se ubique dicha media. Lo anterior requiere un nivel de confianza, al igual que en la
prueba de hiptesis inferenciales. El nivel de confianza es al intervalo de confianza lo
que el nivel de significancia es a la prueba de hiptesis. Es decir, se trata de una
probabilidaddefinidadequeunparmetrosevaaubicarenundeterminadointervalo.
Recordemosquelosnivelesdeconfianzaexpresadosenporcentajesmscomunesen
lainvestigacinson0.95y0.99(.05y.01).Susentidoessimilaralyacomentado,sies
de 0.95; quiere decir que tenemos 95% en favor de que el parmetro se localice en el
intervaloestimado,contra5%deelegirunintervaloequivocado.Elnivelde0.99seala
99%deprobabilidaddeseleccionarelintervaloadecuado.Talesnivelesdeconfianzase
expresan en unidades de desviacin estndar. Una vez ms se acude a la distribucin
muestral,concretamentealatabladereasbajolacurvanormal(apndice4,tabla1de
este CD anexo o en STATS reas bajo la curva normal)3, y se elige la puntuacin z
correspondiente al nivel de confianza seleccionado. Una vez hecho esto, se aplica la
siguientefrmula:

3TambinSTATScontieneestatabla.

Intervalodeconfianza=estadgrafo+

Puntuacinzque
expresaelnivelde
confianzaelegido

Desviacinestndarde
ladistribucinmuestral
correspondiente

Enlafrmula,elestadgrafoeslaestadsticacalculadaenlamuestra,lapuntuacin
z es 1.96 con un nivel de 0.95 y de 2.58 con un nivel de 0.99, en tanto que el error
estndardependedelestadgrafoencuestin.Vemosloconelejemplodelamediaen
elcasodelaexposicindiariaalatelevisin(enfindesemana)porpartedelosnios
deValladolid:

Media=2.9horas
s=1.2horas

(desviacinestndardeladistribucinmuestraldelamedia).

Niveldeconfianza

=0.95(z=1.96)

Intervalodeconfianza

=2.9(1.96)(0.0679)

=2.9(0.133)

Intervalo de confianza: la media poblacional est entre 2.767 y 3.033 horas, con
95%deprobabilidadesdenocometererror.

CLCULODELCOEFICIENTEDECONFIABILIDAD
(FIABILIDAD)ALFACRONBACH
Enloscaptulos9y10sedefinielcoeficientealfadeCronbach(),ascomosususose
interpretacin.LosprogramasdeanlisisestadsticocomoSPSS,Minitab,SASyotros,lo
incluyen y calculan instantneamente. Pero para quienes no tienen acceso a estos
programas, presentamos la forma de obtenerlos. De acuerdo con Carmines y Zeller
(1988, pp. 44 y 45), as como Corbetta (2003), existen tres procedimientos para
determinarelcoeficienteoalfa:

1. Sobre la base de la varianza de los tems, con la aplicacin de la siguiente


frmula:

( )

1 s 2 Yi
N 1

s2 x

En donde N representa el nmero de tems de la escala,

s (Yi ) es igual a la
2

sumatoriadelasvarianzasdelostemsys2xequivalealavarianzadetodalaescala.

2. Sobrelabasedelamatrizdecorrelacindelostems,elprocedimientosera:

a) Seaplicalaescala.
b) Seobtienenlosresultados.
c) Se calculan los coeficientes de correlacin r de Pearson entre todos los tems
(todoscontratodosdeparenpar).
d) Seelaboralamatrizdecorrelacinconloscoeficientesobtenidos.Porejemplo:

tems

0.451

0.399

0.585

yafuecalculado

0.489

0.501

yafuecalculado

yafuecalculado

0.541

yafuecalculado

yafuecalculado

yafuecalculado

Los coeficientes que se mencionan como ya fue calculado, se ubican en la parte


superior de las lneas horizontales (guiones). Es decir, cada coeficiente se incluye una
solavezyseexcluyenloscoeficientesquevinculanaltemopuntuacinconsigomisma
(1con1,2con2,3con3y4con4).

e) Secalcula (promediodelascorrelaciones).

es la sumatoria de los valores de las correlaciones y NP el nmero

decorrelacionesnorepetidasonoexcluidas).

f)

Seaplicalafrmulasiguiente:

Np

1 + p (N 1)

DondeNeselnmerodetemsy elpromediodelascorrelacionesentretems.
Enelejemplo:

= 0.798
= 0.80(cerrando)
Es un coeficiente aceptable y recordemos que todos los tems de la escala deben
estarmedidosenintervalosorazn.
3. Medianteotrafrmulaquesebasaenlacorrelacinpromedio(Corbetta,2003,
p.238).

Seusalasiguientefrmula:

nr
1 + r(n 1)

Donde n representa el nmero de tems o elementos de la escala y r es su


correlacinpromedio.

SUSTENTODELANLISISDEVARIANZAUNIDIRECCIONAL
En el captulo 10 del texto impreso, se dijo que el ANOVA unidireccional produce un
valorF,elcualsebasaenunadistribucinmuestral,conocidacomodistribucinF,ytal
valor compara las variaciones en las puntuaciones debidas a dos diferentes fuentes:
variacionesentrelosgruposquesecontrastanyvariacionesdentrodelosgrupos.
Silosgruposdifierenrealmenteentres,suspuntuacionesvariarnmsdeloque
puedanvariarlaspuntuacionesentrelosintegrantesdeunmismogrupo.Vemoslocon
unejemplocotidiano.SitenemostresfamiliasA,ByC.LafamiliaAestintegradapor
Felipe,Anglica,ElenayJosLuis.LafamiliaBestcompuestaporChester,Pilar,igo,
Alonso y Carlos. Y la familia C est integrada por Rodrigo, Laura y Roberto. Qu
esperamos?Puesquelosintegrantesdeunafamiliaseparezcanmsentresquealos
miembrosdeotrafamilia.Estosegraficaracomoenlafigura8.2.

Figura8.2Ejemplodelasvariacionesdelosgruposcomparados

Es decir, esperamos homogeneidad intrafamilias y heterogeneidad interfamilias.


Qusucederasilosmiembrosdelasfamiliasseparecieranmsalosintegrantesdelas
otrasfamiliasquealosdelasuyapropia?Quieredecirquenohaydiferenciaentrelos
grupos(enelejemplo,familias).
EstamismalgicaseaplicaalaraznF,lacualnosindicasilasdiferenciasentrelos
grupossonmayoresquelasdiferenciasintragrupos(dentrodestos).Estasdiferencias
se miden en trminos de varianza. La varianza es una medida de dispersin o
variabilidadalrededordelamediaysecalculaentrminosdedesviacioneselevadasal
cuadrado.Recuerdequeladesviacinestndaresunpromediodedesviacionesrespecto
a la media X X y la varianza es un promedio de desviaciones respecto a la media

elevadasalcuadrado X X
es

( X X )

expresaas:

) .LavarianzaporesosesimbolizacomoS ysufrmula
2

n . En consecuencia, la razn F, que es una razn de varianzas, se


En donde la media cuadrtica implica un promedio de varianzas elevadas al
cuadrado. La media cuadrtica entre los grupos se obtiene al calcular la media de las
puntuacionesdetodoslosgrupos(mediatotal),despusseobtieneladesviacindela
mediadecadagruporespectoalamediatotalyseelevaalcuadradocadaunadeestas
desviaciones,yluegosesuman.Finalmentesesopesaelnmerodeindividuosencada
grupoylamediacuadrticaseobtieneconbaseenlosgradosdelibertadintergrupales
(nosecalculaconbaseenelnmerodepuntuaciones).Lamediacuadrticadentrode
losgrupossecalculaobteniendoprimeroladesviacindecadapuntuacinrespectoala
media de su grupo; posteriormente esta fuente de variacin se suma y combina para
obtenerunamediadelavarianzaintragrupalparatodaslasobservaciones,tomandoen
cuentalosgradosdelibertadtotales(Wright,1979;DoncasteryDavey,2007).
Lasfrmulasdelamediacuadrticason:

Losgradosdelibertadentregrupos=

(dondeKeselnmerodegrupos).

Losgradosdelibertadintragrupos= n K (neseltamaodelamuestra,lasuma
delosindividuosdetodoslosgrupos,yKrecordemosqueeselnmerodegrupos).
Pues bien, cuando F resulta significativa, quiere decir que los grupos difieren
significativamente entre s. Es decir, se acepta la hiptesis de investigacin y se
rechazalahiptesisnula.
Cuandoseefectaelanlisisdevarianzapormediodeunprogramacomputacional
estadstico,segeneraunatabladeresultadosconloselementosdelatabla8.1.

Tabla8.1Elementosparainterpretarunanlisisdevarianza
unidireccionalrealizadoenSPSS

Fuentede
variacin
(Source)
Entre
grupos
(between
groups)
Intragrupos
(within
groups)
Total

Sumasde
Gradosde
Medias

cuadrados
libertad
cuadrticas

(Sumsof
(Degreesof
(Mean
RaznF
squares)
freedom)
squares)
(Fratio)
SSentre+
glentre
SSentre/gl

entre

SSintra
glintra
SSintra/gl

intra

SSentre
glentre+

SSintra
glintra
EnMinitabsedanlossiguienteselementos:
FuenteGL(gradosSC(sumadeMC(mediaF(valor)P(sig.)
delibertad)cuadrados)cuadrtica)

Significancia
deF
(Fprob.)

Elvaloralfaoprobabilidadaelegirunavezmses0.05o0.01.Siesmenorque0.05
es significativo en este nivel, y si es menor que 0.01 tambin es significativo en este
nivel.Cuandoelprogramaopaqueteestadsticonoincluyelasignificanciaseacudeala
tabla3delapndice4(tabladeladistribucinFoenSTATSaValoresdeFalnivel
de confianza de .05 y .01). Esta tabla contiene una lista de razones significativas
(razones F) que debemos obtener para aceptar la hiptesis de investigacin en los
nivelesdeconfianzade0.05y0.01.Aligualqueencasodelaraznt,elvalorexactode
F que debemos obtener depende de sus grados de libertad asociados. Por lo tanto, la
utilizacindelatablaseiniciaalbuscarlosdosvaloresgl,losgradosdelibertadentrelos
grupos y los grados de libertad intragrupos. Los grados de libertad entre grupos se
indican en la parte superior de la pgina, mientras que los grados de libertad
intragrupos se han colocado al lado izquierdo de la tabla. El cuerpo de la tabla de la
distribucin F presenta razones F significativas en los niveles de confianza de 0.05 y
0.01.

SiF = 1.12
glentre = 2
glintra = 60

EstevalorFsecomparaconelvalorqueapareceenlatabladeladistribucinFque
es 3.15 y como el valor F calculado es menor al de dicha tabla, rechazaramos la
hiptesisdeinvestigacinyaceptaramoslahiptesisnula.ParaqueelvalorFcalculado
seasignificativodebeserigualomayoraldelatabla.

ANLISISMULTIVARIADO
En el captulo 10 del libro, cuando se analizaron los principales mtodos estadsticos
paramtricos, concretamente, despus de revisar el ANOVA unidireccional, nos
preguntbamos: pero qu ocurre cuando tenemos diversas variables independientes y
una dependiente, varias independientes y dependientes? Tal como observbamos en
diagramascomoelquesemuestraenlafigura8.3.

Autoestimade
lapersona

Edad

Sentido
devida
dela
persona

Gnero

Religin

Figura8.3Ejemploconcuatrovariablesindependientesyunadependiente.
Larespuestaera:entonces,requerimosdeotrosmtodosestadsticos.stossonlos
que revisaremos a continuacin y una vez ms, sobre la base de que existen
computadoras y programas como el SPSS, del mismo modo centrndonos en los

elementosfundamentalesdeinterpretacin.

Qusonlosmtodosdeanlisismultivariado?
Los mtodos de anlisis multivariado son aquellos en que se analiza la relacin entre
diversas variables independientes y al menos una dependiente. Son mtodos ms
complejosquerequierendelusodecomputadorasparaefectuarlosclculosnecesarios
(normalmenteseenseananivelposgrado).

Queselanlisisfactorialdevarianza?
ANOVA(anlisisdevarianzadekdireccionesovariosfactores)
Definicin: Es una prueba estadstica para evaluar el efecto de dos o ms variables
independientessobreunavariabledependiente.
Respondeaesquemascomoelquesemuestraenlafigura8.4.

X1

X2

Xk

Figura8.4Esquemadeunanlisisfactorialdevarianza

Constituyeunaextensindelanlisisdevarianzaunidireccional,solamentequeincluye
ms de una variable independiente. Evala los efectos por separado de cada variable
independienteylosefectosconjuntosdedosomsvariablesindependientes.
Variables:dosomsvariablesindependientesyunadependiente.

Niveldemedicindelasvariables:lavariabledependiente(criterio)debeestarmedida
enunnivelporintervalosorazn,ylasvariablesindependientes(factores)pueden
estarencualquierniveldemedicin,peroexpresadasdemaneracategrica.

Interpretacinyejemplo
Hi: la similitud en valores, la atraccin fsica y el grado de realimentacin positiva son
variablesqueincidenenlasatisfaccinsobrelarelacinenparejasdenovios.

Contexto: Muestra de parejas de adultos jvenes (2329 aos) de Santiago de Chile,


pertenecientesaestratoseconmicosaltos(n=400).

El ANOVA efectuado mediante un paquete estadstico computacional como SPSS


producelossiguienteselementosbsicos:
Fuente de la variacin (source of variation). Es el factor que origina variacin en la
dependiente.Siunafuentenooriginavariacinenladependiente,notieneefectos.
Efectos principales (main effects). Es el efecto de cada variable independiente por
separado;noestcontaminadodelefectodeotrasvariablesindependientesnideerror.
Sueleproporcionarselasumadetodoslosefectosprincipales.
Interacciones de dos direcciones (2way interactions). Representa el efecto conjunto de
dos variables independientes, aislado de los dems posibles efectos de las variables
independientes (individuales o en conjuntos). Suele proporcionarse la suma de los
efectosdetodasestasinteracciones.
Interacciones de tres direcciones (3way interactions). Constituye el efecto conjunto de
tresvariablesindependientes,aisladodeotrosefectos.Sueleproporcionarselasumade
losefectosdetodasestasinteracciones.
Puede haber efecto de Kdirecciones, esto depende del nmero de variables
independientes.
Ennuestroejemplo,tenemoslosresultadosquesemuestranenlatabla8.2.

Tabla8.2EjemploderesultadosenelANOVA

Fuentedevariacin
(SOURCEOFVARIATION)
Efectosprincipales
(maineffects)

VARIABLEDEPENDIENTE:SATISFACCINENLARELACIN
Sumade
Gradosde
Medias
Razn
Significancia
cuadrados
libertad
cuadrticas
deFOP
(SUMSOF
(DEGREESOF (MEAN
SQUARES)
FREEDOM)
SQUARES)

22.51
0.001**

Similitud

31.18
0.001**
Atraccin

21.02
0.001**
Realimentacin

11.84
0.004**
Interaccindedos

direcciones(2way

interactions)
7.65
0.010*
Similitud

4.32
0.040*
Atraccin

Similitud

2.18
0.110
Realimentacin

Atraccin

1.56
0.190
Interaccindetres

8.01
0.020*
direcciones(3way
interaction)
Similitud

Atraccin

Realimentacin

Residual

Total

Nota: AlosestudiantesqueseinicianenelANOVAnormalmentelesinteresasabersilasrazonesF
resultarononosignificativas;portanto,sloseincluyenestosvalores.Porloqueesaellosaquieneslos
autoresrecomiendanconcentrarseendichosvaloresyevitarconfusiones.Desdeluego,elinvestigador
experimentadoacostumbraestudiartodoslosvalores.
**RaznFsignificativaalniveldel0.01(p<0.01)
*RaznFsignificativaalniveldel0.05(p<0.05)

Como podemos ver en la tabla 8.2, la similitud, la atraccin y la realimentacin


tienenunefectosignificativosobrelasatisfaccinenlarelacin.Respectoalosefectos
de dos variables independientes conjuntas, slo la similitud y la atraccin tienen un
efecto, hay un efecto conjunto de las tres variables independientes. La hiptesis de
investigacinseaceptaylanulaserechaza.Asimismo,serecuerdaallectorqueenelcaptulo
5delpresentedisco:diseosexperimentales:segundaparte:seriescronolgicas,factorialesy
cuasiexperimentos (en el apartado sobre diseos factoriales) se explica la nocin de
interaccin entre variables independientes. Cabe agregar que el ANOVA es un mtodo
estadsticopropioparalosdiseosexperimentalesfactoriales.

Queselanlisisdecovarianza?
Definicin: es un mtodo estadstico que analiza la relacin entre una variable
dependienteydosomsindependientes,conelqueseeliminaocontrolaelefectodeal
menosunadeestasindependientes.SimilaralANOVA,exceptoquepermitecontrolarla
influencia de una variable independiente, la cual con frecuencia es una caracterstica
antecedentequepuedevariarentrelosgrupos(Mertens,2005;Babbie,2009)oinfluir
losresultadosyafectarlaclaridaddelasinterpretaciones.
Perspectivasousos:WildtyAhtola(1978,pp.89)destacantresperspectivasparael
anlisisdecovarianza:

A. Perspectiva experimental. Se aplica a aquellas situaciones en que el inters del


investigador se centra en las diferencias observadas en la variable dependiente,
por medio de las categoras de la variable independiente (o variables
independientes). Pero el experimentador asume que hay otras variables
independientes cuantitativas que contaminan la relacin y cuya influencia debe
sercontrolada(figura8.5).

Variables
independientes
categricas

X1
X2
Xk

Variables
independientes
cuantitativas
continuas

Z 1

Z 2
Zk

Figura8.5Ejemplodevariablesindependientesqueafectanaunadependiente

Variable
dependiente

Y el investigador nicamente se interesa por conocer la relacin entre las


variables independientes categricas y la variable dependiente. Desea al mismo
tiemporemoverycontrolarelefectodelasvariablesindependientescuantitativas
nocategricas(continuas).Esdecir,deseatenerunesquemacomoeldelafigura
8.6.

X1

X2

Xk

Y
Z1

Removero
controlar

Z2
Zk

Figura8.6Ejemplodecontroldevariablesindependientesnocategricas.

El objetivo es purificar la relacin entre las independientes categricas y la


dependiente,medianteelcontroldelefectodelasindependientesnocategricaso
continuas.
Ejemplos de variables independientes categricas seran: gnero (masculino,
femenino),inteligencia(alta,media,baja),ingreso(menosdeunsalariomnimo,dos
acuatrosalariosmnimos,cincoa10salariosmnimos,11omssalariosmnimos).
Los niveles de medicin nominal y ordinal son categricos en s mismos, mientras
que los niveles de intervalos y razn deben transformarse en categoras ms
discretas.Estosltimossonens:cuantitativos,continuosydecategorasmltiples.
Porejemplo,elingresoensuestadonatural(pesos,dlares,euros,etc.)varadela
categoracerohastalacategora(K)k,yaquepuedehabermillonesdecategoras.


Variablecategricaunascuantascategorasounrangomedio.
Variablecontinuamuchascategoras(avecesunainfinidad).
A dichas variables independientes cuantitativas continuas, cuya influencia se
controla,selesdenominacovariables.Unacovariableseincluyeenelanlisispara
removersuefectosobrelavariabledependiente,eincrementarelconocimientode
la relacin entre las variables independientes categricas de inters y la
dependiente,locualaumentalaprecisindelanlisis(DoncasteryDavey,2007).
Enestaperspectiva,elanlisisdecovarianzapuedeserconcebidoprimerocomo
un ajuste en la variable dependiente respecto a diferencias en la covariable o las
covariables y, posteriormente, como una evaluacin de la relacin entre las
variables independientes categricas y los valores ajustados de la variable
dependiente (Wildt y Ahtola, 1978). En trminos de Creswell (2005): el
procedimiento ajusta las puntuaciones en la dependiente para dar cuenta de la
covarianza (por decirlo en trminos sencillos: hace equivalentes a los grupos en
la(s) covariable(s) y controla influencias potenciales que pueden afectar a la
variabledependiente).
B. Perspectivadeintersporlacovariable.Estaperspectivaseejemplificaconaquellas
instanciasenlascualeselintersprincipalsecentraenanalizarlarelacinentrela
variable dependiente y la covariable (variable cuantitativa continua) o las
covariables. Aqu el enfoque es distinto; la influencia que se remueve es la de las
variables independientes categricas. Primero se controla el efecto (en este caso
contaminante)deestasvariablesydespusseanalizaelefectopurificadodelas
covariables.
C. Perspectiva de regresin. En esta tercera perspectiva, tanto las variables
independientes categricas como las covariables resultan de inters para el
investigador, quien puede desear examinar el efecto de cada variable
independiente(covariablesynocovariables,todas)ydespusajustarocorregirlos
efectosdelasdemsvariablesindependientes.
Encualquiercaso,elanlisisdecovarianzaeliminainfluenciasnodeseadassobrela
variable dependiente. Se puede utilizar en contextos experimentales y no

experimentales. La mayora de las veces la funcin del ANCOVA es remover la


varianzacompartidaentre una o ms covariables y la dependiente, de este modo,
se valora en su justa dimensin la relacin causal entre la(s) variable(s)
independiente(s) de inters y la dependiente (Creswell, 2005). Vemoslo
conceptualmenteperodeformagrficaconunejemplosimple:

EJEMPLO

Estudio:Alinvestigadorleinteresaanalizarelefectoenelaprendizajedelacomputacin,pormedio
deunnuevomtodoparasuenseanzaanios.Lahiptesises:elnuevomtododeenseanzade
lacomputacin(MARH)provocarunmayoraprendizajeenlosniosqueunmtodotradicional.

Entonces, implementa el siguiente experimento: a un grupo de infantes lo expone al nuevo

mtodo de enseanza de computacin (MARH); el otro grupo aprende con el mtodo tradicional;
finalmente,untercergrupo,decontrol,norecibeningntipodeenseanzaencomputacin.
La variable independiente es el tipo de mtodo con tres categoras o niveles (mtodo nuevo,
mtodotradicionalyausenciademtodo),ladependienteeselaprendizajeencomputacin(medida
porunapruebaestandarizadaaniveldeintervalos).Setieneunesquemacomoeldelafigura8.7.

Tipodemtodo(X)

Aprendizaje(Y)

Elinvestigadorsabequeelaprendizajesepuededeberamuchasrazones,ademsdelmtodo.Esdecir,el

aprendizajevarapordiversosmotivos,locualserepresentaenformadeconjuntosdelasiguientemanera:

Variable
independiente:
mtodo(X)

Variable
dependiente:
aprendizaje(Y)

Varianzaencomnentre
mtodoyaprendizaje

Varianzadelaprendizajeno
explicada(quenosedebeal
mtodosinoaotrosfactores)

Conelexperimentoelinvestigadordeseaconocerlavarianzaencomnentremtodoyaprendizaje
(cuantificarla),larelacinXY(pura).Silosniossonasignadosalazaralosgruposdelexperimento
ytienegruposdetamaoaceptable,poreldiseomismo,remuevelainfluenciadelascovariables
quepudieranafectar.Perosinoesfactiblehacerloytieneundiseocuasiexperimental(grupos
intactos),deberemovertalinfluenciaconelanlisisdecovarianza(eliminaralmnimoposiblela
varianzadelaprendizajenoexplicada),paraevitarquelascovariablesimpidanverconclaridadla
relacinXY.Porejemplo,elniveleducativotecnolgicodelospadrespuedeinfluir(hacevariaral
aprendizaje)yesteefectodebesercontrolado,alintroducirlocomocovariable.

Variable
independiente:
mtodo(X)

Variable
dependiente:
aprendizaje(Y)

Elniveleducativo
tecnolgicodelos
padres(COVARIABLE)

Varianzaencomn:entre
mtodoyaprendizaje
Varianzacompartidaentreelnivel
educativodelospadresyelaprendizaje(la
cualsecontrolaconelANCOVA)
Entremscovariablessecontrole,msseexplicarsobrelavarianzacomnentreelmtodoyel
aprendizaje.

Figura8.7Ejemplodelcontroldelascovariables(conunacovariable).

Loqueelinvestigadordeseatambinsepuedeexpresar
grficamenteas:

Tipodemtodo

Aprendizaje

ANCOVA

Niveleducativo
tecnolgicodelos
padres(covariable)

Controlarinfluenciadelacovariable

WildtyAhtola(1978,p.13)definenalgunosusosdelanlisisdecovarianza:

1. Incrementarlaprecisinenexperimentosconasignacinalazar.
2. Eliminar influencias extraas o contaminantes que pueden resultar cuando las
pruebas o los individuos no son asignados al azar a las diferentes condiciones
experimentales(gruposdeunexperimento).
3. Eliminar efectos de variables que confundan o distorsionen la interpretacin de
resultadosenestudiosnoexperimentales.

Nivel de medicin de las variables: la variable dependiente siempre est medida por

intervalosoraznylasvariablesindependientespuedenestarmedidasencualquiernivel.
Interpretacin: depende de cada caso especfico, ya que el anlisis de covarianza
efectuado mediante un programa estadstico computacional, produce un cuadro de
resultados muy parecido al del anlisis de varianza. Los elementos ms comunes
puedenobservarseenlatabla8.3.


Tabla8.3Ejemplodeelementoscomunesdeunanlisisdecovarianza

Fuente

de Sumasde

variacin
(Source
variation)

Sumasde

Gradosde Medias

Razn Significancia de

cuadrados

libertad

F(F)

ajustadas

(Degrees

productos

(Adjusted

of

cruzados

sumof

freedom)

(Sumof

squares)

cuadrados
of y

cuadrticas

F(Sig.)

squares
andcross
products)

La razn F es, igual que en el anlisis de varianza, una razn de varianzas. El

razonamientoestadsticoeselmismoyFseinterpretaigual,inclusoseutilizaelmismo
cuadrodeladistribucinF(tabla3,apndice4oenSTATSaValoresdeFalnivelde
confianza de .05 y .01). Solamente que las inferencias y conclusiones se hacen al
considerarquelasmediasdelavariabledependiente,atravsdelascategorasdelas
variables independientes, se han ajustado, de este modo eliminan el efecto de la
covariableocovariables.

EJEMPLO
Diseodeinvestigacinqueutilizaelanlisisdecovarianza
Hi:lostrabajadoresquerecibanretroalimentacinverbalsobreeldesempeodeparte
desusupervisormantendrnunnivelmayordeproductividadquelostrabajadoresque
reciban retroalimentacin sobre el desempeo por escrito, y ms an que los
trabajadoresquenorecibanningntipoderetroalimentacin.

Hi: 1

>

(verbal)

(porescrito)

>

3
(ausencia)

Elinvestigadorplanteaundiseoexperimentalparaintentarprobarsuhiptesis.
Sinembargo,nopuedeasignaraleatoriamentealostrabajadoresalostresgruposdel
experimento. El diseo sera con grupos intactos (cuasiexperimental) y se
esquematizaraas:

G1

X1

G2

X2

G3

Asimismo, el investigador presupone que hay un factor que puede contaminar los
resultados (actuar como fuente de invalidacin interna): la motivacin. Diferencias
iniciales en motivacin pueden invalidar el estudio. Como la asignacin al azar est
ausente, no se sabe si los resultados se ven influidos por dicho factor. Entonces, el
3

experimentador decide eliminar o controlar el efecto de la motivacin sobre la


productividad para conocer los efectos de la variable independiente: tipo de
retroalimentacin. La motivacin se convierte en covariable. El esquema es el que se
muestraenlafigura8.8.

Retroalimentacin(variable
independientecategrica)

Productividad(variable
dependiente)

ANCOVA
Motivacin
(covariable)


Figura8.8Ejemplodondelamotivacinescovariable

Cabe destacar que, para introducir una covariable en el anlisis, de preferencia debe
medirseantesdeliniciodelexperimento.
Elanlisisdecovarianzaquitaalavariabilidaddeladependienteloquesedebeala
covariable. Ajusta la varianza de la variable dependiente en las categoras de la
independiente, al basarse en la covariable. En el ejemplo, ajusta la varianza de la
productividad debida a la motivacin, en las categoras experimentales (tratamientos o
grupos). El ajuste se realiza sobre la base de la correlacin entre la covariable y la
dependiente.Estosemuestraesquemticamenteenlatabla8.4.

Tabla8.4Ejemplodeundiseodeinvestigacinqueutilizaelanlisisdecovarianzacomo
herramientaparaajustardiferenciasenmotivacinentrelosgrupos

Covariable
Calificacinen
motivacin

Variable
independiente

Tipode
realimentacin

Variable
dependiente
Puntuacionesen
productividadajustadas,
tomandoencuentala
covariable

G1

X1

G2

X2

G3

Una vez realizado el anlisis de covarianza, se evala si F es o no significativa.


CuandoFresultasignificativaseaceptalahiptesisdeinvestigacin.
Sielresultadofuera:
G1=35

G2=36
La correlacin entre la calificacin en motivacin y las puntuaciones en
productividadeslabaseparaelajuste.

G3=38

Glentre=K1=31=2

Glintra=NK=107

F=1.70

Comparamosconelvalordelatablarespectiva:enelnivelde0.05esiguala3.07,y
nuestra razn F a 1.70 es menor a este valor. Por tanto, rechazamos la hiptesis de
investigacin y aceptamos la hiptesis nula. Esto se contrasta y profundiza con las
mediasajustadasdelosgruposqueproporcioneelanlisisdecovarianza(nolasmedias
obtenidas en el experimento por cada grupo, sino las ajustadas con base en la
covariable).
RecordemosqueSPSSyMinitabnosproporcionanautomticamentelasignificancia
deF.

Queslaregresinmltiple?
Esunmtodoparaanalizarelefectodedosomsvariablesindependientessobreuna
dependiente. Asimismo, constituye una extensin de la regresin lineal slo que con
mayornmerodevariablesindependientes.Esdecir,sirveparapredecirelvalordeuna
variable dependiente, cuando se conoce el valor y la influencia de las variables
independientes incluidas en el anlisis. Si queremos conocer el efecto que ejercen las
variables:a)satisfaccinsobrelosingresospercibidos,b)antigedadenlaempresa,c)
motivacin intrnseca en el trabajo y d) percepcin del crecimiento y desarrollo
personal en el trabajo; sobre la variable permanencia en la empresa (duracin o
estancia), el modelo de regresin mltiple es el adecuado para aplicarlo a los datos
obtenidos.Otroejemploseraelsiguiente:

VARIABLESINDEPENDIENTES

Diseodeestrategiasde

cooperacinentremaestrosparala

enseanzaenlasclases.

VARIABLE
DEPENDIENTE

Gradodeutilizacindela
tecnologacomputacionalenel

aula.
Desempeoescolar
delosalumnos

Gradodeinvolucramientodelos

padresenlasestrategiasde
enseanza.

Gradodecooperacinytrabajoen
equipoporpartedelosalumnos
pararealizarlastareas.

Figura8.9Esquemadeunmodeloconunavariabledependienteyvariasindependientes,
dondeseconoceelefectodecadaunadestas

Esdecir,elmodeloderegresinmltiplenosindica:
Larelacinentrecadavariableindependienteylanicadependiente(cmocambios
enlaindependientesevinculanconcambiosenladependiente).
Larelacinentretodaslasvariablesindependientes(enconjunto)yladependiente
(cmocambiosenlasindependientessevinculanconcambiosenladependiente).
Laprediccindeladependienteapartirdelasindependientes.
Lacorrelacinentrelasvariablesindependientes(colinealidad).
Las variables independientes se denominan predictoras4 y anteceden
temporalmentealavariabledependienteocriterio.
La informacin bsica que proporciona la regresin mltiple es el coeficiente de
correlacinmltiple(R)ylaecuacinderegresin.

4Trminoanglosajn.

Coeficiente de correlacin mltiple (R). Seala la correlacin entre la variable


dependienteytodaslasvariablesindependientestomadasenconjunto.
Elcoeficientepuedevariardeceroauno;cuantomsaltoseasuvalor,lasvariables
independientes estarn ms correlacionadas con la variable dependiente y explicarn
en mayor medida sus fluctuaciones (varianza); en consecuencia, son factores ms
efectivosparapredecirelcomportamientodeestaltima.
Enelcaptulo10dellibro,secomentelcoeficientedecorrelacindePearsonyse
mencionquecuandoelcoeficienterseelevaalcuadrado(r2),seobtieneelcoeficiente
de determinacin y el resultado indica la varianza de factores comunes, esto es, el
porcentajedelavariacindeunavariabledebidoalavariacindelaotrayviceversa(o
cuntoexplicaodeterminaunavariablelavariacindelaotra).Puesbien,algosimilar
ocurreconelcoeficientedecorrelacinmltiple,solamentequetenemosmsvariables
aconsiderar.Cuandoel coeficienteR se elevaalcuadrado (R2),se produce el llamado
coeficientededeterminacinocorrelacinparcial,quenossealalavarianzaexplicada
de la variable dependiente por todas las independientes (dicho de otra forma, el
porcentajedevariacinenladependienteesdebidoalasindependientesconsideradas).
Vemoslogrficamenteenlafigura8.10condosindependientesyunadependiente,
afindequeresultemenoscomplejodeentender.

Variableindependiente
1

Variable
independiente2

Variable
dependiente

Figura8.10

Esquemadeuncoeficientededeterminacinocorrelacinparcial

R2(expresaen
porcentajelavarianza
compartidaporlastres
variables)

Este coeficiente (R2) resulta til tambin para determinar la cantidad de varianza
que una variable interviniente explica tanto de la variable independiente como de la
dependiente,deestemodo,sepuederemoverlavarianzacompartidadelainterviniente
conlavariableindependienteoladependiente(Creswell,2005;Sengupta,2009),quees
algosimilaraloqueseefectaconelanlisisdecovarianza.
Talseraelcasodeunarelacindelsiguientetipo:

Autoestimadelestudiante

relacinnegativa

(independiente)

Consumodeestupefacientes
(dependiente)

Reforzamientodelos
valoresdelestudiante
porpartedesustutores
(interviniente)

relacinnegativa

Figura8.11Ejemplodelcoeficientededeterminacin(correlacinparcial)

Siresumimoslovistoenelcaptulo10dellibrosobrecorrelacinyregresinlineal
yloexpuestohastaaqu,tenemosloscoeficientesqueseresumenenlatabla8.5.

Tabla8.5Resumendecoeficientesdecorrelacinbivariadaymltiple
Coeficiente
Pearson

Smbolo
r

Informacinproducida
Grado de asociacin entre dos variables
(oscilaentre0y1).

Coeficientede
determinacin

r2

Varianzadefactorescomunes(porcentaje
delavariacindeunavariabledebidoala
variacin de la otra variable y viceversa).
Oscilaentre0y100%.

Mltiple

Correlacinentrelavariabledependiente

y todas las variables independientes


tomadasenconjunto.Oscilaentre0y1.
Determinacin
(correlacinparcial)

R2

Varianza explicada de la dependiente por


todas las independientes. Oscila entre
0y100%.

Otra informacin relevante producida por el anlisis de regresin mltiple son los
valores beta ( o b) que indican el peso o la influencia que tiene cada variable
independiente sobre la dependiente, al controlar la varianza de todas las dems
independientes. Cada peso beta es un coeficiente que seala la magnitud de la
prediccin de una variable independiente para una variable dependiente (criterio),
despus de remover los efectos de todas las dems independientes. Los valores beta
estnestandarizados,esdecir,noimportaquecadavariablepredictoraestmedidaen
una escala diferente (como ocurra con las puntuaciones z) y se interpretan como el
coeficientedePearson,de1.00a+1.00(Creswell,2005).
Tambin el anlisis proporciona coeficientes de correlacin bivariados entre la
dependienteycadaindependiente(Shaw,2009).
Parapredecirvaloresdelavariabledependienteseaplicalaecuacinderegresin
mltiple:

y=a+b1X1+b2X2+b3X3+bkXk

Dondeaesunaconstantederegresinparaelconjuntodepuntuacionesobtenidas,
b1,b2,b3,bksonlospesosbetadelasvariablesindependientes.MientrasqueX1,X2,
X3yXksonvaloresdelasvariablesindependientesquefijaelinvestigadorparahacer
laprediccin.
La variable dependiente debe estar medida en un nivel por intervalos o de razn.
Lasindependientes,encualquierniveldemedicin(elmodeloestandarizamediciones).
Cuando se utilizan variables categricas (nominales u ordinales, como gnero, grupo
tnico, nivel jerrquico, etc.) se transforman en variables dummy y se introducen al
modelo como predictores. Los cdigos dummy son series de nmeros asignados para

indicar la pertenencia a un grupo en cualquier categora exhaustiva y mutuamente


excluyente.
De acuerdo con Mertens (2005), la cantidad de varianza que cada independiente
aporta para la variable dependiente puede tener cambios con diferentes rdenes de
entradadelasvariablesindependientes.Alrespectonohayreglas,seusalalgicadel
investigadorocriterioscomolossiguientes:

Ingresar las variables de acuerdo con la fuerza de su correlacin con la


variabledependiente,delamsaltaalamsbaja.

Seguirelordenenquesehanintroducidoenestudiosprevios.

Procederdeacuerdoconlateora.

Orden cronolgico (tiempo en que se introducen las variables en un


experimento o al medirse, si es que su medicin fue por etapas, de la
primeraalaltima).

Los resultados ms relevantes que produce SPSS sobre la regresin mltiple se


muestranenlastablas8.6,8.7yenlafigura8.12,quecorrespondenaunestudiopara
predecir el clima laboral (criterio o dependiente) sobre la base de las siguientes
variablesindependientes(HernndezSampieri,2005):

Normalizacin(formalizacindepolticasendocumentos).

Avance del proceso de calidad en el departamento (un nuevo esquema de


trabajointroducidoenel2004).

Innovacindepartamental.

Identificacin del trabajo individual en los resultados generales de la


organizacin.

Comunicacin (percepcin del grado en que la informacin relevante de la


empresalesestransmitidaalosempleadosdesudepartamento).

Desempeo(ndicedeproductividaddelempleado).

Motivacingeneral.

Antigedadenlaempresa(enmeses).

Satisfaccingeneraleneltrabajo.

Liderazgo(percepcindelsuperiorinmediatocomolder).

Cultura(arraigodelaculturaorganizacionaldefinidaporladireccindela
empresa).

Pago(salario).

Primero.Sepresentanlasvariablesintroducidasenelmodeloderegresin:

Tabla8.6Variablesintroducidasenelejemploderegresinmltiple
Variablesintroducidas/eliminadas
Modelo

Variables
Variables
introducidas(a)
eliminadas
Pago

Innovacin
Antigedad
Motivacin
Normalizacin
Procesodecalidad
Cultura
Identificacin
Desempeo
Liderazgo
Satisfaccin
Comunicacin
a. Todaslasvariablessolicitadasintroducidas
b. Variabledependiente:clima

Mtodo(b)

Introducir

Segundo. Se presentan resultados de varianzas (ANOVA), los cuales omitimos, y los


coeficientesbetayestadsticasdecolinealidad(tabla8.7).

Hora

Nombredelparticipante

Codificador

Fecha

Condicinexperimental

Categora

Subcategora

10 20 30 40

50 1

10 20 30 40 50 2

10 20 30 40 50 3

Distancia

Alejamiento(0)

fsica

Acercamiento(2)

Esttico(1)

Movimientos Tensin(0)

corporales

Relajacin(2)

Ninguno(1)

Alsujeto(1)

Aotraparte(0)

Conducta

F.completas(1)

verbal

F.dictomas(0)

Silencios(0)

Conducta
visual

Nota:Seagregaronlassubcategorasestticoenlacategoradistanciafsicayningunoenlacategoramovimientoscorporales.

Figura7.11Primerejemplodeunformatoderegistroocodificacin

66

Figura7.12Segundoejemplodeunformatoderegistroocodificacin

Elejemplodelafigura
7.12 es un formato para registrar conductas inapropiadas en la clase y analizar
cules son las que se presentan con mayor frecuencia y el nmero de estudiantes
involucrados(Creswell,2005).
Los nmeros (columnas) representan episodios de conducta inapropiada en la
clase (cada vez que ocurre). Se coloca en la fila CI (conducta inapropiada) la letra
inicialdelaconducta(ejemplo:O,ofensaverbal;H,hablarenclase),y1sisonotras.
Asimismo,enlafilaNseindicaelnmerodeestudiantesinvolucradosenelepisodio.

67

La hoja de codificacin, formato o gua debe acompaarse de las instrucciones


para su llenado o registros y la mencin de las unidades de observacin, as como el
tiempo que durar sta. Debe evitarse un instrumento que sea tan complejo que sea
difcildecodificaryutilizarseenlarealidad.

7. Determinar el papel de los observadores. Qu tan cercanos deben estar el


observador y los observados? A este respecto mucho se ha escrito y los roles
varandesdeunadistanciaprudentementelejana,hastaunacercanacompleta.
Anastas (2005) y tambin Polster y Collins (2007) plantean dos roles
fundamentalesdelarelacinobservadorobservados:a)participante(dondehay
relacin entre el observador y las personas observadas) y b) no participante (la
relacinesmnimasimplementeporelhechodequelosindividuossabenque
estnsiendoobservadosopuedesernula,silosindividuosnosabenqueestn
siendoobservados).
La tica de la investigacin marca que siempre que va a observarse a un ser
humano, se debe obtener su consentimiento; asimismo, no se deben invadir sus
esferasprivadas(baos,recmaras,etc.).Anastas(2005)estdeacuerdoconesta
consideracin, aunque marca una excepcin: cuando se observan conductas
inocuasquepudieranocurrirdemaneranaturalensituacionespblicasycuando
laspersonasobservadasnosonidentificadasoafectadasporlosobservadores.En
ltimainstancia,sielinvestigadorbuscaevitarlareactividadenelproceso(que
la presencia de los observadores provoque reacciones poco o nada naturales en
losparticipantes),unavezqueseefectanlasobservaciones,debesolicitrselea
cadasujetosuautorizacin,mantenersunombreenelanonimato,nuncamostrar
lasfilmacionesoregistrosyrespetarsunegativa,sieselcaso.
Jorgensen (1989) sugiere tres actuaciones: a) participante activo, el
observador interacta plenamente con los observados, tiene un papel de
miembro,esunomsdeellos(porejemplo,sisetratadeobservarelcompromiso
detrabajadoresenlosgruposdecalidad,elobservadoresunmiembrodelgrupo
con funciones especficas), b) participante privilegiado, no es un miembro del
grupo, pero tiene acceso a informacin amplia y privada, los observados lo
conocenyletienenconfianzayc)observadorlimitado,notienemsqueelpapel

68

de observador externo. Rogers y Bouey (2005) los clasifican en el siguiente


continuo:

Participantecompleto:
totalinteraccin,su

rolprimarioes
participarygenerarla

interaccin.

Participante
observador:surol
primarioesparticipar,
perocasialapar
observa.

Observador
participante:surol
primarioesobservar,
aunquetieneciertas
participaciones.

Observador
completo:nula
participacin,se
limitaaobservar

Patton(2001)sugierequeelobservadordebeubicarseenvarioscontinuospara
establecersupapel(queesunaubicacinaproximadaynoexacta):

Sin que de ninguna manera sea una norma, cuando la observacin


cuantitativatrabajaconpersonas,regularmenteesnoparticipante,encubiertao

69

intermedia,decortaestanciayenfocada.Mientrasquelaobservacincualitativa
esparticipante,abierta,prolongadaygeneral.
8. Seleccionar a los observadorescodificadores. Puesto que son las personas que
habrn de codificar la conducta, deben conocer las variables, categoras y
subcategoras.Lashabilidadesmsimportantesdeunbuenobservadorson:

Selectividadpararegistrarloqueobserva,deacuerdoconreglas.
Uso de todos los sentidos, particularmente ante lo que no se esperaba
encontrar.
Capacidad para seguir el sistema de registro que involucra el
procesamientodeinformacin.

9.

Proporcionar entrenamiento a observadorescodificadores (en las variables,


categoras,subcategoras,unidadesdeanlisisyelprocedimientoparacodificar,
ascomosobrelasdiferentesmanerascomopuedemanifestarseunacategorao
subcategora de conducta). Debido a que, en algn grado, la observacin
involucra hacer juicios, el entrenamiento debe apoyar la estandarizacin de
procedimientosy,porende,laobjetividad.

10.

Efectuar la prueba piloto y calcular la confiabilidad de los observadores


(intraobservador e interobservadores). En la prueba piloto se evala todo lo
relativo al proceso de observacin. Desde la iluminacin en el ambiente
(ejemplo,cmaradeGesell),elsonidoylosequiposdefilmacin;hastaellugar
dondesecoloquenlosobservadores,lasinstruccionesylaguadeobservacino
registro.
Gracias a la prueba piloto nos podemos dar cuenta de problemas
potencialesycorregirlos(porejemplo,sivamosaobservarconductasagresivas
enniosynadamshemostrabajadoconadultos,nospercataremosdequela
agresinnosemanifiestaigualenadultosqueenniosoadolescentes.Deeste
modo, durante la prueba piloto podemos registrar comportamientos agresivos
no contemplados, que se agregarn como subcategoras en el instrumento de
observacin definitivo). Esto se hace con una muestra del repertorio de
conductasoactosaconsiderar.Conrespectoalaconfiabilidad,recordemosque
debe demostrarse y no asumirse y se determina para evaluar si los

70

observadores estn registrando coherentemente (confiabilidad individual) y si


estn registrando entre s de manera similar los mismos eventos o conductas
(confiabilidad interobservadores). Los procedimientos y las frmulas pueden
ser las mismas que las vistas en el apartado sobre el anlisis de contenido; lo
nicoquecambiaeslapalabracodificadores,codificacin,codificadas,por
observadores,observacin,observadas.Porejemplo:

Haynes (1978, p. 160) proporciona otra frmula para calcular la


confiabilidadentreobservadoresoelgradodeacuerdointerobservadores(Ao).

Donde Ia es el nmero total de acuerdos entre observadores, e Id es el


nmerototaldedesacuerdosentreobservadores.Unacuerdosedefinecomola
codificacin de una unidad de anlisis en una misma categora por distintos
observadores.Seinterpretacomocualquiercoeficientedeconfiabilidad(0al).
Es muy importante al establecer la confiabilidad, evitar que los
observadores copien o vean el trabajo de sus compaeros, ya que esto puede
ocurrir.
Anastas (2005) y Grinnell, Williams y Unrau (2009) consideran como una
confiabilidad interobservadores mnima aceptable 0.85 u 85%. Si se elige un
instrumento ya desarrollado, al igual que en otros mtodos de medicin, debe
demostrarse que en los estudios donde se aplic result vlido y confiable, y
adaptarsealascondicionesdenuestrainvestigacin.

71

Para establecer la validez de contenido, se analiza el dominio de nuestras


categoras y subcategoras contra el universo de posibles conductas que pueden
manifestarse.Lavalidezdecriteriomuchasvecesseestableceusandootratcnica
(por ejemplo, la hostilidad, que se infiere de observar actos agresivos, puede
validarsemedianteunaescalaquemidatalvariable).

2. Llevaracabolacodificacinporobservacin.
3. Vaciarlosdatosdelashojasoformatosdecodificacinyobtenertotalesparacada
categora.
4. Realizarlosanlisisapropiados.

CODIFICACINENELANLISISDECONTENIDOYLAOBSERVACIN
Unavezrecolectadoslosdatosdelanlisisdecontenidoy/olaobservacin,tambin
stosdebencodificarse,esdecir,asignarcdigos(generalmentenumricos)alas
categorasy/osubcategoras.Porejemplo,enelcasodelestudiodeNavesyPoplawsky
(1984),lacodificacineslaquesemuestraenlatabla7.10(quecorrespondealprimer
ejemplodeunformatoderegistroocodificacin,figura7.11).

Tabla7.10EjemplodecodificacinenelcasodelestudiodeNavesyPoplawsky

Cdigos

Columnas

1
2

Alejamiento
Acercamiento
Esttico

Tensin
Relajacin
Ninguno

Alsujeto
Aotraparte
Frasescompletas
Frasesdictomaso
silencios

0
2
1

0
2
1

1
0
1
0

Variable

Categoras

Subcategoras

Tratamiento
experimental
Conducta

Codificador

Grupocultural
Gruposociopsicolgico
Distanciafsica

Movimientoscorporales

Conductavisual

Conductaverbal

72

LRE

1
6
MRM

APY
3
Desdeluego,NavesyPoplawsky(1984)paralascategorasdeconductadeevitacinobtenanesta
codificacincada10segundos(cadaunidaddeanlisis),ysumabanelnmerode2(dos)y1(uno)y
lotransformabanenporcentaje.Aqusuponemosquetodalainteraccinconelsupuestodeficiente
mentalpuedecategorizarseysubcategorizarse.Recordemosqueeran30participantes.

YlamatrizdeSPSSoequivalenteseraladelafigura7.13(desdeluego,solamente
seincluyen10casosamaneradeejemplo).

Figura7.13Matrizovistadelosdatosparalacodificacindelatabla7.10(Navesy
Poplawsky)

RECOPILACINYANLISISDEDATOSSECUNDARIOS

La recopilacin y anlisis de datos secundarios se fundamenta en informacin


disponible recolectada por otras personas distintas al investigador. Esta tcnica para
recabarlosdatospuedesubdividirseen:a)datosestadsticosprovenientesdefuentes
oficialesyb)datosparametaanlisis.Enamboscasosseacudeabasesdeinformacin
quepuedenencontrarseenunaovariasfuentesyquesontilesparalospropsitosdel
estudio. La diferencia entre estos dos tipos estriba en que los primeros recogen

73

estadsticas (tasas de defuncin o mortalidad y nacimiento, nmero de hectreas de


riego,cifrasdeegresoenlosdistintosnivelesdelsistemaescolar,nmerodecamasde
los hospitales, nmero de monumentos histricos, producto interno bruto, nmero de
instalaciones deportivas y clases, as como nmero de cada una y tamao en metros
cuadrados,extensindelareddealcantarillado,ndicedeinflacin,montodeladeuda
externapblicayprivada,etc.).Encambio,elmetaanlisisrecopilaestudiosefectuados
porotrossobreelplanteamientodelproblema,losevalaypuedevolveraanalizarsus
datos e integrarlos en una base mayor de informacin; o bien, adicionarlos y
compararlos.
Krysik(2005)consideratrestiposdedatossecundarios:datosobtenidosdelnivel
micro,datosagregadosydatoscualitativosmicro.

a) Datos obtenidos del nivel micro: derivados de unidades de anlisis individuales


como personas, organizaciones u hogares (nmero de habitantes por vivienda,
nmero de trabajadores de la empresa, preferencias electorales, satisfaccin
laboraldelostrabajadores,etc.).Lamayoradelasveceslosdatosserecolectan
pormediodeencuestas.Porejemplo,loscensoseconmicos(vistosenelcaptulo
deencuestasosurveysdeesteCD)generanestaclasededatos,aligualquelosde
poblacin.
La encuesta nacional de adicciones (implementada anualmente en varios
pases latinoamericanos) es otro caso y recolecta entre otros datos los
siguientes:1

1. Personaseconmicamenteactivasenelsistemafamiliar.
2. Distribucindeltiempolibredelestudiante.
3. Convivenciadelalumnoenelhogar(padresyotrosparientes).
4. Estructuradelsistemamatrimonialdelostutoresdelestudiante(padres
casados,divorciados,separados,etctera).
5. Ocupacindelaspersonaseconmicamenteactivasenelhogar.
6. Persona(s) con quien(es) los estudiantes se comunican ms dentro del
hogar.
1Porejemplo,enMxicolapublicaperidicamenteelConsejoNacionalContralasAdicciones(CONADIC).

74

7. Actividades deportivas del estudiante (tipos y periodicidad de cada


actividaddeportiva,tiemposdededicacin,entreotros).
8. Conducta de fumar (inicio, frecuencia de la conducta de fumar, consumo
diariodecigarrillos).
9. Ingestadealcohol(inicio,periodicidad,consumosemanal).
10. Percepcin proyectiva del consumo de estupefacientes o drogas ilegales
(se responde a la pregunta: A cuntos de tus compaeros de escuela has
vistoconsumirdroga?,acuntosdetusamigos,fueradelaescuela?).
11. Conocimientodeltipodedrogaqueseconsume(cuestionamiento:Seala
ladrogaquesabesconsumenenesteplantelSealaladrogaquesabesse
consumeentuvecindario).
12. Preferencia de consumo en el entorno inmediato por tipo de
estupefaciente(fueradelaescuela).
13. Percepcin del encuestado respecto de si es un problema el consumo de
estupefacientes.
14. Percepcin respecto de si se pueden conseguir las drogas o
estupefacientesdentrodelaescuela.
15. Percepcin respecto de si se consume droga o sustancias ilegales dentro
delaescuela.
16. Percepcinrespectodesielconsumodeestupefacientesesunproblema
ensuentornoexterno.
17. Preferenciadeconsumoportipodeestupefacienteenlaescuela.
18. Actitudanteelconsumodeestupefacientesporunaamistad.
19. Manifestacindehaberconsumidoalgnestupefaciente.
20. Edaddeiniciodeconsumo.
21. Figuraqueinvitaexperimentarelconsumo.
22. Tipodeestupefacienteodrogaconsumidaporprimeravez.
23. Consumodediferentesclasesdeestupefacientes.
24. Preferenciaindividualdeconsumoportipodeestupefaciente.
25. Periodicidaddelconsumo.
26. Motivo(s)delconsumo.

75

27. Acciones recomendadas por los encuestados para reducir el consumo,


evitarlooprevenirlo.
28. Concienciadelconsumodeestupefaciente.
29. Fuentemsimpactantedeconocimientodelproblemasocialqueimplica
elconsumodeestupefacientes.
30. Comentariosabiertos(cualitativo).

Peroelinvestigador,aunquenogenerestosdatos,tieneaccesodirectoaellos(a
la informacin individual y original; a los cuestionarios, registros, etc.) y, por lo tanto,
los puede volver a analizar (incluso a veces puede identificar a los encuestados o sus
perfiles).

b)Datos agregados: Consisten en datos individuales que ya se han procesado y


conjuntado con otros en cifras estadsticas, tablas o cuadros. En stos, las
caractersticas de las unidades de anlisis no pueden ser identificadas (por
ejemplo: el investigador recibe el dato sobre el promedio de satisfaccin laboral
enunaescalaolatasadedesempleoyobviamentenopuedereanalizarlosdatos,
sloutilizarlosparalosfinesqueconvengan).
Estosdatossepuedenobtenerde:

1. Oficinasyagenciasgubernamentalesyoficiales(MinisteriodeEducacin,
Ciencia y Tecnologa de Argentina; Ministerio de Educacin y Ciencia de
Espaa; Direccin de Impuestos y Aduanas Nacionales de Colombia;
Instituto Nacional de Estadstica de Bolivia; Ministerio de Industria,
Turismo, Integracin y Negociaciones de Per; Banco Central de
Venezuela;etctera).
2. Organizaciones privadas (Cmara de Comercio de Santiago de Chile,
Consejo de Fundaciones Privadas de Guatemala, Fundacin Cultural
EspaolaparaelFomentodelaArtesana,CentrodeEstudiosEconmicos
delSectorPrivadoenMxico,FundacinFord,entreotras).
Algunas bases de datos privadas contienen archivos periodsticos, como
por ejemplo: U.S. News Archives on the Web (peridicos en Estados

76

Unidos),ReutersyEuroprensa(UniversidadComplutensedeMadrid),etc.
Los peridicos ms importantes del mundo generalmente poseen su
propiabasededatos.
3. Organizaciones no gubernamentales (Agencia de Cooperacin en
Ingeniera Ambiental o ACIA, Pro Amazonia "Selva Para la Vida", Alianza
Cvica en Mxico, Red 2002 de Barcelona para el apoyo de enfermos de
SIDA,yotras).
4. Organizacionesinternacionales(ComisinEconmicaparaAmricaLatina
y el Caribe; Organizacin de las Naciones Unidas para la Educacin, la
Ciencia y la Cultura, UNESCO; Organizacin Mundial de la Salud, OMS;
FondodelasNacionesUnidasparalaInfancia,UNICEF;FondoMonetario
Internacional,FMI;etctera).

Las primeras tres fuentes genricas varan en cada pas, por lo que
resultara imprctico intentar mencionarlas. Por ello, cada estudiante o
profesor debe tener en mente cules son y qu tipo de informacin pueden
proporcionar.2
Delosdatosresultafundamentalconocer:3

Elnombreylafiliacininstitucionaldequienrecolectlosdatos.
Elperiododerecopilacindelosdatos.
Lamuestra(mtododeseleccin,tamao,caractersticas).
Elmtododerecoleccindelosdatos,incluyendoel
instrumento,procedimiento,confiabilidadyvalidez,etctera.
Localizacin(disponibilidad).

Ydeserposible:

Procedimientosdecodificacin.
Anlisispracticados.
Sugerenciasparaelanlisis.
Para el caso de Espaa recomendamos a Berganza y Garca (2005) y a Corbetta (2003) y la siguiente
pgina
web:
http://www.typicallyspanish.com/html/castellano/sociedad/gobierno/organizaciones_no_gubernament
a
les/. Para las organizaciones no gubernamentales latinoamericanas, por ejemplo, en el caso del medio
ambiente, la siguiente direccin en internet incluye una gran cantidad de ellas:
http://www.ecoportal.net/content/view/
full/158
3
Aplicatambinalosdatosmicro.
2

77


c) Datos cualitativos micro: producidos por una persona y recabados por otra. Al
investigador le llega el dato (cartas recopiladas por otros, transcripciones de
entrevistas hechas por psiclogos, grabaciones de las llamadas de pasajeros que
iban en los aviones secuestrados por terroristas en los atentados a las torres
gemelasdelWorldTradeCenterenNuevaYork,etc.).Talesdatospuedenvolvera
seranalizadosporelinvestigador.
Lasventajasdelosdatossecundariosresidenenquesucostoesgeneralmente
elmsbaratodetodoslosmtodosderecoleccinyavecessonlanicaopcin
para el investigador (Smith, 2008; Sieppert, McMurtry y McClelland, 2005),
adems pueden replicarse estudios con base en ellos. Gran cantidad de datos
secundarios se localiza mediante internet. Sus desventajas potenciales consisten
en que a veces no son accesibles, no estn estandarizados, pueden haberse
omitidovariablesimportantesparanuestroestudioyesfactiblequedenunafalsa
impresindeciertossubgrupos(lospromediosdeingresonacionalpercpita,por
ejemplo,suelenresultarengaosos).
Elprocesoparautilizardatossecundariosenunainvestigacinseresumeenla
figura7.14,adaptadodeSieppertetal.(2005)yKrysik(2005).

78

Analizarlarelacinentreel
planteamientodelproblemay
losdatossecundarios:

Sonpertinentesparael
estudio?
Representan
adecuadamenteuna
operacionalizacindenuestras
variables?

Prepararlosdatosparasu
anlisis.

Evaluarlacalidaddelosdatos:

Muestra
Confiabilidad
Validez
Mtododerecoleccin
Fuentedeorigen

Enelcasodedatos
estadsticos,verificarlos
preferentementeenalmenos
dosfuentesconfiables
(validacincruzada).

Figura7.14Procesoesencialparautilizardatossecundarios

ParaelmanejodearchivosserecomiendaconsultaraWebb,CampbellySchwartz
(2000).

Elmetaanlisis
Esta clase de procedimiento de recoleccin y anlisis de los datos implica sintetizar
resultados de investigacin por medio de un nmero de estudios que consideran el
mismoplanteamientoyvariables(WiersmayJurs,2008).
Los pasos de un metaanlisis son muy similares a los de otros estudios, con la
salvedad de que ahora la unidad de anlisis ya no es el participante o caso, sino la
investigacinrealizadaporotro(s)investigador(es).Elretoesresumirlosdatosapartir
delosdiferentesestudiosdemaneramuybienestructurada,queeviteerroresyfacilite
suulterioranlisis.
Cabesealarqueelmetaanlisissermsprecisoentremshomogneosseanlos
estudiosqueseconsideran,encuantoalapreguntadeinvestigacin,variables,mtodo,
instrumentosdemedicinyanlisisestadstico.Porlotanto,elprimerpasoconsisteen
ponderarsiesposiblecombinarlos(nosreferimosnicamenteaestudioscuantitativos).

79

Tal consideracin nos puede llevar a un sinfn de opciones, desde descubrir que hay
varios estudios que son totalmente compatibles y pueden mezclarse, hasta contrastar,
aquellosqueslotienenuntemensuscuestionariosquenosseadeutilidad.
Existen diferentes propuestas para conjuntar estadsticamente los resultados de
distintos estudios, destacan tres fundamentalmente, que se conocen con el nombre de
modelodeefectosfijos,modelodeefectosaleatoriosy,porltimo,elmodelobayesiano
(Molinero,2003).
En el modelo de efectos fijos, los estudios se combinan y se asume que no existe
heterogeneidad entre ellos, que por lo tanto todos constituyen estimaciones de un
efecto real, cuya magnitud se desea conocer. As pues, la inferencia realizada se
condicionaalosestudiosefectuados.

En el modelo de efectos aleatorios la inferencia se fundamenta en suponer que los


estudios incluidos en el anlisis constituyen una muestra aleatoria del universo de
estudios posibles, y sus resultados son ms conservadores al tener en cuenta una
fuente extra de variacin, ya que se incluyen dos fuentes de variacin potenciales: la
existentedentrodelosestudiosylavariacinentrelosestudios(Molinero,2003,p.3).

Lautilizacindemodelosbayesianosrequieredemodelosestadsticoscomplejos
devarianza.
El metaanlisis constituye un intento de resolver contradicciones entre los
resultados de diferentes investigaciones y evaluar patrones comunes en distintos
estudios.Esunmtodosumamenteimportanteparagenerarteora.
Como todo mtodo inferencial, tiene sus problemas y limitaciones. Uno de los
principales problemas es que al ser un estudio que generalmente se ejecuta de forma
retrospectiva, tiene una posibilidad mayor de introducir sesgos (error sistemtico).
Otros retos son los que se derivan del procedimiento de combinar datos de mltiples
estudios, entre los cuales pudiera haber diferencias en cuanto a mtodo y muestreo
(Smith,2008).
El procedimiento general de un metaanlisis es similar al de los datos
secundarios,peroseagreganalgunoselementoscomoelanlisismismo(figura7.15).

80

Evaluarsiel
metaanlisispuede
responderal

planteamientodel
problema

Definirloscriteriosde
seleccindelosestudios
quedebenserincluidos
enelanlisis(criteriosde
inclusinyexclusin)

Analizarlarelacinentreel
planteamientodelproblemaylos
estudios:

Sonpertinenteslosestudiospara
lainvestigacinplanteada?
Qutanhomogneoso
heterogneosresultanyenqus
puedenconjuntarseyenquno?

Prepararlos

datosparasu

anlisis

Seleccionarlosestudios
quehabrndeincluirse

Analizarlos

datos

a)Elegirlosaspectos,dimensiones
y/ovariablesenlascualesvana
conjuntarseocompararse.
b)Evaluarlacalidaddelosestudios:
Muestra
Confiabilidad
Validez
Mtododerecoleccin
Fuentedeorigen

Otrosparmetros:veaelltimo
captulodelCD

Figura7.15Procesoesencialdelmetaanlisis

AlgunasrecomendacionesparaelmetaanlisislasproporcionanCspedes(1995)
yHarpe(2009):

1. Seleccionarinvestigadoresindependientesquelean,clasifiquen,codifiquen,
cuantifiquen y finalmente evalen y elijan el grupo de estudios que sern
incluidosenelmetaanlisis(MA).
2. Elaborar una gua de los datos que deben ser recolectados de los estudios
escogidosparaserprocesadosenelMA.
3. Combinar los resultados obtenidos y asegurar la calidad de los datos y su
procesamientoestadsticoadecuado.
4. Preferentementeutilizardatosprovenientesdemuestrasaleatorias.

81


El anlisis estadstico general para el modelo de efectos fijos (no existe hetero
geneidad, hay homogeneidad o las investigaciones que se estiman muestran un efecto
uniforme, debido al uso de un mismo tratamiento), se utiliza el mtodo de Mantel
HaentzelPeto.
Si los estudios son heterogneos al mostrar el efecto ante un tratamiento
(modelo de efectos aleatorios), se utiliza el mtodo de CochranDersimonianLaird
(Cspedes,1995).
En general, se obtiene para las estadsticas calculadas, el tamao del efecto
(Nugent,2009,WiersmayJurs,2008,yGlass,1976),elcualserevisenelcaptulo10
dellibro.Recordamosqueesunamedidadelafuerzadeladiferenciadelasmediasu
otros valores considerados (Creswell, 2005). Resulta ser una medida en unidades de
desviacinestndar.Suclculofueejemplificadoconlapruebat.
Existendiversosprogramascomputacionalesparaelmetaanlisis,entreloscuales
seencuentranlossiguientes:

EasyMA[M.Cucherat].Lyon,France:
UniversityofLyon.http://www.spc.univlyon1.fr/~mcu/easyma

RevMan: The Cochrane Collaborations Review Manager. The Cochrane


Collaboration:http://www.ccims.net/RevMan

BUGSyWinBUGS:http://www.mrcbsu.cam.ac.uk/bugs

SAS (programa ya comentado, en su pgina existe un programa para


metaanlisis).http://www.sas.com

STATA.http://www.stata.com

MetaWin:http://www.metawinsoft.com

Y otros muchos que puede buscar va disparador (o motor de bsqueda) en

internet. Recuerde que las direcciones electrnicas pueden cambiar en cualquier


momento.

82

EJEMPLOSDEESTUDIOS
BASADOSENDATOSSECUNDARIOS
Shuli et al. (2008) efectuaron una investigacin para desarrollar un modelo que
predijeralapermanenciadepersonasancianasensuhogar(enlugardeacudiraasilos,
por ejemplo), utilizando datos secundarios de 9879 individuos de la base de datos
pblicadeEstadosUnidos:TheNationalHomeandHospiceCareSurvey2000(NHHCS
2000). Descubrieron que el principal predictor de la permanencia es que la persona
viva con familiares. Asimismo, Smith (2009) se fundament en anlisis de datos
secundariosparaestudiarlasinequidadesenlaeducacinbritnica,especficamentela
exclusindeescuelas.
Hernndez Sampieri et al. (2008) realizaron un estudio de mercado utilizando
datossecundariosconlafinalidaddeindagarsobrelaconvenienciadeabrirclnicasde
cirugaestticayplsticaenMxico.Buscandoendiversasfuentesdeinternet,medios
impresos(revistasydiariosdecirculacinnacional)ybasesdedatos,lograronubicara
lasprincipalesclnicasqueoperabananivelnacionalyenlasregionesyciudadesms
pobladas del pas (Ciudad de Mxico, Monterrey, Guadalajara, Tijuana, Puebla),
establecer los precios de sus servicios, determinar el mercado potencial y sus
caractersticas (por ejemplo, nmero de cirugas que se practicaron durante el ltimo
ao, inters por practicarse una ciruga plstica, preocupacin por la esttica
personal),evaluarlasapelacionesdesupublicidadyotrascuestiones.Haberrealizado
unaencuestahubierasidomspreciso,perotambinmscostoso,detalmodoquese
hizounainvestigacindeacuerdoconelpresupuestodelinversionistaespaol.Incluso
le proveyeron de un anlisis del marco jurdico mexicano para abrir y operar tales
clnicas.

Estudioparaeldiagnsticomunicipal
En las anteriores ediciones de esta obra, se integraba un ejemplo para diagnosticar y
caracterizar a un municipio, con el fin ltimo de elaborar su plan de desarrollo.
Regularmente estos diagnsticos son estudios mixtos, pero una parte muy importante
de sus insumos lo constituyen los datos secundarios, que se generan con base en
indicadores,loscualessehandesarrolladopordiferentesorganizacionesdedicadasala

83

investigacin municipal (por ejemplo: el Instituto Vasco de Estadstica; el Centro de


InvestigacinyDesarrolloEconmicodeMxico(CIDE);elInstitutodeEstadsticadela
Comunidad de Madrid; el Sistema Nacional de Indicadores Municipales (SINIM) de la
Unidad de Informacin Municipal del Gobierno de Chile; el Instituto Nacional de
Estadstica, Geografa e Informtica en Mxico (INEGI); el Instituto Brasileiro de
GeografiaeEstadstica;elSistemaNacionaldeInformacinMunicipal,CEDEMUN,dela
Secretara de Gobernacin de Mxico; la Federacin Nacional de Departamentos de
Colombia;elDepartamentodeEstadsticadelAyuntamientodeBarcelona;etctera).
Algunosindicadoresseaplicanacualquiermunicipioysonrelevantesparatodas
lasentidadespoblacionales(nmerodehabitantes,ingresopercpita,ingresostotales
del municipio, gasto total del municipio, inversin total, etc.), mientras que otros
indicadores resultan importantes slo para ciertos municipios (por ejemplo, los
indicadores relativos a la produccin agrcola son irrelevantes para un municipio
completamente urbano). Por ello, en cada diagnstico municipal deben elegirse los
indicadores(datossecundarios)significativosparalaentidadencuestin.
Tambin,cadaprovincia,departamento,reginoestadogeneraindicadoresasu
nivel;lomismoquelasnaciones.
En este CD: Material complementario Documentos Documento 1:
Indicadores, se incluyen ejemplos de indicadores secundarios municipales que
pudieran recolectarse para un diagnstico de un municipio, con el fin de que los
estudiantes que apenas comienzan en estos menesteres de la metodologa de la
investigacin los puedan comprender sin mayores complicaciones (se cubren unas
cuantasreas,perodesdeluego,noensutotalidadnimuchomenos).Nosonlosnicos,
ya que hay miles de ellos. Estn agrupados por reas generales (las cuales tambin
pueden fluctuar segn el autor u otros criterios). Determinados indicadores pueden
formar parte de dos o ms reas. Sin polemizar (porque cuando se sopesan pueden
generar discusiones severas), se presentan a continuacin como muestras de datos
secundarios y fueron en particular desarrollados para un municipio del Estado de
Mxico,Mxico.Serainteresantecomoejercicioqueencadainstitucinsepropusieran
losqueseranlosmsadecuadosparasumunicipio.

84

Erroresenlasmediciones
Esta parte se escribe porque es una pregunta que se nos ha hecho constantemente
sobrelostiposdeerroresenlamedicin.
Encualquierinstrumentodemedicinsetieneungradodeerror(recordemoslo
sealadoenelcaptulo9dellibroyaliniciodeestecaptulo).
Imaginemos que realizamos la evaluacin de la autoestima en un grupo de
estudiantes.Silamidoundaylavuelvoamediraldasiguiente,yposteriormenteala
semana;podemosesperarquelaspuntuacionesseanlasmismasenlastresmediciones.
Laautoestima comootrosatributosno varan a travs del tiempo,a menos que algo
los haga variar (un estmulo, la maduracin de la persona, un suceso de vida, entre
otros).Esdecir,silosestudiantesobtuvieronpuntuacionesdiferentesenlaspruebas,su
desempeosedebialainfluenciadeotromotivodistintoasupropiaautoestima.Estas
otras razones provocan error. El grado en que un instrumento se encuentra libre de
error indica su confiabilidad. Entre ms fiable resulta un instrumento, el investigador
puedeacercarseaunaverdaderaestimacindelatributoconsiderado.Talexactitudse
obtienealminimizarlasfuentesdeerrorenlamedidadeloposibleyconlaestimacin
del grado de error que permanece. Pues bien, hay dos tipos de errores que pueden
ocurrir: sistemticos y no sistemticos. Los primeros maximizan o minimizan el
desempeodeuninstrumentoyafectanalavalidez(Mertens,2005).Enelejemplode
laautoestima,unmtodoparadesarrollarlaofortalecerla(porejemplo,motivacionalo
teraputico)puedeservistocomounainfluenciasistemticaenlavariableoatributo.El
efectodelerrorsistemticoenlasrespuestasesconstanteypuedepredecirse.Perolos
errores no sistemticos (que conciernen a los investigadores) varan de situacin en
situacin (aplicaciones distintas) y en consecuencia no pueden predecirse (o es
sumamentecomplejo),perosprevenirse.
Estos errores pueden caer en tres categoras: a) personales (dependen de cada
individuo, como el estrs, el cansancio o la motivacin), b) condiciones de
administracin del instrumento (instrucciones distintas a los respondientes,
temperaturaambiental,lenguaje,etc.)yc)modificacionesenlosinstrumentosotareas
(por ejemplo, cambios en tems o las conductas a observar). Normalmente, la
confiabilidad es calculada mediante una estadstica que compara el desempeo de los
mismosindividuosentiemposdiferentesopartesdistintasdelinstrumentoyqueoscila

85

entreceroyuno,sufinesprecisamenteayudaralinvestigadoraidentificarelgradode
errorquesepresentaenlamedicin,ensuconsistenciainterna;mediantelafiabilidady
unanlisisdelinvestigadorsedebenhacertransparenteslasfuentesdeerror.

BIBLIOGRAFA

Gall , M. D., Gall, J. P. y Borg, W. R. (2003). Educational research: An introduction (7a.


Ed.).Boston,MA,EE.UU.:AllynandBacon.
Lopez S. J. y Snyder, C. R. (2003). Positive psychological assessment : A handbook of
modelsandmeasures.Washington,DC,EE.UU.:AmericanPsychologicalAssociation.
Roid, G. H. (2003). StanfordBinet intelligence scales (5a. Ed.). Itasca, IL, EE. UU.:
RiversidePublishing.
Weller, S. C. y Romney, A. (1990). Metric scaling: correspondence analysis. Thousand
Oaks,CA,EE.UU.:Sage.

86