Вы находитесь на странице: 1из 58

Diseos experimentales

y cuasiexperimentales
en la investigacin social

Donald T. Cartipbell
Julian C. Stanley

Amorrortu editores
Buenos Aires

, ---- .
,

r1 1 1:1 1
BIBLIg I
- '
,.:.: . ' u N.!;-: .

001.434 CAMci
Disenosexperimentales
172
1 ./

laiii i i i i i11111111111111111101 11111


Material disponible en los Servicios del CECSo
www.serviciosdelcecso.blogspot.com / sercecso@fcs.edu.uy
Por trabajos: pedidosercecso@gmail.com
Cantina & Cafetera: 2410 6720 (220)
Fotocopiadora: 2410 6720 (208 / 218)
2. El problema y sus antecedentes gualados por azar. As como se puede lograr la representa-
. ividad por el mtodo aleatorio ( . ) tambin se puede
conseguir la equivalencia por el mismo medio, siempre que
el nmero de sujetos que hayan de utilizarse sea lo suficien-
temente grande (pg. 41). Tambin en otro punto se anti-
cip a Fisher: la introduccin del diseo del cuadrado latino
con el rtulo de experimento rotatorio, que por otra parte
McCall como modelo haban utilizado ya Thorndike, McCall y Chapman [1916],
tanto en formas 5 X 5 como 2 X 2, unos 10 aos antes de
En 1923, W. A. McCall public un libro titulado How to que Fisher [1926] lo incorporase de modo sistemtico a su
. (Pmo, experimentar en educacin).
experiment in educ-a-iion esquema de diseo experimental con aleatorizacin. 2
Nuestro propsito es exponer aqu en forma actiiiraa los La forma en que McCall utiliza el experimento rotatorio
intereses indicados y las consideraciones apuntadas en dicha ilustra muy bien el nfasis tanto de su obra como de la pre-
obra; comenzaremos, pues, formulando una evaluacin acerca sente. El experimento rotatorio se introduce, no por razones
(d ella. Deca McCall en su introduccin: Hay excelentes - de eficiencia, sino ms bien para lograr algn control cuando
libros y tratados que exponen el manejo estadstico de datos Lno es posible la asignacin aleatoria a grupos equivalentes.
experimentales, pero muy pocos acerca de cmo obtener datos Con una intencin similar examinaremos aqu las imperfec-

I adecuados y correctos a los cuales poder aplicar el procedi-


miento estadstico. Este enunciado contina siendo hoy tan
, cierto que bien puede servirnos de leitmotiv. Aunque la
`-lhfluencia de la corriente fisheriana remedi la situacin en
algunos aspectos fundamentales, su efecto ms conspicuo
ciones de muchos programas experimentales, abogando no
obstante por su aplicacin en aquellas configuraciones en que
no haya modo de recurrir a mejores diseos experimentales.
- En este sentido, la mayor parte de los diseos analizados, in-

,- cluso el experimento rotatorio no aleatorizado, se denomi-


parece haber sido el de afinar y perfeccionar el anlisis esta- nan diseos cuasiexperimentales.
dstico, ms que el de ayudar a conseguir datos adecuados y
correctos.
Quiz por su orientacin prctica y sentido comn, y porque
no pretende constituir un aporte capital, el libro de McCall La desilusin provocada por los experimentos llevados a cabo
representa un clsico insuficientemente valorado todava. en el campo de la educacin
Cuando apareci, dos arios antes de la primera edicin de f-
Statistical methods for research workers (Mtodos estadsticos En esta obra nos declaramos partidarios del mtodo experi-
para investigadores), de Fisher [1925], no haba nada com- mental como nico medio de zanjar las disputas relativas a
parable cualitativamente a l en el mbito de la agricultura ni la prctica educacional, nica forma de verificar adelantos en
en el de la psicologa. Se anticip en varios puntos fundamen- el campo pedaggico y nico mtodo para acumular un saber
tales a las metodologas ortodoxas de esas dos ciencias. Acaso al cual puedan introducrsele mejoras sin correr el peligro de
la ms importante de las contribuciones de Fisher haya sido la que se descarten caprichosamente los conocimientos ya adqui-
idea de formular la igualacin preexperimental de grupos por ridos a cambio de novedades de inferior calidad. Sin embargo,
aleatorizacin. con nuestra enrgica defensa de la experimentacin no pre-
Esta idea, y el consecuente rechazo de la tentativa de llegar tendemos significar que este nfasis sea nuevo. Como lo ma-
a tal igualacin por equiparacin (pese a su intuitiva atraccin nifiesta la existencia misma del libro de McCall, 'en tiempos
y potencialidad de error), no mereci fcilmente la aproba- de Thorndike una ola de entusiasmo experimental recorra el
cin de los investigadores del mbito educacional. En 1923, mbito de la educacin, alcanzando quiz su punto culminante
[McCall haba comprendido cules eran los elementos cua- 2 Kendall y Buckland [1957] afirman que el cuadrado latino fue in-
-7--- 'litativos fundamentales del problema. Dio, como primer m-
ventado por el matemtico Euler en 1782. Thorndike, Chapman y
'todo para establecer grupos comparables, el de los grupos McCall no utilizan esta expresin.

lo 11
en la dcada del veinte. Aquel entusiasmo se convirti des- de nuestra ciencia est constituida de tal manera que hay en ella
pus en apata y rechazo, as como en la adopcin de nuevas muchas ms respuestas errneas que correctas, cabe prever el
doctrinas psicolgicas no susceptibles de verificacin experi- fracaso de la mayor parte de los experimentos. Hay que inmu-
mental. Good y Scates [1954, pgs. 716-21] han documen- nizar, pues, de algn modo a los jvenes investigadores contra
tado un pesimismo general, que se retrotrae quizs a 1935, ese resultado y, en general, justificar ante ellos/la experimen-
y citan incluso a Monroe [1938], aquel decidido defensor de tacin sobre fundamentos ms realistas: no como una panacea,
la experimentacin controlada nos han desilusionado. Cabe pero s como el nico camino hacia el progreso acumulativo.
destacar, adems, que el trnsito de la experimentacin a la Tenemos que inculcar en nuestros discpulos la expectativa
redaccin de ensayos, acompaado a menudo por una con- del tedio y la decepcin, y el deber de la tenaz persistencia,
versin del conductismo tipo Thorndike a la psicologa de la actitudes ambas que con tanto xito se ha logrado implantar
guestalt o al psicoanlisis, se produjo con frecuencia en per- ya en las ciencias biolgicas y fsico-naturales. /Hay que am-
sonas que contaban con una buena formacin en la tradicin pliar el voto de pobreza de nuestros alumnos, de modo que
experimental. no solo se avengan a trabajar con insuficientes recursos finan-
Para evitar que se repita este desencanto, debemos conocer cieros sino a admitir la insuficiencia de sus resultados expe-
los orgenes de la reaccin anterior, procurando sortear las rimentales.
s, falsas expectativas que condujeron a ella. Merecen destacarse 1,-M
- s concretamente: debemos ensanchar nuestra perspectiva
varios aspectos. Ante todo, se pretendi asignar a los resulta- temporal, y reconocer que la experimentacin continua y ml-
'. dos de la experimentacin un cierto ritmo y grado exagerado tiple
tiple es ms propia de la actividad cientfica que los experi-
mentos nicos y'definitivos. Las pruebas que realizamos hoy,
1 de progreso, al par que se menospreciaba injustificadamente el
conocimiento no experimental. Los primeros defensores supu- si llegan a tener xito, exigirn repeticin y validaciones cru-
sieron que el progreso en la tecnologa pedaggica haba sido zadas en otros momentos y en otras condiciones antes de con-
lento solo porque no se haba aplicado a ella el sistema cient- :: vertirse en adquisicin estable para el acervo cientfico y ser
fico: crean que la prctica tradicional era ineficaz solo por- susceptibles de segura interpretacin terica. Adems, aun
\.que no haba sido fruto de la experimentacin. Cuando se cuando reconocemos que la experimentacin es el lenguaje fun-
)demostr que los experimentos eran a menudo tediosos, equ- damental de la demostracin y el nico tribunal decisivo para
vocos, de reiterabilidad insegura y ratificadores, por lo comn, resolver los desacuerdos entre posibles teoras rivales, no es
de conocimientos precientficos, los fundamentos excesivamen- previsible que los experimentos cruciales que contrapongan
te optimistas con que se haba querido justificar la experimen- a las teoras opuestas vayan a producir resultados claramente
tacin quedaron minados 'por la base, y al primitivo entusias- definitorios. Cuando se descubra, por ejemplo, que observa-
Lmo sucedi el desilusionado abandono. - dores competentes sustentan puntos de vista muy dispares en-
Aquella sensacin era compartida tanto por los observadores tre s, ser razonable suponer a priori que ambos habrn encon-
como por los propios involucrados. Entre los experimenta- trado algo vlido sobre la situacin estudiada, y que ambos
dores se adverta una innegable aversin hacia la expe- representarn una parte de la verdad completa. Cuanto mayor
rimentacin. Para el investigador normal, muy motivado, el sea la controversia, ms probable ser que as ocurra. Pode-
hecho de que una de las hiptesis que sustenta no sea confir- mos, pues, esperar en tales casos un resultado experimental
mada resulta por dems doloroso. Como animal biolgico y de carcter mixto, o con sutiles variaciones en el saldo de ver-
psicolgico, est sujeto a leyes de aprendizaje que lo conducen dad entre una prueba y otra. La posicin ms sensata lo-
inevitablemente a asociar este dolor con los estmulos y acon- grada en gran parte por la psicologa experimental (por ejem-
tecimientos inmediatos. No es extrao, pues, que tales est- plo, Underwood, 1957b ) evita los experimentos cruciales,
mulos estn constituidos por el mismo proceso experimental reemplazndolos por relaciones e interacciones dimensionales
de- modo ms vvido y directo que la verdadera fuente de la a lo largo de muchas gradaciones diversas de las variables.
frustracin, a saber: la inadecuada teora. Una situacin tal ^Tampoco hay que olvidar los muy perfeccionados procedimien-
puede inducir, inconscientemente quizs, a evitar o rechazar tos estadsticos que en poca reciente se han ido introduciendo
el proceso experimental. Si, como parece probable, la ecologa poco a poco en la psicologa y la educacin. Durante su perodo
-

12 13
glos se han ensayado muchos enfoques distintos, si de ellos
algunos han obtenido mejores resultados que otros y los que
de mayor actividad, la experimentacin educacional avanz mejor funcionaban es de suponer que habrn sido los aplica-
' lentamente, empleando medios y procedimientos burdos. dos con mayor persistencia por sus creadores, imitados por
McCall [1923] y sus contemporneos realizaron investigacio- otros y trasmitidos a las generaciones siguientes, las costum-
nes en las cuales se estudiaba una sola variable por vez. Para bres resultantes de todo ello pueden representar un valioso y
la enorme complejidad que caracteriza las situaciones de apren- probado subconjunto de todas las prcticas posibles.
dizaje humano, aquello resultaba demasiado lento. Hoy se sabe
la gran importancia que pueden asumir diversas contingencias, " P ero el punto de corte selectivo de esta evolucin se torna
muy impreciso cuando se lo traslada a la realidad. Las condi-
dependientes de la accin conjunta de dos o ms variables ciones de observacin, tanto fsicas como psicolgicas, distan
experimentales. Stanley [1957a, 1960, 1961b, 1961c, 1962], mucho de ser ptimas. Lo que sobrevive o se retiene queda
Stanley y Wiley [1962] y otros han destacado la imperiosa en gran parte determinado por el azar. Es aqu donde la expe-
necesidad de evaluar tales interacciones. rimentacin demuestra la importancia del proceso de prueba,
-
Los experimentos pueden incluir algunas variables en cual- exploracin y seleccin. No se contempla, pues, la experimen-
quiera de dos sentidos o en ambos a la vez. Por ejemplo, in- tacin en s misma como fuente de ideas necesariamente con-
corporando al diseo ms de una variable independiente tradictorias con relacin al saber tradicional, sino ms bien
(sexo, grado escolar, mtodo con que se ensea aritmtica, como mecanismo de refinacin superpuesto a las acumulacio-
estilo y tamao de los tipos de imprenta, etc.), y/o emplean- nes probablemente valiosas de la prctica sensata. Propugnar,
do ms de una variable dependiente (nmero de errores, pues, una ciencia experimental de la educacin no implica re-
velocidad, diversas pruebas, etc.). Los procedimientos de pudiar el saber tradicional.
Fisher .son multivariados_ en el primer sentido y univariados Algunos lectores abrigarn tal vez la sospecha de que la ana-
en el segundo-. Etdstiais matemticos como Roy y Gnana- loga con el esquema evolutivo darwiniano se complique con
desikan [1959] tratan de encontrar diseos y anlisis que factores de carcter especficamente humano. Cuando Juan
unifiquen ambas formas de diseos multivariados. Tal vez per- Prez, director de escuela, tiene que decidir entre adoptar un
maneciendo alertas a la evolucin de tales diseos puedan los libro de texto modificado o continuar con la versin anterior,
investigadores en el campo de la educacin reducir la brecha, es probable que haga su eleccin fundndose en datos insu-
por lo comn demasiado amplia, entre la exposicin en la li- ficientes. Aparte de la eficiencia misma para la enseanza y
teratura especializada de un procedimiento estadstico y su el aprendizaje, son muchas las consideraciones que habr de
aplicacin prctica a investigaciones de envergadura. tomar en cuenta. El director har lo correcto en una de estas
No cabe duda de que una capacitacin ms a fondo de los dos formas posibles: reteniendo el libro antiguo cuando sea tan
investigadores educacionales en tcnicas modernas de estads- bueno o mejor que el revisado, o adoptando este ltimo cuan-
tica experimental permitira elevar la calidad de la experimen- do sea superior al primero. Pero puede equivocarse tambin
tacin pedaggica. de dos maneras: reteniendo el libro antiguo cuando el nuevo
es mejor, o adoptando este cuando no es superior al primero.
En cada una de las dos elecciones errneas es de suponer que
Concepcin evolutiva sobre la ciencia y la acumulacin se producirn inconvenientes diversos: 1) mayor costo finan-
de conocimientos ciero y de gasto de energas; 2) costo para el director, en for-
ma de quejas de los maestros, padres y miembros del consejo
Como fundamento de lo expuesto en los prrafos precedentes escolar; 3) costo para los maestros, los alumnos y la sociedad
y lo que se expondr en los que siguen sealamos una con- a causa de una peor instruccin. Estos costos, evaluados en
cepcin evolutiva del conocimiento [Campbell, 1959], segn trminos de dinero, energa, confusin, menor aprendizaje y
la cual la aplicacin prctica y el conocimiento cientfico son mayor riesgo personal, deben sopesarse frente A la probabili-
el resultado de la acumulacin de ciertas tentativas seleccio- dad de que se produzca cada una de dichas alternativas, as
nadas y remanentes del caudal de observaciones recogidas por como la de que se detecte el error mismo. Si el director toma
,la experiencialEsta concepcin inspira gran respeto por la tra-
T`dicin en la prctica pedaggica.
pi en el trascurso de los si-
15
14
su decisin sin suficientes elementos de juicio, fruto de una tro ideal lo constituye la seleccin de diseos ricos en una y
investigacin a fondo, sobre el costo 3 (peor instruccin), es otra validez. As ocurre, particularmente, respecto de la in-
posible que exagere los costos 1 y 2. Los naipes vienen bara- vestigacin sobre mtodos de enseanza, donde el desidertum
jados en favor de un criterio conservador: manteher el libro ser la generalizacin a situaciones prcticas de carcter cono-
antiguo durante un ario ms. Cabe, sin embargo, tratar de pre- cido. Tanto las distinciones como las relaciones entre estos
parar un experimento con ambos libros a la vez, de acuerdo dos tipos de consideraciones de validez irn hacindose ms
con un esquema de teora de la decisin [Chernoff s Moses, explcitas a medida que se las ilustre durante la exposicin
1959], y adoptar una resolucin que tome explcitamente en rie diseos especficos_ _ _
cuenta los diversos costos y probabilidades. Cmo conseguir dacin a la validez interna, presentaremos ocho clases
que las cuidadosas deliberaciones de un excelente administra- as de variables externas que, de no controlrselas en el
dor educativo se aproximen a este modelo de teora de la experimental, podran generar efectosque se confun-
decisin es un grave problema, cuyo estudio bien vale la pena con el del estmulo experimental. Constituyen los efec-
encarar.

r--- itfl.) Historia, los acontecimientos especficos ocurridos entre la


1 Factores que atentan contra la validez tanto
: primera y la segunda medicin, adems de la variable expe-
1.,interna como externa rimental.
. Maduracin, procesos internos de los participantes, que
En los prximos captulos de esta obra se describen doce fac- operan como resultado del mero paso del tiempo (no son pe-
i tores que amenazan la validez de varios diseos experimen-
tales. 3 Cada uno de dichos factores se explicar con todo detalle
culiares de los acontecimientos en cuestin), y que incluyen el
aumento de la edad, el hambre, el cansancio y similares.
- al exponer los diseos a propsito de los cuales constituye un 3. Administracin de tests, el influjo que la administracin
problema particular; diez de los diecisis diseos se presenta- 1
, e un test ejerce sobre los resultados de otro posterior.
rn antes de completarse la lista. A fin de lograr una perspec- 4. Instrumentacin, los cambios en los instrumentos de me-
tiva ms clara sera conveniente, sin embargo, que demos icin o en los observadores o calificadores participantes que
una lista de dichos factores, as como una gua general acerca pueden producir variaciones en las mediciones que se obten-
de los cuadros 1, 2 y 3, que resumen parcialmente el anlisis. 1 gn.
Es fundamental a este respecto distinguir bien entre validez
interna y validez externa. Llamamos
validez interna a
r -5 ) Regresin estadstica, opera all donde se han seleccionado
! ros grupos sobre la base de sus puntajes extremos.
ma impfscindible, sin la cual es imposible interpretarlaelmni-
mo- G Sesgos resultantes en una seleccin daerencial de partici-
delo: Introducan, en realidad, una diferencia los tratamien- ; pantes para los grupos de comparacin.
tos empricos en este caso experimental concreto? Por su 1._,..,,) Mortalidad experimental, o diferencia en la prdida de
'1"P-
parte la validez externa , participantes de los grupos de comparacin.
Wad de generalizacin:
plantea el interrogante de la posibili
A qu poblaciones, situaciones, vara. ,5. , Interaccin entre la seleccin y la maduracin, etc., en al-
V8)
tbles de tratamiento y variables de medicin puede generali 7: gunos de los diseos cuasiexperimentales de grupo mltiple,
1 zarse este efecto? Ambos criterios son sin duda importantes,
II-aunque . como el i0, se confunde con el efecto de la variable experi-
con frecuencia se contrapongan, en el sentido de que Lmental ( es decir, que podra tomarse por l).
(
ciertos aspectos que favorecen a uno de ellos perjudican al
; otro. Si bien la validez interna es el
tin de la validez externa,
1 tiva, nunca se puede responder
sine qua non, y a la cues-
como a la de la inferencia induc-
llosvidad,
factores que amenazan la validez externa o representati-
y que vamos a analizar aqu, son:
plenamente, es obvio que nues- - 1
9. El efecto reactivo o de interaccin de las pruebas, cuando
3 Gran parte de esta exposicin se funda en Campbell [1957J. En un pretest podra aumentar o disminuir la sensibilidad o la
general, no se harn referencias particulares a esta fuente. calidad de la reaccin del participante a la variable experimen-

16
17
tal, haciendo que los resultados obtenidos para una poblacin
con pretest no fueran representativos de los efectos de la va- 3. Tres diseos preexperimentale. s
riable experimental para el conjunto sin pretest del cual se
seleccionaron los participantes experimentales.
10. Los efectos de interaccin de los sesgos de seleccin y la
variable experimental.
11. Efectos reactivos de los dispositivos experimentales,
que impediran hacer extensivo el efecto de la variable ex- `. 1. Estudio de caso con una sola medicin
perimental a las personas expuestas a ella en una situacin no
experimental. Gran parte de las investigaciones actuales sobre educacin se
12. Interferencias de los tratamientos mltiples, que pueden ajustan a un diseo en el cual se estudia un solo grupo cada
: producirse cuando se apliquen tratamientos mltiples a los vez, despus de someterlo a la accin de algn agente o trata-
1 mismos participantes, pues suelen persistir los efectos de tra- miento que se presuma capaz de provocar un cambio. Estos
tamientos anteriores. Este es un problema particular de los estudios podran diagramarse de la siguiente forma:
:diseos de un solo grupo de tipo 8 o 9.
_
En la presentacin de los diseos experimentales se adopta- X O
rn un cdigo y unos smbolos grficos uniformes, a fin de
compendiar la mayora, si no la totalidad, de sus caractersticas FTComo ya se ha destacado [p. ej., Boring, 1954; Stouffer,
raistintivas. UnarX representar la exposicin del grupo. a una 1949], tales estudios adolecen de tan absoluta falta de con-
variable o acontecimiento experimental, cuyos efectos se han urol que su valor cientfico es casi nulo. Presentamos este
de medir ( ;har referencia a algn Proceso particular de ob- diseo como punto mnimo de referencia. No obstante, a cau-
servacin o medicin; las X y O en una fila dada se aplican - sa de la continua inversin en esta clase de estudios y de la
! a las mismas personas especficas: La dimensin representada extraccin de inferencias causales de ellos, ser imprescin-
de izquierda a derecha indica el orden temporal, en tant) dible formular alguno que otro comentario. El proceso de com-
que las X y O dispuestas en forma vertical sealan la presen- paracin, de registro de diferencias o de contrastes es funda-
cia de simultaneidad. Para hacer ciertas distinciones impor- mental para la comprobacin cientfica (y para todos los pro-
tantes, como entre los diseos 2 y 6 o entre el 4 y el 10, hay cesos de diagnstico del conocimiento, incluso aquellos vin-
I que utilizar un smbolo R, que indica asignacin aleatoria a culados con la retina). Resulta ilusoria cualquier apariencia
Idiferentes grupos de tratamiento. Esa aleatorizacin se concibe de conocimiento absoluto o intrnseco sobre objetos singula-
como un proceso que se produce en un momento dado, y sirve res aislados. La obtencin de datos cientficos implica, por
para lograr, dentro de lmites estadsticos conocidos, la igual- lo menos, una comparacin, cuya utilidad depende de que las
dad de los grupos antes del tratamiento. Agregaremos a ella partes integrantes se estructuren con el mismo cuidado e
otra convencin grfica: las filas paralelas no separadas por idntica precisin.
lnea de puntos significan grupos de 'comparacin no igualados 'En los estudios de casos del diseo 1, se compara implcita-
por dicho procedimiento. No se ha empleado ningn smbolo mente un caso nico, cuidadosamente estudiado, con otros
para la equiparacin como proceso para conseguir la igualacin acontecimientos observados de manera casual y recordados. Las
previa al tratamiento de grupos de comparacin, porque el valor inferencias se fundan en expectaciones generales de cules hu-
de dicho proceso se ha exagerado mucho y suele ms bien bieran sido los datos de no haberse producido X, etc. Tales
conducir a inferencias errneas que contribuir a extraer con- estudios suelen requerir una tediosa recopilacin de detalles
clusiones vlidas. ( Vanse ms adelante el anlisis del diseo concretos, cuidadosa observacin, administracin de tests y si-
10 y la seccin final sobre diseos correlacionales). En el di- milares, y en tales casos se corre el riesgo de hacer precisio-
seo 9 se ha utilizado explcitamente un smbolo M para nes injustificadas. Cunto ms provechoso sera el estudio si
identificar materiales. ese caudal de observaciones
_ se redujese a la mitad, aplicndose

18 19
el esfuerzo ahorrado al estudio igualmente cuidadoso de un convertirse en una hiptesis rival aceptable, tal acontecimiento
apropiado caso de comparacin! Parece hasta casi falto de tica debera haber afectado a la mayor parte de los estudiantes que
el aceptar hoy, como tesis de doctorado en el mbito educa- integran el grupo examinado (p. ej., en algn otro pero-
cional, estudios de casos de esa ndole ( es decir, que implican do lectivo o por medio de una noticia periodstica muy difun-
dida). En el estudio escolar realizado por Collier en 1940,
un solo grupo observado una sola vez). En ellos, los tests
estandarizados solo ofrecen una ayuda muy limitada, puesto sobre el cual inform en 1944, se produjo la cada de Francia
qtte las fuentes antagnicas de diferencias (distintas de X) mientras los estudiantes lean abundante material de propa-
son tan abundantes que tornan casi intil el grupo estn- ganda nazi; los cambios de actitud comprobados parecieron ser
dar de referencia como grupo de control. Por los mismos consecuencia, ms probablemente, de ese suceso que de la pro-
motivos, las muchas fuentes no controladas de diferencias en- 7paganda en s.' La historia se convierte en una explicacin rival
tre el estudio actual de un caso concreto y otros que, plan- ms aceptable del cambio cuanto ms extenso es el lapso entre
tendose en el futuro, pudieran compararse con aquel son tan- 191 y 02, y podra considerarse un detalle trivial en un ex-
tas, que hacen tambin intil su justificacin como punto de perimento realizado dentro del breve lapso de una o dos horas,
referencia para estudios posteriores. En general, sera mejor si bien aun en tal caso deben investigarse fuentes externas
distribuir el esfuerzo descriptivo entre los dos miembros de ' como las risas, las distracciones, etc. La variable historia se
una comparacin interesante. 'relaciona con la caracterstica de aislamiento experimental,
Si se lo toma en conjunto con las comparaciones implicitas de que en muchos laboratorios de fsica suele conseguirse con
conocimiento comn, el diseo 1 presenta la mayor parte ' tanta aproximacin que el diseo 2 resulta aceptable a prop-
de los inconvenientes de cada uno de los diseos posteriores. sito de la mayor parte de sus investigaciones. Pero en el estudio
-Por eso dejaremos el estudio de esos inconvenientes para cuan- '-cle mtodos de enseanza casi nunca se puede suponer un
do encaremos situaciones ms especficas. aislamiento experimental tan completo. Por eso en el cuadro 1
el diseo 2 se ha marcado con un signo negativo bajo el ttu-
lo Historia, en el que incluiremos un grupo de posibles efec-
tos estad-Ohales o de programacin de acontecimientos institu-
1 2. Diseo pretest-postest de un solo grupo cionales, aunque tambin estos podran situarse al pie del t-
tulo Maduracin. As, el optimismo podra variar con las
Si bien este diseo contina siendo de gran aplicacin en la estaciones y la ansiedad producida por el programa de exme-
investigacin educacional, y se lo considera tan superior al nes semestrales [p. ej., Crook, 1937; Windle, 1954]. Tales
diseo 1 que se lo utiliza all donde no cabe bac& nada mejor efectos acaso produjesen una variacin 01 - 02 confundible
( vase ms adelante el anlisis de los diseos cuasiexperimen- con el efecto de X.
: tales ), lo presentamos aqu como un mal ejemplo para ilus- Una segunda variable o categora de variables rivales recibe
trar algunas de las variables externas entremezcladas que pue- - - _ Tal como lo entendemos aqu, este
el nombre de maduracin
den atentar contra la validez interna. Esas variables ofre- trmino abarca todos aquellos procesos biolgicos o psicol-
cen hiptesis aceptables que explican una diferencia 01 - 02, gicos que varan de manera sistemtica con el correr del tiem-
1 opuesta a la hiptesis de que X caus la diferencia: po e independientemente de determinados acontecimientos ex-
ternos. As, es probable que entre 0 1 y 02 los estudiantes
01 X 02 hayan aumentado de edad, apetito, fatiga, aburrimiento, etc.,
y acaso la diferencia obtenida refleje ese cambio y no el
La primera de estas hiptesis rivales no controladas es la his- de X. En educacin correctiva, que se aplica a personas ex-
toria. Entre 01 y 0 2 pueden haber ocurrido muchos otros cepcionalmente disminuidas, un proceso de remisin espon-
acontecimientos capaces de determinar cambios, adems de la tnea, anlogo al que se produce en la curacin de heridas,
X sugerida por el experimentador. Si el pretest ( 01) y el
postest ( 02) se administraron en das distintos, los aconteci- 1 En realidad, Collier utiliz un diseo ms adecuado que este, que
ea el presente sistema se denomina diseo 10.
mientos intermedios pueden haber causado la diferencia. Para

21
20
Cuadro. 1. Fuevtes de invalidacin para los diseos I a 6. puede confundirse con el efecto especfico de una X correctiva.
Fuentes de invalidacin
(Ni que decir tiene que tal remisin no se considera espon-
tnea en ningn sentido causal, sino que representa ms bien
Interna
l
Externa los efectos acumulativos de los procesos de aprendizaje y pre-
...
, -o I< 70 siones ambientales de la experiencia global diaria, que se pro-
.. yI .0a a.. ua> c. duciran aunque no se hubiese introducido ninguna X.)
-0a 7., ci.,.15' 13.., TOu' 7..>U Una tercera explicacin rival entremezclada es el efecto de la
a) . ,c, 0, .,a y
realizacin de pruebas, el efecto del pretest mismo. En prue-

c :o
C 1".7 CO 00o ''':' -oo bas de rendimiento e inteligencia, los estudiantes a quienes se
'.c.9., ...E. , o o "r3ot -o
._es, -o 0 ._, _).., c,
o o :1'- e" '.
.1a>%; -o
"Io
V. Q .-.
..,13 uo3ic,
"r)-o u
Q,,7.;. e
- " Q.)
o _ ....
somete a ellas por segunda vez, o a una de sus variantes,
2
E 11 1,-45 7;cu o,.. etc., suelen desempearse mejor que los que las encaran por
co U ..e. .. Z .1 ..5 vez primera [p. ej., Anastasi, 1958, pgs. 190-91; Cane y
Diseos Heim, 1950]. Esos efectos, que alcanzan de 3 a 5 puntos
preexperimentales de CI en promedio para sujetos sin experiencia previa, se pro-
1. Estudio de caso
con una sola ducen aun sin haberles hecho comentario alguno acerca de sus
medicin puntajes o errores en el test anterior. En las pruebas de
RO
personalidad se advierte un resultado similar: en les segundas
2. Diseo pretest- ? + + ? se observa, en general, un mejor ajuste, aunque en ocasiones
postest de un
solo grupo
ORO
se halla tambin un efecto altamente significativo en sentido
"Contrario [Windle, 1954]. En cuanto a las actitudes hacia
3. Comparacin con -I- ? --I- + Igrupos minoritarios, una segunda prueba suele indicar un ma-
un grupo esttico
XO i yor prejuicio, aunque los datos disponibles son todava esca-
O sos [Rankin y Campbell, 1955]. Es obvio que el anonimato,
Diseos una mayor conciencia de qu respuesta es la socialmente
experimentales aprobada, etc., influiran en general sobre la ndole del resul-
propiamente dichos
4. Diseo de + + + + + + + ? ? tado. Para tests de prejuicio en condiciones de anonimato, el
grupo de control nivel de adaptacin creado por las expresiones hostiles presen-
pretest-postest
RO X0
RO O
tadas puede modificar las apreciaciones del estudiante en lo
referente a la tolerancia que existe para actitudes de ma-
5. Diseo de cuatro 4- ? ? yor hostilidad. En un inventario de adaptacin o de perso-
grupos de
Solomon nalidad que lleva la firma del sujeto, la primera administra-
RO X0
RO O cin del test forma parte de una situacin de solucin de pro-
R X0 blemas en que el estudiante trata de descubrir el propsito
R O
-I- ? ?
oculto de la prueba. Si ya ha pasado por aquella experiencia
6. Diseo de grupo + +
de control con (o si habl con sus amigos sobre las respuestas que ellos die-
postest
nicamente
ron a algunos de los puntos ms destacados), sabe mejor c-
S
R XO mo comportarse la segunda vez.
R O rCon el problema de los efectos del test se relaciona la distin-
Nota: En los cuadros, el signo negativo indica que hay imperfeccin defi- cin entre las posibles mediciones de su reactividad, lo cual'
nida; el positivo, que el factor est controlado; el interrogativo, la presencia
de una posible causa de preocupacin, y por ltimo, el espacio en blanco
Iconstituir un importante tema en todo este libro, as como
significa que el factor no es pertinente. una exhortacin general a que se hagan mediciones no reacti-
Estos cuadros resumidos los presentamos con suma renuencia, ya que pue-
den resultar demasiado tiles, si se llega a confiar en ellos y no en la ex- vas siempre que sea posible. Desde hace mucho tiempo ha
posicin ms completa y calificada que se incluye en el texto. Ningn indicador
de o debe respetarse, a menos que el lector comprenda por qu se lo
sido una verdad manifiesta en las ciencias sociales que el pro-
ha colocado. En particular, va contra el espritu de este trabajo la creacin de ceso mismo de medicin puede hacer cambiar aquello que se
una confianza o suspicacia infundadas cori respecto a determinados diseos.

23
7mide.
- La ganancia test-retest sera una import--_:e consecuen- roo, en una prueba posterior en que se adopte la misma for-
ma de antes u otra similar a ella, casi con seguridad 02 tendr
cia de ese cambio. (Otra, la interaccin entre la realizacin de
la prueba y X, la estudiaremos ms adelante, junto con el di- para ese grupo un promedio ms elevado que 01. Este resul-
seo 4. Adems, es importante evitar esas reacciones al pre- tado confiable no se deber a ningn efecto genuino de X, a
test, aun cuando surtan efectos diferentes para sujetos distin- n ingn efecto de la prctica de test y retest, etc. Es ms bien
tos.) Es de esperar el efecto reactivo siempre que el proceso un aspecto tautolgico de la correlacin imperfecta entre 01
de prueba sea en s un estmulo al cambio, y no un mero re- _ y 02. Los errores de inferencia ocasionados por no haber
gistro de comportamiento. As, en un experimento sobre te- tomado en cuenta el efecto de la regresin han planteado tan-
rapia para el control del peso, el pesaje inicial puede ter de tos problemas en la investigacin educacional porque muy a
suyo un estmulo para el adelgazamiento, aun sin tratamiento menudo se desconoce su verdadera naturaleza aun por estu-
curativo alguno. De manera similar, la ubicacin de observa- diantes que han realizado cursos avanzados de estadstica mo-
dores en el aula para estudiar la capacidad preentrenamiento derna. Como en exposiciones posteriores (p. ej., el diseo
del docente en el mbito de las relaciones humanas puede mo- 10 y el anlisis ex post facto) la daremos por conocida, nos
dificar de por s su forma de comportarse. La colocacin de un detendremos aqu a explicarla brevemente, aunque sea en
micrfono sobre el escritorio o pupitre suele variar la pauta forma muy elemental. La figura 1 presenta algunos datos
de interaccin del grupo, etc. En general, cuanto ms nuevo y imaginarios en los que el pretest y el postest de una poblacin
motivante sea el elemento utilizado para las pruebas, mayor entera tienen una correlacin de 0,50, sin variacin en la
ser su influencia. media grupal o variabilidad. (Los datos se seleccionaron ex-
la_instrume_ntacin o deterioro de los instrumentos [cf. presamente para que la colocacin de las medias de fila y
Campbr, 1957] es el trmino con que se designa una cuarta columna sean obvias a la simple observacin visual. El valor
hiptesis rival no controlada. Esa expresin se refiere a las de 0,50 tambin se elige por conveniencia de exposicin.) En
variaciones autnomas en el instrumento de medicin que po- este caso hipottico no se ha producido ningn cambio real,
dran serla causa de una diferencia 0 1 -- 02. Tales cambios pero, como es corriente, los puntajes falibles del test indican
seran anlogos a la mayor o menor tensin observada en el una correlacin de retest considerablemente inferior a la uni-
dinammetro, la condensacin en una cmara de niebla, etc. dad. Si, como se sugiri en el ejemplo dado antes, comenza-
Cuando se recurre a observadores humanos a fin de obtener mos por observar solo a los escolares calificados con puntajes
,01 y 02, su propio aprendizaje, tensin, etc., determinarn muy bajos en el pretest p. ej., 7 puntos, y en el pos-
diferencias de 0 1 __ 02. Si se califican los ejercicios de re- test solo reparamos en el puntaje de esos alumnos, nos en-
daccin, ensayos o trabajos de investigacin, los estndares contraremos con que los puntajes postest estn dispersos, pero
aplicados variarn de 0 1 a 02 (la tcnica de control sugie- son en general mejores, y en promedio regresionaron
Ye que se mezclen los ejercicios de redaccin 0 1 y 02 y se hacia la media grupal con un coeficiente de regresin o co-
,os haga calificar sin tener conocimiento de cul ha llegado rrelacin de 0,50, obteniendo una media de 8,5. No obstante,
primero). Si se observa la participacin en el aula, tal vez en vez de constituir una prueba de progreso, esto es una rati-
en la segunda sesin los observadores sean ms hbiles, o ms ficacin tautolgica, si bien especfica, de que hay una corre-
indiferentes. Si se entrevista a los padres, la familiaridad de Jacin imperfecta, y de cul es su medida.
quien realiza esa labor con el programa de entrevistas y con I Cuando al trascurrir el tiempo se producen acontecimientos
determinados padres puede producir ciertos desplazamientos. entre el pretest y el postest, nos sentimos tentados a estable-
r Un cambio en los observadores entre 0 1 y 02 cer una relacin causal entre dicho cambio y la accin espe-
tambin podra
Lprovocar alguna diferencia. cfica del paso del tiempo. Pero obsrvese que cabe hacer
Una quinta variable entremezclada en algunos casos del di- aqu un anlisis cronolgico a la inversa, comenzando, por
seo 2 es la regresin estadstica. Por ejemplo, si en una ejemplo, con aquellos cuyo puntaje postest es 7 y observan-
"prueba correctiva se seleccionan alumnos para un experimento do la dispersin de sus puntajes pretest, de los cuales se
etpecialPorque han tenido puntajes particularmente bajos en extraera la implicacin inversa, a saber: que los puntajes van
el test de rendimiento escolar (que para ellos se convierte en empeorando.

24 25
Figura 1. Regresin en la prediccin de punta/es postest del Las inferencias causales ms errneas Son las que se extraen
pretest, y viceversa.
cuando la informacin se presenta en la forma indicada en
la figura 1( b) [o la parte superior o inferior de 1(b)]. As
se da la impresin de que los alumnos ms brillantes van
Lnea de regresin b,
que indica la mejor perdiendo su ventaja, y viceversa, como si fuese por el efecto
vulgarizador y homogeneizante del medio institucional. Aun-
Punta jes
Puntajes postests
/ Medias
vi prediccin de pretest
a postest que esta errnea interpretacin implica que la variabilidad po-
blacional en el postest debera ser menor que en el pretest,
pretests 7 8 9 10 11 12 13 postests ambas son en realidad iguales. Ms todava: si se procede al
13 1 1/1 1
anlisis con grupos puros de puntajes postest [como en la l-
11,5
12
nea de regresin ic y la figura 1(c)], quiz se llegue a la con-
1 1 2 1 1 11,0 clusin contraria. Como lo seal McNemar [1940], el uso
11 1 2 3/3 ..----..... del anlisis de control de tiempo invertido y el examen directo
10 1 1
en busca de cambios en las variabilidades poblacionales son
3......4"..... 3 1 1 10,0 precauciones tiles contra dicho error de interpretacin.
9 1 -2". 3/3 2 1 Cabe observar la regresin hacia la media en otra forma an-
- ,..---- .. - 9,5
8 ' 1 121
loga. Cuanto ms desviado sea el puntaje, mayor ser el pro-
1 9,0 bable error de medicin. As, en cierto sentido, el tpico alum-
7 1 1/1 1 no habituado a la obtencin de puntajes elevados se habr
.5
CO D ir-r
visto favorecido por una suerte extraordinaria ( gran error
.-CD b b Vi a rp positivo), al paso que la mala fortuna acompa a quien
to> ^"
cn
obtuvo puntaje muy bajo (gran error negativo). La suerte
es, sin embargo, caprichosa, por lo cual en un postest se es-
Lnea de regresin c pera que quienes poseen puntajes elevados declinen algo en
que indica la mejor
prediccin de postest
el promedio, as como que los de puntajes bajos mejoren su
(a) a pretest posicin relativa. ( Se aplica la misma lgica si se comienza con
Prediccin
los puntajes de postest y se procede hacia atrs, en direccin
Prediccin al pretest. )
De grupos A medias La regresin hacia la media es un fenmeno general, que no
pretests --- postests A medias De grupos
homogneos pretests "- postests se limita a la administracin del pretest y del postest con la
homogneos misma prueba o formas similares de ella. El director que ob-
13
serva que sus estudiantes de mayor CI suelen obtener pun-
13 tajes inferiores a los mximos ( aunque muy elevados) en las
12
12 pruebas de rendimiento escolar, mientras los de menor CI no
11
suelen ocupar el extremo inferior en esas pruebas ( aunque s

11 puestos bastante bajos), sera culpable de falacia en la re-
10 gresin si dijese que su escuela subestimula a los alumnos ms
su 10
9 brillantes y recarga de trabajo a. los atrasados. Si seleccionase
9 a los que obtuvieron el mayor y el menor puntaje en la prueba
8
8 de rendimiento y analizara sus CI, la misma falta de lgica lo
7 forzara a llegar a la conclusin opuesta.
(

7 Si bien hemos hablado aqu de la regresin a propsito de los


(b) errores de medicin, en general, ella depende ms bien del
(c) grado de correlacin: cuanto menor sea esta, mayor ser la

26.
:--r-egresin hacia la media. La falta de correlacin perfecta puede
deberse a error y/o a fuentes sistemticas de variancia es- r3. Comparacin con un grupo esttico
pecfica propia de una o de otra medicin.
-
Los efectos de la regresin son, pues, acompaamientos ine- El tercer diseo preexperimental necesario para nuestra expo-
vitables de la correlacin imperfecta de test-retest para grupos sicin de los factores de invalidacin es la comparacin con
seleccionados por su ubicacin extrema. No son, sin embargo, un grupo esttico. Es un diseo en el cual un grupo que ha
concomitantes necesarios de puntajes extremos dondequiera experimentado X se compara con otro que no lo ha hecho, a
que ellos se produzcan?`Si un grupo seleccionado por razones fin de establecer el efecto de X.
independientes resulta poseer una media extrema, hay una
menor expectacin a priori de que la media grupal regresione o i
en una segunda prueba, pues se ha permitido a las fuerzas
aleatorias o externas de variancia que influyan sobre los pun- 02
tales inciales en ambas direcciones. Pero no ocurre as en un
grupo seleccionado a causa de su extremidad en una variable Ejemplos de esta clase de investigaCin son: la comparacin
falible, pues ella es artificial y dicho grupo regresionar hacia de sistemas escolares que requieren que los maestros tengan
Ja media de la poblacin de donde se lo seleccion. ttulo universitario (la X) con otros que no exigen esa con-
I Efectos de regresin ms indirectos pueden obedecer a la se- dicin; la comparacin de alumnos de cursos que reciben ins-
leccin de sujetos con puntos extremos en mediciones diferen- truccin en lectura veloz con otros que no la reciben; la com-
11 tes del pretest. Consideremos un caso en el cual se eligen, paracin entre quienes presenciaron determinado programa de
para recibir adiestramiento experimental, estudiantes que fra- televisin y los que no lo hicieron, etc. En marcado contraste
casan en pruebas tomadas en el aula. Como pretest, se les con el experimento del diseo 6 propiamente dicho, que
administra el tipo A de un test estndar de rendimiento es- veremos ms adelante, no hy en _estos cass del diseo_ 3_
colar, y como postest el tipo B de dicho test. Es probable ningn medio explcito A_ue_permita asegurar que los grupos
que la prueba tomada en clase tenga una correlacin ms alta _ _equivalentes de no ser por la X.' La auseinda de
habran sido
con la administracin inmediata del tipo A que con la admi- 'un medio tal, indicada en el diagrama por las lneas punteadas
nistracin del tipo B unos tres meses despus (si en cada se- que separan ambos grupos, seala el prximo factor que re-
sin toda la clase ha sido objeto de la prueba). Cuanto ms , quiere control: la seleccin. Si hay diferencias entte Oi y 02,
elevada sea la correlacin, menor ser la regresin hacia la ello bien puede deberse al reclutamiento diferencial de las per-
media. Por consiguiente, los fracasos de la clase habrn deter- sonas que componen los grupos: estos podran haber diferido
minado una regresin ascendente menor en el pretest que en aun sin la presencia de X. Como se ver ms adelante en el
el postest, dando una seudoganancia que podra haberse con- anlisis ex post facto, la equiparacin fundada en caracters-
fundido con un conato afortunado de educacin correctiva. ticas que no sean O suele resultar ineficaz y conducir a error,
[Para ms detalles sobre ganancias y regresin, vase Lord, particularmente en los casos en que las personas que consti-
1956; McNemar, 1958; Rulon, 1941; R. L. Thorndike, 1942.1 tuyen el grupo experimental han procurado la exposicin
Con ello se concluye la lista de inconvenientes del diseo 2 a la X.
que podemos analizar en este momento. En el cuadro 1 apa- Una ltima variable entremezclada que,' por ende, debe incluir-
rece otro signo negativo bajo el ttulo Validez interna, co- se en esta lista es la llamada mortalidad experimental, o pro-
rrespondiente a un factor que no analizaremos hasta exponer duccin de diferencias 0 - 02 en grupos, al retirarse en
el diseo 10 (vase pgina 93) en la seccin de diseos mayor o menor nmero personas pertenecientes a ellos. As,
cuasiexperimentales, y dos signos negativos bajo Validez ex- aunque en el diseo. 3 ambos grupos haban sido alguna vez
terna, que no explicaremos hasta haber realizado el anlisis idnticos, quiz difiriesen ahora, no por haberse producido un
del diseo 4 (vase pgina 32). -)cambio en los integrantes individualmente considerados, sino
ms bien a causa del abandono selectivo de personas de uno
de los grupos. En el campo de la investigacin educacional,
ste problema suele encontrarse a menudo en los estudios so-
28
29
bre los efectos de la formacin universitaria, cuando se com- 4. Tres diseos experimentales
paran las mediciones efectuadas entre alumnos recin ingresa-
dos (que no han tenido la X) y los que estn a punto de propiamente dichos
egresar ( que la han tenido). Si esos estudios indicaran que las
mujeres recin ingresadas son ms bellas que las que estn
por graduarse, rechazaramos de plano la consecuencia lgica
de que nuestro duro curso de capacitacin menoscaba la be-
lleza femenina, y sealaramos en su lugar las dificultades que
encuentra una muchacha agraciada para finalizar su carrera
antes de contraer matrimonio. Este efecto se clasifica como Los tres diseos fundamentales que vamos a exponer en este
mortalidad experimental. (Por supuesto, si observamos a las captulo son los recomendados en la actualidad por la litera-
mismas muchachas cuando acaban de ingresar y cuando egre- tura metodolgica. Son tambin, como se ver, los ms reco-
san, este problema desaparece, con lo cual tenemos el dise- mendados por nosotros, aun cuando tal respaldo est sujeto a
o 2. ) muchas restricciones concretas en cuanto a la prctica habitual,
y d lugar a que aparezcan algunos signos negativos en el
__cuadro 1 bajo el ttulo Validez externa.
El diseo 4 es el ' crapleado_s_le Inq tre,s ; por eso, nos
pe emos a libertad de explayamos mucho ms en su an-
lisis, haciendo de l el centro de convergencia de otras conside-
raciones, cuya aplicacin es ms general. Obsrvese que los tres
diseos se presentan en forma de comparaciones diversas de
una sola X con ninguna X. Los diseos que han recibido ma-
yor cantidad de tratamientos por parte de la corriente del ex-
perimento factorial de Fisher representan elaboraciones im-
portantes pero tangenciales respecto del hilo conductor de
esta obra, y se estudian al final del presente captulo, a con-
tinuacin del diseo 6. Ahora bien, esta perspectiva puede
servirnos para recordar aqu que comparar X con no X es un
exceso de simplificacin. En realidad la comparacin se esta-
blece con las actividades especificas desplegadas por el grupo
de control durante el perodo en que el grupo experimental
recibe la X. Por lo tanto, sera mejor establecerla entre XI.
y Xo, o entre X1 y X0, o entre X1 y X2. El que la actividad
de esos grupos de control con frecuencia no est especificada
aade un indeseable elemento de ambigedad a la interpreta-
cin del efecto de X.
Teniendo en cuenta todos estos comentarios, continuaremos
en este captulo insistiendo en la convencin grfica de no
presentar ninguna -

30 31
.,
4. Diseo ce grupo de control pretest-postest 1 chas supuestas utilizaciones del diseo 4 ( o 5, o 6) no
i controlan la existencia de una historia intrasesional nica. Si
-- 1 a todos los estudiantes, elegidos al azar, que integran el grupo
Controles de validez interna /experimental se los trata en una sola sesin, hacindose lo
,1 mismo con los controles, los nicos acontecimientos ocurridos
Algunas de las consideraciones anteriores indujeron a los in- i en cada una de esas sesiones y que carecen de importancia
vestigadores psicolgicos y educacionales, entre 1900 y 1920, (la broma exagerada, el incendio en la otra cuadra, los co-
a agregar al diseo 2 un grupo de control, creando el actual mentarios introductorios del experimentador, etc.) se con-
diseo ortodoxo con grupo de control. McCall [1923], Solo- ! vierten en hiptesis rivales que explican la diferencia de
mon [1949] y Boring [1954] fueron en parte los protagonis- ' O 02 contra 0 3 04. Este no es un verdadero experi-
tas de esta historia, y una revisin del Teachers Coltege Re- - mento, aunque se lo presente como paradigma ilustrativo,
cord de aquel perodo implica ms todava, pues ya en 1912 como en la prueba de Solomon [1949] sobre la enseanza del
se mencionaban grupos de control sin necesidad de mayores alfabeto. (Para ser exactos, tenemos que puntualizar que So-
explicaciones [p. ej., Pearson, 1912]. Los diseos con grupos lomon lo eligi para ilustrar un aspecto 'diferente.) Medi-
de control as introducidos se clasifican en esta seccin bajo tando sobre nuestras mejores prcticas en relacin con ese
dos encabezamientos: el presente diseo 4, en el que se em- aspecto, puede que ello carezca de importancia, pero nuestras
plean grupos equivalentes logrados por aleatorizacin, y el mejores prcticas consisten en presentar experimentos que
diseo 10 cuasiexperimental, en el que se utilizan grupos in- con harta frecuencia son imposibles de repetir, y esa misma
tactos de comparacin ya existentes, de equivalencia no ase- fuente de diferencias significativas pero externas bien po;
gurada. El diseo 4 adopta la forma dra ser una falla importante. Adems, en los tpicos experi-
mentos que describe el Journal of Experimental Psychology,
R 0 1 X 02 - el control de la historia intrasesional, se logra exponiendo a
03 04
estudiantes y animales a pruebas individuales, y sometiendo
aleatoriamente a los estudiantes y los perodos de prueba a
Como el diseo controla en forma tan ntida las siete hiptesis !Condiciones experimentales o de control. Obsrvese, no obs-
descritas, las presentaciones que de l se han hecho no han z tante _que aun con sesiones individuales la---Sistria puede
establecido en forma explcita las necesidades de control que . escapar al control si se trabaja-con todo el grupo experimental_
satisfaca. En la tradicin de las investigaciones del aprendi- l'y'no 02,11 el_ grupo de control, etc. El diseo 4 requiere que
ras sesiones experimentales y de control -Sean simultneas. Si
zaje, los efectos prcticos de la administracin de pruebas pa-
recen ofrecer el primer reconocimiento de la necesidad de con-
tar con un grupo de control. La maduracin era a menudo el
punto crtico de los estudibi exp-erimentares en educacin, as
como del problema naturaleza-cultura (nature-nurture) en el
i realizamos sesiones verdaderamente simultneas, tienen que
emplearse distintos experimentadores, y las. diferencias entre
ellos acaso se conviertan en una forma de historia intrasesio-
nal que se confunda con X.
campo del desarrollo infantil. En la investigacin de los cam- La solucin ptima es una aleatorizacin de las sesiones ex-
bios actitudinales, como en los primeros estudios sobre los perimentales, aplicando las restricciones requeridas para lograr
efectos de las pelculas cinematogrficas, la historia puede ha- una representacin equilibrada de fuentes de sesgo tan pro-
ber sido la consideracin primaria de necesidad. De cualquier bables como son los experimentadores, la hora, el da de la
Imanera, creemos conveniente analizar brevemente aqu la semana, la parte del semestre, la proximidad de los exmenes,
forma en que se controlan esos factores, as como las con- etc. El recurso habitual de trabajar con sujetos experimentales
diciones en que se lo hace. en pequeos grupos en vez de hacerlo individualmente es
La historiaje controla en la medida en que los acontecimien- inaceptable si se prescinde de ese agrupamiento en el anlisis
tos histricos generales que podran haber producido una di- estadstico. (Cf. ms adelante el examen de la asignacin de
ferencia del tipo 0 1 02 causaran tambin una diferen- ' grupos intactos a diversos tratamientos.) Todos los que toman
cia del tipo 0 3 04. Advirtase, sin embargo, que mu- parte en la misma sesin participan de la misma historia in-

32 33
r trasesional y tienen, por ende, fuentes de similitud distintas de
, X. Si tales sesiones se han asignado al azar, el procedimiento
estadstico correcto ser el mismo que el que sealamos ms
I En tales casos, el grupo de control regresiona tanto como el
experimental. Sin embargo, aun en las condiciones del di-
I seo 4 se producen con frecuencia vacos interpretativos, a
adelante para la asignacin de aulas intactas a diversos trata- ) causa de los mecanismos de regresin. Un experimentador
mientos. (Para algunos estudios que comprenden la ad- puede aprovechar el grupo de control para confirmar los efec-
ministracin de tests en grupos, los distintos tratamientos
experimentales pueden distribuirse al azar dentro de un grupo tos de X sobre la media grupal, y despus abandonarlo mien-
tras examina cules han sido los subgrupos de puntaje pretest
cara a cara, como en el uso de varias formas de un test para del grupo experimental que han registrado mayores influen-
estudiar el efecto del orden de dificultad de los tems. En cias. Si todo el grupo acusa una ganancia, llega a la estimu-
tales casos, los elementos especficos de la historia intrasesio- lante conclusin artificial de que quienes al principio estaban
nal son comunes a ambos tratamientos y no se convierten en en la posicin ms baja han logrado el mayor adelanto, mien-
una hiptesis rival aceptable que se confunda con X cuando se tras que los que se hallaban en la ms elevada quiz no han
explican las diferencias obtenidas.) avanzado lo ms mnimo. Este resultado se asegura porque, en
La maduracin y la administracin de tests estan ' controladas condiciones de ganancia media de todo el grupo, el mecanismo
en el sentido de que su manifestacin en los grupos experi- de regresin suple el puntaje de ganancia para los participantes
mentales y de control debera ser igual. La instrumentacin con puntaje pretest inferior a la media, y tiende a eliminarlo
se controla con facilidad cuando se dan las condiciones para para quienes en el pretest tenan puntaje elevado. ( Si en el
l el control de historia intrasesional, en particular cuando se
-conjunto no hubo ningn avance, el experimentador quiz
logra la O por medio de reacciones de los estudiantes a un descubra por error que aquello se debi a dos efectos mu-
Linstrumento fijo, como una prueba impresa. Sin embargo,
cuando se recurre a observadores o entrevistadores, el proble- tuamente excluyentes: el avance de los bajos y el retroceso de
ma es ya ms grave. Si el nmero de observadores es suficien- los altos.) Un modo de evitar esos errores de interpretacin es
temente pequeo para que su asignacin a la observacin de ' hacer anlisis paralelos de aquellos que en el grupo de control
sesiones individuales no sea aleatoria, no solo habr que em- presentan puntajes pretest extremos, y fundar las interpreta-
plear cada observador tanto para las sesiones experimentales - dones de ganancias diferenciales en comparaciones de los pun-
como para las de control, sino que adems los observadores tajes postest de los correspondientes subgrupos experimenta-
debern ignorar cules son los estudiantes que reciben cada uno les y de control en el postest. (Ntese, sin embargo, que a
de los distintos tratamientos, a fin de que el conocimiento de causa de las distribuciones asimtricas resultantes de la selec-
ese hecho no sesgue sus puntajes o registros. Tales tendencias cin resulta dudosa la conveniencia de las estadsticas de cur-
-- al sesgo son causas confiables de variancias, como lo con-
va normal.)
firma la necesidad de contar en las investigaciones mdicas Se elimina la seleccin como explicacin de la diferencia en
con un segundo ciego en la prueba de dos ciegos, y tambin la medida en que la aleatorizacin haya asegurado la igualdad
estudios recientes [Rosenthal, 1959] y anteriores [p. ej., Ken- ,grupal en el momento R, medida que queda determinada por
riedy y Uphoff, 1939; Stanton y Baker, 19421. El uso de '1.nuestra estadstica de muestreo. As, la garanta de igualdad
registros de la interaccin grupal, a fin de que los jueces pue- -_ es mayor para grandes que para pequeas cantidades de asig-
dan evaluar una serie de secciones aleatorizadas de trascrip- naciones aleatorias. Este supuesto fallar en ocasiones en el
, grado sugerido por el trmino de error para la hiptesis de no
, ciones pretest, postest, experimentales y del grupo de control,
contribuye al perfecto control de la instrumentacin en las diferencia. En el diseo 4, ello significa que a veces habr
investigaciones sobre la conducta escolar y la interaccin una aparente diferencia significativa entre los puntajes pre-
1.grupal. ttttttt Por lo tanto, aunque la aleatorizacin simple o estratifi-
la regresin se controla, en lo que a ,las diferencias de medias cada asegura la asignacin no sesgada a los grupos de sujetos
concierne y por muy extremo que sea el grupo en los puntajes experimentales, constituye Un medio muy imperfecto para ga-
Ipretest, si tanto el grupo exprimental como el de control se rantizar la equivalencia inicial de dichos grupos. No obstante,
asignan al azar, tomndolos de este mismo conjunto extremo. Les la nica forma prctica de hacerlo. Lo decimos as, tan
categricamente, a causa de una muy difundida y errnea pre-

34
35
dileccin, evidenciada en la investigacin educacional durante innegable que este procedimiento atena el efecto aparente de
los ltimos treinta aos, por la igualacin mediante la equi- X, pero evita el sesgo de muestreo, fundndose en el previo
paracin. McCall [1923] y Peters y V,an Voorhis [1940] _supuesto de que no haba sesgos de mortalidad ms simples.
contribuyen a perpetuar este equvoco.' Como veremos con Este supuesto es susceptible de verificacin parcial examinan-
Mayor detalle al estudiar el diseo 10 y el ex post facto, la do tanto el nmero como los puntajes pretest de quienes
equiparacin no constituye una ayuda real cuando se la utiliza participaron en el pretest pero no en el postest. Es posible
_ para solucionar diferencias iniciales de grupos. Ello no signi- que algunas X influyeran en esa tasa de abandono, en vez de
fica que propugnemos la eliminacin lisa y llana de este pro- modificar los puntajes individuales. Por supuesto, aun cuando
cedimiento como posible aditamento a la aleatorizacin, como tales tasas sean las mismas, queda todava en pie la posibi-
cuando se obtiene mayor precisin estadstica asignando estu- lidad de que se produzcan complicadas interacciones que
diantes a pares equiparados y asignando despus al azar un propenderan a diferenciar el carcter de los abandonos en los
miembro de cada par al grupo experimental y otro al de con- grupos experimentales y de control.
trol! En la literatura sobre estadstica, esto se designa con el El problema de la mortalidad puede observarse con toda cla-
" trmino bloqueo. Vanse, en particular, los estudios de Cox ridad en el estudio de mtodos correctivos con voluntarios.
' [1957], Feldt [1958] y Lindquist [1953]. Pero la equipara- As, por ejemplo, se invita a un grupo de lectores deficientes
cin como sustituto de la aleatorizacin es tab incluso para de una escuela secundaria a participar en sesiones correctivas
los diseos cuasiexperimentales que no emplean ms que dos voluntarias mientras que otro grupo en las mismas condiciones
grupos naturales intactos, uno experimental y otro de control: no es invitado. Del primero de ellos, quiz participen en las se-
aun en ese endeble experimento hay medios mejores que la siones un 30 % de sus integrantes. Los puntajes postests, as
armonizacin para tratar de corregir diferencias iniciales entre como los pretest, provienen de pruebas de lectura estndar ad-
ilas medias de una y otra muestra. ministradas a todos los que asistan 'a clase. No es razonable
I
' Los datos de que disponemos gracias al diseo 4 permiten es- comparar el 30 % de voluntarios con el total del grupo de con-
1 tablecer qu mortalidad explica aceptablemente la ganancia trol, porque representan a los ms preocupados por sus punta-
1 01 02. Mortalidad, casos perdidos y casos para los cuales jes pretest, los capaces de trabajar con mayor ahnco en su
(solo se dispone de datos parciales, son difciles de manejar propio mejoramiento, etc.; ptro es imposible localizar sus exac-
y por lo comn se los trata de disimular. La experimentacin tos equivalentes en el grupo de control. Aunque tampoco pa-
't pica con mtodos educativos se prolonga durante das, se- rece justo para la hiptesis de eficacia teraputica comparar el
manas o meses. Si se realizan los pretests y postests en las total del grupo invitado con el total del no invitado, es esta
aulas de las que se toman el grupo experimental y el grupo de una solucin aceptable, si bien moderada. Ntese, empero, que
control, y la condicin experimental requiere la concurrencia puede ocurrir que lo que produce el efecto sea la invitacin
a determinadas sesiones sin que ocurra lo mismo con la con- misma, y no precisamente la terapia. En general, el grupo de
dicin de control, la distinta concurrencia a las tres sesiones control no invitado debera poseer igual conocimiento de su
( pretest, tratamiento y postest ) produce una mortalidad posicin en el pretest que el grupo invitado. Otra posibilidad
que puede introducir en la muestra sutiles sesgos. Si de todos es invitar a todos los que necesitan sesiones correctivas y asig
los designados en un primer momento como participantes del nar los voluntarios a grupos de tratamiento verdaderos y fal-
grupo experimental eliminamos a los que no concurren a las sos; mas en el estado actual del arte es probable que cualquier
sesiones de prueba, reducimos selectivamente el grupo expe- terapia suficientemente bien presentada como para que parezca
rimental con un mecanismo que no se aplica en forma similar una ayuda al estudiante sea tan eficaz como el tratamiento
al grupo de control, sesgando al primero en el sentido de los mismo que se estudia. Cabe, no obstante, destacar la conse-
, responsables y sanos. El modo preferido de tratamiento, aun- cuencia innegable de que las pruebas experimentales de la
que no de utilizacin habitual, parece ser el empleo de todos eficacia relativa de dos procedimientos teraputicos son mu-
' I los estudiantes seleccionados, experimentales y de control, que cho ms fciles de evaluar que la eficacia absoluta de cual-
A,completaron tanto el pretest como el postest, incluso los inte- quiera de ellos. La nica solucin utilizada en la prctica es
'ygrantes del grupo experimental que no obtuvieron la X. Es crear grupos experimentales y de control entre quienes desean

36 37
tratamiento correctivo, manipulando los perodos de espera [p. jores diseos experimentales resulta as atractiva a quien tiene
ej., Rogers y Dymond, 1954]. Esto, por supuesto, suscita a que aplicarlos, pues piensa con toda razn que se las ha sos-
veces otras dificultades, como el excesivo abandono por parte layado sin motivo en el tratamiento formal comn sobre meto-
dologa experimental. El anlisis siguiente ratificar tales apre-
del grupo de control con terapia pospuesta. Una aplicacin ciaciones sealando multitud de medios que, sin perder validez
feliz y al parecer no reactiva de un mecanismo de lotera para interna, pueden dar mayor validez externa a los experimentos
decidir sobre la aplicacin inmediata o diferida, durante un y bases ms firmes de generalizacin a la prctica docente.
semestre, de un curso correctivo de lectura puede verse en "Pero antes de entrar en ese tema nos es inevitable hacer una
Reed [1956]. advertencia que introduce en la ciencia de la induccin unos
cuantos problemas espinosos, a causa de la persistente resis-
tencia a aceptar lo que con toda verdad dice Hume, a saber:
Factores que atentan contra la validez externa que la induccin o generalizacin nunca tiene una plena justi-
ficacin-lgica_ Al paso que los prbIe-mas-de vridez interna'.
Los factores de invalidez externa descritos hasta ahora han 'Ison susceptibles de solucin dentro de los lmites de la lgica
sido los que directamente influan sobre los puntajes O, y que fcle la estadstica probabilstica, los de validez externa no pue-
por s solos podan producir cambios susceptibles de confun- den resolverse en estricto rigor lgico en una forma ntida y
dirse con los resultados de X, es decir, factores que, una vez I concluyente. Generalizar significa siempre mezclar la extrapo-
agregado el grupo de control, produciran efectos evidentes lacin en un cambio no representado en nuestra muestra. Di-
en este y que se sumaran a los de X en el grupo experi- cha extrapolacin se hace suponiendo que se conocen las leyes
mental. V'En el lenguaje propio del anlisis de variandas _respectivas. As, si tenemos un diseo 4 internamente vlido,
historia, maduracin, realizacin de pruebas, etc. se el efecto queda demostrado solo a propsito de las condicio-
los consider efectosprincipales, y como tales se los ha con- nes especficas que el grupo experimental y el de control tie-
trolado en el diseo 4, dndole validez interna. Las amenazas nen en comn, es decir, solo en relacin con grupos sometidos
a la validez externa, por otra parte, pueden considerarse efec- a pretest, pero de determinada edad, inteligencia, situacin
tos de interaccin entre X y alguna otra variable. Constituyen, socioeconmica, regin geogrfica, momento histrico, conjun-
pues, una posible especificidad de los efectos de X respecto cin estelar, orientacin del campo magntico, presin baro-
de algn conjunto de condiciones inconvenientemente limita- mtrica, nivel de radiaciones gamma, etctera.
das. Como anticipo diremos que, hasta donde nosotros sabe- "Desde el punto de vista lgico no podemos generalizar ms
mos, en el diseo 4 los efectos observados de X pueden ser all de dichos lmites; es decir que no podemos generalizar
especficos de grupos cuyo inters fue intensificado por el en modo alguno. Pero tratamos de hacerlo conjeturando leyes
pretest. Como es natural, no podemos extender nuestras con- y verificando algunas de dichas generalizaciones en otras con-
clusiones al conjunto mayor no sometido a pretest, acerca del diciones no menos especficas pero diferentes. A lo largo de
(dial desearamos extraer conclusiones. la historia de cada una de las ciencias, se aprende a justificar
/ En este captulo examinaremos unas cuantas de esas amenazas las generalizaciones propias de ella a causa de la acumulacin
a la posibilidad de generalizacin, as como los procedimientos misma de la experiencia en hacerlo, pero no es esa una gene-
para sortearlas. Es decir que se prefieren estos diseos por ra- ralizacin lgica, deducible de los resultados del experimento
zones de validez externa o posibilidad de generalizacin, dado original. En esa situacin hacemos, al generalizar, suposiciones
que hay diseos vlidos que evitan el pretest y en muchas sobre leyes an no demostradas, incluyendo algunas que ni si-
situaciones ( aunque no necesariamente en la investigacin edu- quiera se indagaron. As, en la investigacin educacional, su-
cacional) se desea generalizar precisamente con respecto a los ponemos por lo comn que la orientacin del campo magn-
-grupos no sometidos a pretest. En el campo de la docencia tico no la afecta. Pero sabemos de ciertos estudios que con
constituyen juicios acerca de la validez externa las dudas que frecuencia el pretest ha tenido 'un efecto, y por lo tanto quisi-
con frecuencia se expresan sobre la aplicabilidad prctica de ramos eliminarlo como obstculo para nuestra generalizacin.
los resultados de ciertos experimentos muy artificiales. La in- Si 'hiciramos una investigacin sobre barras de hierro, sabra-
troduccin de tales consideraciones en el anlisis de los me-

38 39
mds por la experiencia que una primera pesada nunca produ- 2 ries a algunos experimentadores a la aplicacin del diseo 6,
ce efectos reactivos, pero que la orientacin del campo magn-
tico, si no se la regulara de manera sistemtica, podra limitar Lque omite el pretest. En especial durante los estudios de cam-
gravemente la posibilidad de generalizar nuestros descubr- bios de actitud, en que los mismos tests introducen grandes
' alientos. Los motivos, pues, de invalidacin externa son pre- cantidades de contenido extraordinario (p. ej., una tan abun-
sunciones de leyes generales en la ciencia de una ciencia: con- dante dosis de declaraciones hostiles como las que se hallan
\ jeturas acerca de los factores que pueden interactuar con nues- en el test tpico de prejuicios), es bastante probable - que las
tras variables de tratamiento segn cierta ley, y, por lo tanto, actitudes de la persona y su propensin a dejarse persuadir
acerca de los que pueden dejarse de lado. varen por influjo del pretest. Como psiclogos, dudamos se-
Adems de los elementos especficos existe una ley general riamente de la comparabilidad del pblico que asiste a una
emprica que nosotros, as como el resto de los hombres de proyeccin de Gentlemen's Agreement (un film antiprejuicial)
ciencia, aceptamos como supuesto: es la versin moderna de inmediatamente despus de habrsele administrado un test de
% la hiptesis de Mill acerca de la legalidad de la natiaraleza. 100 tems sobre antisemitismo, con otro pblico que vea la
Esa versin, menos tajante y drstica, puede enunciarse co- misma pelcula sin que se lo haya sometido precisamente a
mo el supuesto del aglutinamiento (stickiness) de la natu- dicho test. Estas dudas se extienden no solo al efecto princi-
raleza: cuanto ms cercanos se hallan dos acontecimientos en pal del pretest, sino tambin a su efecto sobre la respuesta a
la persuasin. Supongamos que esa pelcula en particular fue
tiempo, espacio y valor medido este en cualquiera de sus tan bien realizada que algunas personas llegaron a disfrutarla
dimensiones o en todas ellas, ms tienden a ajustarse a las por su inters romntico, sin darse cuenta siquiera del proble-
mismas leyes. Si bien las interacciones complejas y las relacio- ma social que planteaba. Tales personas no existiran proba-
nes curvilneas habrn de confundir presumiblemente los in- blemente en un grupo al que se hubiere administrado un pre-
tentos de generalizacin, tal posibilidad aumenta en relacin test. Si el pretest sensibiliz al pblico sobre el problema,
directa con el grado en que la situacin experimental difiere podra, por medio de una concentracin de la atencin,. inten-
de la situacin con respecto a la cual se desea generalizar. sificar en s el efecto educativo de X. Sera concebible que

Nuestra necesidad de una mayor validez externa ser, pues, el esa X solo resultase eficaz para un grupo al que se hubiese
_ requerimiento de la mxima similitud entre experimentos y administrado un pretest.
Icondiciones de aplicacin que sea compatible con la validez Aunque es frecuente mencionar un efecto sensibilizador de esta
:interna.
'Tngase en cuenta, en este sentido, que las ciencias ms ndole en comentarios anecdticos sobre el tema, los pocos
prsperas, como la fsica y la qumica, han avanzado sin resultados publicados de investigaciones indican tanto la ausen-
prestar la menor atencin a la representatividad (aunque s, y cia de efectos [p. ej., Anderson, 1959; Duncan y otros, 1957;
Glock, 1958; Lana, 1959a, 1959b; Lana y King, 1960; Piers,
mucha, a la reiterabilidad por parte de investigadores inde- 1955; Sobol, 1959; Zeisel, 1947] como un efecto de interac-
pendientes). Un laboratorio artificial dentro de una torre de cin que equivale a un amortiguador. As, Solomon [1949]
marfil quiz sea una maravilla, pero no ser representativo, y descubri que administrando un pretest se reduca la eficacia
a menudo la artificialidad puede resultar imprescindible si se del entrenamiento ortogrfico experimental, y Hovland, Lums-
quiere separar analticamente variables fundamentales para los daine y Sheffield [1949] sugirieron que un pretest restringa
descubrimientos de muchas ciencias. Pero, sin duda, si no in- los efectos persuasivos de las pelculas cinematogrficas. Bien
terfiere con la validez interna o el anlisis, la validez externa vale la pena evitar este efecto de interaccin aunque no sea
es una consideracin de la mayor importancia, sobre todo para tan expuesto a error como la sensibilizaciOn (ya que los falsos
una ciencia aplicada como es la pedagoga.
-
positivos son un problema mayor en nuestra literatura que los
,Interaccin de las pruebas y X. En estudios del diseo experi- falsos negativos, a causa de la gran cantidad de descubrimien-
tos publicados [Campbell, 1959, pgs. 168 70]).
mental en s, el peligrn que constituye el pretest para la vali-
-

Al restringir la validez externa, el efecto del pretest sobre X


dez externa fue denunciado por primera vez por Solomon depende, naturalmente, del grado en que tales mediciones
1[1949], aunque idnticas consideraciones haban llevado an- repetidas son caractersticas del conjunto respecto del cual se

40
41
quiere generalizar. En el mbito de las comunicaciones masi- por realizar un estudio dentro de una nica escuela volunta-
vas, la entrevista del investigador y los procedimientos del test ria, empleando la asignacin aleatoria de sujetos a grupos ex-
de actitud son bastante atpicos. Pero en la investigacin pe- perimentales y de control, no nos preocupara el efecto prin-
daggica nos interesa generalizar respecto de una situacin en cipal de la escuela en s. Si este factor elevara por igual la
que la administracin de tests es una prctica regular. Sobre media del grupo experimental y la del de control, no se causara
todo si el experimento puede utilizar como O exmenes co- dao alguno. Pero si existiesen en la escuela caractersticas
rrientes tomados en las aulas, pero quiz tambin si las O que hicieran ms eficaz al tratamiento experimental en ella'
experimentales son similares a las de utilizacin habitual, no ,que en la poblacin de escuelas que constituyen el verdadero
se producira ninguna interaccin indeseable entre la adminis- objetivo de la prueba, las consecuencias podran ser graves.
tracin de los tests y X. Cuando se emplea un test con proce- Queremos estar seguros de que puede menospreciarse la in-
dimientos muy poco usuales, o cuando el test implica engao, teraccin entre las caractersticas de la escuela ( probablemente
reestructuracin conceptual o cognitiva, sorpresa, tensin, etc., relacionadas con el hecho de que es voluntaria) y los trata-
los diseos con grupos no sometidos a pretest continan sien- mientos experimentales aplicados. Algunas variables experi-
do muy convenientes, aunque no imprescindibles. mentales podran ser bastante sensibles a las caractersticas de
la escuela, 4o cual quiere decir que interactuaran con ellas;
Interaccin entre la seleccin y X. Aun cuando el diseo 4 otras, no. La interaccin podra darse en escuelas con CI
controla los efectos de seleccin a fin de explicar las diferen- medios similares, o no presentarse all donde las diferencias de
cias entre el grupo experimental y el de control, contina en CI fuesen elevadas. Sera de esperar, sin embargo, una mayor
pie la posibilidad de que los efectos vlidamente demostrados probabilidad de interaccin si las escuelas difiriesen mucho en
solo se verifiquen en aquella poblacin aislada de la cual se distintas caractersticas que si fuesen anlogas.
extrajeron a la vez ambos grupos: Esta posibilidad es tanto A menudo se producen importantes sesgos de muestreo a cau-
mayor cuanto ms graves son nuestras dificultades de conse- sa de la inercia de los experimentadores, que no conceden a
guir sujetos para el experimento. Consideremos las posibles una seleccin ms representativa de escuelas la oportunidad
consecuencias de un experimento de enseanza en el cual el de negarse a participar. De ah que la mayora de las investi-
investigador se ha visto rechazado por nueve sistemas escolares gaciones sobre educacin se hagan en los establecimientos que
y aceptado por el dcimo. Es casi seguro que ese ltimo dife- cuentan con mayor porcentaje de alumnos hijos de profesores
ra, en ms de un aspecto, de los nueve anteriores, as como universitarios. Aunque es imposible la representatividad per-
del conjunto de escuelas para el que quisiramos generalizar. fecta en el muestreo, y aun se la descuida casi en absoluto en
Por lo tanto, no es representativo. Podra asegurarse que, en muchas ciencias (por ejemplo, en la mayora de los estudios
cuanto a la escuela media, su personal tiene ms espritu, me- publicados en el Journal of Experimental Psychology), puede
nos temor a las inspecciones y ms deseo de mejorar. Y aun- y debe aspirarse a ella como a un desidertum en la investi-
que los efectos que descubriramos fuesen internamente vli- gacin educacional. Una forma de aumentarla es reducir el
dos, podran ser especficos de tales escuelas. A fin de poder nmero de alumnos o aulas participantes que pertenezcan a
formular un juicio lo ms exacto posible sobre la materia, con- un colegio o nivel dado y aumentar la cantidad de escuelas y
vendr que los informes de investigacin proporcionen da- niveles en que se lleve a cabo, el experimento. Es obvio que
tos sobre cuntas y cmo eran las escuelas y los cursos de los nunca vamos a realizar experimentos sobre muestras que re-
que se solicit cooperacin y la negaron, a fin de que el lector presenten a todas las aulas de Estados Unidos o del mundo.
pueda estimar la gravedad de posibles sesgos selectivos. En Solo poco a poco aprenderemos hasta dnde se puede genera-
general, cuanto mayor es la cooperacin prestada, mayor el lizar un descubrimiento internamente vlido, por medio de
grado en que se afecte la rutina y ms elevada nuestra tasa de comprobaciones empricas en ese sentido. Pero tales intentos
negativas, mayor ser tambin la oportunidad de que exista de generalizacin tendrn xito ms a menudo si en el expe-
un efecto de especificidad de seleccin. rimento original se demuestra el fenmeno en una amplia va-
Aclaremos ms puntualmente qu es lo que en realidad sig- riedad de condiciones.
nifica la interaccin entre seleccin y X. Si estuvisemos En cuanto a los signos positivos y negativos que aparecen en

42
43
otras ciencias el supuesto emprico de que no existen leyes
el cuadro 1, resulta evidente que nada seguro puede consignar-
que dependan en verdad del tiempo, que los efectos de la
se en esa columna. Se la presenta, no obstante, porque los re-
historia, cuando los haya, se debern a combinaciones espe-
, quisitos de algunos diseos exageran o atenan la. gravedad cficas de condiciones de estmulo que se dieron en aquel mo-
,de este problema. El diseo 4, dentro del mbito de las acti- mento, y que llegarn a incorporarse en definitiva a leyes ge-
tudes sociales, es tan exigente en lo que a cooperacin por nerales independientes del tiempo [Nyman, 1960]. (Tal vez
parte de los participantes se refiere, que en definitiva la inves- parezca que las cosmologas de un universo en expansin
tigacin solo se hace con un pblico cautivo en vez de reali- requieren una restriccin de esta afirmacin,pero no en for-
zarla con ciudadanos comunes, que son a quienes quisiramos mas pertinentes a lo que ahora estudiamos.) Sin embargo, la
referirnos. En una situacin de esa ndole, el diseo 4 mere- feliz reiteracin de los resultados de la investigacin en distin-
. cera un signo negativo en cuanto a seleccin. No obstante, tos tiempos y situaciones aumenta nuestra confianza en el valor
en la investigacin pedaggica nuestro universo de inters est de la generalizacin& al disminuir la probabilidad de la interac-
constituido por un pblico cautivo para el cual se pueden obte- cin con la historia. '
ner diseos 4 de elevada representatividad. 'Estos distintos factores no se han incluido como otros tantos
-
encabezamientos de columnas en el cuadro 1, porque no ofre-
Otras interacciones con X. De manera parecida, las interaccio- cen bases firmes de discriminacin entre diferentes diseos.
nes de X con los dems factores pueden examinarse como
amenazas a la validez externa. La mortalidad diferencial sera
un producto de X y no una interaccin con ella. La interaccin Dispositivos reactivos. En el experimento psicolgico comn,
de la instrumentacin con X se ha incluido implcitamente en si no en la investigacin educativa, la obvia artificialidad de
la situacin experimental y la conciencia del estudiante de
el anlisis de validez interna, ya que un efecto especfico de
que est participando en un experimento son causas ms que
instrumentacin ante la presencia de X falseara el verdadero suficientes de carencia de representatividad. Para sujetos hu-
efecto de X (p. ej., cuando los observadores asignan puntajes,
manos, se proyecta una tarea de resolucin de problemas de
-
Conocen las hiptesis y saben cules son los estudiantes que orden ms elevado, en la cual se reacciona contra los procedi-
recibieron X). Una amenaza a la validez externa es la posi-
mientos y el tratamiento experimental no solo en razn de
bilidad de que los efectos sean especficos de los instrumentos sus simples valores de estmulo, sino tambin por su funcin
, particulares ( tests, observadores, medidores, etc.) empleados de claves para interpretar la intencin del experimentador.
;en el estudio. Si en todos los tratamientos se utilizan obser- 'El representar cargos, el adivinar la intencin, el prepararse
vadores o entrevistadores mltiples, tales interacciones pue- para la inspeccin, el sentir cada cual que soy un conejillo
den estudiarse directamente [ Stanley, 1961a]_ La regresin de Indias, o muchas otras actitudes as generadas, no son
no interacciona con X.
en modo alguno representativas de la verdadera situacin
iLa maduracin tiene consecuencias de especificidad de selec-
cin: los resultados pueden ser especficos de un determi-
escolar; parecen calificar ms bien el efecto de X, dificul-
tando gravemente la generalizacin. Cuando es imposible evi-
nado grupo etano, del cansancio, etc. La interaccin de la tar tales. dispositivos reactiv, habra que continuar de cual-
historia y X implicara que el efecto haba sido especfico de
quier manera con -161- experimentos de esa ndole que tengan
las condiciones histricas del experimento, y aunque su ob- validez interna, pero resulta obvia la (conveniencia de evitar
ervacin es vlida, no se lo hallara en otras. los cuando ello sea posible. Al hacer esta afirmacin adheri-
El hecho de que el experimento se llevase a cabo en el mos en parte a la conocida crtica antiexperimental que es
trascurso de una guerra, o a continuacin de haber fracasado frecuente en los consejos de educacin y entre los docentes,
una huelga de maestros, etc., podra producir una reaccin contra la futilidad de toda esa experimentacin. Nuestra
frente a X que no aparecera en otras circunstancias. Si tu-
ms moderada conclusin no es, sin embargo, que habra que
visemos que preparar un modelo de muestreo para este pro- abandonar la investigacin por ese motivo, sino ms bien -
blema, nos gustara que el experimento se repitiese en una que, a causa de l, habra que mejorarla. A este respecto tene-
muestra aleatoria de ocasiones pretritas y futuras, - lo cual, mos unas cuantas, sugerencias qe ofrecer.
como es obvio, resulta ?raposible. Adems, compartimos con DL
,9
\
44 r 45 I' -I
11 " 411>1.41-r
1)11;1211j
Cualquier aspecto del procedimiento experimental puede pro-
ducir ese resultado de dispositivos reactivos. La administracin descubrimientos hayan de generalizarse a otras situaciones
de pretests, prescindiendo de su contenido, puede hacerlo, y e scolares.
parte de la interaccin del pretest con X puede ser de ese En estos momentos, parecen estar en boga dos tipos principa-
tipo, aunque hay poderosas razones para sospechar de los as- les de experimentacin dentro de las escuelas: 1 ) estudios
pectos mismos de contenido de la aplicacin del test. El sis- impuestos a la escuela por alguien de fuera, que persigue
tema de aleatorizacin y asignacin a tratamientos quiz sea sus propios intereses y cuyo objetivo no es que la escuela em-
de esa ndole. Consideremos el efecto que se produce sobre prenda una accin inmediata (o cambio), y 2 ) el llamado
una clase cuando (como en Solomon [1949] se hace pasar investigador de accin, que procura que sean los maestros
a una habitacin separada a la mitad de los alumnos, elegi- mismos quienes experimenten, tomado este trmino en sen-
dos al azar. Ese acto, ms la presencia de maestros extra- tido muy amplio. En el primer caso los resultados pueden
os, tiene que crear por fuerza expectaciones de hechos set rigurosos pero no aplicables. En el segundo, en cambio,
desusados, suscitndose as el asombro y una activa curiosi- quiz sean muy aplicables pero probablemente no son cier-
dad en cuanto a su objeto y finalidad. La presentacin del tos, a causa de una gran falta de rigor en la investigacin.
tratamiento X, si fuese un acontecimiento inusitado, podra Otro modelo posible es que las ideas para la investigacin es-
tener un efecto similar. Es de presumir que aun el postest, en colar partan de los maestros y directores, se elaboren los
un diseo 6 de postest solamente, podra crear esas mismas diseos para someterlas a prueba en cooperacin con espe-
actitudes. Cuanto ms evidente sea la conexin entre el tra- cialistas en metodologa de investigacin y luego se encar-
tamiento experimental y el contenido postest, ms probable guen de la mayor parte de la experimentacin los promo-
ser ese efecto. tores de la idea. Los anlisis estadsticos respectivos podra
En el campo de los cambios de opinin pblica, esos disposi- realizarlos el investigador metodologista, y los resultados los
tivos reactivos suelen ser difciles de evitar. Pero en la mayor volvera a introducir al grupo un intermediario idneo ( su-
parte de la investigacin de mtodos educativos no hay nece- pervisor, director de investigaciones del consejo escolar, etc.)
sidad de que los estudiantes sepan que se est realizando un que hubiera servido en tal carcter durante todo el proceso.
experimento. (Sera muy conveniente que tambin los maes- De esa manera se lograran resultados pertinentes y correc-
tros lo ignorasen, a la manera del doble ciego en medicina, tos. La forma de realizar investigacin bsica con un siste-
pero por lo comn esto suele ser imposible.) Varios recursos ma de esta ndole es un problema en gran parte sin resolver
permiten disimularlo. Si las X son variables sobre aconteci- an, pero los estudios podran ser cada vez menos ad hoc y
mientos usuales en el aula, pero que se producen a intervalos orientarse ms hacia los aspectos tericos, bajo la supervisin
bastante largos dentro del calendario escolar, un tercio de la de un intermediario competente.
batalla se habr ganado si los tratamientos mencionados se Aunque no tenemos en esta obra la intencin de destacar
aplican sin - previo anuncio. En forma similar, si se incluyen los buenos o malos ejemplos observables en la literatura es-
las O en exmenes regulares, se llena el segundo requisito. pecializada, un reciente estudio de Page [1958] indica una
Si las X son comunicacione -
s centradas en determinados estu- utilizacin tan buena de estos aspectos ( evitando dispositivos
diantes, puede lograrse la aleatorizacin sin necesidad de tras: reactivos, logrando representatividad de muestreo y evitando
portar fsicamente muestras aleatorias equivalentes a aulas las interacciones entre las pruebas y X), que vamos a citarlos
distintas, etctera. aqu como ilustracin concreta de la prctica ptima. Su estudio
A la luz de estas consideraciones, as como de observaciones indica que breves comentarios escritos agregados a exmenes
personales de los experimentadores que han publicado datos objetivos que se devuelven a los alumnos hacen mejorar el ren-
pese a tener un rapport tan pobre que sus hallazgos eran bas-
dimiento en pruebas objetivas posteriores. A esta conclusin se
tante engaosos, los autores del presente volumen van lle- lleg actuando con 74 maestros, 12 consejos escolares, 6 nive-
gando poco a poco a la conclusin de que la experimentacin les o grados (7-12), 5 niveles de rendimiento ( A, B, C, D, F)
dentro de las escuelas debe realizarse, siempre que sea posi- y gran variedad de sujetos; no hubo casi prueba alguna de
ble, con el personal regular de ella, en especial cuando los efectos de interaccin.
Los alumnos y las clases se eligieron al azar. Se emple como
46
47
pretest el primer examen objetivo regular en cada clase. Arro- los estudiantes como si se los hubiese asignado al azar. Los
jando un dado especial, el maestro asignaba alumnos a grupos detalles se estudiarn en el captulo siguiente.
de tratamiento y, segn los casos, agregaba o no comentarios
escritos a la prueba. La siguiente prueba objetiva, tomada de
acuerdo con la programacin normal, pas a ser el postest. y fests de significacin para el diseo 4
Hasta donde pudo determinarse, ninguno de los 2.139 alum-
nos se enter de la experimentacin. Pocos son los procedi- Hay que distinguir el diseo experimental del uso de tests
mientos de instrucciones que se prestan a esta tan disimulada estadsticos de significacin. El primero es el arte de lograr
aleatorizacin, ya que por lo comn la comunicacin oral ne- comparaciones interpretables y, como tal, sera necesario aun-
cesaria se dirige a toda la clase y no a algunos individuos. (Las que el producto final consistiera en porcentajes graficados,
comunicaciones escritas permiten la aleatorizacin, aunque la fotografas de grupos en accin, etc. En todos estos casos, la
captacin, por parte del estudiante, de los distintos trata- interpretabilidad de los resultados depende del control so-
mientos constituye un problema.) Teniendo en cuenta estos bre los factores a que hemos hecho referencia. Si la compara-
ideales los investigadores pueden lograr que los experimentos cin es interpretable, se requieren tests estadsticos de signi-
tengan menos caractersticas reactivas que en la actualidad. ficacin para decidir si las diferencias obtenidas exceden o no
Por medio de exmenes regulares tomados en el aula, o tests las fluctuaciones previsibles cuando no existan verdaderas di-
presentados como exmenes regulares y anlogos en su con- ferencias para muestras de ese tamao. El uso de tests de sig-
tenido, a la vez que mediante procedimientos alternativos nificacin presume que es factible establecer comparaciones en-
de enseanza presentados, sin previo aviso ni peticin de tre los grupos, y que la diferencia descubierta es interpretable,
disculpas, en el curso de las actividades escolares, es probable pero no da pruebas de ello. De ah que nos gustara exponer el
que en la mayora de los casos puedan evitarse estas dos cau- diseo experimental sobre la base del sentido comn y de con-
sas de dispositivos reactivos. A veces, en grandes escuelas se- sideraciones no matemticas. Esperamos que la mayor parte
cundarias o en universidades donde los alumnos se inscriben de esta obra resulte accesible a los estudiantes de ciencias de
en cursos populares dictados en determinados horarios y des- la educacin que carezcan todava de preparacin estadstica.
pus se los asigna en forma arbitraria a mltiples divisiones No obstante, hay que reconocer que la cuestin de los proce-
simultneas, podran lograrse secciones de equivalencia alea- dimientos estadsticos est ntimamente vinculada al diseo
toria mediante el control del proceso de asignacin (vase en experimental, razn por la cual ofrecemos estos comentarios
Siegel y Siegel [1957] la aplicacin de un proceso aleatorio particulares sobre el tema. [Vase, asimismo, Green y Tukey,
natural que se aprovech en esta forma). Sin embargo, por 1960; Kaiser, 1960; Nunnally, 1960, y Rozeboom, 1960.1
la accin de historias intragrupales nicas, tales secciones, al
principio equivalentes, se tornan con el correr del tiempo en Una estadstica errnea de uso comn. Aunque el diseo 4 es
4egm en to s cada vez ms diferenciados.
el comn y frecuente, los tests de significacin que con l se
La solucin a este problema, aplicable en general, es trasla- '1 utilizan son a menudo errneos, incompletos o inapropiados.
dar la aleatorizacin al aula tomada como unidad Al aplicar la razn crtica comn o prueba t a ese diseo
y construir -

grupos experimentales y de control, constituido cada uno de experimental estndar, muchos investigadores han computado
ellos por muchas aulas asignadas al azar [vase Lindquist, dos t: una para la diferencia pretest-postest en el grupo ex-
1940, 1953]. Por lo comn, aunque no es imprescindible, los perimental y otra para la ganancia pretest-postest en el gru-
cursos se clasificaran para su anlisis sobre la base de facto- po de control. Si la primera resulta estadsticamente signi-
res como escuela, maestro o (cuando este tenga varias clases), ficativa y la otra no, llegan a la conclusin de que X tuvo
hora, asignatura, nivel intelectual medio, etc.; de ellos se asig- un efecto, sin ninguna comparacin estadstica directa entre
naran por un proceso aleatorio varios grupos de tratamiento el grupo experimental y el de control. A menudo las condi-
experimental. Ya se han realizado algunos estudios de esta ciones fueron tales que, de haberse aplicado una prueba ms
ndole, pero creemos que pronto se generalizarn. Ntese que apropiada, la diferencia no habra sido significativa (como
el test de significacin apropiado no consiste cuando los valores de significacin son casos lmites y el gru-
en mezclar todos

48
49
po de control indica una ganancia que casi alcanza el nivel
de significacin). Windle [1954] y Cantor [1956] han de- para el experimento habitual de laboratorio. En casos muy
mostrado la frecuencia de este error. raros, como el estudio de Page [1958], hay un muestreo real
tomado de un gran universo predesignado, que se apropia las
Utilizacin de Punta/es de ganancia y covariancia. frmulas habituales. En el extremo opuesto se encuentra el
aceptable de uso ms comn consiste en computar para La prueba
cada experimento de laboratorio presentado en el Journal of Ex-
grupo puntales de ganancia pretest-postest y calcular una perimental Psychology, por ejemplo, en el que la validez in-
entre los grupos experimentales y de control sobre la base de t terna ha sido la nica consideracin y todos los integrantes
esos puntajes. El bloqueo o nivelacin aleatoria de pun- de un pequeo universo nico se asignaron a los grupos de
tales pretest y el anlisis de covariancia utilizando como co- tratamiento. En este tipo de prueba se pone gran nfasis en
variable los puntajes de pretest son, por lo comn, preferibles el procedimiento aleatorio, pero no a fin de asegurarse la re-
a las simples comparaciones de puntajes de ganancia. Puesto presentatividad respecto de otra poblacin mayor, sino al ex-
que la mayor parte de los experimento clusivo efecto de igualar los grupos experimentales y de control
s en educacin no acu- o los distintos grupos de tratamiento. La aleatorizacin se apli-
san diferencias significativas, y por lo tanto no suelen infor-
marse, el uso de este anlisis ms preciso parece ser muy con- ca, pues, a una poblacin finita muy reducida, que es en rea-
veniente. Considerando la labor que implica conducir un ex- lidad la suma de los grupos experimentales y de control.
perimento, el trabajo de realizar el anlisis correcto es relati- Esta posicin extrema sobre el universo de muestreo se jus-
vamente trivial. Para Ms detalles, pueden consultarse trata- tifica cuando se describen procedimientos de laboratorio de
mientos estndar de anlisis del tipo Fisher [vanse tambin esta ndole: se solicitan voluntarios, prometindoles o no una
Cox, 1957, 1958; Feldt, 1958, y Lindquist, gratificacin en dinero, puntajes de personalidad, punta-
1953]. jes para la aprobacin de cursos, o cumplimiento de un re-
Aspectos estadsticos de la asignacin aleatoria a tratamientos
de cursos intactos. quisito obligatorio que de todos modos tendrn que satisfacer
La estadstica habitual solo resulta apro- en algn momento del curso acadmico. A medida que llegan,
piada en casos de asignacin aleatoria de alumnos individua-
les a los tratamientos. Si, en cambio, se asignaran cursos intac- se los va asignando al azar a los distintos tratamientos. Cuan-
tos, las frmulas precedentes daran un trmino de error de- do se ha alcanzado determinado nmero de sujetos, se inte-
masiado pequeo, pues, como es natural, el procedimiento de rrumpe el experimento. Ni siquiera ha habido una seleccin
aleatorizacin habr sido ms global --y---g aleatoria entre los integrantes de una lista mucho mayor de
menos acontecimientos aleatorios. Lindquist a habrn utilizado
[1953, pgs. voluntarios. Los primeros constituyen una muestra sesgada y
172-89] ha suministrado el fundamento lgico y las frmu- el universo total muestreado cambia de un da a otro a
las para la realizacin de un correcto anlisis. En esencia, se medida que el experimento contina, que se requiere ms
emplean las medias de la clase como observaciones bsicas, presin para reclutar voluntarios, etc. En un momento dado
y se prueban los efectos del tratamiento contra variaciones en se detiene el procedimiento, despus de haberse utilizado a
esas medias. Un anlisis de covariancia utilizar todos los miembros designables del universo en uno u otro
riable medias pretest. a como coya- de los grupos de tratamiento. Ntese que los sesgos implica-
dos de muestreo no amenazan en lo ms mnimo la equiva-
Aspectos estadsticos de la validez interna. lencia aleatoria de los grupos de tratamiento, sino solo su
precedentes se hicieron a fin de dar a conocerLas observaciones
la ortodoxia representatividad.
estadstica relativa al diseo experimental. Las siguientes re- Consideremos ahora a un cientfico ms meticuloso, que de
presentan un esfuerzo por ampliar o corregir esa ortodoxia, una clase integrada por 250 personas extrae 100 al azar, se
extendiendo al terreno de la estadstica del muestreo una in- pone en contacto con ellas por carta o por telfono y, despus
ferencia de la distincin entre de entrevistarlos, los asigna, tambin al azar, a grupos de tra-
na. validez externa y validez inter- tamiento. Por supuesto, unos 20 de ellos no pueden ajustarse
Los principios estadsticos antes analizados implican en
su totalidad el muestreo en un universo infinitamente gran- al horario de laboratorio, estn enfermos, etc: por lo cual
de, ms apropiado para una encuesta de opinin pblica que se ha producido una redefinicin implcita del' universo. Y
aunque gracias a su perseverancia consiga los 100, lo que_12,44-
50
51
br ganado, desde el punto de vista de la representatividad, y social, aunque no todava con la investigacin pedaggica ),
ser la posibilidad de generalizar con seguridad estadstica a ese error si lo es ser siempre preferible. La posibilidad
propsito del cursa del ario 1961 de Psicologa Educacional de subestimar la significacin es mayor cuando solo hay dos
A en la Escuela Normal del Estado. Este nuevo universo, condiciones experimentales y se emplean todos los sujetos
aunque mayor, carece de positivo inters cientfico. Sus lmi- disponibles [Wilk y Kempthorne, 1955, pg. 1154].
tes no son los estatuidos por ninguna teora cientfica. Los
aspectos de verdadero inters para la generalizacin debern
explorarse por medio del muestreo de experimentos rea-
lizados en otros lugares. Por supuesto, al ser menos seleccio- 5. Diseo de cuatro grupos de Solomon
nados sus alumnos, se tiene una mayor validez externa, pero
no ganancia suficiente para que la mayora de los psiclogos Aunque el diseo 4 se usa ms, el 5, denominado diseo de
experimentales consideren que se compensa con ello el es- cuatro grupos de Solomon [1949 ] tiene con razn un ma-
fuerzo realizado.
yor prestigio y constituye la primera consideracin explcita
Resulta, en general, obvio que el fin principal que se persi- de factores de validez externa. El diseo es el siguiente:
gue con la aleatorizacin en experimentos de laboratorio es
Ja validez interna, no la externa. Por tanto, habra que utili- R 0 1 X 02
zar mrgenes de error ms reducidos y apropiados, basados R 03 04
en pequeos universos finitos. Siguiendo a Kempthorne R X 05
[1955] y Wilk y Kempthorne [1956], creemos que el mo- 06
delo correcto es la aleatorizacin en urnas en vez de la extrac-
cin de muestras de un universo. De ese modo se dispone de Trazando en forma paralela los elementos del diseo 4 (01
- un test no paramtrico ms apropiado y preciso, en el cual a 04 ) con los grupos experimental y de control sin pretest,
se toman los puntajes obtenidos en los grupos experimenta- cabe determinar tanto los efectos principales de la realizacin
les y de control y se los asigna una y otra vez a dos urnas, de la prueba como la interaccin entre ella y X. De ese modo,
generando emprica o matemticamente una distribucin de no solo se aumenta la posibilidad de generalizar, sino que
diferencias medias que resultan en su totalidad de asignacio- adems se repite el efecto de X en cuatro formas diferentes:
nes aleatorias de esos puntajes particulares. Tal distribucin 02> 01, 02> 04, 05 > 06 y 05 > 03. Las inestabilidades
constituye el criterio con que debera compararse la diferen- concretas de la experimentacin son tales que, si esas compara-
cia media obtenida. Cuando exista una interaccin posicin- ciones concuerdan, el vigor de la inferencia queda muy incre-
tratamiento (heterogeneidad de efectos reales entre los mentado. Otra contribucin indirecta a la posibilidad de ge-
sujetos), esa distribucin tendr una variabilidad menor que neralizar los hallazgos experimentales es tambin que, en vir-
la correspondiente distribucin adoptada en la prueba comn. tud de la experiencia con el diseo 5 en cualquier mbito de
Con estos comentarios no pretendemos modificar mucho la investigacin dado, se averigua la posibilidad general de in-
actual prctica en la administracin de tests de significacin teracciones de pruebas por X, pudindose as interpretar
en la investigacin pedaggica. Las soluciones exactas son mejor los diseos 4, 'tanto futuros como pasados. Asimismo,
difciles de conseguir y, por lo comn, muy laboriosas. La alea- puede advertirse (comparando 06 con 01 y 0 3 ) un efecto
torizacin por urnas, por ejemplo, suele exigir la utilizacin combinado de maduracin e historia.
de computadoras de gran velocidad. La direccin del error, es
conocida: el empleo de la estadstica tradicional es demasiado
conservador, con una excesiva tendencia a decir no se regis- Pruebas estadsticas para el diseo 5
tran efectos. Si juzgamos que nuestras publicaciones estn
saturadas de falsos positivos, es decir, -de informacin so- No hay ningn procedimiento estadstico particular que utili-
bre efectos que no resiste la prueba de una validacin cru- ce a un mismo tiempo los seis conjuntos de observaciones.
zada (como acaece, por cierto, con la psicologa experimental Las asimetras del diseo descartan el anlisis de la variancia

52
53
de puntajes. (Las sugerencias de Solomon a este respecto se
de la informacin presentada al jurado por el abogado defen-
consideran inaceptables.) Dejando de lado los pretests, salvo
como un nuevo tratamiento coordinado con X, sor. El diseo 6 responde a esa necesidad, y adems es apro-
se pueden piado para todas las situaciones en que podran utilizarse los
estudiar los puntajes postest mediante un simple anlisis 2
del diseo de variancia: X2 diseos 4 o 5, es decir, aquellas en que es posible una ver-
dadera aleatorizacin. Su forma es la siguiente:
Sin X Con X R X01
Con administracin de pretest 04
Sin administracin de pretest 02 02
06 05
Si bien este diseo se utilizaba ya- en la dcada de 1920, la
Sobre la base de las medias de las columnas se estima el
efecto principal de X; mayora de los 'textos metodolgicos no lo han recomendado.
de las medias de las filas, el efecto Ello se debi en parte a que se lo confunda con el diseo
principal del pretest y de las medias de los casilleros, la
interaccin entre la aplicacin del test y X. 3, y tambin a la falta de confianza en la aleatorizacin como
Si los efectos procedimiento de igualacin.
principales e interactivos de la aplicacin de las pruebas son
muy pequeos, acaso sea conveniente Puede considerarse que este diseo comprende los lti-
covariancia de 0 4 realizar un anlisis de mos dos grupos del diseo de cuatro grupos de Solomon;
covariable. contra 02, con los puntajes del pretest por , controla la aplicacin del test como efecto principal y la in-
teraccin, pero, a diferencia del diseo 5, no los mide. Sin
L 'embargo, esa medicin es tangencial a la cuestin bsica de
si X tuvo o no un efecto. As, pues, el diseo 5 es preferible
6. Diseo de grupo de control con postest al 6 por las razones apuntadas, pero las mayores ventajas
nicamente del 5 quiz no justifiquen el esfuerzo que demanda (ms del
rdoble). Asimismo, el diseo 6 es por lo comn preferible al
4, a menos que haya alguna duda a propsito de la autenti-
El pretest es un concepto muy arraigado en el pensamiento del proceso aleatorio de asignacin. El diseo 6 se usa
cidad
i
- de los investigadores en los campos de la educacin y la psi-
-demasiado poco en investigacin educacional y psicolgica.
cologa, pero en realidad no es imprescindible para los dise- Pero en el caso de repeticin de pruebas, que se presenta
Los experimentales propiamente dchos.Por razones psico- con frecuencia en la investigacin educacional, si se dispone de
lgicas, es difcil renunciar a tener la seguridad de que los antecedentes apropiados en materia de variables, se los debe-
grupos experimentales y de control eran iguales antes del ra emplear para bloqueo o nivelacin, o como covariables.
tratamiento experimental diferenciaLt No obstante, la aleato- Esta recomendacin la hacemos por dos motivos. Primero,
rizacin implica la mayor seguridad, plicable a cualquier fin, porque las pruebas estadsticas en que se apoya el dileo 4
de, la carencia de sesgos iniciales entre grupos. Dentro de los son ms decisivas que las existentes para el 6. El esfuerzo
margenes de confianza establecidos por las pruebas de signi- que exige el diseo 4 anula esta ventaja en la mayor parte
ficacin, .ja aleatorizacin puede ser suficiente, sin necesidad de las situaciones de investigacin, pero no ocurrira as si se
de recurrir al pretest: ',En realidad, casi todos los experimen- dispusiese 'en forma automtica de antecedentes apropiados
tos agrcolas realizados en la tradicin de Fisher [1925, 1935] sobre puntajes. En segundo lugar, la disponibilidad de pun-
carecen de pretest. Ms todava, en investigacin pedaggica, tajes pretest permite examinar la interaccin de X y el nivel
sobre todo en los grados primarios, tenemos que experimen- de habilidad en el pretest, explorando as ms a fondo la
tar a menudo con mtodos que permitan la introduccin ini- posibilidad de generalizar el hallazgo. Algo similar puede ha-
cial de elementos absolutamente nuevos, para los cuales son cerse a propsito del diseo 6, empleando otras medidas dis-
imposibles los pretests en el sentido ordinario del trmino, lo ponibles en vez del pretest, pero estas consideraciones, suma-
mismo que estaran fuera de lugar los referidos a la presunta das al hecho de que para la investigacin pedaggica los tests
culpabilidad o inocencia en un estudio acerca de los efectos frecuentes son caractersticos del universo al cual se quieren

54
55
extender las generalizaciones, pueden invertir el criterio de
preferir por lo comn el diseo 6 al 4. Ntese asimismo que D mo medicin postest, a causa de su probable insensibilidad
para cualquier mortalidad sustancial entre R y el postet los X si se lo compara con una medicin ms especficamente
datos de pretest del diseo 4 ofrecen mayores oportunidades propiada en contenido y oportunidad. No tiene mucha im-
de eliminar la hiptesis de mortalidad diferencial entre los ortancia decidir si ese seudodiseo de pretest debe clasifi-
grupos experimental y de control. arse como 6 o como 4. Tendra las ventajas del primero, ya
Aun as, hay muchos problemas para los cuales no se dispone ue evitara una sesin pretest introducida por el experimen-
de pretests, o estos resultan inconvenientes o capaces de pro- idor, as como la reveladora repeticin de un contenido
vacar reacciones, y para esos casos es preciso seguir insistien- oco usual idntico o muy similar (como en los estudios de
do, en muchos sectores, acerca de la legitimidad del dise- ambios de actitud).aSor estas razones la inclusin del dise-
o 6. Adems de los estudios sobre el modo de ensear o 6 bajo el ttulo de 'Dispositivos reactivos debera_ser algo
material nuevo, queda una gran cantidad de casos en los que l s positiva que respecto de los diseos 4 y 5. La justifica-
la X y la O postest pueden entregarse a los alumnos o grupos n de esta diferencia es, por cierto, mucho ms vlida para
como un solo paquete natural, y un pretest resultara mo- 3 ciencias sociales en general que para la investigacin sobre
lesto. Tales situaciones se producen con frecuencia en los ..istruccin pedaggica.
mismos procedimientos de prueba, as como en estudios de
instrucciones distintas, planillas de respuesta de formato di-
ferente, etc. Algo similar ocurre con los estudios sobre cam-
paas para reclutar voluntarios, etc.t.En los casos en que hay Diseos factoriales
que guardar el anonimato del alumno, el diseo 6 suele ser
el ms conveniente, encarndose entonces la aleatorizacin Sobre la base conceptual de los tres diseos anteriores, pero
por medio del ordenamiento mezclado de materiales destina- en particular el 4 y el 6, pueden ampliarse las complejas ela-
dos a la distribucin._ boraciones tpicas de los diseos factoriales de Fisher, agre-
gando otros grupos con otras X. En un criterio tpico de cla-
sificacin nica o anlisis de la variancia en un solo sentido,
Aspectos estadsticos del diseo 6 tendramos varios niveles del tratamiento, por ejemplo,
X1, X2, X3, etc. y quiz tambin un grupo X. ( ausencia de
El modo ms sencillo sera la prueba t. El diseo 6 es quiz X). Si se considera el grupo de control como uno de los tra-
la nica situacin para la cual esa prueba es ptima. Sin em- tamientos, habra en los diseos 4 y 6 un grupo para cada
bargo, se pueden emplear el anlisis de covariancia y el tratamiento. En el diseo 5 habra dos grupos (uno some-
bloqueo de variables sujeto [Underwood, 1957b], as como tido a pretest, el otro no) para cada tratamiento, y aun sera
niveles anteriores de educacin, puntajes en tests, ocupacin posible un anlisis de variancia de doble clasificacin (en
de los padres, etc., consiguindose as mayor poder del test dos sentidos). No tenemos noticia de que se hayan realizado
de significacin, muy similar al que brinda un pretest. No es diseos del tipo 5 en ms de dos niveles. Por lo comn, si
necesario que el pretest y el postest sean idnticos. A menudo nos preocupa la interaccin pretest, empleamos el diseo 6,
sern formas diferentes del mismo test y por lo tanto me- a causa del gran nmero de grupos que de no hacerlo as
nos idnticos que una repeticin del pretest. La mayor pre- seran necesarios. Muy a menudo se utilizarn dos o ms varia-
cisin obtenida se vincula en forma directa con el grado de bles de tratamiento, una en cada uno de los distintos nive-
covariancia, y aunque esta suele ser ms elevada en formas les, dando una serie de grupos que podran designarse Xai
alternadas del mismo test que en tests diferentes, se X bi , Xai Xb2, Xai Xb3, Xa2 Xbl, etctera.
trata de una cuestin de grado tan confiable y factorialmente Tales elaboraciones, complicadas con, intentos de economizar
compleja como la superioridad eventual de un promedio pun- eliminando algunas de las posibles permutaciones de X. por
tual respect de un breve pretest. Advirtase, sin embargo, Xb, han producido parte de los inquietantes misterios del di-
que un promedio puntual no es por lo comn conveniente seo factorial ( bloques aleatorizados, parcelas divididas, cua-
drados grecolatinos, repeticin fraccional, confusin, etc. ),
56
57
origen de la enorme brecha que separa las metodologas avan-
zadas de las tradicionales en el mbito de la investigacin Interaccin
educacional. Esperamos que esta obra ayude a salvar ese vaco
por medio de una continuidad con la metodologa tradicional Ya hemos utilizado este concepto en situaciones en que, se-
Lin
y las consideraciones dictadas por el sentido comn que el es- - ' creemos, el lector no especializado lo habr encontrado
tudiante lleva siempre consigo. Tambin estimamos que gran ... c omprensible.Tomo antes, insistimos aqu en las consecuen-
parte de lo que debe ensearse sobre diseo experimental se irias relativas a la posibilidad de generalizar3Expondremos en
entiende mejor si se lo expone en forma de diseos de dos forma grfica (figura 2) cinco posibles resultados de un di-
tratamientos, sin interferencia de otras complicaciones. No seo con tres niveles, compuesto cada uno de ellos de X. y
obstante, la exposicin completa de los problemas planteados Xb, que denominaremos A y B. (Puesto que se han de gra-
por el uso comn provocar una comprensin mayor tanto de ficar tres dimensiones [A, B y O] en dos, son varias las
la necesidad como de la localizacin de modernos enfoques. presentaciones que resultan posibles, de las cuales no emplea-
Al buscar la forma ms eficaz de resumir el anticuado pero tan remos ms que una.) En la figura 2(a) puede apreciarse un
difundido diseo 4 nos vimos ya constreidos a disponer notable efecto principal tanto para A como para B, pero nin-
de un anlisis de covariancia, casi no utilizado en esta situa- guna interaccin. (Hay, por supuesto, una suma de efectos
cin. Y en el diseo 5, con un problema de dos tratamientos siendo A3, B3 el ms fuerte, pero ninguna interaccin,
que se elabora slo para obtener controles necesarios, nos ya que los efectos son aditivos.) En todos los dems casos
alejamos de las relaciones crticas o pruebas t, y nos introdu- encontramos interacciones significativas adicionales, o bien en
cimos en la estadstica del anlisis de variancia. reemplazo de los efectos principales de A y B. Es decir que la
Los detalles de los anlisis estadsticos para diseos facto- ley sobre el efecto de A vara de acuerdo con el valor espe-
riales no pueden ensearse ni aun esbozarse siquiera en esta r cfico de B.
obra. Edwards [1960], Ferguson [1959], Johnson y Jackson En este sentido, los efectos de interaccin son reglas de espe-
[1959] y Lindquist [1953] presentan a los investigadores cificidad de efecto y, por tanto, conducen al intento de gene-
pedaggicos aspectos elementales de tales mtodos. Confiamos, ' ralizacin. El efecto de interaccin en 2(d) es, sin duda
sin embargo, en que las explicaciones siguientes permitirn -- alguna, de ese orden. Aqu, A no produce un efecto principal
alguna mayor comprensin de ciertas alternativas y comple- ( es decir que, si se promedian los valores de las tres B para
jidades de particular relevancia en los aspectos de diseo cada A, resulta una lnea horizontal). Pero cuando se man-
analizados en nuestra obra. Las complejidades que tenemos tiene B en el nivel 1, los aumentos en A producen un efecto
que analizar no comprenden las razones comunes para re- decreciente, en tanto que si se mantiene B en el nivel 3, A
currir a cuadrados latinos ni a muchos otros diseos incom- tiene un efecto incremental. Ntese que si el experimentador
pletos en que el conocimiento de ciertas interacciones se sacri- slo hubiese variado A, manteniendo B constante en el nivel
fica por meras razones de costo. (Pero el uso de cuadrados 1, los resultados, aunque internamente vlidos, 'hubiesen dado
latinos como sustituto de los grupos de control en los casos pie a que se hiciesen generalizaciones errneas a propsito de
en que no hay modo de aleatorizar se estudiar ms adelante, 132 y B3. La caracterstica de mltiple factorial del diseo ha
'omo diseo cuasiexperimental 11.) La razn de haber pres- llevado, pues, a realizar valiosas exploraciones sobre la posi-
cindido aqu de esos diseos incompletos es quer para el ble generalizacin o validez externa de cualquier enunciacin
problema de validez externa resulta muy convenienfe contar sumaria sobre el efecto principal de A.CLas limitaciones de la
con un conocimiento detallado de las interacciones, sobre todo posibilidad de generalizar o de la espeficidad de los efectos
en una ciencia que ha tenido problemas para repetir los des, aparecen en el anlisis estadstico como interacciones signifi-
cubrimientos de un investigador en otro ambiente distinto cativas.-..
[vase Wilk y Kempthorne, 1957]. Los conceptos que trr La figura 2(e) representa una forma de interaccin an ms
tamos de exponer en este captulo son los de la interaccin, extrema: ni A ni B producen efecto principal alguno (no re-
las clasificaciones inclusivas y las clasificaciones cruzadas, y los sultan reglas generales sobre qu nivel de ambas es mejor)
modelos factoriales finitos, fijos, aleatorios y mixtos. pero las interacciones son fuertes y bien definidas. Conside-
remos un resultado hipottico de esta ndole. Supongamos
58
59
Figura 2. Algunos resultados posibles de un diseo factorial
>que tres clases de maestros son, en general, de la misma
3 X 3. eficiencia (p. ej., los improvisadores espontneos, los que pre-
paran a conciencia su, trabajo y los que supervisan con esmero
Grados de O la tarea de sus alumnos). Asimismo, tres mtodos de ense-
Grados de O '
1 (a) t (6)
fianza resultan, en general, de idntica eficacia (p. ej., dis-
cusin en grupo, exposicin formal y supervisin individual).
B, B' En tal caso, aun en ausencia de efectos principales en cual-
i quiera de los tipos de maestros o mtodos pedaggicos, podra
ocurrir que estos segundos tuviesen gran interaccin con la
. ----->... modalidad del maestro: el improvisador espontneo tendra
ms xito con la discusin en grupo y menos 'con la super-
e<>
s B, visin individual, mientras que el acostumbrado a seguir de
Bi cerca a sus alumnos alcanzara los mejores resultados en la
supervisin individual y los peores en el sistema de la discu-
Ai A, sin en grupo.
A, A, A, A3 Desde este punto de vista, cabe distinguir los tipos de interac-
Grados de O 1 Grados de O ciones significativas halladas. Quiz nos resulte provechoso un
concepto como el de interacciones montonas. Ntese que
(e/ /33
(d) en 2(b), como en el 2(a), hay un efecto principal tanto de
A como de B, y que A produce el mismo efecto direccional
en cualquier panel separado de valores de B. En consecuencia,
B, nos sentimos mucho ms seguros si generalizamos a situacio-
e . nes nuevas la expectativa de aumento en O con aumentos
B2 en A que si lo hacemos en 2(c), que podra producir tambin
...,_
11 ....... B2 efectos principales significativos en A y B, as como una in-
teraccin A-B significativa. En realidad, podramos estar casi
tan seguros de la generalidad del efecto principal de A en el
I
caso 2( b) como en el 2(a), libre este de interaccin. Por
A, A, A, cierto que al interpretar efectos con miras a la generalizacin
A, A, A,
Grados de O se las debera graficar y - examinar bien, en todos sus detalles.
Algunas interacciones montonas o unidireccionales pro-
f (e) ducen pocas limitaciones y a veces ninguna sobre la es-
pecificidad. (Vase en Lubin [1961] un profundo estudio de
este problema.)

Clasificaciones inclusivas
En los ejemplos dados hasta aqu, todos los criterios de cla-
sificacin (las A y las B) se han cruzado con todos los
dems criterios. Es decir que todos los niveles de A se han
dado con todos los niveles de B. Sin embargo, el anlisis
de variancia no se limita a esa situacin.
Hasta ahora hemos utilizado, a ttulo de ilustracin, criterios

60
61
de clasificacin que eran tratamientos experimentales Otros
tipos de criterios de clasificacin, como el sexo y la edad de lo comn inclusivos dentro de las escuelas, ya que lo ha-
los alumnos, podran introducirse en muchos experimentos en bitual es que un maestro d clases en un solo colegio. En
forma de clasificaciones plenamente cruzadas. Pero a fin de este caso es concebible una interaccin maestro-escuela, pero
incorporar los usos ms comunes de clasificaciones inclusi- no se la podra computar a menos que todos los maestros
vas, presentaremos la posibilidad de criterios de clasificacin enseasen en uno y otro establecimiento, en cuyo caso maes-
menos obvios. Uno de ellos es maestros. Operando en el ros y escuelas seran cruzados, no inclusivos.
nivel de cruzado total, se podra hacer una prueba en una A los alumnos, o sujetos de un experimento, tambin se los
escuela secundaria en la cual diez maestros emplearan uno puede tratar como criterio de clasificacin. En un mecanismo
de los dos mtodos posibles para ensear una determinada totalmente cruzado, a cada alumno se lo somete a cada uno
asignatura a distintos cursos experimentales. En ese caso los de los distintos tratamientos, pero en muchos casos entra en
maestros seran un criterio de clasificacin absolutamente varios, aunque no en todos, los tratamientos; es decir que
cruzado, pues cada uno de ellos constituira un nivel dife- lo se produce el fenmeno de la inclusin. Un caso frecuente
rente. El efecto principal de los maestros sera la evi- es el estudio, durante el aprendizaje, de datos obtenidos por
dencia de que algunos de ellos son mejores que otros, con pruebas individuales. Aqu podramos tener curvas de apren-
prescindencia del mtodo que emplearon. (Los estudiantes o dizaje para los distintos alumnos, divididos estos entre dos
las clases se habrn asignado al azar; de lo contrario se con- mtodos de estudio. Podran analizarse las interacciones prue-
fundiran las idiosincrasias del maestro con las diferencias de ba-mtodo y alumno-prueba, pero no alumno-mtodo. Si a
seleccin.) Una interaccin significativa entre maestros y m- los alumnos se los clasifica por el sexo, se genera tambin
un- fenmeno de inclusin.
todos significara que el mtodo que mejor funcion haba
Casi todas las variables de inters en la experimentacin edu-
dependido del docente en particular a quien se estaba consi-
derando. cacional pueden cruzarse con otras variables y no tienen por
qu ser objeto de inclusin. Excepciones notables, adems de
Supongamos ahora, siguiendo una interaccin de esta ndole,
que nos interesa conocer si, en general, una tcnica dada es las ya mencionadas, son la edad cronolgica, la edad mental,
el grado escolar (primero, segundo, etc.) y el nivel socioeco-
mejor para maestros que para maestras. Si dividimos ahora
nmico. El lector inteligente habr notado que las variables
nuestros diez maestros en cinco hombres y cinco mujeres, se
independientes, o los criterios de clasificacin, pertenecen a
obtiene una clasificacin inclusiva en el sentido de que la
distintos tipos: 1 ) variables manipuladas, como el mtodo
clasificacin maestros, aunque todava til, no considera los
sexos; es decir que el mismo maestro no aparece en uno y de enseanza, que el experimentador puede asignar a volun-
tad; 2) aspectos potencialmente manipulables, como mate-
otro sexo, en tanto que cada maestro y cada sexo s considera
rias estudiadas, que el experimentador podra asignar de al-
los mtodos. Esta inclusividad exige un anlisis algo distinto
guna manera aleatoria entre los alumnos que utiliza, pero
de aquel en que todas las clasificaciones se cruzan entre s.
(Un anlisis ilustrativo puede verse en Green y Tukey [1960] que rara vez lo hace; 3 ) aspectos relativamente fijos del
y Stanley [1961a] ambiente, como comunidad, escuela o nivel socioeconmico,
.)
Adems, quedan eliminadas ciertas inte- fuera del control directo del experimentador pero que sirven
racciones de las variables inclusivas. As, no son computables
ni tienen, en realidad, sentido desde el punto de vista con- de bases explcitas para la estratificacin de la prueba; 4) ca-
ractersticas orgnicas de los alumnos, como edad, estatura,
ceptual. las interacciones maestros-sexo y maestros-sexo-m-
_todo. peso y sexo, y 5 ) caractersticas de reaccin de los alumnos,
como puntajes en distintos tests. Por lo comn las variables
Maestros tambin podra convertirse en una Clasificacin
independientes manipuladas de la clase 1 son de inters fun-
inclusiva, si el experimento anterior se extendiese a varias
damental, mientras que las variables independientes no ma-
escuelas, de manera que ellas viniesen a constituir un criterio
manipuladas de las clases 3,4 y a veces 5 sirven para aumentar
de clasificacin (en el cual los efectos principales acusaran
la precisin y revelar hasta qu punto son generalizables los
diferencias en la tasa de aprendizaje de los alumnos de los
efectos de las variables manipuladas. Las variables de clase 5
distintos establecimientos). En tal caso los maestros seran por
aparecen de ordinario como covariables o variables depen-

62
63
dientes. Otra forma de considerar las variables independien- Otras dimensiones de extensin
tes es como intrnsecamente ordenadas (grado, nivel socio-
econmico, estatura, pruebas, etc.) o no ordenadas (mtodo Antes de abandonar los verdaderos experimentos a prop-
de enseanza, asignatura, maestro, sexo, etc.). A menudo, sito de los diseos cuasiexperimentales, queremos explorar
los efectos de las variables ordenadas suelen analizarse ms a algunas otras extensiones desde este simple ncleo, aplicables
fondo, a fin de ver si la tendencia es lineal, cuadrtica, c- a todos los diseos que se vern ms adelante.
bica o de grado ms elevado [Grant, 1956; Myers, 19591.

Aplicacin de tests en busca de efectos mediatas


Modelos finitos, aleatorios, fijos y mixtos
En la esfera de la persuasin bastante afn a la de la edu-
Hace poco, estimulados por el trabajo indito de Tukey del cacin y la enseanza, Hovland y sus colegas comproba-
ario 1949, varios estadsticos matemticos crearon modelos ron, en reiteradas oportunidades, que los efectos a largo
finitos para el anlisis de variancias que aplican al mues- plazo son no solo cuantitativa sino tambin cualitativamente
treo de niveles de factores experimentales (variables inde- diferentes Estos efectos son mayores que los inmediatos en-
pendientes) los principios, bien elaborados ya, del muestreo las actitudes generales, aunque ms dbiles en algunas- actitu-
en poblaciones finitas. Scheff [1956] public una resea des especficas [Hovland, Lumsdaine y Sheffield, 1949]. Las
histrica de aquel desarrollo clarificador. Se dispone de me- afirmaciones de una persona desacreditada carecen de efecto
dias cuadrticas esperadas, que ayudan a determinar trmi- persuasivo inmediato, pero ese efecto puede resultar signifi-
nos de error apropiados [Stanley, 1956] para el diseo fac- cativo un mes ms adelante, a menos que se recuerde a los
torial totalmente aleatorizado de tres clasificaciones. Los interlocutores de qu fuente provienen [Hovland, Janis y
modelos finitos resultan de particular provecho porque pueden Kelley, 1953]. Estos descubrimientos nos alertan contra la
generalizarse con facilidad a situaciones en que uno o ms de prctica de establecer toda nuestra evaluacin experimental
los factores son aleatorios o fijos. Ferguson dio una sencilla de los mtodos pedaggicos sobre la base de postests o medi-
explicacin de aquellas extensiones en 1959. ciones inmediatas realizadas en cualquier punto aislado del
En vez de presentar frmulas, recurriremos a una ilustracin tiempo.
verbal para mostrar cmo difieren entre s las selecciones finita, A pesar de los problemas incomparablemente mayores de eje-
aleatoria y fija de niveles de un factor. Supongamos que en cucin implicados (y la incomodidad que ello constituye para
un experimento dado los maestros constituyen una de las el desarrollo del programa de nueve meses de una tesis de
distintas bases de clasificacin (es decir, variables indepen- doctorado), nos permitimos recomendar que en la planifica-
dientes ).1 5i.
- se dispone de 50 maestros, se podran extraer cin de las investigaciones se incluyan perodos de postests de
5 de ellos al azar y utilizarlos en el estudio. Aparecera en-
un mes, seis meses y un ario.
tonces en algunas de nuestras frmulas un coeficiente de " - Cuando las mediciones del postest consistan en calificaciones
muestreo de factores (1 5/50) o 0,9. Si se utilizara el to- y puntajes de exmenes que de todos modos van a obtenerse,
:al de 50 maestros, constituiran un efecto fijo, y el coefi-
ese estudio ser un simple problema de contabilidad (y mor-
:iente se convertira en (1 50/50) = 0. Por lo contrario, talidad). Pero cuando sea el experimentador quien introduz-
;i existiese una poblacin prcticamente infinita de maes- ca las O, casi todos los autores consideran que la repeticin
ros, 50 de ellos elegidos al azar constituiran un porcentaje de mediciones postest con los mismos alumnos sera ms
nfinitesimal, por lo que en cada efecto aleatorio el coefi- engaosa que el pretest. As se ha comprobado por cierto en
iente tendera a 1. Los anteriores coeficientes modifican las investigaciones sobre memoria [p. ej., Unclerwood, 1957a].
Cormulas de medias cuadrticas esperadas, y por lo tanto de Al paso que el grupo de Hovland recurra a la tpica aplica-
5.rminos de error. Ms detalles pueden verse en Brownlee cin de un pretest (diseo 4), ellos organizaron grupos se-
1960], Cornfield yTukey [1956], Ferguson [1959], 'Wilk parados experimentales y de control para cada aplazamiento
Kempthorne [1956] y Winer [1962]. cronolgico del postest, por ejemplo:

4 65
RO XO
R O O Pero ocurre lo contrario si por saber interpretamos la habi.
R O X O lidad para seleccionar la correcta clasificacin abstracta del
R O tratamiento y trasmitir eficazmente la informacin a nuevos
destinatarios. Con la entrevista grabada hemos repetido cada
Para los diseos 5 o 6 se exigira una duplicacin similar de vez muchos aspectos especficos carentes de importancia; has-
grupos. Ntese que este diseo carece de control perfecto ta donde nos fue dado conocer, el efecto pudo haberse creado
para su propsito de comparar las diferencias en los efectos co- por esos detalles y no por las caractersticas que incluimos
mo funcin del tiempo trascurrido, puesto que tales diferencias adrede. No obstante, si tenemos muchos ejemplos indepen-
podran deberse tambin a la interaccin entre X dientes, los detalles especficos sin importancia no sern sus-
y los aconte- ceptibles de repeticin en cada caso, y por tanto ser ms
cimientos histricos especficos que se produjeron entre la apli-
cacin de los postests de corto y de largo plazo. Un control probable que nuestra interpretacin de la causa de los efectos
completo de esta posibilidad lleva a la elaboracin de diseos sea correcta.
ms complejos todava. A causa de los grandes gastos que Consideremos, por ejemplo, la comparacin de Guetzkow,
esos estudios exigen, salvo cuando las O se obtienen por algn Kelly y McKeachie [1954] entre los mtodos de enseanza
mecanismo rutinario, parece recomendable que quienes reali- por disertacin y por discusin. Nuestro conocimiento de
zan estudios empleando O institucionalizadas reiteradamente cules fueron los tratamientos experimentales, en el sentido
disponibles aprovechen la ventaja que ello representa y realicen de poder extraer recomendaciones para otros maestros, es me-
observaciones ulteriores de los efectos en varios momentos jor porque se emplearon ocho docentes, cada uno de los cua-
sucesivos. les interpret cada mtodo a su manera, en vez de utilizar
uno solo, o de hacer que los ocho memorizasen detalles co-
munes no incluidos en la descripcin abstracta de los procedi-
Generalizacin a otras X. Variabilidad en mientos comparados. (Como en Guetzkow y otros [1954],
la ejecucin de X esa ejecucin heterognea de X debera complementarse, de ser
El objetivo de la ciencia comprende la generalizacin, no" solo posible, con la prctica de que cada tratamiento lo ejecutara ca-
a otras poblaciones y momentos cronolgicos, sino tambin a da uno de los participantes en el experimento, para que ningn
rep elemento especfico sin importancia se confundiera con un
resentaciones distintas del mismo tratamiento, es decir, a
otras representaciones que en teora deberan ser idnticas, tratamiento especfico. A fin _de poder estimar la significacin
pero que no lo son en determinados aspectos que, en prin- de la interaccin maestro-mtodo cuando se emplean cursos
cipio, carecen de importancia. Esta meta es contraria a la de intactos, convendra que cada maestro aplicara dos veces cada
Irlanda de un mayor control experimental, que a menudo resul- mtodo.)
ta evidente y que conduce al deseo de obtener en cada repe- ' En un ejemplo ms sencillo, un estudio del efecto del sexo del
ticin una rplica exacta de X. , docente sobre los primeros pasos de instruccin aritmtica
As, al estudiar el efecto de
una apelacin emocional frente a otra racional, y volviendo debera utilizar no uno solo, sino muchos ejemplos de cada
al ejemplo del individuo que hace declaraciones pblicas, po- sexo. Aunque esta es una precaucin obvia, no siempre se
dramos conseguir que la misma persona se dirigiese a los la ha respetado, como lo seala Hammond [1954]. El pro-
distintos tipos de grupo empleando todos los grados de per- blema constituye un aspecto de lay sistencia de Brunswik
suasin posibles o, con mayor rigor todava, grabar sus decla- [1956] en el diseo representativo Underwood [1957b,
raciones_a fin de que todos los pblicos incluidos en un deter- pgs. 281-87] ha sostenido, sobre fu damentos similares, una
minado tratamiento oyesen exactamente el mismo men- posicin contraria a la estandarizacin o rplica exacta de los
saje. Aparentemente, esto sera mejor que si varias personas aparatos utilizados en los distintos estudios, de manera com-
hablasen una sola vez cada una en los distintos niveles de patible con su vigoroso operacionalismo
persuasin, ya que en. este caso no sabramos con exactitud
qu estmulos experimentales se aplicaron en cada sesin

67
Generalizacin a otras X: Refinamiento secuencial de X y
-pupas de control noveles tema objeto de investigacin por medio de pruebas consisten-
tes en la redaccin de ensayos habr de efectuarse empleando
En cualquier experimento la X real es un complicado conjun- como vehculos la habilidad literaria y el uso del vocabulario
to de lo que eventualmente se habr de conceptualizar como y, por lo tanto, deber contener la variancia debida a esas
fuentes que, con frecuencia, no son importantes para nuestros
distintas variables. Una vez detectado un efecto fuerte y de-
fines. Dada esa complejidad inherente a cualquier O, nos
finido, el curso del proceso cientfico exige que se realicen
nuevos experimentos, que refinen la X, destacando bien los e ncontramos con un problema cuando queremos generalizar
los resultados a otras O posibles. A qu aspecto de nuestra
aspectos ms esenciales al efecto. Ese refinamiento se logra-
r por medio de tratamientos definidos y presentados en for- O experimental se debi aquel efecto internamente vlido?
Como la finalidad de la enseanza no es solo la de preparar
ma ms particular y concreta, o bien organizando nuevos
grupos de control, que igualen al grupo experimental en un individuos para futuros exmenes de ensayo y objetivos,
debe tomarse siempre en cuenta ese problema de la validez
nmero cada vez mayor de aspectos del tratamiento, redu-
ciendo las diferencias a caractersticas ms especificas de la externa o la posibilidad de generalizacin.
compleja X original. El grupo de control falso y el de control 17na vez ms, desde el punto de vista conceptual, la solucin
no est en confiar a ciegas en que se tendrn mediciones
con operacin simulada que se utilizan en la investigacin m-
dica son ejemplos de ello. Los experimentos anteriores demos- puras sin complejidades carentes de importancia, sino ms
bien en utilizar medidas mltiples en las cuales los medios y
traron un efecto internamente vlido, pero que, no obstante,
detalles especficos sin importancia sean todo lo diferentes
pudo haberse debido a que el paciente saba que se lo someta
al tratamiento, o bien al shock quirrgico, y no a las propie- que sea posible, al paso que el contenido comn ciue nos
preocupa est presente en todos y cada uno de ellos. Dentro
dades especficas de la droga o a la remocin del tejido ce-
rebral: de ah la introduccir de los controles especiales --d1 un experimento aislado, es ms lo que puede hacerse en
para prever esas posibilidades. La generalizacin a otras X es este sentido por las O que por las X, pues en un solo expe-
rimento se pueden lograr muchas mediciones de efecto (es
un proceso exploratorio de extrapolaciones sugeridas por la
decir, variables dependientes). En el estudio de Guetzkow,
teora, pero sujetas a la experiencia, en cuyo transcurso es
posible que el mencionado refinamiento de X represente un Kelly y McKeachie [1954], se notaron efectos no solo en los
importante papel. ' exmenes regulares de curso y en pruebas especiales de ac-
titud introducidas a este fin, sino tambin en comportamien-
tos ulteriores, como la eleccin de carrera y la inscripcin en
Generalizacin a otras O cursos superiores sobre el mismo tema. (Aquellos compor-
tamientos resultaron de igual sensibilidad a las diferencias de
As como una X dada arrastra un bagaje de caracteres espe- tratamiento que las mediciones del test.) /Las O mltiples
deberan ser un requisito ortodoxo en cualquier estudio sobre
cficos tericamente sin importancia, pero que pueden resultar
los causantes del efecto, as tambin cualquier O dada, cual- mtodos de enseanza. En el plano ms simple, deberan apli-
quier instrument de medicin, es un complejo en el cual el carse tanto exmenes Cljetivos como de ensayo [vanse Stan-
ley y Beeman, 1956], junto con ndices de participacin en
contenido correspondiente est necesariamente inserto en una
clase, etc. (Una extensin de esta perspectiva a la cuestin
situacin instrumental concreta, cuyos detalles son marginales
de la validez de los tests se hallar en Campbell y Fiske
a la finalidad terica. As, cuando utilizamos lpices y plani-
llas de respuesta con calificacin mecnica IBM solemos ha- [1959] y Campbell [1960].)
cerlo por razones de conveniencia y no porque queramos
incluir en nuestros puntajes la variancia debida a la habilidad
de los empleados, la familiaridad con el formulario del test,
la exactitud en la observancia de las instrucciones, etc. Asi-
mismo, nuestro examen de la competencia especfica en un

68
69
5. Diseos cuasiexperimentales 1 acogerse a la prctica de mtodos de investigacin ms infor-
males todava. Adems, esta larga lista de fuentes de invali-
dacin podra, con mayor probabilidad an, reducir la voluntad
de realizar los diseos cuasiexperimentales en que se advierta
desde un primer momento que se carece de pleno control ex-
perimental. Este resultado sera la anttesis de lo que nos ha-
bamos propuesto.
-
Desde el punto de vista de su interpretacin definitiva y del
Son muchas las situaciones sociales en que el investigador intento de adaptarlo al proceso evolutivo de la ciencia, todo
puede introducir algo similar al diseo experimental en su e xperimento es imperfecto. Lo que puede lograr una lista de
pro-g-r-m
- acin de procedimientos para la recopilacin de - verificacin de criterios de validez es que el experimentador
datos tenga ms conciencia de las imperfecciones residuales que im-
(p. ej., el cundo y el a quin de la medicin), aunque
- ca- plica su diseo, para poder determinar en los puntos perti-
rezca de control total acerca de la programacin de estmulos
experimentales ( el cundo y el a quin de la exposicin y Aentes las distintas interpretaciones de sus datos. Por supues-
la capacidad de aleatorizarla), que permite realizar un autn- to que debera disear el mejor experimento que la situacin
tico experimento. En general, tales situaciones pueden con- permitiera, y buscar con el mayor empeo los laboratorios
siderarse como diseos cuasiexperimentales. Uno de los Pro- rtifciales y naturales que ofrecieran las mejores oportuni-
psitos --de esta obra es indcir a - qu se utilicen estos cua-
siexperimentos y se aumente el conocimiento de los tipos de
rd ades de control. Pero, adems de todo ello, tendra que se-
, guir experimentando e interpretando con plena conciencia de
situaciones en que se dan oportunidades para su empleo. los puntos donde los resultados son an equvocos. Esa con-
-
Pero precisamente porque se carece de control experimental ciencia es importante en los experimentos en que se ha ejer-
total, es imprescindible que el investigador tenga un conoci- citado un control total, pero es imprescindible en los di-
miento a fondo de cules son las variables especficas que .seos cuasiexperimentales.
su diseo particular no controla. Por esa necesidad de eva- persecucin de ese objetivo general, researemos a esta
luar cuasiexperimentos, ms que para satisfacer la de com- :altura de nuestra obra las ventajas e inconvenientes de un con-
prender los experimentos propiamente dichos, se prepararon junto heterogneo de diseos cuasiexperimentales, cada uno de
las listas de verificacin de fuentes de invalidacin en los ala- los cuales merece utilizarse all donde no haya otros mejores
dros 1, 2 y 3. susceptibles de que se los aplique. Veremos primero tres di-
'El estudiante o posible investigador medio que haya ledo el seos experimentales unigrupales. Despus, cinco tipos gene-
captulo anterior quiz se encuentre con ms problemas sin rales de experimentos multigrupales. Una seccin aparte se
resolver en el diseo de un experimento que los que haba ocupar de la correlacin, los diseos ex post facto, los estu-
considerado al comienzo que pudieran plantearse siquiera. dios en panel y otros temas anlogos.
Ser para su bien si todo ello lo induce al diseo y ejecucin
de mejores experimentos y a una mayor circunspeccin al
extraer conclusiones de los resultados obtenidos. Constituir,
Algunos comentarios preliminares sobre
sin embargo, un efecto secundario indeseable si crea en l
la sensacin de desesperanza en cuanto al logro del control la teora de la experimentacin
experimental y lo induce a abandonar tales esfuerzos para
Este captulo est destinado en principio al experimentador
1 Este captulo recurre en su mayor parte a D. T. Campbell, Dise- que desee sacar sus investigaciones del laboratorio para tras-
os cuasiexperimentales para su aplicacin en situaciones sociales na- ladarlas a la situacin operativa. Sin embargo, los autores no
turales en D. T. Campbell, Experimenting, validating, knowing: pro-
blems of method in the social sciences,
pueden dejar de reconocer que los psiclogos experimentales
Nueva York: McGraw Hill, quiz vern con suspicacia cualquier intento de recomenda-
en preparacin. -

cin de estudios en que el control experimental no sea com-

70
71
pleto. En parte para justificar el presente trabajo ante esos
monitores, ofrecemos algunos comentarios generales acerca a menudo por conveniencia al enunciar la hiptesis de un
de la funcin de los experimentos en la ciencia, con la convic- ex perimento, nunca puede ser aceptada en virtud de los
datos obtenidos; solo cabe rechazarla o no rechazarla.
cin de que son compatibles con la mayor parte de las mo-
De igual modo, las hiptesis ms generales de hecho nunca
dernas teoras cientficas que ellos fundan en la perspectiva
se confirman; cuando por conveniencia utilizamos ese tr-
de una posible psicologa general de los procesos inductivo
[Campbell, 1959]. s mino queremos significar, ms bien, que la hiptesis fue ex-
puesta a refutacin y sali airosa de ella. Este punto de vista
"Ea ciencia, como otros procesos cognitivos, comprende la
es compatible con todas las filosofas humanas de la ciencia
formulacin de teoras, hiptesis, modelos, etc. as como la
aceptacin o el rechazo de ellos en virtud de alg que proclaman la imposibilidad de obtener pruebas concluyen-
n conjunto tes para leyes _ inductivas. En trabajos recientes, Hanson
de criterios externos. La experimentacin pertenece a esa se-
gunda fase, la del desbrozamiento, el rechazo y la revisin. -
[1958] y Popper [1959] han sido taxativos a este respecto.
Podemos suponer para nuestra ciencia una ecologa en la cual Muchos conjuntos de datos recopilados en la investigacin
el nmero de posibles hiptesis positivas exceda en mucho al educacional tienen poco o ningn valor indagatorio, y muchos
de las hiptesis que a la larga demostrarn ser compatibles grupos de hiptesis son tan intrincados que no se los puede
-con nuestras observaciones. confirmar por medio de los mecanismos de sondeo disponi-
La caracterstica predominante bles. No deseamos en modo alguno acrecentar la aceptabilidad
de la tarea de compilacin de datos para la prueba de teoras
es, pues, el rechazo de hiptesis inadecuadas. [ de esa seudoinvestigacin. Creemos que los diseos de inves-
Para conseguir.. tigacin que estudiamos ms adelante son, sin embargo, lo
lo resulta provechoso cualquier ordenamiento de observacio-
nes en virtud del cual se desautorice la teora correspondien- bastante indagatorios para merecer que se los utilice all
te, incluyendo diseos cuasiexperimentale s donde no se disponga de otros medios de estudio ms efi-
' que los verdaderos experimentos. de menor eficacia \caces.
'Cabe preguntarse, sin embargo, si tales diseos imperfectos Aunque correcta, la idea de que los experimentos jams con-
no vendrn a confirmar con falsedad una teora inadecuada, firman la teora contradice de tal forma nuestras actitudes y
descarriando del buen camino los - siguientes esfuerzos y des- experiencias como cientficos que nos resulta casi intolerable.
perdiciando el espacio de nuestras publicaciones con las doce- En particular, ese nfasis parece poco aceptable frente a las
nas de estudios que parecen necesitarse para desarraigar un ruidosas y llamativas confirmaciones obtenidas en fsica y
falso positivo de notable divulgacin. Es este un grave riesgo, qumica, donde los trabajos de experimentacin pueden ajus-
que, no obstante, debemos encarar, y del cual participan en tarse con minuciosidad, sobre muchos puntos de medicin, a
esencia, ya que no en grado los verdaderos experimentos una compleja curva prevista por la teora. Y para la mayora
r--de los diseos 4, 5 y 6. En un sentido muy fundamental, los de nosotros la perspectiva se torna inaceptable, en sentido fe-
resultados experimentales nunca confirman ni demues- nomenolgico, cuando se la extiende a las conclusiones induc-
tran una teora: ms bien, la teora triunfante est probada tivas de la visin. Resulta, por ejemplo, difcil comprender
y escapa a la refutacin. La palabra demostrar, a menudo que las mesas y sillas que vemos ante nosotros no sean
empleada para designar la validez deductiva, ha adquirido en confirmadas o aprobadas por la evidencia visual, sino que
Inuestra generacin un significado impropio, tanto respecto consistan en meras hiptesis sobre objetos externos an no
lde sus anteriores aplicaciones como a su utilizacin actual en desautorizadas por las mltiples indagaciones del sistema p-
trocedim i en tos inductivos, como la experimentacin cientfica. tico. Hay algo de razn en ese rechazo.
Los resultados de un experimento ponen a prueba pero no Se confiere a una teora diversos grados de confirmacin- a
prueban una teora. Una hiptesis bien fundada es aquella tenor de la mayor o menor cantidad de hiptesis rivales acep-
que ha sobrevivido en reiteradas ocasiones a esos exmenes, tables de que se dispone para explicar la informacin. Cuanto
pero que siempre puede ser desplazada por otra nueva inves- menos hiptesis rivales queden, mayor ser el grado de con-
tigacin. firmacin. Es de presumir que en cualquier etapa de la re-
' En la actualidad se entiende que la hiptesis nula, utiliz-ada ' copilacin de datos, aun para la ms avanzada de las cien-
cias hay muchas teoras compatibles con la informacin, en
72
73
especial si se consideran todas las teoras que abarcan circuns- "'de variables no controladas, una para cada diferencia obser-
tancias complejas. Sin embargo, en la prctica se dispone de vada, entonces el efecto de X viene a ser el ms defendible.
pocas teoras cuando las hay que hagan frente a las bien .-- -Es frecuente recurrir a este modo de inferencia cuando los
establecidas o a las que han sido verificadas a fondo me- cientficos tienen que limitarse a resumir literatura por carecer
diante complicados experimentos; tampoco se proponen seria- de experimentos perfectamente controlados. As, Watson
mente esas teoras rivales. Dicha escasez es el equivalente [1959, pg. 296 ] hall confirmatoria la evidencia de los efec-
epistemolgico de la afirmacin positiva de la teora que pa- tos nocivos de la privacin materna, porque se la ve confir-
recen ofrecer los experimentos espectaculares. Una escasez se- mada por una amplia variedad de datos, cuyas insuficiencias
mejante de hiptesis rivales se da en el conocimiento fenom- especficas varan de unos estudios a otros. A su vez, Glickman
nicamente positivo que por contraste parece ofrecer, por [1961], a pesar de la presencia de hiptesis rivales sostenibles
ejemplo, la visin a la comparativa ambigedad de la explo- en cada uno de los estudios, consider importantes las prue-
racin tctil a ciegas. bas de un proceso de consolidacin slo porque la hiptesis
rbentro de esta perspectiva, la lista de fuentes de invalidacn rival sostenible variaba de un estudio a otro. Esta forma de
que controlan los diseos experimentales puede considerarse induccin lgica, adoptada por lo comn en la combinacin de
como una enumeracin de hiptesis a menudo aceptables inferencias de distintos estudios, se ifitroduce deliberadamen
rivales de la hiptesis de que la variable experimental ha sur- te dentro de ciertos diseos cuasiexperimentales, en especial
tido un efecto. Donde un diseo experimental controla uno los remendados, como el 15.
e esos factores, se limita a hacer insostenible esta hiptesis .1 -El recurrir a la economa no se justifica desde el punto de
)
rival, aun cuando, en virtud tal vez de complicadas coinci- vista deductivo, sino que constituye ms bien un supuesto
dencias, contine operando para producir el resultado experi- _ general acerca de la naturaleza del mundo, que fundamenta
mental. Las hiptesis rivales aceptables que han requerido - casi toda aplicacin de la teora en la ciencia, por ms que
el uso rutinario de grupos especiales de control actan a modo en aplicaciones particulares resulte a menudo errnea. En rela
de leyes empricas bien establecidas: por ejemplo, los efectos -cin con esta observacin hay otro argumento de admisibilidad,
de la prctica para el agregado de un grupo de control al que invocaremos acaso ms en detalle a propsito del muy
diseo 2, la sugestibilidad para el falso grupo de control, el utilizado diseo 10 ( un buen diseo cuasiexperimental, que
shock quirrgico para el control con operacin simulada, etc. a menudo se confunde con el verdadero diseo 4). Es la pre-
Las hiptesis rivales son crebles en la medida en que pueda suncin de que, en casos de ignorancia, el efecto principal
7.triburseles categora de leyes empricas. Cuando en un cuasi- de una variable debe juzgarse ms probable que la interaccin
experimento se carece de controles, al interpretar los resulta- de otras dos variables; o que, en general, los efectos princi-
dos hay que considerar bien la posibilidad de que tales resul- pales son ms probables que las interacciones. En su mxima
tados obedezcan a factores no tomados en cuenta. Cuanto 1
, expresin, cabe sealar que si cada interaccin de orden su-
ms improkable sea esta posibilidad, ms vlido ser el ex- , perior es significativa y cada efecto es especfico de determi-
perimento. , nados valores en todas las dems dimensione posibles de tra-
Como lo sealamos al exponer el diseo de cuatro grupos - tamiento, ya no hay lugar para la ciencia.i Si podemos ge-
de Solomon, cuanto ms numerosas e independientes sean las neralizar alguna vez, es porque podemos hac r caso omiso de
formas en que se demuestra el efecto experimental, menos nu- un gran cmulo de factores potenciales determinantes.,
merosas y probables se tornan todas las dems hiptesis rivales Esto fue denominado por Underwood [1957b, pg. 61 su-
invalidantes. Se apela entonces a la economa. La validez del puesto de causacin finita. En otro lugar [1954], el mismo
experimento viene a ser, pues, la de la admisibilidad relativa de autor ha registrado la frecuencia de efectos principales y
las teoras rivales: la teora de que X tuvo un efecto frente a de interacciones en el Journal of Experimental Psychology,
las teoras de causacin que comprenden los factores no con- confirmando la relativa escasez de interacciones significativas
trolados. Si cabe explicar la totalidad de varios conjuntos de ( aunque las correcciones introducidas por el editor, tendientes
diferencias por la hiptesis nica de que X tiene un efecto, a presentar resultados claros, nos hacen dudar de este ha-
al paso que es necesario hipotetizar varios efectos separados llazgo).

74 75
En los prrafos siguientes expondremos primero los experi- riado durante muchos meses se sumerge y retira de un bario
mentos con un solo grupo. Desde 1920, por lo menos, el di- de cido ntrico, la deduccin que relacionara esta operacin
seo experimental predominante en psicologa y educacin con la prdida de peso de la barra seguira alguna lgica ex-
ha sido el de grupo de control, como el 4, 6 o, acaso ms perimental de esta ndole. Por supuesto, pueden haber exis-
a menudo an, el diseo 10, que veremos ms adelante. En tido grupos de control de barras de hierro que se dejaron
las ciencias sociales, y considerando situaciones sobre el te- en los estantes y no perdieron peso, pero la.medicin e infor-
rreno, los diseos de grupo de control han predominado a macin de esos pesos constituira un caso tpico en el cual no
tal punto que para algunos son sinnimo de experimen- se la considerara ni necesaria ni pertinente. Parece, pues,
tacin. A consecuencia de ello muchos investigadores llegan probable que ese diseo experimental se considere a menudo
a abandonar todo intento de experimentacin en situaciones vlido en las ciencias de ms xito, si bien rara vez se lo acepte
en las cuales no se disponga de grupos de control, terminando en las enumeraciones de diseos experimentales disponibles
a-s-. como una imprecisin innecesaria.. En realidad, varios di- en las ciencias sociales. [Vase, sin embargo, Maxwell, 1958;
seos cuasiexperimentales aplicables a 'grupos aislados podran
lemplearse provechosamente, y seguir los cnones lgicos e in-
Underwood, 1957b, pg. 1331 Hay buenas razones que jus-
tifican esa diferencia de categoras, y una cuidadosa conside-
racin de ellas ofrecer una mejor comprensin de las condi-
terpretativos experimentales, en muchos casos en que es imp-
.sible el diseo con grupo de control. La cooperacin y la ciones en que los cientficos sociales podran emplear con pro-
posibilidad de experimentar se dan a menudo en unidades ad- vecho el diseo cuando no hay modo de utilizar un control
ministrativas naturales: una maestra dispone de su clase; el e
xperimental ms preciso. El diseo es tpico de los experi-
director de una escuela secundaria tal vez est dispuesto a mentos clsicos del British Industrial Fatigue Research Board
realizar encuestas peridicas sobre el estado de nimo de los sobre factores que influyen en la produccin industrial [p.
alumnos, etc. En tales situaciones el tratamiento diferencial ej., Farmer, Brooks y Chambers, 1923].
de segmentos dentro de la unidad administrativa ( requerido La figura 3 indica algunas posibles situaciones resultantes en
para el experimento con grupo de control) quiz resulte im- series cronolgicas en las cuales se haba introducido una al-
posible en sentido administrativo o, aun cuando ello no ocu- teracin experimental, segn se indica por medio de la lnea
rra, sea indeseable como experimento a causa de los efectos vertical X. Supongamos, a los fines de este estudio, que sen-
reactivos de los dispositivos. Para situaciones de esta ndole timos la tentacin de deducir que X tuvo algn efecto en las
bien podran adoptarse experimentos con un grupo nico. series cronolgicas con resultados como A y B, y quiz C,
D y E, pero no un efecto en las series cronolgicas
04 a
tal como
05 fuese tan
F, G y H, aunque el salto de valores de
grande y desde el punto de vista estadstico tan persistente
77 / Experimento de series cronolgicas como, por ejemplo, las diferencias 04 a 05 en A y B. Aunque
dejaremos el anlisis del problema de las pruebas estadsticas
(El diseo de series cronolgicas consiste, en lo esencial, en para algunas pginas ms adelante, se supone que el proble-
un proceso peridico de medicin sobre algn grupo o indi- ma de la validez interna se reduce en definitiva a la cuestin
viduo y la introduccin de una variacin experimental en esa de hiptesis competitivas aceptables que ofrezcan otras ex-
serie cronolgica de mediciones, cuyos resultados se indican plicaciones probables, distintas del efecto de X, acerca del
or medio de una discontinuidad en las mediciones registra- desplazamiento en las series cronolgicas. Ofrecemos en el cua-
Os en la serie2; Se lo puede diagramar de la manera siguiente: dro 2 un intento de lista de comprobacin de los controles
, suministrados por este experimento en las mencionadas con-
01 0 2 03 04X05 0 6 0 7 Os diciones ptimas de resultado. Las ventajas del diseo de se-
ries cronolgicas resultan muy evidentes en contraste con el
Este diseo experimental tipific gran parte de la experi- diseo 2, con el que guarda una similitud superficial, ya que
mentacin clsica del siglo XIX en las ciencias fsicas y biol- carece de grupo de control y utiliza mediciones previas y pos-
gicas. Por ejemplo, si una barra de hierro cuyo peso no ha va- teriores.

76 77
Figura 3. Posibles configuraciones de los resultados de intro-
-Observando en el cuadro 2 la lista de problemas de validez
ducir una variable experimental en el punto X, en una serie interna, vemos que la imposibilidad de controlar la _historia
cronolgica de mediciones, 01 08. Salvo en el caso t s dmdeuseplcoil asr zqaeum
xeti eeernxnt iooss-.
D, la niuic ioldn
-v iess iiibm
ram
gad dueei adprir soetva
t avdneenodi e ne qim
del
diferencia 04 OS es la misma para todas las series cronol- es el eom as
lmenos
sino otro acontecimiento
/ e la hiptesis rival de que no sea X

gicas, en tanto que la legitimidad de inferir un efecto vara el que provoc


mucho, siendo mxima en A y B y totalmente injustificada tales Es
en F, G y H. obre
debe basarse en todos los casos la confianza depositada en
la interpretacin de este experimento. Analicemos un expe-
rimento que exija mediciones reiteradas y el efecto que un
filme documental produce sobre el optimismo o pesimismo de
los alumnos con relacin a la probabilidad de que estalle o no
una guerra. En tal caso, no suministrar un control definido
sobre la historia parecera sin duda muy grave, ya que es ob-
vio que los estudiantes estn todos los das expuestos a mul-
titud de fuentes de estmulo en ese mismo sentido, adems
de las que maneja el experimentador en el aula. Por supuesto
que, aun as, si el experimento se complementara con un cuida-
doso registro de estmulos no experimentales de alguna rele-
vancia, sera quizs aceptable una interpretacin por la cual
I lei justificara llevarlo a cabol Como ya hemos dicho, la va-
\ riable historia es la contrapartida de lo que en el laboratorio
fsico y, biolgico ha sido denominado aislamiento experi-
-.' ental. ;La admisibilidad de la historia como explicacin de
de splazamientos del tipo de los verificados en las series crono-
lgicas A y B de la figura 3 depende, en gran parte, de la me-
dida del aislamiento experimental que pueda conseguir el ex-
perimentador. Los estudios sobre reflejos condicionados rea
lizados por Pavlov con perros, y que eran en definitiva exp(
rimentos de un grupo o un animal, hubiesen sido muchiD
menos admisibles como fundamento de las teoras del sabio
ruso si, en vez de haberlos efectuado en un laboratorio alejado
de todo ruido, los hubiese practicado en cualquier esquina
de la ciudad. Que es lo que constituye un aislamiento experi-
-

mental vara con el problema que se estudia y el tipo de ele-


- mentos de medicin que se utilizan. Se exigen, sin duda, ms
Precauciones para establecer el aislamiento experimental ne-
cesario cuando se han de estudiar partculas subatmicas en
cmara de niebla o con un contador de centelleo, que para
el experimento hipottico acerca del peso de las barras de
hierro baadas en cido ntrico. En muchas situaciones que
permitiran utilizar el diseo 7, sera. admisible que el ex-
01 02 0 Ot OS OS
perimentador sostuviese haber trabajado en condiciones de
07 OS
aislamiento experimental, si tuvo conciencia de los posibles
acontecimientos rivales tambin capaces de producir el cam-

78
79
pudo descartar con suficiente lgica la probabilidad de
,y
Cuadro 2. Fuentes de invalidacin para los diseos 7 a 12. que estos ltimos lo explicaran.
Entre otras variables externas que, por razones de convenien-
Fuentes de invalidacin estn los efectos
cia, podran incluirse en el factor historia,
Interna Externa meteorolgicos. Los experimentos de esa ndole ( p. ej., los
a a . estudios sobre rendimiento laboral) tal vez se prolonguen
..-. . ._,
u 18
e o E durante lapsos que abarquen cambios estacionales, y entonces
tu - e
90 .11 -
CI3 (1) e . V
e e
las fluctuaciones estacionales en iluminacin, condiciones me-
C ro
iri sO a> - e' e II "t1 teorolgicas, etc., pueden confundirse con la introduccin de
u -o
e xperimentales. Quiz fuera mejor incluir
a
c"3 as .1:i z'cl O . tz ro>
O
. cd
13 en la
-o
. 1 '5 ct o e -o e
.-. . ... 'O *-0
E7. variaciones
l_h _ madura-
cl o
w
'I
-- e -0 ..c, T., ow S
c., "eu *.r.:
- aunque sean en cierto sentido anlogos a la
E . 1
8
: o -0 istoria,
.9' "12 E 11 isl e 1
as 15, os
a) E los desplazamientos peridicos de las series cronolgicas
cin,
referidas a las costumbres institucionales del grupo, como los
Diseos ciclos semanales de trabajo y de pagos de salarios, los perodos
eliasiexperimentales: de exmenes y vacaciones, y las fiestas escolares. Las series
7. Series + + ? + + + + 1 ? ? de observaciones deberan ordenarse de tal manera que se
cronolgicas
O O O ORO O O O mantuvieran constantes los ciclos conocidos, o de lo contrario
8. Diseo de + + + + + + + + ?

muestras ser lo bastante prolongadas como para incluir en su totalidad


cronolgicas
equivalentes , varios de ,esos ciclos. ma-
X i0 X00 X 1 0 Continuemos con los factores que hay que controlar: la
X 00, etc.
9. Diseo de + + + + + + + + I?? parece quedar eliminada' sobre la base de que, s el
duracin de la figura 3,
muestras
materiales resultado es como los de los ejemplos A y B
equivalentes ella no ofrece de ordinario hiptesis rivales aceptables para
MaX,0 maco() 4 y OS que
M cX j0 explicar algn desplazamiento producido entre 0
MdX 00, etc. no se haba dado en los anteriores perodos observados. (No
10. Diseo de
grupo de control
+ + + + ? + I?? ' Obstante, la maduracin no siempre es uniforme y regular.
no equivalente Ntese cmo la sbita iniciacin de las menstruaciones en
O X O
O O
alumnas del primer ao de la escuela secundaria podra apa-
como un efecto del cambio de escuelas
11. Diseos + + + + + + + ?I ? ? ? recer en un diseo 7
compensados sobre los registros fisiolgicos, si no supisemos que no era
X 10 X 20 X30 X 4 0 as.) Asimismo, la aplicacin de tests parece, en general, hi-
X20 X,,0 X 1 0 X 30 ptesis rival no creble para un salto entre 04 y 05. Si solo
X30 X 10 X .,0 tuviramos las observaciones en 04 y 05, como en el diseo
.71,0 X 30 2120 X 10
, 2, careceramos de ese medio de convertir en inaceptables los
12. Diseo de + ? + + 1 + + + ; efectos de maduracin y los tests-retests. Esta es la gran ven-
muestra
separada ' taja del diseo 7 sobre el diseo 2.
pretest-postest 'Be igual modo, muchas hiptesis que invocaran variaciones
R O (X) careceran de base racional especfica
E XO instrumentacin
en la
para suponer que en aquella ocasin particular, a diferencia
12a + ? + + + + +
R O (X) de otras anteriores, se haba producido el error de los apara-
R X O tos de medicin. No obstante, el signo de interrogacin en el
0 (X)
X0 - cuadro 2 llama la atencin recordando las posibles situacio-
12b + + ? + ? + + -i- nes en que un cambio en la calibracin del instrument% de
R Oi (X) medicin podra dar lugar a que se lo interpretase como efec-
R 02(X)
ti X0 3 I\ /
12e ' + ? + + + _ '+ + +
R 01 X 02 81
R X 0,,

to de X. Si el procedimiento de medicin implica las aprecia- de la variable experimental a esa muestra especfica, as como
ciones de observadores humanos conocedores del plan expe- a la posibilidad de que esa reaccin no fuese tpica de algn
rimental, puede producirse una seudoconfirmacin de la hi- niverso de inters ms general, con respecto al cual el grupo
ptesis a causa de las expectativas del observador. As, el u
." xpuesto, constituido naturalmente, sea una muestra sesgada.
cambio experimental de poner en posesin de su cargo a un ejemplo, la necesidad de datos puede limitarnos a aquellos
nuevo director puede producir una variacin en las estadsti- Por
alumnos que han tenido asistencia perfecta durante largos pe-
cas de faltas disciplinarias, en vez de influir sobre la tasa de rodos: un evidente subconjunto selecto. Adems, si se han
(---infracciones como tal. A menudo puede emplearse el diseo
- - z..- . 7 para medir los efectos de un importante cambio introducido utilizad O nuevas, ese reiterado acontecimiento puede haber
_provocado ausentismo.
en la poltica administrativa. Teniendo esto en cuenta, con- 1Para que estas series cronolgicas se interpreten como experi-
endra evitar el cambio de instrumentos de medicin a la mentos, es imprescindible que el experimentador especifique
vez que se modifica la poltica. En la mayor parte de los casos \I.
e antemano la relacin cronolgica esperada entre la intro-
'sera preferible, a fin de preservar la interpretabilidad de una uccin de la variable experimental y la manifestacin de un
serie cronolgica, continuar empleando dispositivos un. tanto --7
fecto. Si se lo hubiese hecho as, la situacin indicada en la
anticuados, en vez de sustituirlos por otros ms modernos
, pero distintos. serie cronolgica D de la figura 3 podra ser tan concluyente
,' Los efectos de la regresin suelen consistir en una funcin como la de A. Las encuestas exploratorias que decidiesen se-
gn las circunstancias sobre las interpretaciones de efecto
/ negativamente acelerada del tiempo trascurrido, razn por diferido, requeriran una validacin cruzada antes de que fue-
., la cual no son aceptables como explicaciones de un efecto en ran interpretables. A medida que aumenta el lapso trascurri-
' 0 5 mayor que los efectos en 02, 0 3 y 04. La seleccin
como do entre X y el efecto, aumenta asimismo la admisibilidad de
' fuente de efectos principales se elimina tanto en este diseo los efectos resultantes de acontecimientos histricos externos.
como en el 2, si en todas las 0 estn implicadas las mismas Tambin parece imprescindible que se especifique la X antes
., personas. Si en un determinado grupo los datos se recopilan de examinar el resultado de la serie cronolgica. El examen
! sobre la base de sus integrantes individuales, se puede elimi-
post hoc de una serie cronolgica para inferir cul fue la X
nar la mortalidad en ese experimento lo mismo que en el que precedi al desplazamiento ms notable tiene que des-
diseo 2. No obstante, si las observaciones se refieren a datos cartarse, a causa de que el aprovechamiento oportunista del
--tolectivos, habra que llevar un registro del ausentismo, las
azar que l permite dificulta, y hasta imposibilita, cualquier
renuncias y las reposiciones, a fin de asegurarse de que las intento de comprobar la significacin de los efectos.
coincidencias de cambios de personal no ofrezcan hiptesis ri- La preponderancia de este diseo en las ciencias ms prs-
vales aceptables. peras debera hacernos sentir algn respeto por l; recurdese,
En cuanto a la validez externa, est claro que el efecto expe- sin embargo, que los aspectos de aislamiento experimental
rimental bien podra ser especfico para las poblaciones suje- y las condiciones constantes lo hacen ms interpretable pa-
tas a reiteracin de pruebas. Es improbable que ello consti- ra ellos que para nosotros. Recurdese, asimismo, que en el
tuya una limitacin a la investigacin sobre la enseanza en uso que suele hacerse de l, un experimento nico jams es
establecimientos escolares, a menos que el experimento se ' concluyente. Anque puede ocurrir que no se utilice un grupo
realice con O artificiales no comunes en la situacin escolar de control, antes de establecer un principio es menester que
abitual. Adems, este diseo es de particular aplicacin en las _ varios investigadores repitan el diseo 7 en muchos lugares
lituaciones institucionales en. que se llevan registros regula- , distintos. Tal debera ser, asimismo, la aplicacin que noso-
res que constituyen, por tanto, parte natural del ambiente en tros le diramos a este diseo.1Deberamos utilizarlo all
I -sjue se realiza el experimento. Las pruebas anuales de cali-
donde no se pueda hacer nada mjor controlado. 'Organizare-
ficacin en las escuelas pblicas, los registros de enfermedad, mos nuestra contabilidad institucional de tal m'Ocio que nos
1 etc., no son por lo comn reactivos, puesto que son tpicos
suministre el mayor nmero posible de series cronolgica,
del universo al cual se quiere hacer la generalizacin. La in- para dichas evaluaciones, y trataremos de examinar con mayo. -
teraccin seleccin-X se refiere a la restriccin -de los efectos
cuidado que hasta entonces los efectos de los cambios acl.

82
83
r`nistrativos y otros acontecimientos sbitos y arbitrarios co- 7vaciones pre-X y post-X resulta inadecuada, pues no distin-
mo X. Pero no los consideraremos definitivos hasta haberlos ira entre casos del tipo F y casos del tipo A.
repetido una y otra vez en situaciones diversas. En el desarrollo de un test de significacin suele haber una
, -
enojosa falta de independencia. Si tal carencia estuviese dis-
Tesis de significacin para el diseo de serie cronolgica

Si las ciencias ms avanzadas no emplean tantos tests de sig-


nificacin como la psicologa y la pedagoga es, sin duda, por-
que la magnitud y claridad de los efectos con que trabajan
ti tribuida en forma homognea entre todas las observaciones,
ella dejara de constituir una amenaza para la validez interna,
; aunque fuera una limitacin a la validez externa. Lo que s
' resulta inoportuno es que en casi todas las series cronolgicas
' se encontrar que las observaciones adyacentes son ms si-
milares que las no adyacentes ( es decir, que la autocorrela-
son tales que los hacen innecesarios. Si se aplicase en ellas cin del defasaje 1 es mayor que la del 2, etc.). As, una in-
nuestros tests habituales de significacin, se descubriran tam- , fluencia o perturbacin aleatoria externa que influya sobre
bin all elevados ndices de este factor. Parece, sin embargo, un punto de observacin, por ejemplo, en 05 u O s , tambin
tpico de la ecologa de las ciencias sociales tener que trabajar , alterar 07 y Os, por lo cual no se las puede tratar como
con minerales pobres, para los que no son necesarias las prue- ; varias desviaciones independientes de la extrapolacin de la
bas de significacin. Tambin es probable que all donde tendencia 01 04.
el sentido comn o las apreciaciones intuitivas sealen con -
E1 test de significacin utilizado depender en parte de la
claridad un efecto resulte posible, por lo comn, alguna prue- ndole hipottica del efecto de X. Si est implicado un mo-
ba de significacin que ratifique las consideraciones en que se delo como la lnea B, se podra utilizar una prueba de la des-
funda el juicio intuitivo. As, se pueden aplicar pruebas de viacin de 05 respecto de la extrapolacin de 0 1 04. Mood
significacin sobre los efectos de X que distinguiran entre los [1950, pgs. 297 - 98] ofrece una prueba de esta ndole. Ese
varios resultados que ilustra la fibra 3, juzgando que A y B test podra emplearse en todos los casos, pero parecera inne-
son significativos y que F y G no lo son. Veamos algunos cesariamente insuficiente si se supone una mejora cons-
posibles enfoques. tante o un mayor ndice de ganancia. Para esos casos, sera
Ante todo debemos rechazar, por inadecuados, ciertos trata- aconsejable una prueba que emplease todos los puntos. Son
mientos imaginables. Si la informacin recogida en la figura 3 dos los componentes que constituiran tales Pruebas de sig-
representa medias grupales, ser insuficiente una simple prueba nificacin: la interseccin y la pendiente. Por interseccin
de significacin de la diferencia entre las observaciones de queremos significar el salto en la serie cronolgica en el pun-
04 y 05 . Aunque en las series F y G estas suministrasen rela- to X (o en algn desplazamiento especificado despus de X).
ciones t de elevada significacin, no podramos decir que los As las lneas A y C indican un desplazamiento de intersec-
datos demostraban el efecto de X a causa de la presencia de cin sin variacin en la pendiente. La lnea E ilustra un cam-
otros desplazamientos significativos similares, que a veces ocu- bio en la pendiente pero no en la interseccin, ya que coin-
rren, y para los cuales no tendramos explicacin experimental ciden las extrapolaciones pre-X a X y post-X a X. A menudo
alguna que les correspondiese. Cuando se trabaja con la infor- ambas se cortan, y la pendiente quedara modificada por una
macin obtenida de encuestas nacionales de opinin, suelen X efectiva. Podra conseguirse una prueba pura de intersec-
encontrarse desplazamientos muy significativos entre una y cin en forma anloga a la aplicacin de una prueba Mood
otra consulta que, desde el punto de vista del cientfico en- desde una y otra direccin a la vez. En este caso estaran im-
cargado de las interpretaciones, no son ms que ruidos plicados dos puntos extrapolados, con observaciones pre y
aleatorios, ya que constituyen una parte de la variacin en los post X extrapoladas a un punto X intermedio entre 04 y 05.
fenmenos para la que se carece de explicacin. A fin de Las pruebas estadsticas casi con seguridad comprenderan,
que sea interpretable, el efecto de un bien perfilado aconteci- en todas las series cronolgicas (con excepcin de las ms ex-
miento o variable experimental debe trascender ese nivel tensas) ajustes lineales a los datos, tanto por conveniencia
y rdinario de desplazamiento. Asimismo, una prueba de signi- como porque un ajuste ms exacto agotara los grados de li-
ficacin que abarque los datos combinados de todas las obser- bertad, no dejando oportunidad alguna para verificar la hip-

84 85
un espaciamiento temporal constante, sobre todo cuando pue-
tesis de cambio. Sin embargo, en muchos casos la presuncin den introducir un elemento de confusin con un ciclo diario,
de linealidad puede no ser correcta. La admisibilidad de inferir semanal o mensual, o cuando a causa de la periodicidad pre-
un efecto de X es mayor en un punto prximo a X. Cuanto decible, un condicionamiento indeseable al intervalo tempo-
ms gradual o ms lento sea el efecto supuesto, ms grave ser
la confusin con la historia, ya que aumenta el nmero de ral puede intensificar la diferencia entre las distintas presen-
taciones. As, Sorokin se asegur de que cada tratamiento ex-
posibles causas externas. perimental se realizara con idntica frecuencia de maana y
de tarde.
Casi todos los experimentos con este diseo han empleado en
proporcin pocas repeticiones de cada condicin experimental,
8. Diseo de muestras cronolgicas equivalentes pero una extensin de la teora del muestreo como la represen-
tada por Brunswik [1956] seala la necesidad de grandes
La
.1) forma ms comn de diseo experimental utiliza una muestreos aleatorios, representativos y equivalentes, de los pe-
muestra equivalente de personas a fin de suministrar la base rodos. Kerr [1945] es quien ms se ha aproximado tal vez a
con la cual comparar los efectos de la variable experimental. este ideal en sus experimentos acerca del influjo de la m-
Como contraste, una forma recurrente de experimentacin sica sobre el rendimiento industrial. Cada uno de ellos com-
---- con un solo grupo utiliza dos muestras equivalentes de sesio- prendi un solo grupo experimental con una muestra aleato-
nes, con la variable experimental en una de ellas y no en la rizada y equivalente de das a., lo largo de varios meses. De
, tra. Ese diseo puede esquematizarse de la siguiente manera esta forma, en un experimento pudo comparar 56 das con
(aunque la intencin es obtener una alternacin aleatoria, no msica y 51 das sin ella, y en otro tres tipos diferentes de
regular): msica, representada cada una por muestras equivalentes de
XI O X00 X1 0 X00 14 das.
Tal como lo emple Kerr, por ejemplo/el diseo 8 parece
-en general internamente vlido, -,i,a historia,)que es el principal
--

ri-
! Este diseo puede considerarse una forma del experimento de inconveniente del experimento con series cronolgicas, se con-
---; serie cronolgica con la introduccin reiterada de la variable
1 experimental.' El experimento es, sin duda, de mayor utilidad . trola presentando X en numerosas sesiones separadas, ha-
' ciendo as improbable en extremo cualquier otra explicacin

1 cuando se anticipa que el efecto de la variable experimental


ser de carcter transitorio o reversible. Al paso que la I, gica
del experimento puede considerarse una extensin del expe-
fundada en la coincidencia de acontecimientos externos. Las
otras fuentes de invalidacin se controlan con la misma lgica
detallada a propsito del diseo 7 En cuanto a la validez
rimento de serie cronolgica, el modo de anlisis estadstico tie- -externa, es evidente que solo cabe extInder la generalizacin
ne mayor similitud, en general, con el del experimento de dos a poblaciones probadas con frecuencia./ El efecto reactivo de
grupos en los cuales se emplea la significacin de la diferencia los dispositivos y la conciencia de que se es objeto de la
entre las medias de dos conjuntos de mediciones. Por lo co- experimentacin constituyen una deficiencia de esta prueba.
mn, las mediciones estn apareadas de manera muy espec- Cuando son grupos separados los que reciben las distintas X,
fica con las presentaciones de la variable experimental, siendo puede ocurrir ( sobre todo en el diseo 6) que ignoren por
a menudo concomitante, como en los estudios de aprendizaje, completo la existencia del experimento o de los tratamien-
rendimiento laboral, condicionamiento, reaccin fisiolgica, tos que se comparan. No ocurre as cuando se maneja un
etc. Acaso el ms tpico de los primeros usos de este diseo solo grupo y se lo expone en repetidas sesiones a una u otra
experimental, como en los estudios de Allport [1920] y So- condicin, por ejemplo, a una base de cmputo de pago con-
rokin [1930] sobre el rendimiento escolar en condiciones di- tra otra en el experimento de Sorokin; una condicin de tra-
versas, consisti en la comparacin mutua de dos variables bajo contra otra en el de Allport; un tipo de ventilacin con-
experimentales, es decir X1 versus X2, en vez de una sola tra otro en los estudios de Wyatt, Fraser y Stock [1926],
de ellas con un control. Para la mayora de los fines resultan
ineficaces la simple alternacin de condiciones y el empleo de y una clase de msica contra otra en el de Kerr ( aunque este
-

87
86
Para esos objetivos, este diseo
investigador tom cuidadosas precauciones para conseguir que de presencia concreta de, X.
una programacin variada se convirtiese en parte integrante
dra ser muy valioso. Supongamos que un maestro pone
po
en tela de juicio el valor de las lecciones en voz alta contra el
. - del ambiente laboral). En cuanto a la interaccin de seleccin
y X, se da, como es habitual, la limitacin de la generaliza- del estudio individual en silencio. Variando esos dos proce-
cin de los efectos demostrados de X al tipo particular de la dimientos durante una serie de unidades de lecciones, se
poblacin de que se trata. podra preparar un experimento interpretable. De ese modo
Este diseo experimental lleva implcito un riesgo para la cabra estudiar el efecto de la presencia en el aula de un pa-
validez externa que se encontrar en todos los experimentos
dre que actuara como observador durante un debate volun-
descritos en este trabajo en los cuales se presentan muchos tario entre los alumnos. El conocimiento de ese tipo de di-
niveles de X para el mismo conjunto de personas. Ese efecto seos puede poner al alcance de un maestro individual la
se ha denominado interferencia de X mltiples. El efecto de verificacin experimental de las alternativas. Esto podra dar
X I , en la situacin ms simple, en que se la compara con lugar a procedimientos de tipo piloto que, de resultar pro-
Xn, slo puede generalizarse a condiciones de presentaciones
misorios, se examinaran por medio de experimentos de ma-
repetidas y espaciadas de X1. No se ofrece una base slida yor envergadura y mejor coordinados.
para la generalizacin a posibles situaciones en que X 1 est !Este enfoque es aplicable a un muestreo de sesiones con un
siempre presente, o a la condicin en que se la introduzca en !solo sujeto. Aunque no es habitual todava administrar tests
una sola sesin. Adems, la condicin X0 o la ausencia de X de s ignificacin,
tigacin
es este un diseo muy utilizado en la inves-
fisiolgica, en la cual se aplica repetidas veces un
no es tpica de perodos sin X en general, sino que es re-
presentativa solo de ausencias de X intercaladas entre presen- !estmulo a un animal, poniendo sumo cuidado en evitar cual-
cias de este factor. Si X1 tiene algn efecto prolongado que quier periodicidad en la estimulacin, ya que este ltimo as-
llega a influir en los perodos sin X, como parece por lo pecto corresponde al requisito de aleatorizacin para aquellas
comn probable, el diseo experimental, comparado con un sesiones en que as lo demande la lgica del diseo. Tambin
estudio con diseo 6, por ejemplo, puede subestimar el efecto pueden utilizarse cuadrados latinos en vez de la aleatorizacin
de X. Por el contrario, el hecho mismo de que se produzcan simple {p. ej., Cox, 1951; Maxwell, 1958].
frecuentes desplazamientos puede incrementar el valor de es-
tmulo de una X, excediendo al que se dara en una presen-
tacin continua y homognea. En el estudio de Kerr las Tesis de significacin para el diseo 8
melodas hawaianas influiran sobre el trabajo de manera bas-
tante diferente si se las intercalase durante todo un da entre Una vez ms necesitamos pruebas de significacin apropiadas
otras formas de msica, que si constituyen el nico ali- para este tipo particular de diseo. Advirtase que hay im-
mento musical. Los diseos experimentales de Ebbinghaus plcitas en l dos dimensiones de generalizacin: con respecto
[1885] pueden considerarse en lo esencial de esta ndole y, a las sesiones y con respecto a las personas. Si consideramos
como lo ha destacado Underwood [1957a], las leyes por un caso en que se utilice una sola persona, es obvio que la
l descubiertas estn limitadas en sus posibilidades de gene- generalizacin de la prueba de significacin se limitar a esa
ralizacin a una poblacin de personas que hayan aprendido persona en particular, comprendiendo una generalizacin en-
docenas de otras listas muy similares. Incluso gran parte de tre casos, para cuyo fin convendr utilizar una t con un n-
sus descubrimientos no se verifican en personas que aprenden mero de grados de libertad igual al de sesiones menos dos.
una sola lista de slabas desprovistas de significado AAs, Si se poseen registros individuales de cierto nmero de per-
mientras el diseo es internamente vlido, su validez eterna sonas sometidas al mismo tratamiento y todas ellas comparten
suele verse limitada en gran parte por ciertos tipos de con- el mismo grupo, se tendrn tambin datos para generalizar
_--renido' [Vase tambin Kempthorne, 1952, cap. 29.] entre personas. En esta situacin habitual dos estrategias pa-
Ntese, sin embargo, que muchos aspectos de la enseanza recen comunes. Una, errnea, es la de generar a propsito de
sobre los cuales se deseara experimentar pueden muy bien cada individuo un puntaje nico para cada tratamiento expe-
tener efectos restringidos, para los fines prcticos, al perodo rimental, y aplicar luego tests de significacin de la diferen-

88 89
r aa entre las medias con datos correlacionados. Esta es la l-
gica de los anlisis de Allport y Sorokin, aunque en realidad
-leben aplicarse a un contenido no idntico. El diseo puede
expresarse as:
no se utilizaron tests de significacin. Pero cuando solo estn
implicadas una o dos repeticiones de cada condicin experi- MaXIO MbX00 MeX10 MaX00 etc.
mental, los errores de muestreo de las sesiones pueden ser
muy grandes o el control de la historia muy deficiente. Los Las M indican materiales especficos, siendo la muestra M.,
errores aleatorios en el muestreo de sesiones podran consti- M etc., en trminos de muestreo, igual a la muestra Mb,
tuir lo que a la luz de este anlisis parecen ser diferencias Md, etc. La importancia de la equivalencia de muestreo de
significativas entre unos y otros tratamientos. Esto ser un ambos conjuntos de materiales quedara acaso mejor indicada
error muy grave si el efecto de las sesiones es significativo si se diagramara el diseo de esta manera:
y apreciable. Sobre ese supuesto lgico se podra obtener, por
ejemplo, una diferencia sumamente significativa entre X1 y Una persona o J Muestra de materiales A(0) Xo O
X2, cuando cada una solo haya sido presentada una vez y cuan- grupo Muestra de materiales B(0) X 1 O
do en una sesin algn acontecimiento externo haya producido
azar un resultado notable. Parece, pues, imprescindible Las O entre parntesis indican que en algunos diseos se
que para cada tratamiento se incluyan por lo menos dos se- utilizar un pretest y en otros no.
L siones y estn representados los grados de libertad entre ellas. El experimento de Jost [1897] sobre prctica masiva contra
La mejor forma de cumplir con este requisito es, quiz, pro- prctica distribuida ofrece un magnfico ejemplo. En su ter-
bar ante todo la diferencia entre las medias de tratamiento y cer experimento se prepararon bastante al azar doce listas de
un trmino de error entre las diversas sesiones y con respec- doce slabas carentes de sentido. Seis se asignaron a la
to a cada tratamiento. Despus de establecer as la signi- prctica distribuida y seis a la masiva. Las doce se aprendieron
ficacin del efecto del tratamiento, se podra proceder a de- simultneamente en un lapso de siete das, combinndose con
terminar la proporcin de sujetos para los cuales se verifica, cuidado su programacin de modo que se controlasen la fa-
obteniendo as datos sobre la posibilidad de generalizar el efec- tiga y otros aspectos. Siete de aquellos conjuntos de seis lis-
to a diversas personas .'`I, Las mediciones y muestreos repetidos tas distribuidas y seis masivas se aprendieron durante un lapso
de sesiones plantean niuchos problemas estailsticos, algunos que se extendi desde el 6 de noviembre de 1895 hasta el 7 de
de los cuales no han sido resueltos todava [Collier, 1960; abril de 1896. Al final, Jost obtuvo resultados sobre 40 listas
Cox, 1951; Kempthorne, 1952]. ) diferentes de slabas aprendidas con prctica masiva y 40 con
prctica distribuida. La interpretabilidad de las diferencias
descubiertas en el nico sujeto de la prueba, G. E. Mller,
f - depende de la equivalencia de muestreo de las listas no idn-
9. 'Diseo de materiales equivalentes ticas existentes. Dentro de estos mrgenes, el experimento

,r El diseo 9 est ntimamente relacionado con el de muestras


cronolgicas equivalentes, y su argumento se funda en la equi-
descripto parece tener validez interna. Los descubrimientos,
naturalmente, se limitan a los rasgos psicolgicos de Mller
en 1895 y 1896 y al universo de material de memorizacin
valencia de las muestras de materiales a que se aplican las muestreado. Para poder generalizar a otras personas y esta-
1 variables experimentales que se comparan. Siempre, o casi blecer una ley psicolgica ms general, habra, por supuesto,
! siempre, hay tambin implicadas muestras cronolgicas equi- que repetir el experimento con muchos individuos.
valentes, pero pueden estar intercaladas en forma tan sutil . o Otro ejemplo proviene de los primeros estudios sobre con-
. intrincada, que prcticamente vienen a constituir una equi- formidad a la opinin del grupo. Moore [1921], por ejem-
, plo, obtuvo una estimacin control de estabilidad en retest
- ' valencia temporal. En un diseo con un grupo y X repetida,
' se requieren materiales equivalentes all donde la ndole de las de las respuestas a un conjunto de tems de un cuestionario,
, variables experimentales sea tal que los efectos son perma- despus de lo cual compar esa medida con la variacin resul-
nentes, y los distintos tratamientos y repeticiones de ellos tante cuando, con otro conjunto, se acompa el retest con

90 91
una manifestacin de la opinin de la mayora. Consideremos listas, o sea, las que tenan un elevado nivel de interferencia.
en cambio un estudio en el cual se solicita de los alumnos que La investigacin contempornea indica que la superioridad del
manifiesten su parecer acerca de un determinado nmero de prendizaje espaciado slo se restringe a tales poblaciones,
a
temas presentados en un extenso cuestionario. Se dividen en- y que en personas que aprenden por primera vez materiales
tonces las preguntas en dos grupos tan equivalentes como sea muy nuevos, no se da esa ventaja [Underwood y Richardson,
posible. En un momento posterior, se devuelven los cuestio- 19581.
narios a los alumnos y el grupo vota por cada uno de los
tems indicados. Se falsifican esos votos a fin de indicar ma-
yoras opuestas a las que prevalecieron en las dos mues- Estadsticas del diseo 9
tras de tems. Como medicin post-X, se solicita de los alum-
nos que vuelvan a votar sobre todos los temas. En caso de Es obvio que el muestreo de materiales guarda relacin con
que el argumento de equivalencia de muestreo de ambos con- la validez y el grado de prueba del experimento. Como tal,
juntos de elementos fuera correcto, las diferencias de des- es probable que la N para el clculo de la significacin de
plazamientos entre los dos tratamientos pareceran suminis- las diferencias entre las medias de grupos de tratamiento de-
trar una prueba definitiva acerca de los efectos de dar a cono- biera haber sido una N de listas en el experimento de Jost
cer las opiniones del grupo, aun en ausencia de grupo de con- (o una N de elementos en el estudio de conformidad) a fin
de que se representara ese importante campo de muestreo. Se
trol alguno.
lo debe completar con una base de generalizacin entre per-
, A semejanza del diseo 8, el 9 tiene validez interna en todos
sonas. En la actualidad, acaso lo mejor sea hacerlo en forma
.los puntos, y en general por los mismos motivos: Obsrvese,
seriada, estableciendo ante todo la generalizacin entre la
V. propsito de la validez externa, que en el diseo 9, como
muestra de listas o tems, computando despus un puntaje
! en todos los experimentos con mediciones repetidas, los efec-
tos pueden ser bastante especficos de las personas medidas de efectos experimentales para cada persona, y empleando
todo ello como base para la generalizacin entre personas.
I.._en varias sesiones. En pruebas de aprendizaje, las mediciones
(Vase la bibliografa antes citada, a propsito del diseo 8,
son parte tan integrante de la situacin experimental propia
del mtodo tpico utilizado en la actualidad ( aunque no ne- con respecto a las precauciones que deben tomarse.)
cesariamente en el mtodo de Jost, en el cual las prcticas
comprendieron cantidades controladas de lecturas de las lis-
tas), que esta limitacin a la generalizacin pierde toda im-
rportancia. Parecera que en el diseo 9 hay menos posibili- 10. Diseo de grupo de control no equivalente
dades de dispositivos reactivos que en el 8 a causa de la hete-
1 rogeneidad de los materiales y la mayor probabilidad de que Uno de los diseos experimentales ms difundidos en la in-
' 11 los sujetos no adviertan que reciben tratamientos diferentes en vestigacin educacional comprende un grupo experimental y
L momentos diferentes y para tems diferentes. Esta escasa reac- otro de control, de los cuales ambos han recibido un pretest
fividad no aparecera en el experimento de Jost, pero s en el y un postest, pero no posee; equivalencia preexperimental de
estudio de conformidad. Es probable, pues, que la interferen- muestreo. Por lo contrario, [os grupos constituyen entidades
cia entre los niveles de l, variable experimental o entre los formadas naturalmente (como una clase, por ejemplo) tan si-
materiales sea una innegable imperfeccin de este experimen- milares como la disponibilidad lo permita, aunque no tanto,
to, al igual que en el diseo 8. sin embargo, que se pueda prescindir del pretest. La asigna-
Tenemos un ejemplo especfico del tipo de limitacin as in- , cin de X a uno u otro grupo se supone aleatoria y contro-
troducido acerca de los descubrimientos de Jost. Este inves- lada por el experimentadort
tigador inform que el aprendizaje espaciado era ms eficaz
que la prctica masiva. De las condiciones generales de su O X o
experimentacin cabe inferir que estaba justificado al genera-
lizar slo para las personas que estuviesen aprendiendo muchas
o o
92 93
-
I
Dos cosas han de tenerse claras sobre este diseo. Ante todo, (columna del cuadro 2 y es el principal factor de validez
que no se lo debe confundir con el 4, el diseo con grupo interna que caracteriza a los diseos 4 y 10.
_ de control pretest-postest, donde los sujetos experimentales Acaso se aclare este punto con un ejemplo concreto de in-
-

que se toman de una poblacin comn se asignan en forma estigacin 'educacional. El estudio de Sanford y Hemphill
v
aleatoria al grupo experimental y de control. En segundo [1952] sobre los efectos de un curso de psicologa en Anna ,
lugar, que, a pesar de ello, hay que admitir que el diseo 10 polis ofrece una excelente ilustracin del diseo 10. En ese
l es utilizable en muchas oportunidades en que son imposibles trabajo, el Segundo Curso de Annapolis constituy el grupo
i los diseos 4, 5 o 6. Sobre todo, habr que reconocer que xperimental, y el Tercero, el de control. Las mayores ga-
e
1 aun el agregado de un grupo de control no equiparado o no nancias registradas por el grupo experimental podran expli-
' equivalente reduce en gran parte la ambigedad de las in- carse como parte de un proceso general de perfeccionamiento,
con resultados mximos en los primeros dos cursos y mni-
, terpretaciones que derivan del diseo 2 de un grupo pretest-
,ostest. Cuanto ms similares sean en su reclutamiento el mos en el tercero y cuarto, constituyendo, por tanto, una
Tgrupo experimental y el de control y ms se confirme esa interaccin entre los factores de seleccin que diferencian los
!similitud por los puntajes del pretest, ms eficaz resulta ese grupos experimental y de control y las variaciones naturales
Icontrol. Suponiendo que estos ideales se aproximen a los maduracin caractersticas de tales grupos, y no un efecto
'objetivos de la validez interna, podemos considerar que el del programa experimental. El grupo - particular de control
diseo controla los principales efectos de la historia, la ma- utilizado por Sanford y Hemphill posibilita alguna veri-
duracin, la administracin de tests y la instrumentacin, ficacin de esta interpretacin rival ( en forma un tanto si-
donde la diferencia para el grupo experimental entre el pre- milar al diseo 15, que expondremos ms adelante). La hi-
test y el postest ( si fuera mayor que para el grupo de con- ptesis de seleccin-maduracin pronosticara que el Tercer
trol) no puede explicarse por efectos principales de esas va- Curso (grupo de control) habra de indicar en su test inicial
riables, como los que afectaran tanto al grupo experimental una superioridad respecto de las mediciones pretest del Se-
como al de control. (Sin embargo, deben extremarse las pre- gundo Curso (grupo experimental), con magnitud casi igual
cauciones sobre la historia intrasesional mencionadas en el a la hallada entre el pretest y el postest de este ltimo gru-
diseo 4.) po. Por fortuna para la interpretacin de su experimento, no
[ Un esfuerzo por explicar una ganancia pretest-postest propia ocurri en general as. Las diferencias entre los cursos en el
1 del grupo experimental en trminos de factores externos, como pretest no presentaban en la mayora de los casos el mism
' historia, maduracin o aplicacin de tests, tiene que suponer sentido ni igual magnitud que las ganancias pretest-postest
del grupo experimental. Sin embargo, sus comprobaciones de
-r..- una interaccin entre esas variables y las diferencias espec- una ganancia significativa para el grupo experimental en pun-
ficas de seleccin que se den entre el grupo experimental y
el de control. Aunque tales interacciones son en general poco tajes de confianza en el cuestionario de situaciones sociales
probables, hay un cierto nmero de situaciones en las que pueden explicarse como un mecanismo artificial de seleccin-
- podran invocarse. Acaso las ms comunes sean las interac- maduracin. El grupo experimental pas de 43,26 puntos
ciones que implican maduracin. Si el grupo experimental a 51,42, en tanto que el Tercer Curso comenz por un pun-
t consta de pacientes de psicoterapia y el de control de alguna taje de 55,82 y continu aumentando hasta alcanzar 56,78.
otra poblacin disponible a la cual se le hayan administrado La hiptesis de interaccin entre seleccin y maduracin ser
I un test y un retest, una ganancia peculiar al grupo experi- en ocasiones aceptable, aun cuando los grupos obtengan pun-
mental bien podra interpretarse como un proceso espontneo tajes pretest idnticos. El ms comn de tales casos ser aquel
1 de remisin tpico de grupo tan extremo, ganancia que se hu- en que un grupo obtenga una tasa de maduracin o variacin
biese producido tambin aun en ausencia de X. Tal interac- autnoma ms elevada que el otro. El diseo 14 ofrece una
cin entre seleccin y maduracin (o seleccin-historia, o se- extensin del 10 que tendera a eliminar este factor.
( leccin-test ) podra confundirse con el efecto de X, consti- El otro gran problema de la validez interna en el diseo 10
tuyendo por tanto una amenaza a la validez interna del ex- es la regresin. Como se indic con ? en el cuadro 2, cabe
' perimento. Esta posibilidad ha sido representada en la octava evitar ese riesgo, pero no siempre al tropezar con l se lo
L
94 95
- sortea. En general, si se ha elegido cualquiera de los grupos miento de hallar pares de grupos similares. No obstante,
de comparacin por sus puntajes extremos de O o mediciones habra que tomar en cuenta recientes advertencias de Lord
correlativas, una diferencia en el grado de desplazamiento de [1960] a propsito del anlisis de covariancia cuando la con-
pretest a postest entre ambos grupos bien puede ser pro- fiabilidad de la covariable no es absoluta. Tambin pueden
ducto de la regresin y no efecto de X. Esta posibilidad ha aplicarse puntajes simples de ganancia, pero suelen ser menos
tenido mayor trascendencia a causa de una obcecada y en- convenientes que el anlisis de covariancia. La aplicacin del
gaosa tradicin en el mbito de la experimentacin educa- anlisis de covariancia a esta situacin del diseo 10 implica
cional, por la que se considera la equiparacin como una supuestos (como el de 'homogeneidad de regresin) menos
tcnica apropiada y suficiente para establecer la equivalencia posibles aqu que en los casos del diseo 4 [vase Lindquist,
preexperimental de grupos. Este error ha ido acompaado 1953].
por la falta de distincin entre los diseos 4 y 10 y los Al interpretar estudios publicados del diseo 10, en que se
diferentes papeles representados por la equiparacin en los recurri a la equiparacin, se puede advertir que el sentido
)-- puntajes de pretest en ambas condiciones. En el diseo 4, del error es predecible. Consideremos un experimento de psi-
puede considerarse este procedimiento como un comple- coterapia que utiliza como O calificaciones de descontento con
mento provechoso de la aleatorizacin, pero no como un la propia personalidad. Supongamos que el grupo experimental
sustituto de ella; en trminos de puntajes en el pretest o en consta de personas sometidas a terapia, en tanto que el grupo
las variables relativas, cabe organizar la poblacin total dis- de control seleccionado est formado por personas considera-
ponible para fines experimentales en pares de sujetos cuida- das normales. En este caso el grupo de control presentar
dosamente equiparados; los integrantes de esos pares se asig- puntajes extremadamente bajos con zespecto al grupo normal
narn al azar a las condiciones experimentales o de control. (seleccionados por esta caracterstica), y regresionar en el
Esa equiparacin ms la ulterior aleatorizacin suelen pro- postest en el sentido de la media del grupo normal, haciendo
ducir un diseo experimental ms preciso que la aleatoriza- as menos probable que se demuestre un efecto significativo
ejem por s sola. de la terapia en vez de producir una falsa impresin de efica-
No debe confundirse con ese ideal la tcnica, correspon- cia en favor del procedimiento teraputico.
diente al diseo 10, de tratar de compensar las diferencias El ejemplo de los pacientes de psicoterapia nos ofrece tam-
entre los grupos experimentales y de control no equivalentes bin un caso en el cual los supuestos de regresin homognea
mediante un procedimiento de equiparacin, cuando no se y muestreo del mismo universo, salvo para los puntajes ex-
puede hacer la asignacin aleatoria a tratamientos. Si en el tremos, parecen inapropiados. La inclusin de controles nor-
diseo 10 las medias de los grupos son sustancialmente di- males en la investigacin psicoteraputica es de alguna utli-
ferentes, el proceso de equiparacin, no solo no suminis- dad, pero hay que poner suma cautela en la interpretacin
tra la igualacin pretendida, sino que provoca la presencia de de los resultados. Es importante distinguir dos versiones del
efectos indeseados de regresin. Se torna previsible que am- diseo 10, y darles diferente jerarqua como aproximaciones
bos grupos diferirn en sus puntajes postest en forma por a la experimentacin propiamente dicha. Por una parte, se
completo independiente de cualesquiera efectos de X, as como da la situacin en que el experimentador dispone de dos gru-
que esa diferencia variar en proporcin directa a la diferen- pos naturales, por ejemplo dos clases, y puede elegir con
cia entre las poblaciones totales de las que se hizo la seleccin, libertad cul ha de recibir X, o por lo menos no tiene ningn
motivo para sospechar que se haga un reclutamiento diferen-
y en proporcin inversa a la correlacin entre el test y el
pre-retest. cial con relacin a X. Aunque los grupos pueden diferit en
sus medias iniciales de O, el estudio se aproximar a la ex-
Rulon [1941], Stanley y Beeman [1958] y Thorndike [1942]
perimentacin propiamente dicha. Por otra parte, hay casos
han estudiado este problema en forma exhaustiva, destacando del diseo 10 en que los participantes son a todas luces
el anlisis de covariancia y otras tcnicas estadsticas sugeri- autoseleccionados: el grupo experimental busca deliberada-
das. por Johnson y Neyman [vase Johnson y Jackson, 1959,
mente la exposicin a X, y no se cuenta con un grupo de
pgs. 424-44] y por Peters y Van Voorhis [1940] para pro- control tomado de esa misma poblacin. En este ltimo caso,
bar los efectos de la variable experimental sin el procedi-

96 97
es menos probable que se cumpla el supuesto de regresin presencia .del studio del latn. Este resultado se clasificara
uniforme entre los grupos experimental y de control, au- aqu como interaccin seleccin-maduracin. En. muchos sis-
mentando en cambio la posibilidad de interaccin seleccin temas escolares esta hiptesis rival podra verificarse am-
maduracin (y las dems interacciones de seleccin). El di.. pliando la gama de las O previas al aprendizaje del latn que
serio 10 autoseleccionado es, pues, mucho ms endeble, se toman en consideracin como en un diseo 14.
pero no ofrece informacin que en muchos casos eliminara Tales estudios constituyeron denodados esfuerzos por intro-
la hiptesis de que X surte algn efecto? El grupo de control ducir la mentalidad experimental en la investigacin de cam-
ayuda a interpretar, aunque sea muy divergente en el mtodo po, y merecen que se les preste renovada atencin y se los
de reclutamiento y el nivel medio: ample con los mtodos modernos.
La amenaza que la administracin /e tests constituye para la
validez externa es la expuesta a Propsito del diseo" 4 (va-
se pg. 32). El signo de interrogacin para la interaccin de
la seleccin y X nos recuerda que el efecto de X bien puede Diseos compensados
11.
ser especfico de los participantes seleccionados como lo fue
de los participantes de nuestro experimento. Como los re- 1Bajo este ttulo se renen todos aquellos diseos en los cua-
quisitos del diseo 10 pueden poner menos restricciones a
1 les se logra el control experimental o se aumenta la precisin
nuestra libertad de muestreo que los del diseo 4, esa espe-
-i
eficidad ser por lo comn menor que en un experimento
i aplicando a todos los participantes (o situaciones) la totalidad
1de los tratamientos.kEsos diseos recibieron las denominacio-
r de laboratorio. La amenaza a la validez externa proveniente
i de la reactividad de los dispositivos existe, pero tal vez
nes de experimentos rotativos [segn McCall, 19231, di-
- seos compensados [p. ej., Underwood, 1949], diseos
\11
en menor grado que en la mayora de los experimentos pro- - cruzados [Cochran y Cox, 1957; Cox, 1958] . y diseos
piamente dichos, como el diseo 4.
de conmutacin [Kempthorne, 1952]. El dispositivo de cua-
Donde existe la posibilidad de utilizar dos cursos intactos 'Idrado latino - es el que ms se utiliza en la compensacin.
con el diseo 10, o la de tomar muestras aleatorias de los
,Ese cuadrado latino es el utilizado \en el diseo 11, esquema-
alumnos fuera de las aulas para distintos tratamientos expe-
itizado aqu como cuasiexperimental, en el que se aplican
rimentales segn un diseo 4, 5 o 6, es casi seguro que cuatro tratamientos experimentales en forma restrictivamente
este ltimo dispositivo ser ms reactivo, creando mayor con-
aleatorizada y por turno a cuatro grupos formados de ma-
ciencia de que se est siendo sometido a experimento la
nera natural o incluso a cuatro individuos [p. ej., Maxwell,
sensacin de ser un conejillo de Indias y similares.
1958];
Los estudios de Thorndike sobre disciplina, formal y transfe-
rencia [p. ej. E. L. Thorndike y Woodworth, 1901; Brolyer, Primera Segunda Tercera Cuarta
'
Thorndike y Woodyard, 1927] constituyen otras tantas apli- vez vez vez vez
caciones del diseo 10 a X no controladas por el experimen-
tador. Tales estudios soslayaron, al menos en parte, el error Grupo A X10 X20 X30 X40
de los efectos de regresin causados por la equiparacin sim- Grupo B X20 X40 X10 X30
ple, pero habra que compararlos cuidadosamente con los m-
todos modernos. As, es probable que el uso de estadsticas Grupo C X30 X10 X40 X20
de covariancia produjera una prueba ms contundente, por Grupo D X40 X 30 X 20 X 10
ejemplo, de trasferencia del vocabulario latino al ingls.
En otro sentido, los efectos por lo comn positivos, aunque \ El diseo ha sido diagramado slo con postests, dado que
mnimos, que se hallaron podran explicarse no como trasfe- presta particular utilidad all donde los pretets resultan
rencias sino como la seleccin en los cursos de latn de los inapropiados y no se dispone de diseos como el 10. ..El
.
alumnos cuyo ndice anual de enriquecimiento de vocabulario ;diseno contiene tres clasificaciones (grupos, sesiones y X
habra sido mayor que el del grupo de control, aun sin la o tratamientos experimentalesl. Cada clasificacin es orto-

98 99
gonal respecto de las otras dos, en el sentido de que cada maduracin, los efectos de la prctica, etc. Si se tuviese que
variable de cada clasificacin se produce con la misma fre- t
organizar as un -experimento con control total, cada perso-
cuencia (una vez para un cuadrado latino) con cada variable na debera ser asignada a cada grupo en forma independiente
de cada una de las otras clasificaciones. Obsrvese que cada y aleatoria, eliminndose esta fuente tanto de los efectos prin-
tratamiento ( o X) slo se da una vez en cada columna y cada cipales como de la interaccin, al menos en lo que concierne
fila. El mismo cuadrado latino puede modificarse de tal ma- al error de muestreo. Es caracterstico del cuasiexperimento
que las X se conviertan en ttulos de filas o de columnas: que la compensacin se introduzca para suministrar una suer-
Ln_ te de igualacin, solo porque tal asignacin aleatoria no es
X1 X2 X3 X4 posible. (Como contraste, en diseos del todo controlados, se
Grupo A t10 t20 t30 t40 - emplea l cuadrado latino por razones de economa o para re-
Grupo B t30 t10 40 t20 ( sblver problemas peculiares del muestreo de parcelas.) Una
Grupo C t20 t40 tiO t30 segunda posible fuente de efectos entremezclados en los gru-
Grupo D t40 t30 t20 t10 pos es la vinculada con secuencias especficas de tratamientos.
Si todas las repeticiones de un experimento propiamente di-
Resultan as comparables las sumas de puntajes por X, al te- cho hubiesen seguido el mismo cuadrado latino, esta fuente
ner representados, en cada una de ellas, cada oportunidad y de efectos principales y de interaccin tambin habra esta-
grupo. Las diferencias en tales sumas no se podran interie- do presente. Sin embargo, en el tpico experimento propia-
tar como resultados artificiales de las discrepancias grupales mente dicho, a algunos grupos de participantes se les ha-
iniciales o de efectos de la prctica, la historia, etc. De pare- bran asignado en la repeticin diferentes cuadrados latinos,
cida comparabilidad son las sumas de las filas para diferen- eliminndose as el efecto sistemtico de secuencias espec-
cias grupales intrnsecas, y las sumas de las columnas de la ficas. De ese modo se elimina tambin la posibilidad de que
primera presentacin para las diferencias en las sesiones. Des- determinada interaccin sistemtica haya producido un apa-
de el punto de vista del anlisis de variancia, el diseo parece rente efecto principal de las X.
suministrar as informacin acerca de tres efectos principales 'Es probable que las sesiones produzcan un efecto principal
con el nmero de casilleros que suelen exigirse para dos. Re- debido a la repetida aplicacin de pruebas, la maduracin, la
sulta evidente el costo de esta mayor eficacia: lo que parece prctica y los efectos acumulados o trasferencias. Asimismo,
ser un efecto principal significativo segn cualquiera de los la historia puede generar efectos con respecto a las sesiones.
tres criterios de clasificacin, acaso constituye en cambio una El dispositivo en cuadrado latino impide, por supuesto, que
compleja interaccin significativa entre los otros dos [Lind- esos efectos principales contaminen los de X. Pero donde ta-
quist, 1953, pgs. 258 64]. Las diferencias aparentes _entre
- les efectos son sntomas de una heterogeneidad significativa,
los efectos de las X podran reSTfr un "complejo efecto es- es probable que se justifique ms la sospecha de interacciones
pecfico de interaccin entre las diferencias grupales y las -- significativas que cuando tales efectos principales no se pro-
sesiones. Las inferencias sobre los efectos de X dependern ducen. Los efectos de la prctica, por ejemplo, quiz sean
de la admisibilidad de esta hiptesis rival/ y por lo tanto las Montonos, pero tambin es probable que no sean lineales y
estudiaremos en forma ms detallada. generen efectos tanto principales como de interaccin. Muclias
rDigamos,
en primer lugar, que la hiptesis de tal interaccin aplicaciones de los cuadrados latinos en experimentos propia-
i es ms admisible para la aplicacin cuasiexperimental descrita, mente dichos, como en la agricultura, por ejemplo, no exigen
que para las de los cuadrados latinos en los experimentos reiteradas mediciones y es caracterstico que no produzcan
' propiamente dichos mencionados en los textos. En lo que ningn efecto sistemtico correspondiente de columna. Los del
se ha denominado la dimensin grupal, se entremezclan dos tipo cruzado, sin embargo, comparten este posible inconve-
1 posibles fuentes de efectos sistemticos. Ante todo, estn los niente con los cuasiexperimentos.
i factores de seleccin sistemtica implicados en la formacin Estas consideraciones permiten apreciar la mxima importan-
! natural de los grupos. Cabe esperar que esos factores tengan cia de la repeticin del diseo cuasiexperimental con diferen-
I a la vez efectos principales e interacten con la historia, la tes cuadrados latinos especficos. Tales repeticiones, realizadas
,

100 101
cii numero suficiente, haran del cuasiexperimento un experi- 'uno solo de los grupos a un acontecimiento externo k historia)
mento propiamente dicho. Es probable que implicasen tam- o a la prctica (maduracin) podra simular un efecto de X,
bin cantidades suficientes de grupos para posibilitar la asig- _ en el diseo compensado tales efectos coincidentes tendran
nacin aleatoria de grupos intactos a los tratamientos, medio que darse en sucesivas sesiones separadas y en cada uno de
e control que por lo comn es preferible. No obstante, ca- los grupos. Este resultado supone, por supuesto, que no inter-
reciendo de tales posibilidades, un cuadrado latino nico cons- pretaramos un efecto principal de X como significativo si la
tituye un diseo cuasiexperimental intuitivamente satisfacto- inspeccin de los casilleros indicase que un efecto principal
.,.. rio, a causa de su demostracin de todos los efectos en la desde el punto de vista estadstico ha sido originado, funda-
otalidad de los grupos de comparacin. Aun reconociendo mentalmente, por un muy poderoso efecto en solo uno de los
los posibles errores de interpretacin, constituye un diseo grupos. Para -un estudio ms detenido de esta cuestin, vanse
que bien vale la pena adoptar cuando no hay posibilida- Wilk y Kempthorne [1957], Lubin [1961 ] y Stanky [1955 ] .
des de un control ms eficaz. Una vez destacados sus graves
r inconvenientes, examinemos sus ventajas relativas.
Como todos los cuasiexperimentos, gana este en pujanza con
la congruencia de las repeticiones internas de la prueba. Para
,---
poner de relieve esa congruencia, deben eliminarse los efectos (7_12.;
- / Diseo de muestra separada pretest-postest
principales de las sesiones y los grupos, expresando cada Para grandes poblaciones p. ej., ciudades, fbricas, escu-e
casillero como un desvo respecto de las medias de filas (gru- las y unidades militares, suele ocurrir que, aunque no se
po ) y columnas (momentos): M o M9. M. M . . . Des-
pueden segregar subrupos en forma aleatoria para tratamien-
pus se reordenan los datos, con los tratamientos (X) enca- tos experimentales diferenciales, cabe ejercer algo as como
bezando las columnas. Supongamos que el cuadro que obte- un control experimental completo sobre el momento de apli-
nemos es de una satisfactoria congruencia, que el ms eficaz de cacin y los destinatarios de la O, utilizando procedimientos
los tratamientos es el mismo en los cuatro grupos, etc. Cules de asignacin aleatoria. Ese control posibilita el diseo 12: '
son las probabilidades de que eso no sea un efecto real de los
tratamientos, sino una interaccin de grupos y sesiones? Po- R O (X)
demos observar que casi todas las posibles interacciones de R X O
grupos y sesiones reduciran o enturbiaran el efecto mani-
fiesto de X. Una interaccin que imitara un efecto principal
de X sera poco probable, y lo sera menos an en cuadrados En este esquema, las filas constituyen subgrupos de equiva-
lencia aleatoria, representando la X entre parntesis una pre-
latinos mayores.
sentacin de X sin importancia. Se mide una muestra an-
Nos sentiramos muy atrados por este diseo cuando tuvi- tes de X, otra equivalente despus de X. El diseo no es in-
semos control de programacin sobre unos cuantos grupos de ( trnsecamente eficaz, como lo indica su fila en el cuadro 2.
formacin natural, como por ejemplo clases, pero no nos fue- No obstante, suele resultar viable, y a menudo merece que
se posible subdividir esos grupos naturales en subgrupos de se lo aplique. Se lo ha utilizado en experimentos de ciencias
equivalencia aleatoria, sea para una presentacin de X o para sociales que son an los mejores estudios existentes en sus
aplicar tests. En tal situacin, si hubiera cmo aplicar un temas especficos [p. ej., Star y Hughes, 1950]. Aunque se
pretest, se dispondra asimismo del diseo 10; tambin im- lo ha denominado diseo simulado antes-y-despus [ Selltiz,
plica una posible confusin de los efectos de X con interac- Jahoda, Deutsch y Cook, 1959, pg. 116], vale la pena des-
ciones de seleccin y sesiones. Se juzga que esta posibilidad tacar su superioridad respecto del diseo comn antes-y-des-
es menos probable en el diseo compensado, porque en cada pus, el diseo 2, por su control tanto del efecto principal de
grupo se demuestran todas las comparaciones y por lo tanto la aplicacin de tests como de la interaccin de la adminis-
se necesitaran varias interacciones equiparadas a fin de imi- ((racin de tests con X:t El defecto fundamental del diseo es
tar el efecto experimental. *k que no puede controla': la historia. As, en el estudio de la
_Mientras que en los otros diseos la especial sensibilidad de campaa de publicidad realizado 'El Cincinnati para las Na-

102 103
w
do se la utiliza en el marco de las encuestas por muestreo. Si
ciones Unidas y la UNESCO [Star y Hughes, 1950], es pr o. [ o en aenn ceune stl aidnoaryeosr,
do recurre na sltoess tmismos
bable que hechos externos de la escena internacional hubie- :
:u e
e:pa:: a
Si h
ltest ayy nlpaodscit si tr i se
suele ocurrir que muchos, carentes an de experiencia en el
ran sido la causa de la reduccin observada en el optimismo tengan
sobre la coexistencia pacfica con Rusia. hayan adquirido
en cada tanda de encuestas se recurre a distintas
Esta obra aspira a estimular los diseos de retazos, en los personas para esa tarea, y su nmero no es elevado, las dife-
cuales se agregan aspectos que permitan controlar factores encias en la idiosincrasia de los encuestadores se confun-
especficos, de ordinario uno por vez (en contraste con los r con la variable experimental. Si los experimentadores
experimentos propiamente dichos, de mayor elegancia, en que den
conocen la hiptesis, sus expectativas pueden provocar dife-
con un solo grupo se controlan todas las amenazas a la validez como lo demostraron
(interna). Repitiendo el diseo 12 en diferentes situaciones y rencias, hyase o no trasmitido la X,
con sus experimentos Stanton y Baker [1942] y Smith y Hy-
\ momentos, como en el diseo 12a ( vase cuadro 2, pg. 80 ) , man [1950]. En un caso ideal se utilizaran muestras aleato-
se controla la historia, pues si el mismo efecto se da en varias -y
ias equivalentes de distintos entrevistadores en cada tanda,
ocasiones, la posibilidad de que sea resultado de acontecimien- r
;mantenindolos ignorantes acerca del objeto del experimento.
tos histricos coincidentes se torna menos probable. No obs- 'Adems, el reclutamiento de los encuestadores puede indicar
iante, las tendencias histricas persistentes o los ciclos esta- Idiferencias estacionales, por ejemplo, ya que durante los me-
cionales siguen constituyendo explicaciones rivales no contro- ses de verano se dispone de ms estudiantes universitarios,
ladas. Por la repeticin del efecto en otras condiciones, cabe 1etc. Las tasas de rechazo son acaso menores y la duracin de
reducir la posibilidad de que el efecto observado sea caracte- !las entrevistas mayor en verano que en invierno. Para cues-
rstico de la nica poblacin seleccionada en el primer mo- utoadministrados en el aula, este error instrumental
mento. No obstante, si la situacin de la investigacin permite tionarios a
'ser menos probable, aunque las orientaciones hacia la admi-
utilizar el diseo 12a, tambin ser viable el 13, que en gene- nistracin de tests quiz se desplacen en formas mejor clasifi-
, ral resultar preferible. ; cables como instrumentacin que como influjos de X sobre 0.
Es poco probable qu se invoque la maduracin, o el efec- , Para pretests y postests aplicados con varios meses de separa-
to del envejecimiento d los participantes, como explicacin cin, la mortalidad puede plantear un problema en el diseo
rival, ni aun en estudios sobre la opinin pblica que se ex- 12. Si ambas muestras se eligen en forma simultnea (punto
tiendan durante meses. Pero en la encuesta por muestreo, y R), es de suponer que a medida que trascurra el tiempo ms
hasta en ciertos cursos universitarios, las muestras son sufi- integrantes de la muestra elegida se tornen inaccesibles, per-
cientemente grandes y las edades lo bastante heterogneas pa- dindose los segmentos ms transitorios de la poblacin, lo
ra que se puedan comparar las submuestras del grupo pretest cual producir una diferencia poblacional entre los distintos
que difieren en maduracin (edad, nmero de semestres cur- perodos de entrevista. Una advertencia de esa posibilidad la
f lados, etc.). La maduracin, y la acaso ms peligrosa posibili- constituyen las diferencias entre los grupos en el nmero de
dad de tendencias persistentes y estacionales, tambin es con-
\ trolable por un diseo como el 12b, que agrega un grupo pre- k personas no entrevistadas.
En estudios realizados a lo largo de perodos extensos, las
test anterior, aproximando el diseo al de series cronolgicas, muestras para pretest y postest deberan seleccionarse acaso
aunque sin la aplicacin reiterada de tests. Para poblaciones en forma independiente y en momentos distintos apropiados,
como la de pacientes a quienes se aplican tratamientos de psi- aunque ello tambin posee una fuente de sesgo sistemtico,
coterapia, donde podra darse una mejora espontnea o cu- resultante de los posibles cambios en el esquema residencial
racin, los supuestos de linealidad implicados en forma im- del conjunto del universo. En algunos medios (p. ej., en las
plcita en este control quiz no fueran aceptables. Es ms pro- escuelas, los archivos permitirn que se eliminen los Puntales
bable que la tendencia de maduracin reciba una aceleracin pretest de quienes no estarn ya disponibles en el momento
negativa, haciendo as que la ganancia de maduracin 01 02 del postest, haciendo as ms comparables el postest con el
sea mayor que la de 02 03, en detrimento, por tanto, de la pretest. Para lograr un mecanismo que haga posible esa correc-
,interpretacin de que X ha producido efecto. cin en la encuesta con muestras, as como una ratificacin
'La instrumentacin constituye un riesgo en este diseo, cuan-

105
104
del efecto que no pudiera contaminarse con la mortalidad, se 13. Diseo de muestra separada pretest-postest
puede someter el grupo pretest a un nuevo test, como en el con grupo de control
diseo 12c, donde la diferencia 01 02 confirmara la com-
paracin 01 0 3 . As, el estudio que Duncan y otros [1957] Se supone que el diseo 12 ha de utilizarse en aquellas situa-
efectuaron sobre la reduccin en las creencias errneas lograda dones en que la X, si existe, debe presentarse al grupo como
durante un curso introductorio de psicologa. (En este di- un todo. Si se cuenta con grupos comparables ( ya que no
seo, el grupo sometido a un retest no permite que se exa- equivalentes) a los cuales sea posible rehusar la X, se podr
minen las ganancias de personas con puntajes iniciales diver- agregar un grupo de control al diseo 12, creando as el
sos, por no haberse utilizado un grupo de control para veri- diseo 13:
ficar la existencia de regresin.)
'"---Lo caracterstico de este diseo es que lleva el laboratorio a la RO (X)
situacin de campo a la cual el investigador desea extender R X O
sus generalizaciones, probando los efectos de X en su ambien-
, te natural. En general, segn se indica en los cuadros 1 y 2, RO
los diseos 12, 12a, 12b y 12c pueden resultar superiores en
O
validez externa o posibilidad de generalizacin respecto de
los experimentos propiamente dichos de los diseos 4, 5 y 6.
Este diseo es bastante parecido al 10, solo que no se vuelve
"-Estos diseos no requieren gran cooperacin de los partici-
! a someter a test a las mismas personas y, por lo tanto, se
pantes, ni que estn disponibles en ciertos lugares y momentos,
evita la posible interaccin entre la administracin de tests
etc., de modo que se puede utilizar un muestreo representa-
tivo de poblaciones previamente determinadas. y X. Como en el diseo 10, la desventaja del 13 en cuanto a
Ila validez interna proviene de la posibilidad de interpretar co-
En los diseos 12 y 13 (y sin lugar a dudas tambin en algunas
variantes de los diseos 4 y 6, donde X y O se trasmiten por mo efecto de X otra tendencia local propia del grupo experi-
mental que, en realidad, no ha influido. Aumentando el n-
contactos individuales, etc.), es posible el muestreo represen- mero de las unidades sociales implicadas ( escuelas, ciudades,
tativo. Los signos positivos en la columna de interaccin se-
fbricas, buques, etc.) y asignndolas en cierto nmero y con
leccin-X son muy relativos y con todo derecho se los podra aleatorizacin a los tratamientos experimentales y de con-
cambiar por signos de interrogacin ya que en la prctica ge- trol, se conseguir eliminar la nica fuente de invalidacin,
neral las unidades no se seleccionan por su relevancia terica, logrndose as un experimento propiamente dicho, anlogo al
-- sino a menudo por razones de cooperacin y accesibilidad, que
diseo 4, con la nica diferencia de que se evitan nuevas
!posiblemente las tornen atpicas del universo al cual se las pruebas sobre los mismos individuos. Este diseo puede de-
Ll_esea generalizar. signarse 13a. Su esquematizacin ( en el cuadro 3) se ha visto
Star y Hughes [1950] no deseaban generalizar a Cincinnati, complicada por los dos niveles de equivalencia (logrados por
sino ms bien a los ciudadanos de Estados Unidos o -al mun- asignacin aleatoria) en l implicados. En el nivel de partici-
do en general, y persiste la posibilidad de que la reaccin a pantes, existe en el interior de cada unidad social la equiva-
X en aquella urbe fuese atpica de esos universos. Pero el lencia de las muestras separadas pretest y postest, indicadas
grado de ese sesgo de accesibilidad es tan inferior al de otros por el punto R de asignacin. Entre las varias unidades socia-
diseos ms exigentes que, en comparacin, parece justificado les que reciben cualquiera de los tratamientos, no se verifica
atribuirle un carcter positivo. esa equivalencia, lo cual se indica con la lnea punteada.
La R' designa la igualacin del grupo experimental y el de
control por la asignacin aleatoria de esas muchas unidades
sociales a uno u otro tratamiento.
rComo puede_ verse en la fila correspondiente a 13a del cua-
\ dro 3, este diseo obtiene un puntaje perfecto para validez

106 107
,.1.
tanto interna como externa, esta ltima en virtud de los' Cuadro 3. Fuentes de invalidacin para los diseos 13 a 16.
fundamentos ya expuestos a propsito del diseo 12, y con 1 Fuentes de invalidacin

mayor hincapi en el problema de la interaccin seleccin-X, Interna l


Externa
. a causa de que estn representadas muchas unidades sociales y : e e
;\ no una sola. Que nosotros sepamos, este diseo, excelente ... 2.0
11
.".,. :2
,. y.< o
.
o u -- o o E

-

pero costoso, no ha sido utilizado nunca. u "t5 c.)


2 -o >.
e,,
o
,,,
u ><
o ..... ces u
o -.0 u
o 'u -z
e . O
41 .., 0-1 Ce
ti. ..0 ,J -0 >
:o - 1 e ` C> e
e 2 .- ' :9.. -g 13'd
.1 1 . 5 1 13 '3
5 7
14. Diseo de series cronolgicas mltiples .2
..,
-o
e
E
-0 .
-5.1t-d
b -, O .2
FI) ciii U '71 >,
- .9. I,.
- .g 5' h ZI .5: -

_
En los estudios de grandes cambios administrativos por medio Diseos cuagiexperi-
de datos en series cronolgicas, al investigador le conviene bus- mentales (cont.)
+ + + + + + + + -I- +
13. Diseo de
car una institucin similar no sujeta a X, de la cual tomar muestra separada
r-sluna serie cronolgica de control anloga ( idealmente, con pretest-postest
con grupo de
tX asignada al azar): control
R O (X)
R XO
0 0 0 OX 0 0 0 0 RO
O
R
+ + + + + + + + + +
0 00 0 0 000 i0 (X)
R X O
+
13a [

RO (X)
1--Este diseo contiene ( en las 0 que comprenden a X) el n-
mero 10, de grupo de control no equivalente, pero gana { FI R O ( X)
R XO
de interpretacin por las mltiples mediciones re-
RO
presentadas, ya que en cierto sentido el efecto experimental se R O
'demuestra dos veces, respecto del control y respecto de los RO
O
R' IR
Valores pre-X en su propia serie, como en e,1 diseo 7. Ade- RO
----- ms, la interaccin entre seleccin y maduracin se controla R O
en el sentido de que, si el grupo experimental demostr por 14. Series cronolgicas -I- -F -f- + + + -I- -I- ?
lo comn una mayor tasa de ganancia, aparecera as en las mltiples
O O ORO O O
0 pre-X. En los cuadros 2 y 3 es escasa la representacin de 0 0 0 0 0 0
Eta nueva ganancia, pero aparece en la columna final de va- 15. Diseo de ciclo
lidez interna, titulada Interaccin de seleccin y madura- institucional
cin. Puesto que la maduracin se controla tanto en la serie Cl. A X 0 1
Cl. B 1 RO 2 X 0 2
experimental como en la de control, por las razones expues- Cl. B 2 11 X0 4
tas en nuestra primera presentacin , del diseo 7 de serie Cl.'C 05 X
cronolgica, la diferencia en la seleccin de los grupos, que Cont. Gen. Pob.
opera juntamente con la maduracin, instrumentacin o re- p/C1. B O,
Cont. Gen. Pob.
gresin, difcilmente podr explicar un efecto notorio. Sin p/C1. C 07
1
02 < 01 j ? ? -E ?
embargo, no se excluye la posibilidad de una interaccin en- Os <Os
1. +
? +
? ? + 4-
02 < 05
tre la diferencia de seleccin y la historia. 02 < 04 ? ? ? + ? ?
reorno con el diseo 7 de serie cronolgica, se ha, puesto un . 06 = 07 1 -I- ,
_
-
022= 02o 3
'-'1 signo negativo en la columna de validez externa para la in- + -I- -I- -V-
-I- -F -I- ? -I- + ?
16. Discontinuidad
.. 1. p,resin
.Cont. Gen. Pob. p/C1. significa Controles generales de poblacin para la clase.
108
r -traccin entre la aplicacin de pruebas y X,
aunque como en
,i el caso del mismo diseo 7, el que comentamos se emplear
La idea fundamental puede apreciarse en las filas segunda y
tercera del cuadro 1, donde se advierte que los signos posi-
[a menudo cuando la administracin de los tests no sea reac- tivos y negativos de los diseos 2 y 3 son en su mayor parte
tiva. Tambin la habitual preocupacin acerca de la posible
especificidad de un efecto demostrado de X en la poblacin que com plementarios, y que, en consecuencia, la correcta combi-
nacin de esos dos criterios, insuficientes por s solos, po-
se estudia queda registrada en el cuadro 3. En cuanto a los tests 'ara tener gran vigor. El diseo es apropiado para aquellas
de significacin, se sugiere que las diferencias entre la serie situaciones en que se presenta en forma cclica, a cada nuevo
experimental y la de control se analicen como los datos del grupo de participantes, cierto aspecto de un proceso institu-
diseo 7. Parece mucho ms probable la linealidad de estas Gonal ( escuelas, mtodos de adoctrinamiento, aprendizaje de
diferencias que la de los datos no elaborados de las series o ficios, etc.). Si en esas situaciones nos interesa la evaluacin
cronolgicas. de los efectos de una X tan global y compleja como un pro-
Este es, en trminos generales, un excelente diseo cuasiexpe- grama de adoctrinamiento, es probable que el diseo de ciclo
rimental, acaso el mejor de los ms viables. Presenta claras institucional recurrente ofrezca la respuesta ms aproximada
ventajas respecto de los diseos 7 y 10, como ya lo hemos posible resultante de los diseos que hasta aqu hemos ex-
indicado al presentar el diseo 10. La posibilidad de efectuar
reiteradas mediciones torna particularmente apropiadas las El diseo se ide originariamente durante una investigacin
series cronolgicas mltiples para las investigaciones que se de los efectos de un ao de entrenamiento para oficiales y
llevan a cabo en establecimientos educativos. pilotos sobre las actitudes hacia los superiores y los subordi-
nados y las funciones de liderazgo de un grupo de cadetes de
la Fuerza Area, mientras se completaba un ciclo de entrena-
miento de 14 meses [Campbell y McCormack, 1957]. La res-
Diseo de ciclo institucional recurrente: triccin que impidi que se realizara un experimento propia-
irn diseo de retazos mente dicho fue la imposibilidad de controlar quines esta-
ran expuestos a la variable experimental. No haba forma de
dividir el curso de ingreso en dos mitades igualadas, una de
[El diseo 15 ilustra una estrategia para la investigacin de las cuales cursara el programa anual planificado, mientras que
1 campo en la cual se comienza por un diseo insuficiente y se
a la otra se la hara volver a la vida civil. Aun en el supuesto
( van sumando luego caractersticas particulares, a fin de inves- de que fuese posible un experimento propiamente dicho de esa
tigar una u otra de las fuentes recurrentes de invalidacin. El ndole ( y el aprovechamiento oportuno de imprevistas reduc-
resultado es a menudo una burda acumulacin de verificacio- ciones presupuestarias pudo haberlo hecho posible en ms de
nes precautorias, que carece de la simetra intrnseca de los una ocasin), los efectos reactivos de ese dispositivo experi-
diseos experimentales propiamente dichos, pero se asemeja mental el inevitable trastorno en las vidas de quienes fue-
La la experimentacin. Como parte de esa estrategia, el expe- sen aceptados, seleccionados, trasportados a la base area y
rimentador habr de estar alerta ante las interpretaciones an-
tagnicas ( ajenas al efecto de X) que el diseo ofrece, y devueltos despus a sus casas distara mucho de hacer de
ellos un grupo ideal de control. La diferencia entre ellos y el
tendr que buscar la explicacin de los datos, o las posibles grupo experimental que recibira el adoctrinamiento difcil-
rextensiones de ellos, que permitiran descartarlas. Otro aspec- mente podra constituir una base adecuada sobre la cual ge-
to bastante caracterstico de estos diseos es que el efecto de neralizar las conclusiones obtenidas a las condiciones norma-
' X se demuestra en varias formas diferentes. Este aspecto es
les de reclutamiento y entrenamiento de las milicias. Queda-
=--', importante sin duda cuando cada comparacin especfica sea
Lequvoca por s sola. ba, sin embargo, el control del experimentador sobre la pro-
gramacin del momento y los destinatarios de los procedimien-
El diseo de retazos especfico que exponemos se limita
tos de observacin. Esto, ms el hecho de que la variable ex-
a un riguroso conjunto de cuestiones y situaciones, y explota
perimental era recurrente y se presentaba constantemente a
segn las circunstancias las caractersticas que estas exhiben. cada nuevo grupo de participantes, hizo posible cierta forma
de control experimental. En aquel estudio se dispona de dos completado su exposicin a X y luego elimina de 02 todas
clases de comparaciones relativas al influjo de la experiencia las medidas pertenecientes a participantes que despus no
militar sobre las actitudes. Cada una de ellas era bastante completaron su instruccin. La frecuente ausencia de este pro-
insuficiente desde el punto de vista del control experimental, cedimiento justifica la insercin de un signo interrogativo al
pero cuando ambas suministraron pruebas coincidentes, se la-do de la variable de mortalidad. La columna Regresin
'

ratificaron entre s en la medida en que ambas incluan sus se completa con signos interrogativos a fin de sealar la po-
respectivos puntos dbiles. La primera ofreca comparaciones sibilidad de efectos espurios si la medida que se utiliza en el
entre poblaciones medidas al mismo tiempo pero con distinta ----diseo
' experimental es la misma en que se fundan la acepta-
duracin de servicio. La segunda inclua medicines del mis- ' cin o el rechazo de candidatos al curso de entrenamiento.
mo grupo de personas en su primera semana de entrenamien- En tales circunstancias seran de prever diferencias constan-
to militar y otra vez despus, trascurridos ya unos 13 meses tes no atribuibles a los efectos de X. La comparacin pretest-
de servicio. 1 Jn tanto estilizado, el diseo es como sigue: postest implicada en 02 y 03 , si resulta ser el mismo tipo de
diferencia que en la comparacin 02 01, elimina las dems
Clase A X 01 hiptesis posibles de que la diferencia se deba a. un desvo
en la seleccin o reclutamiento entre ambas clases, as como
Clase B 02 X Os cualquier posibilidad de que la mortalidad haya sido la causa.
No obstante, si no se utilizara ms que la comparacin
, ;r -
Este diseo combina los enfoques longitudinal y de corte 02 03, sera vulnerable a las explicaciones rivales de histo-
' trasversal que suelen emplearse en la investigacin del desarro- ria y aplicacin de tests.
llo. En esta se supone que la comparacin es tal, que pueden En una situacin donde el lapso de entrenamiento que se exa-
medirse a la vez un grupo expuesto a X y otro que va a serlo; mina es de un ario, el aspecto ms costoso del diseo es la
esta comparacin entre 0 1 y 02 corresponde as al diseo 3, programacin de ambos conjuntos de mediciones con un ao
Comparacin de grupos estticos 1 La segunda medicin del de diferencia. Dada la inversin ya realizada en este sentido,
personal de la Clase B, un ciclo despus, nos da el segmento constituye un pequeo gasto ms realizar nuevas pruebas en
de diseo 2, Pretest-postest de un grupo. En el cuadro, la segunda ocasin. Teniendo en cuenta todo ello, cabe exten-
pg. 109, las dos primeras filas referentes al diseo 15 mues- der el diseo institucional recurrente al esquema indicado en
tran un anlisis de esas comparaciones. La comparacin cru- el cuadro 3. Ejerciendo el poder de designar cundo y a quin
zada de 0 1 > 02 suministra diferencias que no podran expli- se ha de medir, la Clase B se ha dividido en dos muestras
carse por los efectos de la historia o por el test-retest, sino igualadas, una medida antes y despus de la exposicin y la
que podran deberse a diferencias en el reclutamiento de un otra medida solo despus de ella, como en 04. Este segundo
Lao a otro (como se indica por medio del signo negativo en grupo permite una comparacin, sobre muestras cuidadosa-
Seleccin) o a la circunstancia de que los participantes eran mente igualadas, de una medicin inicial antes y despus;
lin ario mayores ( signo negativo en Maduracin). Cuando es ms precisa que la comparacin 01 02 en lo que respecta
todas las pruebas se realizan durante el mismo perodo, pare- a la seleccin, y superior a la comparacin 02 03, ya que
ce improbable que haya una variable entremezclada de instru- evita los efectos de test-retest. El efecto de X queda as do-
mentacin o desvos en la ndole del instrumento de medicin. cumentado por medio de tres comparaciones distintas,
En la tpica comparacin de las diferencias de actitud entre 0 1 > 02, 02 < 03 y 02 < 04.
alumnos universitarios de primero y segundo ario, el efecto de Ntese, sin embargo, que 02 aparece en las tres, razn por la
la mortalidad no pasa de ser una explicacin rival: 0 1 y 02 po- cual todo ello podra parecer confirmatorio solo en virtud de
dran diferir solo a causa del tipo de personas que han aban- una actuacin excntrica del mencionado conjunto particular
donado sus estudios en la Clase A, pero contina teniendo de mediciones. La introduccin de 05, o sea la Clase C, pro-
representacin en la B. Este inconveniente se puede evitar si bada en ocasin del segundo test antes de ser expuesta a X,
las reacciones se identifican por individuos y el experimenta- ofrece una nueva medicin pre-X que puede compararse con
dor espera antes de analizar sus datos a que la Clase B haya 04 y 01, etc., brindando una redundancia necesaria. La divi-

112 113
sin de la Clase B hace esta comparacin de 04 - 05 ms clara la poca de las pruebas. Para confirmar la hiptesis de un'
que lo que sera una 0 3 - 05. Advirtase, empero, que la di- efecto de X, los grupos 06 y 07 deberan ser iguales, o al me-
visin de una clase en dos mitades, sometida una a test y la nos acusar una discrepancia menor que las comparaciones
otra no, suele constituir un dispositivo reactivo. Por eso se que abarcan la exposicin a X. La seleccin de tales controles'
ha incluido un signo de interrogacin para ese factor en la pohlacionales generales dependera de lo especfico de la hi-
' - fila 02 < 04 del cuadro 3. Que sea o no un procedimiento ptesis. Dado nuestro conocimiento acerca de la universal
reactivo depende de las condiciones concretas. Cuando se importancia de las consideraciones de clase social y educacin,
--I echan suertes y se pide que la mitad de la clase pase a otra esos controles podran seleccionarse de tal modo que equipa-
ula, es probable que el procedimiento sea reactivo [p. ej., rasen el reclutamiento institucional con la clase social y la
Duncan y otros, 1957; Solomon, 1949]. Cuando, com .() sucede educacin anterior. Asimismo, podran ser personas que vi-
en muchos estudios sobre militares, las entrevistas se han rea- vieran fuera de - sus hogares por primera vez y que tuviesen la
lizado en forma individual, una clase puede dividirse en mi- edad tpica de bsqueda de independencia; as en el ejemplo
tades iguales sin que el hecho resulte tan ostensible. Cuando dado, el grupo 06 habra estado lejos de su casa durante un
' un curso est formado por un cierto nmero de divisiones ao, y el 0 7 estara a punto de abandonarla. Esos controles
con programas diferentes, hay la posibilidad de asignar esas de relacin de edad en la poblacin general seran siempre
unidades intactas a los grupos con pretest y sin l [p. ej., hasta cierto punto insatisfactorios y constituiran el rubro
Hovland, Lumsdaine y Sheffield, 1949]. Para una clase nica, ms costoso, ya que la aplicacin de pruebas dentro del
el recurso de distribuir cuestionarios o tests a todos, pero va- esquema de una institucin es por lo comn ms simple que
riando el contenido a fin de que una mitad aleatoria obtenga seleccionar casos de una poblacin general. Por esa razn,
lo que constituira el pretest y la otra se pruebe con algn 06 y 07 han sido programados con la segunda tanda de prue-
otro instrumento, puede servir para lograr que la divisin del bas, pero si no resulta ningn efecto de X en el primer con-
curso no sea ms reactiva que el test de la clase total. junto de resultados (la comparacin 01 > 02), tan costosos
; El diseo, tal como se lo representa por medio de las medi- procedimientos estaran por lo comn injustificados ( a menos,
z. ciones 0 1 a 0 5 falla siempre en el control de la maduracin. claro est, que se propugnase la hiptesis de que la X insti-
,
La gravedad de esa limitacin variar de acuerdo con el 'Inte- tucional haba eliminado un proceso normal de maduracin).

1
1 rial que se investigue. Si el experimento versa sobre la adqui- Otro enfoque por corte trasversal del control de la maduracin
sicin de una habilidad o tcnica muy poco comn, la hip- (puede darse si hay heterogeneidad de edades (o un cierto
tesis rival de maduracin que el simple hecho de envejecer 71nmero de arios fuera del hogar, etc.) dentro de la poblacin
o de adquirir experiencia gracias a las prcticas sociales co- \,que ingresa en el ciclo institucional. As ocurrira en muchas si-
tidianas habra producido esa habilidad puede resultar su- tuaciones; por ejemplo, al estudiar los efectos de un curso
4-mamente improbable. universitario aislado. En este caso, las mediciones de 0 2 po-
; Sin embargo, en el citado estudio de actitudes hacia superio- dran subdividirse en un grupo de mayor y otro de menor
res y subalternos [Campbell y McCormack, 1957], el desvo edad, a fin de examinar si esos dos subgrupos ( 02. y 02, en
' fue tal que bien podra explicarse a causa de la mayor pre- el cuadro 3 ) diferan como lo haban hecho 01 y 02 (aun-
paracin que, casi en cualquier contexto, habra adquirido un que la universal correlacin negativa entre edad y capacidad
grupo de aquella edad y tipo particular de ambiente al crecer dentro de los grados escolares, etc., introduce aqu no pocos
. en edad o estar lejos de sus hogares respectivos. En tal situa- peligros). Mejor que el control con los coetneos de toda la
cin parece imprescindible un control de maduracin. Por ese poblacin, la comparacin podra hacerse con otra institucin
i motivo se han agregado 06 y 0 7 al diseo, a fin de ofrecer determinada, por ejemplo, entre los conscriptos de la Fuerza
;' una prueba de corte trasversal de una hiptesis general de Area y los estudiantes universitarios de primer ario. Si se ha
' maduracin hecha en ocasin del segundo perodo de test., de hacer una comparacin de esta ndole, se reduce la varia-

Ello exigir someter a prueba a dos grupos de personas de la ble experimental a aquellos aspectos que ambas instituciones
poblacin general que solo difieran en la edad, la cual se ele- 'no tienen en comn. En tal caso, es probable que los diseos
gira a fin de que coincidiera con las de las Clases B y C en 10 y 13, por lo comn ms eficaces, sean igualmente factibles.
-
/., _ el \- 1
114

p 115
7- 1 7 11 2
Los requisitos formales de este diseo parecen aplicables in-
cluso a un problema como el de la psicoterapia. Esta posi- [neidad. No obstante, difcilmente podra aceptarse la expli-
bilidad revela cun difcil es una verificacin correcta de la cacin desde el punto de vista de la historia si ambas com-
variable maduracin. Comoquiera que se elijan los controles paraciones acusaran el efecto, como no fuera postulando una
poblacionales para una situacin de psicoterapia, si no reciben serie bastante compleja de coincidencias.
este tipo de tratamiento diferirn en aspectos importantes. Ntese que ninguna tendencia histrica general, como la que
Aunque estn tan enfermos como los sometidos a tratamien- sin duda hallamos en las actitudes sociales, se confunde con
to psicoteraputico, es casi seguro que diferirn en su cono- resultados experimentales concretos. Una tendencia de esa n-
cimiento de l, as como en sus creencias al respecto y su dole colocara a 02 en posicin intermedia entre 01 y 03,
fe en ese procedimiento curativo. Un grupo de esta ndole, mientras que la hiptesis de que X tiene un efecto exige que
enfermo pero optimista, podra muy bien tener posibilidades 01 y 03 sean iguales y 02 difiera de ambas en el mismo sen-
de recuperacin tpicas de cualquier grupo de comparacin tido. En general, si se repite varias veces el experimento,
de que pudisemos echar mano y, por consiguiente, podra es poco probable que la confusin con la historia constituya
malinterpretarse una interaccin de seleccin y maduracin un problema, ni siquiera en esta versin del diseo. Pero,
como un efecto de X. para ciclos institucionales de menos de un ario, habr posibi-
(-15i*ra el estudio aislado de procesos de desarrollo, el no poder lidad de confusin con variaciones estacionales en actitudes,
\ 1 controlar la maduracin no es, ciertamente, un inconveniente, moral, optimismo, inteligencia, etc. Si la X es un curso desa-
) ya que ella es el objetivo mismo del anlisis. Esa combina- rrollado solo en la temporada de otoo,* y entre setiembre y
cin de comparaciones longitudinales y de corte trasversal de- enero la gente suele experimentar mayor agresividad y pesi-
bera emplearse en forma ms sistemtica en este tipo de es- mismo a causa de los factores climticos de la estacin, esa
1 tudios. El estudio aislado de cortes trasversales confunde ma- tendencia estacional recurrente se confundir con los efectos
de X en todas sus manifestaciones. Para situaciones de esta
duracin con seleccin y mortalidad. El estudio longitudinal
confunde maduracin con aplicacin reiterada de tests e histo- ndole pueden utilizarse, y resultan aconsejables, los diseos
ria. Por s solo no es probablemente mejor que el de corte 10 y 13.
trasversal, aunque su costo ms elevado le otorga mayor pres- Si las comparaciones de corte trasversal y longitudinales indi-
tigio. La combinacin de ambos, quiz con reiteradas com- i can efectos anlogos de X, ello sera inexplicable como
paraciones de cortes trasversales en diversos momentos, pa- , interaccin entre la maduracin y las diferencias de seleccin
rece ideal. jentre las clases. No obstante, se ha dejado en blanco la co-
'Tal como se presentan los esquemas del diseo 15, se supone rumna porque este control no aparece en las presentaciones
que se podr aplicar el postest a un grupo al mismo tiempo fragmentarias del cuadro 3. Las calificaciones de los criterios de
que el pretest a otro. No siempre ocurre as en situaciones validez externa se ajustan en general al esquema de los di-
en que tal vez se deseara utilizar este diseo. La siguiente es S'ellos anteriores que contienen los mismos fragmentos. Los
una representacin ms precisa del caso tpico en la situacin signos de interrogacin en la columna Interaccin de selec-
escolar: cin y X, advierten simplemente que los denubrimientos se
limitan al ciclo institucional que se estudiajDada la com-
Clase A X 01 plejidad de X, es posible que se realice la iniiestigacin por
' razones prcticas ms que con propsitos tericos, y tal vez
Clase B1 RO 2 X 03 . se quier? en este caso generalizar a una institucin en par-
Clase 112 , ticular>a
R X 04
_....
Clase C 05 X
,
Este diseo carece del claro control sobre la historia en lar.
comparaciones
L__ 01 > 0 2 y 04> 05, por falta de simulta-
* Vale decir, la primera en el hemisferio Sur. (N. del E.)

116
16. Anlisis de discontinuidad en la regresin ra un experimento propiamente dicho. Tales experimentos
_ion factibles y habra que realizarlos.
-

Este diseo es practicable en una situacin en que se han El diseo cuasiexperimental 16 trata de establecer ese expe-
utilizado ya diseos ex post facto. Aunque de muy limitada rimento propiamente dicho examinando la lnea de regresin
aplicacin, parece justificado presentarlo aqu por el hecho ara una discontinuidad en el punto de corte, claramente im-
de que esas situaciones poco numerosas son, en su mayor ' lcita en la hiptesis causal. Si el resultado fuese como el
parte, educacionales. Tambin parece oportuno incluirlo co- 'agramado
p y los crculos de la figura 4 representasen extra-
mo ejemplo de la conveniencia de indagar, en cada situacin polaciones de las dos mitades de la linea de regresin, y no
concreta, todas las implicaciones de una hiptesis causal, bus- un experimento de solucin de empate dividido al azar, la
cando nuevos afloramientos de esta ltima, mediante los cua- prueba del efecto sera casi tan incontestable como en el
les se la pudiera verificar. La situacin que tomaremos [ This- ex erimento propiamente dicho.
tlethwaite y Campbell 1960] consiste en el otorgamiento de
premios a los aspirantes ms calificados, sobre la base de un Figura 4. Anlisis de discontinuidad en la regresin.
puntaje de corte dentro de un conjunto cuantificado de cali-
ficaciones. El premio puede ser una beca, el ingreso en una unt-
versidad tan prestigiosa que todos los aprobados se inscriben Desempeo posterior, O
en ella, un ao de estudios en Europa, etc. Despus de ese
acontecimiento, tanto los solicitantes que reciben el premio 40
como los que no lo obtienen son objetos de mediciones res-
pecto de varias O que representan logros, actitudes, etc., pos-
teriores. Se plantea entonces el interrogante de si el premio
provoca alguna diferencia. El problema de inferencia es dif- 30
cil porque casi todas las cualidades que acreditan a un alum-
no para el premio (salvo, a veces, otros factores, como sus
necesidades econmicas y el estado en que reside) son las mis-
20
mas que" habran llevado - a un mejor desempeo en esas O.
Tenemos casi la 'certeza anticipada de que los premiados ha-
bran obtenido puntales superiores en las O que quienes no lo
fueron, aunque no se hubiesen otorgado los premios. 10
La figura 4 presenta el tema del diseo. Ilustra la relacin 60 70 80 90 100 110 120 130 140 150
prevista entre capacidad pre-premio y rendimientos posterio-
res, ms los resultados adicionales de las oportunidades edu- Puntajes en los cuales influy el premi
racionales o motivacionales consiguientes. Consideremos ante
todo un experimento propiamente dicho del tipo del diseo Algunos de los tests de significacin estudiados en el diseo
6, con el cual contrastaremos nuestro cuasiexperimento. Ese 7 son tambin aplicables aqu. Ntese que la hiptesis es a
experimento propiamente dicho podra racionalizarse como un todas luces de diferencia de ordenada ms que de pendien-
proceso de solucin de empate, o como un experimento adi- te, y que el paso tiene que estar localizado en el punto X de
cional, en el que, para una estrecha amplitud de puntajes la lnea de regresin: cualquier desfasaje o dispersin es
en el punto de corte o por debajo pero muy cerca de l, la incompatible con la hiptesis. Son, pues, apropiadas las prue-
asignacin aleatoria dara lugar a un grupo experimental ga- bas paramtricas y no paramtricas que evitan supuestos de
Lnador del premio y un grupo de control no ganador. Es de linealidad. Ntese asimismo que tales supuestos son por lo
presumir que tales grupos tendran un desempeo similar al comn ms aceptables para los datos de regresin que para
representado por los dos crculos en la lnea de corte de la series cronolgicas. (Con determinados tipos de datos, como
figura 4. Para esa estrecha amplitud de capacidades, se logra-

118 119
los porcentajes, puede ser necesaria una trasformacin lineal).
Tal vez sea conveniente efectuar una prueba t vinculada con el grupo experimental y el de control, historia y maduracin
la diferencia entre los dos puntos linealmente extrapolados. parecen estar controladas. La administracin de tests como
Acaso el test ms eficaz fuera un anlisis de covariancia, en efecto principal tambin lo est, pues tanto el grupo experi-
el cual el puntaje de decisin de otorgamiento del premio mental como el de control la han recibido. Los errores de
sera la covariable de los rendimientos ulteriores, y el trata- ' instrumentacin bien podran plantear un problema si la O
miento estara representado por , la adjudicacin o no adjudi-
cacin del premio. ' de seguimiento se realizase bajos los auspicios determinantes
del premio, en el sentido de que 1agratitud por haberlo reci-
Es probable la aplicacin de este tipo de diseo? Sin duda bido y el resentimiento por lo contrario pudieran inducir a
alguna se refiere a una situacin recurrente en la cual abun- distintas manifestaciones de actitud, mayor o menor exagera-
dan las afirmaciones en favor de la eficacia de X. Vale la cin del xito alcanzado en la vida, etc. Este defecto se ob-
pena verificar esas afirmaciones? Un sacrificio necesario es servara asimismo en el experimento propiamente dicho de
que todos los elementos que entran en la decisin final se solucin de empate. Podra controlrselo haciendo que los
combinen en un ndice compuesto, determinando con nitidez seguimientos los efectuara otro organismo o institucin dife-
el punto de corte. Pero estamos convencidos de que todos los rente. Creemos, conforme a los argumentos que anteceden, que
factores que influyen en una decisin el aspecto que presen- tanto la regresin como la seleccin estn controladas en lo
ta la fotografa, la jerarqua del curso deducida de la reputacin que atae a sus posibles contribuciones espurias a la infe-
de la escuela secundaria, las relaciones del padre con los di- rencia, aun cuando la seleccin sea sesgada y exista regresin:
rectivos del establecimiento, etc., pueden incluirse en un ambas han sido controladas al representrselas en detalle, no
ndice de esta ndole, por, medio de puntajes, si no se mediante la igualacin. La mortalidad constituira un pro-
cuenta con un medio ms directo. Tambin deberamos estar blema si fuese el ente de otorgamiento del premio el que di-
ya convencidos [Meehl, 1954] de que una frmula de pon- Ti \ rigiese la medicin de seguimiento, pues quienes lo recibie-
deracin correlacional mltiple para la combinacin de los , ) ron, los ex alumnos, etc., cooperaran probablemente con
elementos (aun empleando como criterio decisiones ante- \ mucha mejor disposicin que los no ganadores. Ntese cmo
riores del comit de seleccin) suele ser mejor que las pon- El deseo, por lo comn conveniente, del investigador de lo-
deraciones de un comit en cada caso particular. Nada perde- grar que la muestra seleccionada sea bien representativa
ramos, pues, y mucho se podra ganar en todo sentido, cuan- puede inducir aqu a error. Si la conduccin del seguimiento
tificando las decisiones de todo tipo relativas al premio. De con un membrete distinto provocara una reduccin en la
proceder as, y si se llevasen registros de otorgamientos y cooperacin, por ejemplo, del 90 al 50 %, el experimentador
rechazos, cabra hacer un seguimiento de los efectos varios tal vez se resistiese a hacer el cambio, ya que l tiene como
aos despus.
meta una representacin del 100 % de los ganadores del
Acaso convenga telatar aqu una parbola verdica. Una ge- premio. Es posible que olvide que su verdadero objetivo es
nerosa fundacin, interesada en mejorar la educacin supe- obtener datos interpretables, que ningn dato es interpreta-
rior, don a una universidad de Estados Unidos medio mi- ble si est aislado, y que es imprescindible contar con un
lln de dlares para que estudiase los efectos de la escuela grupo de contraste similar a fin de utilizar la informacin
sobre sus alumnos. Diez arios despus no haba- aparecido un que posee sobre los ganadores. -Tanto por este motivo como
solo informe ni siquiera remotamente relacionad o con el tema. por el problema de instrumentacin, quiz fuese mejor desde
Tomaron con alguna seriedad los donantes o los favorecidos el punto de vista cientfico tener auspicios independientes y
con la donacin las especificaciones de la propuesta formal? _un 50 % de respuestas de ambos grupos en vez de un 90 %
Exista alguna respuesta . 1 de los ganadores y un 50 % de los no ganadores. Una vez
posible al interrogante propuesto?
Los diseos 15 y 16 parecen ofrecer las nicas aproximaciones ms, el problema de la mortalidad sera el mismo para el
viables. Pero, por supuesto, quiz ningn cientfico sienta experimento propiamente dicho de solucin de empate. En am-
verdadera curiosidad por los efectos de una X 'bos casos, la amenaza que implica para la validez interna la
tan global.
Veamos el anlisis del cuadro 3. A causa de la sincrona entre interaccin seleccin-maduracin queda controlada. En cuanto
al cuasiexperimento, se lo controla en el sentido de que esa
120
121
interaccin no podra dar una explicacin lcita de una clara
discontinuidad de la lnea de regresin en X. La amenaza
a la validez externa de una interaccin aplicacin de prue-
bas-X queda controlada, a su vez, en la medida en que las
mediciones fundamentales utilizadas al decidir la adjudicacin
del premio integran el universo al cual se quiere generalizar.
Tanto el verdadero experimento de solucin de empate como
el anlisis de discontinuidad de regresin estn particular-
mente sujetos a la limitacin de la validez externa por la
interaccin seleccin-X, ya que el efecto slo ha quedado
demostrado con respecto a una gama muy estrecha de talentos,
es decir, slo para los situados en el puntaje de corte. En
el cuasiexperimento, las posibilidades de inferencia tal vez
parezcan ms amplias, pero ntese que los inconvenientes del
1
supuesto de ajuste lineal son mnimos cuando se los extrapola
psolamente a un punto, como en el diseo ilustrado en la
1 figura 4. Generalizaciones ms amplias implican la extrapo-
i lacin del ajuste debajo de X a travs de toda la gama de
i valores de X, y en cada grado mayor de extrapolacin au-
menta el nmero de hiptesis rivales aceptables. Tambin
; aumenta la dispersin de los valores extrapolados de diferen-
testipos de curvas ajustadas a los valores inferiores a X,
Letctera.

122

Вам также может понравиться