Вы находитесь на странице: 1из 13

e

--tTk ~~~1ka

LA PARADOJA DE SIMPSON Y LA INTERPRETACIÓN DE LOS RESULTADOS


DE LAS EVALUACIONES DEL RENDIMIENTO ACADÉMICO EN EL SISTEMA
EDUCATIVO
JOSÉ LUIS GAVIRIA (•)

Este artículo pretende alcanzar los siguien- clínico al azar entre las personas que han
tes objetivos: explicar en qué consiste la recibido ese tratamiento. Si el paciente en
paradoja de Simpon; explicar que la para- cuestión sobrevivió a la enfermedad, en-
doja de Simpson puede aparecer cuando la tonces el médico gana. Si el paciente falle-
variable dependiente de continua; resaltar ció, entonces el médico pierde la apuesta.
que la interpretación de los resultados de El colega observó que su compañero siem-
una evaluación puede ser errónea si este pre apostaba por el tratamiento convencio-
fenómeno se da; presentar un caso en el nal, y no por el nuevo. Sabiendo que su
que dicha paradoja aparece en la recien adversario había participado en el estudio,
evaluación de la Secundaría del Sistema supuso consecuentemente que el médico
Educativo Español, y comprobar que la co- conocía los datos, y por tanto jugaba con
rrecta interpretación de los resultados pue- ventaja.
de ser contraria de lo que prima facie Al cabo del tiempo, el médico cayó
pudiera parecer. enfermo de la misma enfermedad. El cole-
Un médico ' estuvo participando du- ga fue a visitarle, y quedó muy sorprendi-
rante un tiempo en un experimento clínico do al enterarse de que había elegido
para probar la eficacia de un nuevo trata- voluntariamente recibir el tratamiento nue-
miento para una enfermedad de una alta vo, en lugar del tratamiento convencional.
tasa de mortalidad. La muestra que partici- Inmediatamente pensó que la enfermedad
pó en el experimento estaba compuesta había afectado a su capacidad de racioci-
por enfermos procedentes de una zona ru- nio. Con mucha delicadeza le preguntó:
ral y por enfermos procedentes de la capi- »¿Cómo es que has elegido el nuevo trata-
tal. Al cabo del experimento el médico miento para tu enfermedad? ¿No habías
contaba con todos los resultados. Era ade- participado en el estudio clínico corres-
más muy aficionado a las apuestas, y deci- pondiente?» »Efectivamente, y es esa la ra-
dió apostar con un colega, utilizando los zón de mi decisión. Definitivamente es el
datos del experimento. La apuesta consis- mejor tratamiento de los dos». »Pero, ¿cómo
tía en lo siguiente: El médico elige un tra- es que cuando apostábamos siempre ele-
tamiento, y su colega extrae un historial gías el tratamiento convencional?» »Pues

e) Universidad Complutense de Madrid.


(1) Esta historieta es una adaptación de la presentada en • BLYTH, 1972.


Reinkta de Educación, núm. 318 (1999), pp. 211-223 211
porque eligiendo ese tratamiento tenía más Puedes comprobar que cuando se
posibilidades de ganar». »Pero, ¿no quiere aplicaron los dos tratamientos en el medio
decir eso que ahora tienes menos prob- rural, el tratamiento experimental consi-
abilidades de sobrevivir?» —¡No, de ningu- guió una tasa de supervivencia de 0.1, con-
na manera!— Esta respuesta casi convenció tra 0.05263 del tratamiento convencional.
al colega de que el médico tenía afectado En el medio urbano, el resultado fue de
el cerebro. Decidió no parecer grosero, y 0.95, contra 0.5 del convencional. Esto me
por entretener un rato al enfermo le conce- convenció de que definitivamente el trata-
dió el beneficio de la duda. —¿Puedes explicar- miento experimental era el que me conve-
me como es posible eso?». —¡Naturalmente!», nía. Es más, teniendo en cuenta que yo soy
respondió el enfermo. —Basta con que ob- un paciente de medio urbano, y suponien-
serves con detenimiento la siguiente tabla, do que mis características son similares al
que casualmente tengo aquí (tabla I). Pue- resto de los sujetos de esa muestra, ¡mis
des observar que con el tratamiento con- probabilidades de supervivencia son del
95%,
vencional aproximadamente el 46% de los
pacientes sobrevivieron, mientras que de El colega se dio cuenta de que el mé-
los que recibieron el tratamiento experi- dico estaba en sus cabales, y aunque sin
mental, sólo el 11% sobrevivieron. ¡Me pa- acabar de entender del todo el asunto, se
reció la opción más lógica apostar por el despidió cortésmente y pasó el resto del
tratamiento convencional!». »Claro, eso lo día dando vueltas a las dichosas tablas.
entiendo perfectamente», —dijo el colega A esta curiosa situación, se la conoce
algo mosqueado. «De hecho sospechaba como paradoja de Simpson. Ha sido des-
que tú tenías estos datos cuando hicimos crita y tratada en varios lugares (Simpson,
nuestra apuesta. Sin embargo no entiendo 1951; Blyth, 1972; Wainer, 1986). Tiene que
porqué ahora que tienes que elegir trata- ver con la interacción de segundo orden
miento ¡no eliges también el convencio- en las tablas de contingencia de 2x2x2.
nal!». Lo entenderás perfectamente cuando Formalmente la paradoja de Simpson
consiste en lo siguiente: Es posible que P
veas la tabla II. (a I b) < P(a 115) a pesar de que P (a I -6c) >
P (a 15c) y P (a I bU) > P (a I Como se-
TABLA I ñala Blyth (1972), intuitivamente parece
que tiene que ser que P (a I b) haya de ser
Tratamiento Tratamiento algún valor intermedio entre P (a I bc) y P
convencional experimental
(a I bc), y que P (a I b) debiera ser algún va-
Fallecidos 5.950 9.005 lor intermedio entre P (a I bc) y P (a I bc) , y
Supervivientes 5.050 1.095 que P (a I b) debiera ser algún valor inter-
medio entre P (a I bc) y P (a I bc).
Como sabemos, P (a I b) = P (a I bc) P
(c I b) + P (a I bU) P(I b), y P (a I E) = P
TABLA II
MEDIO RURAL MEDIO URBANO

Tratamiento Tratamiento Tratamiento Tratamiento


Convencional experimental Convencional experimental
Fallecidos 950 9.000 5.000 5
Supervivientes 50 1.000 5.000 95

212
(a 115c) P (c 115) + P (a 113U) P (Z113). Como la paradoja. Nada nos impide utilizar una
podemos ver, el razonamiento intuitivo se- codificación distinta de la dicotómica, y
ría cierto, si los pesos P (clb) = P (c 1b), y obtener por tanto una variable dependien-
P (lb) = P ("El b). Cuando ese no es el te continua y unas tablas similares a las an-
caso, resulta que b y c no son inde- teriores en las que también se produce la
pendientes, y es su interacción la que da paradoja de Simpson.
lugar a la paradoja mencionada. Es muy importante considerar la posi-
Simpson describió este caso con tres bilidad de la aparición de la paradoja de
variables dicotómicas. Es habitual que Simpson al interpretar resultados de eva-
como en el ejemplo de Blyth, una de ellas luación 2 del rendimiento. No hacerlo así
actúa como variable dependiente en un llevaría necesariamente a la mala interpre-
experimento. Pero la paradoja también se tación de los datos.
produce cuando dicha variable dependien-
te es continua. Calcular las proporciones INTERPRETACIÓN DINÁMICA DE LA PA-
como estimadores de las probabilidades es RADOJA DE SIMPSON
lo mismo que en los datos de las tabla I y
II asignar un cero a los casos de falleci- Como hemos visto en el apartado anterior
miento, y un uno a los de supervivencia. también puede darse la paradoja de Simpson
Tendríamos entonces para cada casilla las cuando la variable dependiente es una varia-
medias que aparecen en las tablas III y IV, ble continua. Las propiedades de la media
donde podemos apreciar que se produce nos ayudan a entender mejor la naturaleza
del problema, y a darnos cuenta de que es
posible que aparezca también en diseños
TABLA III en los que las variables independientes no
son dicotómicas.
Tratamiento Tratamiento En la tabla V, tenemos los datos corres-
convencional experimental
pondientes a las medias de rendimiento en
Resultados 0,45909091 0,10841584 matemáticas en las pruebas de la evalua-
TABLA IV
MEDIO RURAL MEDIO URBANO

Tratamiento Tratamiento Tratamiento Tratamiento


convencional experimental convencional experimental
Resultados 0,05 0,1 0,5 0,95

(2) Un revisor anónimo mantiene que sólo puede hablarse de paradoja cuando los datos proceden de un
experimento y no cuando proceden de una evaluación. Según el diccionario una »paradoja es una especie ab-
surda o que lo parece». También es una »aserción inverosímil o falsa que se presenta con apariencias de verda-
dera». Analicemos los datos del ensayo ilustrativo. Cuando se realizan las apuestas, podemos no saber si los
datos proceden de una evaluación o de un experimento. La paradoja se plantea cuando hacemos apuestas so-
bre esos datos. El resultado sería el mismo fuese cual fuese la procedencia de los datos. Si sólo tenemos en
cuenta la tabla I, parece que el mejor tratamiento es el convencional. Si tenemos en cuenta la tabla II, nos da-
mos cuenta de que es justo lo contrario. La consideración de la información de la tabla I en exclusiva nos em-
puja a hacer una aseveración aparentemente acertada, que al analizar la tabla 11 se demuestra errónea. En esto
estriba la paradoja. No importa de donde procedan los datos.

213
ción de la secundaria, 1997, de los alum- incluyen las frecuencias reales con las que
nos españoles de 16 años. Como resultado se apreciará una variante del problema
de la aplicación de la reforma del sistema mencionado con más de dos categorías en
educativo español, algunos centros ya ha- una de las variables de clasificación.
bían implantado la nueva modalidad curri- En la ilustración 1 tenemos repre-
cular, (Educación Secundaria Obligatoria, sentados los datos de la tabla V. Las me-
4Q de ESO), mientras que en otra parte im- dias de los centros de naturaleza pública y
portante de los mismos todavía seguían privada se representan como puntos de
impartiendo el curriculum anterior, 29 cur- una barra rígida, mientras las frecuencias
so de Mil'. También en este grupo de edad representan a la masa que se apoya en
existen otras dos vías curriculares, 2Q de esos puntos. De esta manera, si la frecuen-
Formación Profesional de ler grado, y 2Q cia corresponde a la masa, entonces la
curso de REM (Reforma Experimental de media es centro de gravedad del sistema.
las Enseñanzas Medias). Queda claro en esta ilustración que es per-
Los datos de la tabla V, corresponden fectamente posible que las medias de 21 y
a las medias de rendimiento en las pruebas 22 (4Q de ESO y 2º de BUP privado) sean
de matemáticas de 4Q de ESO y 2.2 de BUP superiores a las de 11 y 12 (4Q de ESO y 2Q
de centros públicos y privados. Las fre- de BUP público) respectivamente, y que al
cuencias de cada casilla han sido variadas mismo tiempo la media de la fila I sea su-
para ilustrar el problema. Más adelante se perior a la media de la fila II.

TABLA V

Media
49 ESO Free. 2 9 BUP Free.
global

PÚBLICO 268,13 278,03 276,558957


2284 13084 15368

PRIVADO 270,68 285,97 275,887535


3716 1920 5636
6000 15004 21004

ILUSTRACIÓN I

ni 2

o
'712

n21 n22

o o

V22

214
El que ocurra esta paradoja es posible A. Dado el peso total de los dos con-
siempre que se den ciertas condiciones. juntos, y las medias de cada categoría en los
La determinación de cuáles son esas con- dos conjuntos, decidir:
diciones es importante en dos momentos 1. Si es posible la paradoja en esos conjuntos
distintos. Por una parte, cuando se está 2. Valores de las frecuencias en una de las
planificando un estudio; tanto de evalua- categorías en uno de los conjuntos que ha-
cen posible la paradoja.
ción, como un experimento. En la evalua- 3. Dado un valor dentro del intervalo ante-
ción del sistema educativo ocurre que se rior, decidir el conjunto de valores en una
realizan periódicamente mediciones de categoría del otro conjunto que hace posible
los rendimientos de los alumnos con la in- la paradoja.
tención de llevar a cabo comparaciones B. Dados los cuatro totales marginales,
entre evaluaciones sucesivas. Cuando los determinar:
instrumentos de medida son suficiente- 1. Si puede haber paradoja
mente fiables los cambios observados 2. Qué valores de una casilla hacen posible
pueden atribuirse a cambios reales pro- la paradoja.
ducidos en el sistema. Sin embargo los En los párrafos siguientes se analizan
cambios en el sistema educativo se pro- cada uno de estos puntos.
ducen de forma muy lenta y paulatina. Es A.1 Dadas las medias de cada categoría
muy difícil que la diferencia en los valo- se decide inmediatamente si existe alguna
res medios de rendimiento entre dos eva- distribución de frecuencias que haga que
luaciones sucesivas sea estadísticamente aparezca la paradoja. Para ello tiene que
significativa. Por ello, dados los resultados darse que:
de una evaluación tenemos una estimación Xi . Fc21 y 5E 12 5E22
razonable de los valores medios que se ob-
tendrán en la siguiente en cada estrato. Sin mm (1-21, 5Z22) max (71],g12)
embargo, cuando un sistema educativo se A.2 Dada la frecuencia total de los
encuentra en un periodo de transición en- conjuntos, podemos fácilmente determi-
tre dos líneas curriculares distintas, en un nar en una de las categorías de uno de los
breve periodo de tiempo nos encontramos conjuntos, cuáles son los valores máximos
con que la composición de los estratos de o mínimos que su frecuencia puede adop-
la muestra debe cambiar muy sustancial- tar para que se produzca la paradoja. Su-
mente de una a otra evaluación. Esto nos pongamos que el conjunto 1 es aquél en
plantea una situación en la que es posible el que las medias de las categorías son
de antemano saber si se da la posibilidad menores.
de que en la próxima evaluación aparezca Inspeccionando la ilustración 1 vemos
la paradoja de Simpson. que para que la paradoja se produzca, las
También puede resultar interesante dos medias 5e, y 3 tienen que estar com-
cuando se han recogido los datos y se van prendidas en la región determinada por Vc12
a interpretar. Eso nos sitúa en dos condi- y R21,o en general entre max (111,R12) y mmn
ciones distintas. Cuando conocemos los (21, /22).
totales marginales de una de las variables La categoría 12 puede tener el máximo
de clasificación, y cuando conocemos los de frecuencia. La categoría 11 ppede tener
cuatro totales marginales. El estudio de como máximo aquella frecuenciá que hace
esas condiciones lo realizamos para el que la media rc, sea mayor que x21.
caso de dos variables de clasificación di- n/1012i-Rit) = (N1. - ni - F[21) de
cotómicas, pero puede generalizarse a va- donde
riables con más niveles.

215

— — x21)
n„ N, _ (1) n„ <N1 + n NI (r1 21 T(22)
( x 12 -- k 11) (Y(12 — 1) N1(12 — T(11)
Esta es condición necesaria aunque no o bien
suficiente para que se produzca la parado- (21 - 5-1 11) NI ( c 2i -22)
ja. Si tornamos como referencia otras fre- n>
12 N 1 n22N (-
x11)
cuencias, las condiciones equivalentes lA l2 51-112 2 kX 12

serían Naturalmente si se pretende evitar la


paradoja los valores de las frecuencias de-
n 1 2 > N,
rI
(12 311)
, o bien berían ser los complementarios de las co-
@Tu — T111) tas indicadas.
B. Un problema distinto es el que se
( 3722 - X
21)
plantea cuando los totales marginales es-
n 22 15- N2 , o bien tán completamente determinados. Es el
( 1-12 - x
21)
caso en el que ya se han recogido todos
los datos de una evaluación, o de un expe-
n21 > N, (X12 — 5122) (2) rimento. Entonces podemos determinar:
CX- 12 —T(21) 1. Si puede haber paradoja con esos tota-
A.3 Una vez determinado el valor de les marginales.
la frecuencia en una de las categorías de 2. Qué valores de frecuencia de una casi-
lla, ya que sólo hay un grado de libertad,
uno de los conjuntos, y puesto que hay hacen posible la paradoja.
dos totales marginales que no están deter- B.1 Para lo primero, suponemos que
minados, entonces tenemos todavía otro N 1 >=N2 . Entonces n„ tiene que ser sufi-
grado de libertad. Supongamos que esa cientemente pequeño. Pero dados los tota-
primera frecuencia se ha determinado en les marginales, n„ tiene que ser mayor o
el conjunto en el que las medias son infe- igual a N, - N 2 ya que N, = n ll + n 21 , y n21
riores. Para que se produzca la paradoja no puede ser mayor que N2.
entonces el valor mínimo que puede tomar En consecuencia una condición nece-
n,, es tal que la medida x, sea menor que saria para que se pueda producir la para-
XI.
doja es que
11 21(x1. - x41) = n 22 (x 2.2 - x l.) Y n 22 = N 2 - n21
De (2) se deduce que (N — N2.) < N, (3 12 - 5121)

071 12 - 5111)
(22 - XI)
n21 = N, _ y como Y en general entonces n1 1 tiene corno
(x„ — x11)
límites los dos extremos de la anterior de-
n„„ +n ,A2)
(
sigualdad.
— se deduce que
N, B.2 En el segundo punto, si los tota-
para que se produzca la paradoja tiene que les marginales permiten la paradoja, se tra-
ocurrir que ta de ver cuál es el valor máximo que
( 5111 -11 12) N1 (51., xi2)
puede tomar n„ para que ésta de hecho se
n2 , > N (3) produzca.
— („ 1 21) n"N i („ )72.)
El valor más pequeño de la frecuencia
o lo que es lo mismo, que
de la casilla 11 está determinada por el valor
( T I2 — X 21) N, — más grande que puede haber en la frecuen-
n 22 -< N 2 íz.- n
cia de 21. Y eso es el min(N ,, N, ). Una vez
V122 5¿ 21) " Ni ( 1)
R 22 — Y(2
Alternativamente, si el valor que fue determinada)7, se produce la paradoja si
determinado en primer lugar hubiese sido x, < x 1 , es decir como n21 = N - n, susti-
del conjunto 2, entonces los valores corres- tuyendo en la (3), y operando obtenemos
pondientes del conjunto 1 serían que para que se produzca la paradoja

216

V(22 - 5112)
Si tenemos dos variables de clasifica-
N — N2
I ción, A y B, con dos niveles cada una, A, y
("22 - "21)
n„ < N2 A2 y B, y B2, existe interacción si la diferen-
I I - 3112) cia de medias en la variable dependiente
N1 (371 11 - (21)
entre los niveles de A, y A, es de distinta
Naturalmente para que ésta no se magnitud en el nivel B, que en el nivel B2.
produzca el valor de n„ tiene que ser su
Al A2
complementario.
G.H. Haggstrom, (citado en Blyth, B1 11 12
1972) señala que la paradoja de Simpson B2 21 22
es la forma más simple de la paradoja de
la falsa correlación. «Un dominio x está Si se da *nteracción entre las variables
dividido en cortos intervalos, en cada de clasificación, ésta puede ser básicamente
uno de los cuales y es una función lineal de dos tipos.
de x con pendiente negativa. Pero los
segmentos van subiendo paulatinamente ILUSTRACIÓN III
cuando avanzamos hacia la derecha, de
forma que cuando consideramos la rela-
ción global entre x e y, y es prácticamente IX
una función lineal de x con una fuerte co- 4
rrelación positiva.» (Véase la ilustración II).

o
ANN

X12

ILUSTRACIÓN II x„

70

60

50
En el primer tipo las diferencias entre las
40
categorías varían en su magnitud, pero no en
30 el sentido. Así por ejemplo en la ilustración
20 III, vemos que R2I III? Y 122 312, aunque
/0
la diferencia entre las dos últimas es ma-
o
yor que entre las dos primeras. En este
20

40

63

80

ICO caso la diferencia entre las medias globa-
les, - )72. no representa de manera exac-
OTROS PROBLEMAS DE INTERPRETA- ta la magnitud de las diferencias entre los
CIÓN EN DISEÑOS 2 x 2 pares de medias de las columnas, pero sí
que mantiene el sentido. Es decir, al inter-
La paradoja de Simpson no es el único pretar estos resultados podemos aceptar
caso en el que puede ser un error realizar que la fila II superior a la I, aunque no po-
comparaciones de las medias globales. demos hacer conjeturas acerca de las mag-
Como regla general, siempre que exista nitudes de esas diferencias, excepto en su
una interacción entre al menos dos varia- valor medio.
bles de clasificación, la diferencia entre las En el segundo tipo de interacción las
medias globales de las categorías de una diferencias entre las medias cambian de
de las variables puede enmascarar los ver- sentido al cambiar de una a otra categoría
daderos resultados. de una de las variables de clasificación.

217
Podemos ver en la ilustración IV que L 1 > Dadas las medias de cada casilla, el va-
I II , pero TC22 < k- 12 . En este caso la diferencia lor de las cotas de las frecuencias es muy
- 5Z2. no representa ni la magnitud ni el similar al caso de A.2 y A.3.
sentido de los verdaderos efectos.
CUASI-PARADOJA
ILUSTRACIÓN IV
En el caso en el que una cle las variables de
clasificación tiene tres o más categorías, pue-
de darse una situación como la de la ilustra-
ción VI.

ILUSTRACIÓN VI

o
La paradoja de Simpson es un caso si-
milar al que se da en la interacción del tipo
1, la de la ilustración III, y tiene mucha im-
portancia porque puede darse cuando no
hay interacción en absoluto. En ambos ca-
sos lo más prudente es realizar las compa-
raciones con los datos desagregados.
En ella uno de los conjuntos tiene
GENERALIZACIÓN A MÁS DE DOS una media superior en dos categorías
CATEGORÍAS e inferior en una tercera. Se trata por
tanto de un caso en el que puede exis-
A partir de la ilustración I se entiende fácil- tir interacción entre las variables de cla-
mente que la generalización a más de dos sificación. Llamamos a esta situación
categorías en una de las variables de clasi- cuasi-paradoja ya que no es la magnitud
ficación es inmediata. En la ilustración V de las diferencias de las medias la que
vemos cómo sería un caso con tres niveles determina por sí sola la situación. Apa-
en una de las variables. En una tabla cle rentemente esta situación no es tan llama-
este tipo tendríamos cuatro grados de li- tiva como el verdadero caso de Simpson.
bertad si sólo dos totales marginales estu- Sin embargo, tanto en un caso como en
viesen determinados, o bien dos grados otro la media general está enmascarando
de libertad si estuviesen definidos los cin- los verdaderos efectos.
co totales marginales. Es evidente que cuando hay interac-
ción entre las variables de clasificación,
ILUSTRACIÓN V es desaconsejable la utilización cle las
medias generales. Pero no es el único
caso. Como hemos visto con la paradoja
y la cuasi-paradoja de Simpson, es posi-
ble que no haya interacción entre las
variables y que sin embargo sea desa-
consejable la presentación de los datos
agregados.

218
ALGUNOS EJEMPLOS EN LA Cuando analizamos con más deta-
EVALUACIÓN DEL RENDIMIENTO EN lle estos datos vemos que de las cinco
SECUNDARIA EN EL SISTEMA materias evaluadas, en cuatro de ellas, cuan-
EDUCATIVO ESPAÑOL 3 do hay diferencias significativas es favor de
los centros privados (tablas VII a XI). En la
En el momento en el que se evaluó la en- materia restante, matemáticas, mientras que
señanza secundaria en España, (1997), en la diferencia aparente a nivel global era de
los cursos modales correspondientes a 16 3,28 puntos a favor de los centros públicos,
arios, coexistían cuatro modalidades curri- al desglosar los datos aparece una diferencia
culares con distintos niveles de implanta- de 7,05 puntos a favor de los privados en se-
ción. Se trata de 2Q de BUP, 4Q de ESO, 2Q gundo de BUP, de 4,34 a favor de los públi-
de REM y 2Q de FP1. Las modalidades de cos en Y de FP, y una diferencia de 3,64
Y de BUP y Y de REM estaban en proce- puntos a favor de los públicos significativa
so de desaparición. Pero mientras la últi- sólo al nivel del 5% en 4Q de ESO.
ma sólo subsistía residualmente en una cle El efecto es ciertamente espectacular
las comunidades evaluadas, Y de BUP era en ciencias de la naturaleza y en geografía
todavía la opción mayoritaria en la mayo- e historia. En la primera de estas dos mate-
ría de ellas, mientras que paulatinamente rias la diferencia aparente es de 5,68 pun-
se estaba implantando 4 Q de ESO. tos a favor de los centros públicos. Cuando
Cuando se analizan los datos de los analizamos por líneas curriculares vemos
alumnos de 16 años en las distintas ma- que las diferencias significativas son de
terias, (tabla VI), vemos que la diferencia 10,25 puntos y de 15,34 puntos ¡a favor de
es estadísticamente significativa a favor los centros privados!
de los centros públicos, y sólo en gramá- Algo similar ocurre en geografía e histo-
tica y literatura esa diferencia es a favor ria. A una diferencia aparente no significativa
de los centros privados. de 0,33 puntos a favor de los centros públi-

TABLA VI

Dif. Significativa
A favor de:

Públicos Privados Diferencia


Comprensión 271,46 270,36 1,1 Públicos
Lectora
Gramática y 266,24 269,25 -3,01 Privados
Literatura
Matemáticas 264,25 260,97 3,28 Públicos
Ciencias de la 268,87 263,19 5,68 Públicos
Naturaleza
Geografía e 269,9 269,57 0,33 No
I listoria

(3) Ejemplos tornados de DE LA ORDEN y otros (1998).


(4) Curso modal correspondiente a una edad es aquél en el que la mayoría de los alumnos tienen esa edad.

219
TABLA VII
Comprensión lectora
Dif. Significativa
Públicos Privados Diferencias a favor de:
r BUP 281,68 286,34 -4,66 Privados

42 ESO 273,1 271,35 1,75 No

r FP 246,22 246,27 -0,05 No

TABLA VIII
Gramática y literatura
Dif. Significativa
Públicos Privados Diferencias a favor de:
r BUP 289,26 298,74 -9,48 Privados
42 ESO 264,96 265,32 -0,36 No
r FP 221,72 2226,76 -5,04 Privados

TABLA IX
Matemáticas
Dif. Significativa
Públicos Privados Diferencias a favor de:
r BUP 276,86 283,91 -7,05 Privados
42 ESO 267,27 263,63 3,64 Públicos
(Sólo a15%)
22 FP 230,26 225,92 4,43 Públicos

TABLA X
Ciencias de la Naturaleza
Dif. Significativa
Públicos Privados Diferencias a favor de:
r BUP 271,21 281,46 -10,25 Privados

42 ESO 273,79 289,13 -15,34 Privados


r FP 226,46 225,73 0,73 No

TABLA XI
Geografía e Historia
Dif. Significativa
Públicos Privados Diferencias a favor de:
r BUP 278,92 289,92 -11 Privados

42 ESO 271 281,7 -10,7 Privados

22 FP 232,3 232,91 -0,61 No

220
cos corresponden dos diferencias muy sig- una de las comunidades autónomas es
nificativas de 11 y de 10,7 puntos en 29 de consistente 5 con los datos de las tablas VII
BUP y 49 de ESO respectivamente a favor a XI en comprensión lectora, gramática y
de los centros privados. literatura, ciencias de la naturaleza y geo-
En la tabla XIII aparece la distribución grafía e historia, en matemáticas de 4 9 de
de frecuencias de cada estrato que dio ESO se da también una interacción con la
como resultado los efectos paradójicos re- variable comunidad autónoma. Así vemos
señados. en la tabla XII que hay cinco comunidades
En resumen, una vez analizadas con en las que la diferencia es a favor de los
detenimiento las líneas curriculares vemos centros públicos, y seis en las que las dife-
que de diez diferencias estadísticamente rencias son a favor de los centros privado.
significativas ocho son a favor de los cen- Además, esas diferencias varían desde 25
tros privados, y dos, una de ellas sólo al ni- puntos a favor de los centros privados (As-
vel del 5%, a favor de los centros públicos. turias), hasta 17 puntos a favor de los pú-
Es evidente que las conclusiones a las blicos (Cantabria) (tabla XII). Todo son
que se puede llegar son radicalmente dis- claros ejemplos de cómo quedan enmasca-
tintas cuando se tiene en cuenta la exist- rados los verdaderos efectos si se agregan
encia de la paradoja de Simpson. indiscriminadamente los datos.
También a un nivel mayor de desagre- Dado que el nivel de implantación del
gación se producen interacciones que es nece- curso 49 de la ESO es muy distinto en unas
sario atender para explicar el verdadero y otras comunidades, está claro que no
significado de los datos. Mientras que las dife- puede hacerse una comparación global
rencias observadas por materia y curso en- entre centros públicos y privados referidos
tre centros públicos y privados en cada a este curso.

TABLA XII
Matemáticas en 4 9 de ESO por comunidades autónomas
COMUNIDAD MATEMÁTIC.AS
GRUPO DE EDAD AUTÓNOMA DEL TITULARIDAD 49 DE ESO
CENTRO
Media
16 AÑOS ARAGÓN PÚBLICO 286,94
PRIVADO 281,71
ASTURIAS PÚBLICO 265,24
PRIVADO 301,21

BALEARES PÚBLICO 257,86


PRIVADO 264,81

(5) Sólo en Baleares, en Extremadura (Comprensión Lectora y Matemáticas), y en Navarra (Matemáti-


cas), ocurre que sean los centros públicos superiores significativamente a los privados en 2° de BUP. En las
dos primeras comunidades se da también el caso de que en ellas los centros privados son superiores a los
públicos en todas las materias evaluadas en 40 de ESO, lo que está señalando probablemente diferencias en
el ritmo de implantación de la ESO entre estas comunidades y las demás. En el caso de Navarra no se había
implantado 40 de ESO en ningún centro en el momento de la evaluación.

221
TABLA XII (cont.)
Matemáticas en 4 2 de ESO por comunidades autónomas
CANTABRIA PÚBLICO 272,11
PRIVADO 255,75
LA MANCHA PÚBLICO 270,01
PRIVADO 282,36
CAS11 L. LEÓN PÚBLICO 284,56
PRIVADO 276,28
CATALUÑA PÚBLICO 254,79
PRIVADO 255,18
CEUTA/MELILLA PÚBLICO 243,93
PRIVADO 266,86
EXTREMA PÚBLICO 265,06
PRIVADO 288,28
GALICIA PÚBLICO 247,32
LA RIOJA PÚBLICO 288,47
PRIVADO 286,68
MADRID PÚBLICO 273,67
PRIVADO 262,88
MURCIA PÚBLICO 257,59
PRIVADO 246,02
VALENCIA PÚBLICO 252,10

TABLA XIII
Número de alumnos por línea curricular y titularidad del centro 6

Alumnos en Comp.
Titularidad del Alumnos en CCNN y
Curso Lect., Gram. y Lit. y
centro Geo. e Hist.
Mat.

2Q
BUP Públicos 6852 622
Privados 3920 479
42 ESO Públicos 8238 1541
Privados 927 57
2ºFP Públicos 3257 214
Privados 2635 273

(6) Las frecuencias reseñadas son las resultantes de ponderar el tamaño del estrato por el peso que a di-
cho estrato le corresponde corno corrección por submuestreo.

222
CONCLUSIONES facie (aparentes) de las variables de clasifi-
cación.
Se han presentado las condiciones en
Cuando se presentan resultados de la eva- las distribuciones de frecuencias que posi-
luación del rendimiento de los alumnos en bilitan la aparición de la paradoja en los di-
el sistema educativo, es importante poder seños 2x2, y se han ilustrado los efectos de
determinar las diferencias asociadas con la cuasi-paradoja con datos tomados de la
ciertas variables de clasificación. Por esta evaluación del rendimiento académico en
razón el diseñar la muestra se estratifican el sistema educativo español.
los datos en función de las variables consi-
deradas de más interés. En la presentación
de los resultados se tiende a hacer hinca- BIBLIOGRAFÍA
pié en los efectos principales de las varia-
bles de clasificación, y en algunas BLYTH, C. R. (1972) «On Simpson's Paraclox
interacciones de primer orden, por razones and the Sure-Thing Principie». Journal
de parsimonia. Es sabido que si existe una of the American Statistical Association,
interacción entre las variables de clasifica- V. 67, 338, pp. 364-366
ción, la presentación de los efectos princi- ORDEN Hoz, A. de la y otros (1998) 2. »Los
pales en exclusiva puede enmascarar los resultados escolares». Diagnóstico del
verdaderos efectos. Pero incluso cuando sistema educativo 1997. Estudios e in-
no hay interacción entre las variables de formes INCE, Ministerio de Educación
clasificación respecto de la variable depen- y Cultura. Madrid.
diente, pueden darse casos como el de la SINIPSON,E. H. (1951) »The interpretation of
paradoja de Simpson en los que la interac- Interaction in Contingency Tables».
ción se da respecto de las frecuencias. Tan- Journal of tbe Statistical Society, Series
to en la paradoja de Simpson en diseños B, V. 13, pp. 238-241
de 2x2, 2x3 ó más, como en lo que hemos WAINER, H. (1986) «Minority Contributions
denominado cuasi-paradoja de Simpson, to the SAT Score Turnaround: An
en diseños de 2x3 ó más, la presentación example of Simpson's Paradox». Jour-
de sólo los efectos principales enmascara nal of Educational Statistics, V. 11, 4,
el verdadero sentido de los efectos prima- pp. 239-244.

223

Вам также может понравиться