Вы находитесь на странице: 1из 33

SEMINARIO DE TÍTULO

TÍTULO DE INGENIERO COMERCIAL


MENCIÓN ECONOMÍA.

DEPARTAMENTO DE ECONOMÍA
PONTIFICIA UNIVERSIDAD CATÓLICA DE CHILE

EVALUACIÓN DEL SISTEMA DE VOUCHERS


CHILENO POR MEDIO DE LA PRUEBA DE
SELECCIÓN UNIVERSITARIA (PSU)
COMPARACIÓN DE METODOLOGÍAS Y VARIABLES DE
EXCLUSIÓN

Francisco Meneses

11 de enero de 2008

En esta tesis se analiza una investigación, la cual obtiene resultados atı́picos


dentro de la literatura nacional. La investigación en cuestión, Contreras (2001),
evalúa la eficacia en la entrega de educación por parte de los colegios, utilizando
la PAA. Se compara la metodologı́a de estimación utilizada por Contreras con la
de otro autor, se actualiza la muestra utilizada y se evalúan distintas variables
de exclusión.
Se evidencia que no se pueden utilizar las pruebas de selección universitaria
para evaluar el desempeño de los establecimientos, ya que los resultados estarı́an
sesgados debido a que la PSU esta afectada por un proceso de autoselección en
los alumnos que rinden la prueba.
Además se concluye que las variables de exclusión, y no la metodologı́a de
estimación, son la fuente principal de diferencias en los resultados de este trabajo
con el de Contreras(2001) y con otros estudios.

1
Índice
1. Introducción 3

2. Revisión Literaria 3

3. Datos 7

4. Modelo 10
4.1. Regresiones con IV/TSLS . . . . . . . . . . . . . . . . . . . . . 11
4.2. Regresiones tipo Heckman . . . . . . . . . . . . . . . . . . . . . 13
4.3. Tratamiento promedio (ATE) y de los Tratados (TT) . . . . . . 16
4.4. Test de Hausman . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

5. Discusión de los resultados 19


5.1. Merma en datos PSU y SIMCE . . . . . . . . . . . . . . . . . . . 19
5.2. Diferencias con el trabajo de Contreras . . . . . . . . . . . . . . 22
5.3. Análisis a las variables de exclusión . . . . . . . . . . . . . . . . 23

6. Conclusiones 30

7. Anexo 32
7.1. Tablas Descriptivas . . . . . . . . . . . . . . . . . . . . . . . . . . 32
7.2. Regresiones Mlogit . . . . . . . . . . . . . . . . . . . . . . . . . . 32

2
1. Introducción
La educación es un factor decisivo en la determinación de los ingresos futuros
de las personas. En Chile, en particular, la enseñanza universitaria es la que
genera los mayores retornos.1 Con esto en mente, se ha desarrollado un debate
sobre opciones para mejorar la eficacia y la eficiencia en la entrega de educación.
El objetivo de este trabajo es analizar, actualizar y mejorar el trabajo desar-
rollado por Contreras(2001), el cual hace un análisis al sistema educacional en
Chile. Este sistema está compuesto por establecimientos que reciben sus ingre-
sos de distintas fuentes; siendo éstos municipales, particulares subvencionados,
y particulares pagados. Este sistema fue introducido en 1982 y está caracteri-
zado por una subvención por alumno o voucher para los colegios municipales y
particulares subvencionados.
El trabajo de Contreras(2001) es un outlier en literatura nacional, ya que
es el primero en utilizar una prueba de selección universitaria para evaluar el
desempeño de los colegios. Este autor obtiene resultados relativos a la eficacia
de los colegios subvencionados cuyas magnitudes son bastante superiores a las
existentes en la literatura nacional. Esta tesis es un aporte a la discusión ya que
evalúa las causas de la diferencia del trabajo de Contreras con el resto de las
investigaciones nacionales.
Para examinar el trabajo de Contreras(2001) repetiremos sus estimaciones
utilizando la Prueba de Selección Universitaria (PSU). En primer lugar, se
evalúan los datos a utilizar y, luego, dos metodologı́as de estimación: la utiliza-
da por Contreras(2001) y la usada por Tokman(2002). Finalmente se comparan
distintas variables de exclusión.
Este trabajo se divide de la siguiente manera. En la sección 2 se realiza una
breve revisión de la literatura nacional. En la sección 3 se describen los datos.
En la sección 4 se desarrollan los modelos a utilizar. En la sección 5 se presentan
y discuten los resultados. Finalmente, en la sección 6 se concluye.

2. Revisión Literaria
En Chile se ha desarrollado un debate respecto a las variables que explican el
buen rendimiento de los colegios, y sus alumnos, en las pruebas estandarizadas.
1 Esto se encuentra ampliamente documentado en la literatura nacional. Algunos ejemplos

son Sapelli (2003), Bravo y Marinovic (1997), Benavente, Meller y Rappoport (2004), y Beber
(2001)

3
A continuación, realizamos una breve revisión de la literatura reciente.
Mizala & Romaguera (2000a), evalúan el sistema de vouchers de Chile. Uti-
lizando la prueba SIMCE rendida por los alumnos de 4to año básico en 1996.
Controlan la producción de la educación por medio de variables socioeconómi-
cas, caracterı́sticas de los alumnos del colegio, y de desempeño pasado del colegio
en las pruebas SIMCE. Concluyendo que la diferencia de eficiencia entre colegios
municipales y subvencionados es pequeña o inexistente, al ser mucho menor a
lo que sugieren los análisis basados en los promedios ponderados.
Las mismas autoras, Mizala & Romaguera (2000b), utilizan datos de alum-
nos de 2do año de enseñanza media del SIMCE 1998. Estiman una función de
producción para establecimientos de enseñanza media y realizan estimaciones
a nivel de alumnos, incluyendo variables de contexto, socioeconómica y carac-
terı́sticas del alumno y del establecimiento.
Concluyen que los alumnos que se educaron en colegios municipales, tienen
menores resultados en el SIMCE que sus pares de iguales caracterı́sticas que
accedieron a colegios subvencionados.
En los trabajos recién expuestos los coeficientes estimados podrı́an estar
sesgados, ya que Mizala & Romaguera (2000a y 2000b) no corrigen el problema
de la endogeneidad en la selección de colegios por parte de los individuos.
Tokman (2002), realiza un análisis con los datos del SIMCE 1996 de 4to
básico. La autora, controla por sesgo de selección realizando regresiones y cor-
rigiendo sesgo de selección por medio de la metodologı́a desarrollada por Heck-
man(1979), para cada muestra, agregando no sólo el efecto aditivo y multiplica-
tivo al efecto de tratamiento de los tratados (TT), sino que también agregando
efectos diferenciales para distintas caracterı́sticas de los colegios. Siendo ası́ las
variables de exclusión utilizadas para corregir la endogeneidad, las caracterı́sti-
cas socioeconómicas de las familias de los alumnos. El trabajo concluye que los
colegios municipales suelen ser relativamente más eficientes en la educación de
alumnos de menores ingresos.
Sapelli & Vial (2002), usan la misma base de datos de Mizala & Romaguera
(2000b) para evaluar el sistema de vouchers considerando las diferencias en los
ingresos de los colegios, separados por áreas geográficas, y tomando en consid-
eración las diferencias de ingresos. Utilizan el modelo de Roy generalizado para
caracterizar el proceso de autoselección según el tipo de colegio. Controlando
de manera parcial la oferta de la educación e incluyendo en sus estimaciones las
transferencias del gobierno a los colegios municipales.
Estiman el efecto de tratamiento promedio (Average treatment effect, ATE)

4
y el efecto de tratamiento de los tratados (TT)2 , descubriendo ganancias aso-
ciadas al asistir a colegios subvencionados. Como variable de exclusión para
corregir el sesgo de selección, los autores utilizan el número de colegios sub-
vencionados y municipales por kilómetro cuadrado, y el ratio entre alumnos
de colegios subvencionados y alumnos en colegios subvencionados más munici-
pales. De esta manera, los autores asumen que además del nivel de ingresos y
educación de los padres, la elección de colegio depende de la disponibilidad de
colegios en área geográfica.
Ambos autores, Sapelli & Vial (2004), realizan un análisis similar al hecho el
año 2002 utilizando una base de datos individual de estudiantes de 4to básico que
rindieron el SIMCE 2002. Concentran su estudio en colegios que reciben bajos
aportes económicos por parte de los padres. Ası́, encuentran un efecto de los
tratamiento de los tratados positivo, grande en magnitud y significativo. Como
variable de exclusión para corregir el sesgo de selección, los autores utilizan
dos indicadores del ratio resultados de prueba SIMCE y costo del colegio de
esa área geográfica, desarrollando una serie para establecimientos municipales
y otra para colegios subvencionados, siendo su idea el tener un proxy del costo
de una unidad de prueba SIMCE.
Este segundo enfoque asume que la selección del establecimiento por parte
de los padres de los educandos y tiene relación con la productividad media del
dinero invertido en educación. Viendo los resultados, los signos de la ecuación
de selección son los esperados, donde al disminuir (aumentar) el costo medio de
la educación subvencionada (municipal), aumenta (disminuye) la posibilidad de
ingresar a un colegio subvencionado (municipal). El estudio también evidencia
que las mujeres obtienen mejores resultados en el SIMCE, comparados con sus
pares de distinto género.
Un enfoque distinto es desarrollado por Contreras, Bustos & Sepúlveda
(2007) al emplear el SIMCE 2005 para 4to año básico, con datos individuales.
Utilizan variables de contexto, socioeconómicas, caracterı́sticas del colegio y de
los profesores para explicar los resultados en la prueba SIMCE. Para controlar
la endogeneidad del colegio de origen utilizan variables instrumentales. Como
variables de exclusión consideran si los colegios seleccionan a sus educandos y
el origen socioeconómico de los alumnos para estimar la endogeneidad en la
elección de tipo de establecimiento (IV/LATE). Los autores concluyen una vez
considerado el factor de selección del colegio y origen socioeconómico, la difer-
2 Utilizan la metodologı́a propuesta por Heckman, Tobias & Vytlacil (2000) para la esti-

mación de los errores estándares y el cálculo del ATE y TT

5
encia de productividad entre los colegios se acaba, sugiriendo que la diferencia
de puntajes en el SIMCE, es atribuible al sistema de selección de los colegios.
Contreras et al. no explı́cita el origen de los sistemas de selección utilizados,
punto clave en el análisis, ya que éstos podrı́an ser endógenos a la calidad de los
colegios.
La diferencia de los enfoques de Sapelli & Vial y Contreras et al.(2007)
lleva a conclusiones distintas. Sapelli & Vial asumen que la elección de colegio
se da por los padres y la metodologı́a utilizada para corregir la endogeneidad
consiste en la probabilidad de estar en un grupo u otro. Mientras que Contreras
et al(2007) asumen que los colegios son los que seleccionan alumnos y utilizan
variables instrumentales para corregir la endogeneidad.
Un trabajo outlier en la literatura nacional, tanto por la variable a explicar,
como por sus resultados, es el de Contreras (2001). El autor evalúa el desempeño
de los alumnos en la Prueba de Aptitud Académica (PAA). La PAA, es una
prueba rendida de manera voluntaria por los alumnos al finalizar la educación
escolar media y es el instrumento principal del sistema de selección universitario
chileno. Contreras en una primera etapa desarrolla un modelo OLS y encuen-
tra que el asistir a un colegio particular subvencionado, no implica un aumento
en los puntajes obtenidos en la PAA. Luego, con un set de caracterı́sticas in-
dividuales del alumno y variables del establecimiento (variables de contexto y
origen socioeconómico) controla la endogeneidad en la elección del establec-
imiento de los estudiantes. Esto lo realiza a través de Mı́nimos Cuadrados en
dos Etapas (TSLS) o (IV/LATE), encontrando diferencias significativas entre
colegios municipales y subvencionados. Además manifiesta que las caracterı́sti-
cas de contexto y origen disminuyen su impacto en la PAA, una vez controlada
la endogeneidad causada por el colegio de origen, siendo estos factores decisivos
en la elección de colegio. Contreras, también encuentra evidencia que indica que
los resultados de las mujeres en la PAA son inferiores al de los hombres.

6
Cuadro 1: Resumen Resultados Literatura

Autor Estimación Prueba ATE / SD TT / SD LATE /SD

Mizala & Romaguera (2000a) OLS SIMCE 0


Mizala & Romaguera (2000b) OLS SIMCE 23.7 %*
Tokman (2002) Heckman SIMCE
Sapelli & Vial (2002) Treatment Reg. SIMCE -5 %** 15 %**
Sapelli & Vial (2004) Treatment Reg. SIMCE 33 %** 37 %**
Contreras et al (2007) IV/TSLS SIMCE 32 %
Contreras (2001) IV/TSLS PAA 89 %*[
*Prueba Matemáticas
** Prueba Lenguaje
[ Hombres

En el Cuadro (1) se resumen los trabajos de la literatura nacional reciente.


Los LATE, TT y ATE han sido divididos por la desviación estándar de la prue-
ba utilizada, para poder hacer comparables los resultados. Se puede ver que el
trabajo de Contreras(2001) es el único que utiliza una prueba de selección uni-
versitaria para evaluar el sistema educacional. Además sus resultados resultan
ser atı́picos, dada la magnitud del la efectividad en la entrega de educación por
parte de los colegios subvencionados. Este dato llega ser incluso superior a una
desviación estándar para algunos de los casos analizados por este autor.
En este trabajo evaluaremos los motivos que causan las diferencias en los
resultados de Contreras (2001) con el resto de la literatura nacional. En primera
instancia evaluaremos dos metodologı́as de estimación; la metodologı́a usada
por Contreras (2001), para luego desarrollar la metodologı́a usada por Tokman
(2002), la cual es similar a la de Sapelli & Vial. En ambos casos se evalúa el
rendimiento en la PSU de los alumnos de distintos establecimientos.
En una segunda parte de este trabajo se evaluarán los datos de esta tesis y
las variables de exclusion usadas por Contreras(2001), comparándolas con las
usadas por Sapelli & Vial (2002).

3. Datos
Contamos con los datos SIMCE del año 2003 por establecimiento, el cual fue
rendido por 239.195 alumnos de 2do año de enseñanza media en 2.117 colegios
de Chile.

7
El SIMCE fue rendido de manera obligatoria por todos los estudiantes que se
encontraban en segundo medio en Chile. Contamos con los puntajes de la prueba
de lenguaje y la prueba de matemáticas SIMCE por colegio; promediamos ambos
puntajes y de esta manera obtendremos el promedio del SIMCE por colegio.

Cuadro 2: Datos por tipo de colegio


Colegio Simce PSU Porcentaje
Mun 123.797 42.520 34 %
Subv 97.087 48.157 50 %
PP 18.311 14.450 79 %
Total 239.195 105.127 44 %

fuente: Elaboración propia


Disponemos de los datos de la PSU 2006 por alumno3 . La PSU es la contin-
uación del la PAA, prueba que fue rendida en el proceso de admisión del año
1998 por 142.382 alumnos 4
Promediamos las pruebas de lenguaje y matemática obteniendo la PSU
promedio por estudiante. Esta prueba fue rendida por 176.901 individuos de
manera voluntaria, de los cuales 125.371 habı́an egresado el año 2006. La primera
y más importante merma en los datos es de 113.824 educandos que dieron el
SIMCE 2003 de manera obligatoria, pero que no rindieron la prueba PSU 2006.
Una caracterı́stica importante de esta pérdida de datos, es que no es homogénea
a través de los colegios, siendo los colegios municipales los que presentan la may-
or merma en los datos, punto que deber ser considerado al momento de evaluar
los resultados de este trabajo.
Al empalmar ambas bases de datos, SIMCE y PSU, contamos con informa-
ción disponible para 105.262 alumnos, existiendo una merma de información
para 20.109 alumnos, la cuál se refiere principalmente a la diferencia de códigos
entre el Ministerio de Educación y el DEMRE. Esta última pérdida de infor-
mación está distribuida homogéneamente según los distintos tipos de establec-
imientos, y continuaremos el trabajo considerando los datos como una muestra
representativa de la población que rinde la PSU. No esta demás mencionar que
la base considera un número mayor de alumnos que la usada por Sapelli & Vial
(2002) y (2004), pero un número menor a la utilizada por Contreras et al.(2001)
3 La PSU 2006 fue rendida en diciembre del 2005 por los alumnos de 4to medio
4 De los cuales 97.935 se graduaron ese mismo año, Contreras(2001) realiza regresiones
sobre 119.450 alumnos.

8
Cuadro 3: Cuadro de Correlaciones
Variables NEM PSU SIMCE MeanNEM nemst
NEM 1.000
PSU 0.547 1.000
SIMCE 0.216 0.639 1.000
MeanNEM 0.445 0.352 0.485 1.000
nemst 0.885 0.451 -0.000 0.000 1.000

Para facilitar la interpretación de los resultados en este trabajo generamos


una serie de variables.
La primera variable es el promedio de notas de los alumnos por promoción
por colegio. Es decir el promedio las notas de enseñanza media de todos los
alumnos de un mismo colegio, definida como MeanNEM.5
Con el objetivo de tener un indicador de rendimiento escolar que tenga la
misma media y varianza a través de todos los colegios generamos la variable
NEMST (las NEM estandarizadas por colegio), las cuales tienen media 0 y
varianza 1 para cada establecimiento educacional chileno.6
Luego evaluamos las correlaciones del NEM, SIMCE, PSU, NEMST y Mean-
NEM. Podemos ver, que existe una correlación positiva entre PSU y SIMCE,
ya que a mayor calidad del colegio de origen (SIMCE), son mejores los punta-
jes en la prueba de selección universitaria. Encontramos también correlaciones
positivas entre SIMCE y NEM , SIMCE y MeanNEM, y MeanNEM y PSU.
Al ser la PSU y SIMCE variables que miden calidad en los colegios, evidenci-
amos que existe una correlación entre los colegios con notas más altas, los cuales
entregan educación de mejor calidad. 7 Esta correlación, la cual podrı́a ser es-
puria, generará ruido en las regresiones, sı́ agregamos las NEM como variables
explicativas. Esta correlación positiva nos indica que al utilizar las NEM para
explicar la PSU, incluirı́amos una variable que contendrı́a información sobre la
calidad del colegio. Esto causarı́a problemas, ya que las NEM serı́an una variable
endógena a la calidad del colegio cuando lo que se desea es evaluar la calidad
en la educación. Para solucionar este problema, utilizaremos en las regresiones
5 M eanN EM
P
j = NEM promedio para colegio j, M eanN EMj = i N EMi / Nj para cole-
gio j, sumamos las notas de los alumnos y las dividimos por el total de alumnos del colegio
6 N EM ST = ((N EM -M eanN EM )/S.D.N EM ) las NEMST se calcula al restarle a las
i i j j
NEM de un alumno i las NEM promedio del colegio j y dividiendo por la desviación estándar
de NEM del colegio
7 Si las NEM reflejaran la calidad de los alumnos, “podemos pensar, entonces, que en cole-

gios de elite tener notas más altas es justo y más informativo ya que se reflejan las habilidades
superiores de sus alumnos comparados con el resto” en Chan, Hao & Suen. “A signaling
Theory of Grade inflation”

9
una variable de desempeño escolar basada en las notas de enseñanza media es-
tandarizadas (NEMST). En la tabla de correlaciones vemos que NEMST no esta
correlacionada con SIMCE o MeanNEM, pero si con las NEM y con la PSU.

4. Modelo
Deseamos replicar y evaluar el trabajo de Contreras(2001), en el cual se
evalúan las variables que explican el desempeño de los alumnos en la prueba
de selección PAA, considerando que es necesario controlar la endogeneidad ex-
istente en el colegio de origen de los estudiantes.
Contreras en su trabajo pretende explicar el rendimiento de los alumnos en
las pruebas de selección universitaria, en este caso usaremos la PSU, utilizando
como variables explicativas las caracterı́sticas académicas y variables de contexto
de los alumnos, educación de los padres y variables de origen del establecimiento.
Al evaluar los puntajes PSU obtenidos por los distintos tipos de colegios,
consideramos que existe un proceso de selección o elección en el tipo de colegio
en el cual se encuentran los alumnos. Este proceso tendrı́a relación con carac-
terı́sticas del alumno que no son directamente observables, ya que los estudiantes
son admitidos o matriculados en los colegios de una manera no aleatoria.
Realizar regresiones OLS sobre una muestra seleccionada de manera no
aleatoria generarı́a coeficientes que estarı́an sesgados. Para solucionar este prob-
lema utilizaremos dos metodologı́as; la primera es la utilización de Variables
Instrumentales (IV) en un proceso de dos etapas TSLS, al igual que Contr-
eras(2001). La segunda metodologı́a es la desarrollada por Heckman (1979), la
cual también es utilizada por Tokman (2002).
Es importante hacer hincapié, que no controlaremos por factores de eficiencia
en la oferta como lo hace Sapelli & Vial (2004) o por factores como el los sistemas
de selección de los colegios como lo poseen Contreras et al. (2007).
Utilizaremos dos variables exclusión para corregir la endogeneidad en la elec-
ción del tipo de colegio. Éstas deben tener la caracterı́stica de no influir en la
variable explicada, pero si ser relevantes en la modelación de la elección de cole-
gio. La primera variable a utilizar es el “Número de integrantes de la familia”,
lo cual serı́a similar a utilizar como variable de exclusión al “Numero de her-
manos”, la que fue usada por Heckman et al (2002), esto bajo la premisa que a
mayor “Numero de hermanos”, mayor es la probabilidad de que los padres ma-
triculen al hijo en un colegio municipal. Una segunda variable de exclusión es

10
“Porcentaje de alumnos en colegios Subvencionados” y “Porcentaje de alumnos
en colegios Municipales”, esto siguiendo el ejemplo de Sapelli & Vial (2002). Es-
ta variable hace referencia al porcentaje de alumnos de cierto tipo de colegio por
comuna, con lo cual existirı́an mayores posibilidades de incorporar a un alum-
no a un colegio subvencionado, si existe una mayor oferta de establecimientos
subvencionados en la comuna de residencia del alumno. 8
De esta manera tendrı́amos dos variables de exclusión, una de demanda (in-
tegrantes en la familia) y una de oferta ( proporción de colegios subvencionados),
las cuales serán evaluadas en la próxima sección del trabajo.

4.1. Regresiones con IV/TSLS


En esta sección se rehace la metodologı́a empleada por Contreras (2001) en
su paper. Este ejercicio se hará mediante los datos de la PSU 2006.
Contreras (2001) utiliza mı́nimos cuadrados en dos etapas (TSLS), realizan-
do en la primera un Multinominal Logit (Mlogit) para explicar la elección del
colegio del alumno. Una vez obtenidas las probabilidades de estar en uno u
otro colegio, las integra en las regresiones, las cuales se realizan sobre toda la
población e identifican el tipo de colegio de origen con variables binarias. Los
pasos del proceso de estimación del TSLS se enumeran a continuación:

• Estimación del Mlogit.


• Predicción de la probabilidad de estar en colegio Subvencionado, utilizando
los resultados del Mlogit.
• Se reemplaza la variable Dummy de colegio subvencionado por la proba-
bilidad antes predicha.
• Estimación en OLS de los puntajes de la PSU, utilizando la probabilidad
antes predicha.

En una primera etapa realizamos los Mlogit para las Dummy de tipo de
colegio utilizando las variables de elección. Luego obtenemos las probabilidades
de ser de un tipo de colegio u otro e integramos estas probabilidades a las
regresiones completando el TSLS. Las tablas con los resultados del Mlogit se
encuentran en el anexo.
8 Se define la variable como Por Suv = (Nro Alumnos Colegio Subv / Nro Total alumnos

en la Comuna), y de manera análoga para los colegios municipales

11
Cuadro 4: IV/ TSLS
1 2 3
Muestra Completa Muestra Sin P. Pagados
OLS TSLS TSLS
Coef./se Coef./se Coef./se
nemst 48.044 48.192 46.373
(.240) (.243) (.262)
Pr(d suv==1) 10.826 –22.383 –16.629
(.534) (1.289) (1.279)
Pr(d pp==1) 68.248 83.595
(1.011) (2.648)
edu padre sin –25.799 –29.302 –29.071
(3.197) (3.239) (3.282)
edu padre basica in –17.909 –20.844 –19.701
(1.034) (1.053) (1.062)
edu padre basica –14.640 –16.501 –15.439
(1.034) (1.050) (1.062)
edu padre media in –8.042 –8.683 –7.972
(.833) (.846) (.857)
edu padre tecnica in 17.556 19.107 22.231
(2.507) (2.538) (2.704)
edu padre tecnica 14.202 16.521 19.718
(1.149) (1.166) (1.259)
edu padre univ 16.280 14.575 22.632
(.866) (.885) (1.027)
edu padre univ in 20.558 19.977 26.806
(1.177) (1.193) (1.334)
edu padre otro 1.900 2.023 5.336
(1.696) (1.719) (1.947)
edu madre sin –33.329 –37.774 –37.108
(4.408) (4.465) (4.547)
edu madre basica in –28.378 –32.460 –31.164
(1.021) (1.048) (1.056)
edu madre basica –21.540 –23.972 –23.089
(1.002) (1.022) (1.032)
edu madre media in –13.129 –13.837 –13.628
(.778) (.793) (.802)
edu madre tecnica in 17.779 18.934 20.106
(2.486) (2.517) (2.711)
edu madre tecnica 16.023 17.109 21.805
(1.026) (1.043) (1.154)
edu madre univ 20.080 18.014 24.086
(.886) (.908) (1.067)
edu madre univ in 18.606 17.044 23.908
(1.360) (1.383) (1.632)
edu madre otro 5.300 4.318 8.297
(1.904) (1.932) (2.250)
Ingreso 1 18.081 20.794 19.834
(6.025) (6.102) (6.484)
Ingreso 2 42.425 48.212 47.562
(6.031) (6.107) (6.496)
Ingreso 3 58.134 53.519 66.480
(6.098) (6.216) (6.614)
Ingreso 4 66.668 52.114 75.621
(6.221) (6.425) (7.074)
Ingreso 5 71.315 52.330 73.884
(6.310) (6.560) (7.780)
Ingreso 6 89.425 67.146 76.611
(6.224) (6.516) (7.883)
genero –21.733 –21.141 –20.138
(.478) (.484) (.524)
Constant 458.512 471.281 467.575
(6.019) ( (6.128) (6.503)
Adj. R2 .470 .457 .359
No. of cases 105126 105126 90676

12
En el Cuadro 4 se entregan los resultados de los TSLS. En la primera columna
se entregan los resultados de un OLS. En la segunda columna se entregan los
resultados del TSLS. En las columna 3 se entregan resultados para los TSLS
para una muestra sin colegios particulares pagados.
En el OLS podemos ver que la Dummy de colegios subvencionado es positiva
y estadı́sticamente significativa. Obtenemos un valor parecido al de Contreras
(2001) Cuadro 9, pero significativo. Luego realizamos el TSLS corrigiendo la
endogeneidad de tipo de colegio y vemos que el valor de las Dummy de colegio
subvencionado disminuye llegando a ser -22 para la muestra completa y -16 al
eliminar a los colegios particulares pagados. Estos resultados son muy distin-
tos a los presentados por Contreras(2001), lo cual será evaluado en secciones
posteriores. Para evaluar una diferente metodologı́a, en la siguiente sección de-
sarrollamos regresiones a la Heckman.

4.2. Regresiones tipo Heckman


En esta sección evaluaremos lo puntajes PSU obtenidos por los colegios,
utilizando la metodologı́a desarrollada por Heckman.
La corrección del sesgo de selección de Heckman (1979), en su version orig-
inal, consiste en una primera etapa en desarrollar una regresión Probit, donde
se identifica si el individuo está o no fuera de la muestra de los individuos.
Luego se incluye el ratio del inverso de mills (obtenido de las Probits) en las
regresiones OLS. Es importante que en las regresiones Probit existan variables
que no estén incluidas en las regresiones OLS de la segunda etapa. Ellas deben
influir en la elección del Probit (estar o no en la muestra tratada) pero no influir
en la variable dependiente que se desea analizar.
Se definen ecuaciones que representan el comportamientos de los alumnos
de colegios Municipales (Mun), Subvencionados (Subv) y Particulares Pagados
(PP). Teniendo ası́ dos grupos de ecuaciones, primero una de selección bina-
ria (está el alumno o no en el tipo de colegio i) y un segundo set de ecua-
ciones lineales que explicarı́an los puntajes de la PSU. Un cambio respecto
a la metodologı́a de Heckman (1979) serı́a el uso de estimadores de Máxima
verosimilitud en la ecuación de selección, en reemplazo de los Probits, debido
a las mejores propiedades de estimación utilizando Máxima-Verosimilitud. Por
tanto,

Di = 1 si Di = αi ∗ Z > 0; D = 0 (1)

13
Con i =1,2,3 = Tipo de Colegio(PP, Subv, Mun).
Utilizando en los tres casos al número de integrantes en la familia y la pro-
porción de alumnos de colegios subvencionados y municipales por comuna como
variables de exclusión .

P SUi = βi + β1,i X + µi (2)

Con X =variables de contexto del alumno y el colegio.


Con Z=X+ Variables de Exclusión
Se realizan regresiones a las Ecuaciones (1) y (2), utilizando la metodologı́a
desarrollada por Heckman (1979). Los resultados se adjuntan en el cuadro(5).
En las columnas 1, 2 y 3 se entregan los resultados para la muestra completa
de alumnos. Analizando según procedencia, alumnos de colegios (1) particulares
pagados, (2) subvencionados y (3) municipales. En las columnas 4 y 5 se entregan
resultados para una muestra que excluye a los alumnos de colegios particulares
pagados, analizando solo alumnos de colegios subvencionados (4) y municipales
(5).
Obtenemos los coeficientes esperados para NEMST, donde a mayor rendimien-
to del alumno en su colegio, mejores son los resultados en la PSU. Vemos lo
mismo para todos los niveles de educación, donde la “educación media comple-
ta” de padre y madre es la variable Dummy omitida. Al aumentar los niveles
de educación de los padres, mejoran los resultados de los alumnos, resultados
similares para la Dummy de ingresos.
Al igual que Contreras (2001), vemos que una vez controlado por factores de
contexto y educación, las mujeres obtienen menores puntajes que los hombres,
lo que deberı́a ser abordados por otros estudios.

Cuadro 5: Regresiones Modelo 1 y 2: PSU 2006

1 2 3 4 5
Muestra Completa Muestra sin P.Pagados

PP Subv Mun Subv Mun


Coef./se Coef./se Coef./se Coef./se Coef./se
nemst 58.310 47.705 44.882 47.560 44.869
(.575) (.350) (.394) (.350) (.394)
edu padre sin 16.030 –31.195 –23.412 –31.497 –24.632
(20.643) (5.655) (4.073) (5.649) (4.083)
edu padre basica in 6.360 –19.896 –16.253 –20.055 –17.202
(9.945) (1.687) (1.390) (1.686) (1.393)
edu padre basica –18.030 –16.708 –11.845 –16.955 –12.522
(7.578) (1.587) (1.442) (1.586) (1.444)
edu padre media in –12.546 –9.214 –5.791 –9.646 –6.160

14
Cuadro 5
Continuación
Muestra Completa Muestra sin P.Pagados

PP Subv Mun Subv Mun


Coef./se Coef./se Coef./se Coef./se Coef./se
(5.515) (1.214) (1.211) (1.214) (1.212)
edu padre tecnica in –14.983 18.496 27.599 18.695 28.124
(6.463) (3.255) (4.699) (3.261) (4.702)
edu padre tecnica –10.621 15.839 26.583 16.178 27.566
(2.779) (1.473) (2.350) (1.476) (2.351)
edu padre univ –4.416 19.727 23.552 21.461 23.627
(1.660) (1.238) (1.795) (1.242) (1.794)
edu padre univ in –8.687 20.776 34.955 21.502 35.205
(2.431) (1.638) (2.247) (1.642) (2.248)
edu padre otro –15.145 4.044 5.188 5.074 5.647
(3.276) (2.348) (3.384) (2.356) (3.386)
edu madre sin 5.393 –28.066 –35.976 –28.287 –37.392
(22.760) (7.957) (5.639) (7.950) (5.653)
edu madre basica in –18.791 –29.614 –28.551 –30.019 –29.916
(10.560) (1.690) (1.381) (1.689) (1.382)
edu madre basica –14.844 –21.591 –21.667 –22.016 –22.605
(7.692) (1.540) (1.405) (1.539) (1.406)
edu madre media in –8.121 –12.103 –13.394 –12.733 –13.879
(4.955) (1.117) (1.154) (1.118) (1.154)
edu madre tecnica in 11.289 17.254 23.651 17.453 24.293
(5.979) (3.264) (4.695) (3.270) (4.698)
edu madre tecnica 3.329 18.235 27.761 19.361 28.870
(2.197) (1.353) (2.138) (1.358) (2.138)
edu madre univ 11.532 21.347 24.511 23.293 24.694
(1.636) (1.276) (1.897) (1.280) (1.896)
edu madre univ in 6.068 20.153 26.309 21.891 26.624
(2.388) (1.978) (2.798) (1.985) (2.799)
edu madre otro –2.340 5.728 10.475 7.211 10.860
(3.362) (2.688) (3.970) (2.698) (3.972)
Ingreso 1 63.897 23.326 16.995 21.978 17.556
(14.505) (8.931) (9.287) (8.936) (9.301)
Ingreso 2 70.026 46.787 46.898 47.115 49.084
(14.223) (8.938) (9.318) (8.943) (9.335)
Ingreso 3 74.211 58.093 69.078 66.929 71.751
(14.247) (9.030) (9.748) (9.044) (9.748)
Ingreso 4 81.358 56.865 90.684 75.310 93.250
(14.327) (9.395) (11.977) (9.421) (11.940)
Ingreso 5 85.827 54.874 68.687 77.787 70.435
(14.375) (9.997) (14.111) (10.041) (14.063)
Ingreso 6 101.693 54.391 67.671 80.030 67.921
(14.353) (10.170) (13.592) (10.212) (13.524)
genero –28.093 –19.398 –20.826 –19.326 –20.613
(1.132) (.695) (.788) (.696) (.789)
Constant 542.195 446.165 456.831 446.786 460.805
(14.334) (8.945) (9.315) (8.945) (9.319)
select
nemst –.038 .001 .011 –.007 .008
(.007) (.004) (.004) (.005) (.005)
edu padre sin –.060 –.243 .225 –.237 .240
(.164) (.060) (.061) (.062) (.062)
edu padre basica in –.269 –.196 .175 –.178 .179
(.064) (.019) (.019) (.019) (.019)
edu padre basica –.216 –.132 .126 –.126 .124
(.053) (.018) (.019) (.019) (.019)
edu padre media in –.306 –.090 .113 –.103 .100
(.040) (.015) (.015) (.015) (.015)
edu padre tecnica in .141 .143 –.180 .170 –.181
(.064) (.044) (.047) (.048) (.048)
edu padre tecnica .133 .173 –.232 .232 –.239
(.029) (.020) (.022) (.023) (.023)
edu padre univ .312 –.029 –.169 .105 –.110
(.020) (.015) (.017) (.018) (.018)

15
Cuadro 5
Continuación
Muestra Completa Muestra sin P.Pagados

PP Subv Mun Subv Mun


Coef./se Coef./se Coef./se Coef./se Coef./se
edu padre univ in .234 .024 –.112 .083 –.091
(.028) (.021) (.022) (.023) (.024)
edu padre otro .205 .063 –.165 .142 –.149
(.040) (.030) (.033) (.035) (.035)
edu madre sin .116 –.350 .310 –.329 .334
(.191) (.083) (.084) (.086) (.086)
edu madre basica in –.448 –.306 .311 –.305 .307
(.067) (.019) (.019) (.019) (.019)
edu madre basica –.393 –.178 .202 –.191 .192
(.053) (.018) (.018) (.018) (.018)
edu madre media in –.396 –.080 .127 –.110 .109
(.036) (.014) (.014) (.014) (.014)
edu madre tecnica in .074 .137 –.159 .166 –.170
(.063) (.043) (.047) (.048) (.048)
edu madre tecnica .180 .150 –.262 .253 –.261
(.025) (.018) (.020) (.021) (.021)
edu madre univ .293 –.018 –.192 .131 –.134
(.020) (.016) (.018) (.019) (.019)
edu madre univ in .292 .027 –.190 .149 –.155
(.031) (.024) (.027) (.029) (.029)
edu madre otro .250 .039 –.181 .134 –.144
(.043) (.034) (.038) (.040) (.040)
Ingreso 1 –.680 .310 –.153 .307 –.313
(.134) (.105) (.103) (.111) (.111)
Ingreso 2 .120 .637 –.653 .750 –.759
(.133) (.105) (.103) (.112) (.112)
Ingreso 3 .979 .282 –1.272 1.097 –1.106
(.134) (.106) (.105) (.114) (.114)
Ingreso 4 1.536 –.195 –1.763 1.312 –1.330
(.136) (.109) (.112) (.126) (.126)
Ingreso 5 1.777 –.431 –1.907 1.266 –1.267
(.139) (.112) (.119) (.141) (.141)
Ingreso 6 1.968 –.669 –2.007 1.095 –1.109
(.138) (.111) (.116) (.140) (.140)
n c grupo familiar –.071 –.001 .026 –.016 .017
(.004) (.002) (.002) (.002) (.002)
psuv –2.698 3.050 –1.360 2.115 –2.244
(.043) (.034) (.041) (.045) (.047)
pmun –2.346 .380 1.533 –.825 .689
(.042) (.034) (.040) (.045) (.047)
genero –.046 .073 –.074 .084 –.087
(.014) (.008) (.009) (.009) (.009)
Constant 1.027 –1.856 –.121 –.777 .908
(.136) (.108) (.108) (.118) (.119)
athrho
Constant –.236 .328 –.054 .351 –.143
(.026) (.013) (.015) (.013) (.015)
lnsigma
Constant 4.231 4.341 4.391 4.342 4.395
(.006) (.004) (.003) (.004) (.004)
No. of cases 106351 106351 106351 91598 91598

4.3. Tratamiento promedio (ATE) y de los Tratados (TT)


Para evaluar los puntajes de unos u otros colegios en la PSU evaluamos tanto
el efecto promedio de ser tratado (ATE) como el efecto del tratamiento en los
tratados (TT), considerando la educación subvencionada como el tratamiento.

16
Al comparar los colegios vemos que las familias que inscriben a sus hijos
en establecimientos particulares pagados tienen diferencias fundamentales con
las familias que inscriben a sus hijos en los otros dos tipos de colegios, munici-
pales y subvencionados. Entonces, para evaluar de forma más limpia el sistema
de “vouchers” en el sistema educacional chileno, se excluyen los colegios par-
ticulares pagados del análisis. De esta manera obtendrı́amos valores que son
comparables a los obtenidos bajo estimaciones tipo IV/LATE.
Para evaluar el efecto de tratamiento promedio (ATE) estimaremos la difer-
encia entre los coeficientes, por el promedio de las variables explicativas:

AT Ei = E(4)=X(βi - βj )
P
ATE = 1/n i X(βi - βj )

La obtención de la estimación del (TT) la hacemos evaluando la ganancia


promedio esperada para los establecimientos que fueron efectivamente elegidos
en el programa.

T Ti = E(4 | D(Z) = 1)=Xt (βi - βj )


P
TT = 1/nt i Di T T (xi , zi , D(Z) = 1)

Conj 6= i
Realizamos regresiones a las ecuaciones (1) y (2) para colegios subvenciona-
dos y municipales. Ası́, obtenemos las desviaciones estándares del ATE y TT
por medio de bootstrapping no paramétrico utilizando 1000 muestras.
Vemos en el Cuadro 6 que el ATE y TT son -14.78 y -16.09 respectivamente,
siendo los resultados estadı́sticamente significativos al 1 %.
Se advierte que los puntajes PSU parte de los colegios municipales es superior
a la de los colegios subvencionados, lo cual implicarı́a que los colegios municipales
serı́an más eficaces en la producción de puntajes PSU.

Cuadro 6: Tratamiento promedio (ATE) y de los Tratados (TT)


ATE (Subv-Mun) TT(Suv-Mun)
-14.775 -16.087
(1.239)* (1.313)*

* SD. Calculada usando Bootstrap noparametrico N=1000

4.4. Test de Hausman


Para comprobar la utilidad de las variables de exclusión, se utilizó un test
de Hausman, el cual compara las propiedades asintóticas de los estimadores.
Suponemos que uno de los estimadores tienen varianza mı́nima, lo cual eval-
uamos con respecto a un segundo estimador. Este proceso lo realizamos para
evaluar el uso de las variables de exclusión en las regresiones a la Heckman.

17
Evaluamos el cambio definiendo la matriz Z como:
• Z=X+ Variables de exclusión verdaderas + variables de exclusión evalu-
adas.

• Z=X+ Variables de exclusión verdaderas


Para realizar el test de Hausman, se realizan regresiones que corrigen sesgo
de selección, donde hay que asumir al menos una variable de exclusión como
verdadera. 9 En el cuadro (5) mostramos las variables de exclusión que fueron
consideradas como verdaderas y cuáles fueron evaluadas.
En el primer caso se asumió que la variable de exclusión verdadera es el
Numero de integrantes de la familia y se evaluó el porcentaje de alumnos en
colegios municipales en la comuna (Pmun) y el porcentaje de alumnos en colegios
subvencionados en la comuna (Psuv). Luego de realizar ambas regresiones a la
Heckman realizamos el test de Hausman.
Al revisar el cuadro (5) podemos ver en la fila (1) que se rechaza la hipótesis
nula: la diferencia en los coeficientes no es sistemática. Aceptamos la variable
proporción de alumnos de colegios subvencionado en la comuna (Psuv) y propor-
ción de alumnos de colegios municipales en la comuna (Pmun) como variables
de exclusión válidas, ya que minimizan la varianza de los estimadores.

Cuadro 7: Test de Hausman


N Variables evaluadas Variables verdaderas Chi2 Prob > chi2
1 Pmun Psuv N.familia 986.9 0.0
2 Pmun N.familia Psuv 1538.0 0.0
3 Psuv N.familia Pmun -3.2 **
4 N.familia Pmun Psuv 2.2 1

Al evaluar las variables de exclusión una a una, podemos ver en la fila (2)
que Pmun es una variable de exclusión válida. En la fila (3) vemos que podemos
prescindir de Psuv como variable de exclusión, una vez incluida Pmun. 10 En la
fila (4) vemos que N.familia no es una variable de exclusión valida.
Debemos recordar que el test de Hausman no es concluyente, ya que debe
asumir que las otras variables de exclusión son verdaderas y se basa en criterios
asintóticos que pueden no ser adecuados en este caso particular, pero nos entrega
una idea de la utilidad de las variables de exclusión. Continuaremos el trabajo
considerando todas las variables de exclusión como válidas.
9 Esto para que puedan hacer las regresiones corrigiendo sesgo de selección. Esta información

fue confirmada al autor por Justin L. Tobias, co-autor de J. Heckman y E. Vytlacil


10 Debido a que la varianza de las variables aumenta en vez de disminuir. Esto tendrı́a cierta

lógica, ya que Pmun es el complemento de Psuv. Incluir Psuv implicarı́a incluir la misma
información dos veces, ya que P mun = 1 − P suv.

18
5. Discusión de los resultados
Una vez obtenidos los resultados del LATE, ATE y TT, cabe preguntarse él
por qué de las diferencias con los resultados de la literatura nacional. Obtuvimos
LATE, ATE y TT en torno a -16, lo que es muy distinto a lo obtenido por otros
autores en la literatura nacional, donde los LATE, ATE y TT tienden a ser
positivos. En una primera etapa se explicaran las diferencias de este trabajo
con la literatura nacional y en una segunda las diferencias con el trabajo de
Contreras (2001).

5.1. Merma en datos PSU y SIMCE


En la literatura nacional Mizala & Romaguera (2000a) & (2000b) , Tokman
(2002), Sapelli & Vial (2002) & (2004) y Contreras et al.(2007) utilizan la prueba
SIMCE para evaluar la eficacia en la entrega de la educación.
El SIMCE es una prueba obligatoria, que se realiza en 4to básico, 8vo básico
o 2do medio, y es una prueba que no tiene incidencia para los alumnos. La
PSU, al igual que la PAA, es una prueba voluntaria que se rinde al finalizar
la educación escolar media y que tiene, a diferencia del SIMCE, repercusiones
en el futuro educacional del estudiante. Esto nos puede hacer pensar que la
PSU reflejarı́a de mejor manera lo aprendido por los estudiantes, ya que tienen
incentivos a demostrar sus habilidades y conocimientos.
Es sabido que un número importante de los alumnos que rindió el SIMCE
no rindió la PSU. Un análisis de los datos nos permite ver que los estudiantes
que no rinden la PSU, no fueron seleccionados de manera aleatoria, a través de
los colegios, sino que fueron seleccionados en mayor proporción de los colegios
municipales (Cuadro (2)). En esta sección mostraremos algunas caracterı́sticas
de esta selección y comentaremos las consecuencias de esto.
Analizamos los datos de los colegios, cuyos alumnos rinden la PSU y SIMCE,
diferenciándolos por tipo de dependencia.11 En particular evaluamos la propor-
ción de alumnos que fueron examinados por el SIMCE y la PSU. En las figuras
1 y 2 graficamos la proporción de alumnos de cada colegio que rindió la PSU y
los promedios de PSU y SIMCE por colegio.12
11 para simplificar el análisis, eliminamos a los colegios particulares pagados de la muestra
12 Prop = N o.AlumnosP SUj /N o.AlumnosSIM CEj = La proporción de alumnos del cole-
gio j que rindieron la PSU.

19
SIMCE y proporción de alumnos que rinden la PSU PSU y proporción de alumnos que rinden la PSU

700
350

600
300

500
SIMCE

PSU
250

400
200

300
150

0 .2 .4 .6 .8 1 0 .2 .4 .6 .8 1
Proporción alumnos que rinden la PSU por colegio Proporción alumnos que rinden la PSU por colegio

subvencionados municipales subvencionados municipales

Figura 1: Figura 2:

fuente: Elaboración propia, datos PSU 2006 y SIMCE 2003.

En la Figura (1) evidenciamos que existe una correlación, entre los puntajes
promedios del SIMCE por colegio y la proporción de los alumnos de los colegios
que rinden la PSU. Se observa una relación entre la calidad de los colegios, me-
dida en SIMCE, y la proporción de alumnos que da la PSU. Siendo que a mayor
calidad de un colegio, mayor es la cantidad de alumnos que rinden la prueba de
selección universitaria. Esto evidencia que existe un proceso de autoselección de
los estudiantes que rinden la PSU donde los alumnos provenientes de colegios
de menor calidad, tienden en menor proporción a rendir la prueba.
La relación entre la PSU promedio por colegio y la proporción de alumnos
chilenos de establecimientos que rindió la PSU, la podemos presenciar en la
Figura (2), siendo esta correlación similar a la evidenciada en el SIMCE. De
este modo, los alumnos de colegios que tienen menores puntaje de PSU, tendrán
menos estudiantes rindiendo la prueba.
Este problema se acentúa, al evaluar las proporciones de alumnos que no dan
la PSU según tipo de colegios. En las Figuras (3) y (4) realizamos histogramas
de la proporción de estudiantes que rinden la PSU, según tipo de colegio. Se
evidencia que es importante la proporción de estudiantes de colegios municipales
que no es examinado por la PSU.

20
Histograma proporción alumnos que rinde la PSU Histograma proporción alumnos que rinde la PSU
Proporción de alumnos que rinden la PSU de colegios Subvencionados Proporción de alumnos que rinden la PSU de colegios Municipales
2

2
1.5

1.5
Densidad

Densidad
1

1
.5

.5
0

0
0 .2 .4 .6 .8 1 0 .2 .4 .6 .8 1
Proporción alumnos que rinde la PSU por colegio Proporción alumnos que rinde la PSU por colegio

Figura 3: Figura 4:

fuente: Elaboración propia, datos PSU 2006 y SIMCE 2003.

Ahora cabe hacerse la pregunta, ¿Cómo se seleccionan dentro de los colegios


los alumnos que no rinden la PSU?.
Si los estudiantes fueron elegidos de manera aleatoria dentro de los colegios,
incluirlos en la estimación de una función de producción de educación puede tra-
ducirse en resultados sesgados. Ello, ya que se considerarı́a en menor proporción
a los colegios donde pocos alumnos rindieron la PSU. La solución a este tipo de
problemas se analiza en la literatura, donde se presentan soluciones estadı́sticas
para este problema.13
Suponer una selección aleatoria podrı́a no ser acertado, ya que existirı́a una
lógica en dar o no dar la prueba, que se presentarı́a también en los colegios. Al
observar en los colegios con bajo SIMCE una menor proporción de estudiantes
rindiendo la PSU, podemos pensar que se da la misma lógica para los alumnos
en estos establecimientos. Es decir, los alumnos que rinden la PSU son los que
tienen los mayores puntajes esperados, y los que no la rinden serı́an los que
tendrı́an menores puntajes esperados. Esto podrı́a ocurrir por factores como lo
son los costos de preparar y rendir la prueba, para un alumno que tiene una
PSU esperada muy baja.
Bajo este esquema, si los alumnos que no rindieron la PSU eran los peores
alumnos de sus colegios, los cuales tendrı́an una PSU esperada baja, podemos
pensar que la PSU promedio por colegio está sobre estimada para los establec-
imientos con baja tasa de alumnos en la PSU, siendo estos los colegios munici-
pales. Para solucionar este problema de autoselección necesitamos información
13 Para obtener estimadores insesgados, una solución para este problema serı́a realizar un

OLS generalizado dando más peso a los alumnos cuyos colegios están sub-representados. Una
segunda forma de resolver el problema, es generar alumnos representativos por colegio, y
repetirlos la cantidad de veces que sea necesario para poder obtener la representatividad real
de los alumnos que estudiaron en estos establecimientos. (Esta solución tienen la ventaja de
que dejarı́a los datos aptos para ser evaluados con metodologı́as que corrijan la endogeneidad
en la elección de colegio, tipo Heckits, IV, Matching etc.)

21
sobre todos los estudiantes, incluidos los que no rindieron la PSU, información
con la que no contamos en este trabajo.
Al no poder corregir la autoselección de los alumnos en la PSU, en este
trabajo no se pueden generar conclusiones insesgadas para toda la población
estudiantil o sistema educacional chileno, por lo cual su injerencia se atañe sólo
a los alumnos examinados, es decir, sólo los alumnos que son examinados por
la PSU. Dado lo anterior, los resultados de este trabajo estarı́an sesgados por el
sesgo de selección presente en la PSU. Esta limitación también la tiene el trabajo
de Contreras(2001), el cual ocupa la Prueba de Aptitud Académica (PAA).
Cualquier estudio que no controle el sesgo de selección en la PSU presentara
resultados sesgados. En consecuencia el trabajo desarrollado en esta tesis, al
igual que el de Contreras(2001) no cumple el objetivo de evaluar el sistema de
vouchers en Chile, y los resultados de las estimaciones no pueden ser utilizados
para fundamentar polı́ticas públicas.

5.2. Diferencias con el trabajo de Contreras


En la sección anterior se mostró que una sobre estimación del puntaje PSU
de los colegios municipales explicarı́a un TT y ATE menores a los obtenidos en
la literatura nacional, los cuales en sus estudios utilizan el SIMCE como medida
de rendimiento escolar. Ahora bien, la diferencia entre PSU y SIMCE, y el sesgo
de la PSU, no explica las diferencias de este trabajo con el de Contreras(2001),
el cual usa la PAA para evaluar a los colegios.
Contreras(2001) encuentra mayores puntajes PAA por parte de los establec-
imientos subvencionados, resultado opuesto al encontrado en esta tesis, donde
los colegios municipales serı́an más eficaces. Las principales diferencias de este
trabajo con el de Dante Contreras son: el tipo de prueba, el momento del tiempo,
caracterı́sticas de los alumnos analizados, las variables y método de estimación.
Como se mencionó anteriormente, el trabajo de Contreras se realiza utilizan-
do la PAA, prueba centrada en medir las aptitudes y habilidades desarrolladas
por los alumnos considerando los conocimientos trabajados hasta 8vo año básico.
La PSU, en cambio, busca medir conocimientos mı́nimos desarrollados hasta 4to
año de enseñanza media. Ante lo cual los distintos enfoques de medición de ca-
da una de las pruebas pueden haber afectado el rendimiento de los alumnos de
distintos establecimientos.
En su paper, Contreras considera a los alumnos rezagados como los que
egresarón con más de un año de diferencia de enseñanza media al momento de
rendir la PAA. En la figura 5 podemos ver los puntajes de los individuos que
rindieron la PSU 2006, siendo los alumnos rezagados quienes obtienen en prome-
dio de puntajes más altos, lo que es acorde con los resultados de las regresiones
de Contreras. Este autor utiliza la variable “madurez”, la cual busca contro-
lar hace cuántos años se graduaron los alumnos del colegio y agrega la edad
de los alumnos y su edad al cuadrado. Con estas variables se podrı́a controlar
este factor, pero no hacen interactuar estas variable con las Dummy de colegios

22
subvencionados o particulares pagados.14 La diferencia de resultados podrı́a ser
argumentada en base a un cambio estructural en la educación chilena. Este ar-
gumento pierde fuerza debido a que no se apreciarı́an cambios importantes en
la estructura de la educación recibida por parte de los alumnos.15
Como se menciono anteriormente, obtuvimos LATE, ATE y TT en torno a
-16 . Este resultado está en lı́nea con lo expuesto por Heckman et al (2000),
un LATE levemente distinto a un ATE cuando las variables de exclusión son
las mismas. Ahora bien, las diferencias expuestas por Heckman et al(2000) en
ningún caso son comparables a las diferencias vistas en los resultados de este
trabajo con el de Contreras(2001), y menos explicarı́an un cambio de signo y
las diferencias de magnitud entre los resultados.
Heckman et al. (2000) comentan que las diferencias en los resultados de las
distintas metodologı́as de estimación aumentarán en la medida que la selección
de los modelos, sea más importante. Será la selectividad y la forma de corregirla
por medio de las variables de exclusión una fuente de diferencias, entre este
estudio y el de Contreras(2001).
Las variables de exclusión utilizadas por Contreras(2001) son variables Dum-
my (si hay o no un colegio subvencionado o particular pagado en la comuna).
Cabe señalar que estas variables de exclusión son en extremo simples y entregan
información limitada al sistema de elección de colegios.
Como las diferencias de estimación no parecen ser desde el punto de vista
teórico, éstas podrı́an provenir de (1) la diferencia en las pruebas, (2) un cambio
estructural en la educación, (3) la muestra de los alumnos analizados o (4) las
variables de exclusión usadas.
Con el objetivo de comparar las variables de exclusión tanto de Contreras
(2001) como de este trabajo a continuación desarrollamos un TSLS, utilizando
las variables de exclusion utilizadas por Contreras (2001).

5.3. Análisis a las variables de exclusión


En esta sección se evalúan las variables de exclusión usadas por Contreras
(2001) en su paper. Las variables de exclusión usadas por este autor son variables
binarias que indicaban si habı́an o no colegios p. subvencionados, o particulares
pagados en la comuna.
Variables de Exclusión: Podemos separar las variables de exclusión según
como las han propuesto los autores en la literatura nacional. Primero la utilizada
en esta tesis y luego la utilizada por Contreras(2001).

Sapelli & Vial ⇒ Proporción de colegios subvencionados en la comuna,


14 Los alumnos rezagados son alumnos que deciden volver a intentar ingresar a la educación

superior, estos son alumnos que (1) se auto seleccionaron y esperan obtener un buen resultado
en la prueba (2) pudieron haberse preparado en un instituto o preuniversitario. Ambos puntos
harı́an que la inclusión de estos individuos en el análisis generarán resultados sesgados, tanto
por un efecto de sesgo de selección, como porque no se estarı́an evaluando la calidad de los
colegios, ya que existirı́a un input incontrolable en la educación de los estudiantes.
15 De existir un cambio, este deberı́a haber sido nota por estudios anteriores, basados en la

prueba SIMCE.

23
Proporción de colegios particulares pagados en la comuna

Contreras ⇒ Dummy si hay colegios subvencionados en la comuna,


Dummy si hay colegios particulares pagados en la comuna

En una primera etapa estimamos modelos Mlogit para las Dummy de tipo de
colegio, utilizando las variables de elección de Contreras (2001). Luego, obten-
emos las probabilidades de ser de un tipo de colegio u otro y las integramos a
las regresiones, de modo de completar el TSLS. Finalmente, comparamos estos
resultados con los obtenidos en la sección 4.1.
De los resultados de los Mlogit, se desprende que, en ambos, las variables
de exclusión son significativas y con los signos esperados. Al evaluar los Log
likelihood se encuentra que el MLogit utilizando las variables de exclusión prop-
uestas por Contreras (MLogit Contreras) tiene una Log likelihood -56496.696 y
el Mlogit usando variables de exclusión propuestas por Sapelli & Vial (Mlogit
S&V) tiene una Log likelihood -50265.592, al ser el segundo más cercano a cero,
deberı́amos preferir esta especificación.16
En la Figura 6 se grafican las probabilidades, obtenidas de los Mlogit, de
estar en colegio subvencionado. En color rojo se encuentra la probabilidad de
estar en colegio subvencionado proveniente del MLogit Contreras y en azul del
Mlogit S&V. Estas probabilidades fueron calculadas en una muestra sin alum-
nos de colegio particular pagado (Cuadro 8, regresiones columnas 4 y 5). Vemos
que la distribución de las probabilidades con las variables de exclusión propues-
tas por Contreras están agrupadas en torno a 0.6, no ası́ la distribución de las
variables de exclusión propuestas por Sapelli & Vial, la cual es más uniforme.
Al evaluar las diferencias entre ambas distribuciones se puede presenciar que
Contreras encuentra que hay alumnos que con probabilidad 0 irán a un colegio
subvencionado, lo que es correcto; pero no tiene alumnos con probabilidad entre
0 y 0.22, o con probabilidad mayor a 0.9. Esta no continuidad en la distribución
de probabilidades es difı́cil de justificar, lo que nos hace pensar que es un prob-
lema de especificación. La correlación de ambas probabilidades es de 0.682. Las
diferencias entre ambas probabilidades es importante.
Para evaluar el efecto de estas probabilidades realizamos a continuación las
regresiones. Los resultados de las regresiones son entregados en el Cuadro (8),
donde se incluyen los resultados de la sección 4.1.
16 Se intentó además realizar regresiones tipo Heckman con las variables de exclusión prop-

uestas por Contreras, pero las ecuaciones de selección no convergı́an debido a la no concavidad
de la función de Máxima-Verosimilitud

24
Histograma puntajes PSU segun año de egreso Probabilidad de los alumnos de ir a colegio subvencionado
(En azul egresados 2005, en rojo alumnos rezagados) (Rojo: Exclusión a lo Contreras, Azul: Exclusión a lo Sapelli)
.005

4
.004

3
.003

Density
Density

2
.002

1
.001

0
0

0 .2 .4 .6 .8 1
0 200 400 600 800 Pr(d_suv==1)

Density Density Density Density

Figura 5: Figura 6:

fuente: Elaboración propia, datos PSU 2006.

En la primera columna del Cuadro (8) se entregan los resultados del OLS. En
la segunda columna se entrega un TSLS con variables de exclusión del Mlogit
Contreras, mientras que en la columna tres se muestran los resultados de un
TSLS con variables de exclusión del Mlogit S & V. En las columnas 4 y 5 se
entregan resultados para los TSLS para una muestra sin colegios particulares
pagados.
Al realizar el TSLS con las variables de exclusión del Mlogit Contreras, vemos
que la variable Dummy de colegios subvencionados es positiva y significativa,
condiciones que comparten con la variable dicotómica asociada a los colegios
particulares pagados. Para los TSLS Mlogit S & V obtenemos una dummy de
colegios subvencionados negativa y significativa. El uso de distintas variables de
exclusión generó en un caso un LATE positivo y en el otro caso un LATE negati-
vo. La diferencia en resultados obtenidos por la utilización de distintas
variables de exclusión es dramática, y lleva a conclusiones diametralmente
distintas.
Al revisar los resultados de las columnas (4) y (5), donde se eliminan los
colegios particulares pagados, vemos que los resultados se mantienen.
En el Cuadro (9) se resumen los resultados de este trabajo y el de Contreras
(2001), En la primera parte se entregan los resultados de Contreras(2001) para
la muestra de hombres en la prueba de matemáticas. Además se entregan los
resultados de este trabajo, primero para la muestra completa de los alumnos,
luego se entregan los resultados excluyendo del análisis a los alumnos de colegios
particulares pagados.

25
Cuadro 8: TSLS y variables de exclusión

1 2 3 4 5
Muestra Completa Muestra Sin P. Pagados
OLS TSLS-Contreras TSLS-Sapelli TSLS-Contreras TSLS-Sapelli
Coef./se Coef./se Coef./se Coef./se Coef./se
nemst 48.044 48.120 48.192 46.478 46.373
(.240) (.245) (.243) (.262) (.262)
Pr(d suv==1) 10.826 40.323 –22.383 49.310 –16.629
(.534) (2.322) (1.289) (2.285) (1.279)
Pr(d pp==1) 68.248 97.007 83.595
(1.011) (3.789) (2.648)
edu padre sin –25.799 –22.390 –29.302 –21.424 –29.071
(3.197) (3.262) (3.239) (3.284) (3.282)
edu padre basica in –17.909 –14.917 –20.844 –13.278 –19.701
(1.034) (1.073) (1.053) (1.077) (1.062)
edu padre basica –14.640 –12.442 –16.501 –10.825 –15.439
(1.034) (1.062) (1.050) (1.069) (1.062)
edu padre media in –8.042 –6.631 –8.683 –5.257 –7.972
(.833) (.853) (.846) (.859) (.857)
edu padre tecnica in 17.556 16.039 19.107 18.741 22.231
(2.507) (2.553) (2.538) (2.701) (2.704)
edu padre tecnica 14.202 12.287 16.521 14.874 19.718
(1.149) (1.179) (1.166) (1.264) (1.259)
edu padre univ 16.280 15.495 14.575 21.708 22.632
(.866) (.904) (.885) (1.026) (1.027)
edu padre univ in 20.558 19.882 19.977 25.722 26.806
(1.177) (1.202) (1.193) (1.332) (1.334)
edu padre otro 1.900 .581 2.023 2.333 5.336
(1.696) (1.729) (1.719) (1.946) (1.947)
edu madre sin –33.329 –29.289 –37.774 –27.958 –37.108
(4.408) (4.495) (4.465) (4.547) (4.547)
edu madre basica in –28.378 –24.018 –32.460 –21.849 –31.164
(1.021) (1.082) (1.048) (1.088) (1.056)
edu madre basica –21.540 –18.494 –23.972 –16.743 –23.089
(1.002) (1.039) (1.022) (1.046) (1.032)
edu madre media in –13.129 –11.269 –13.837 –10.070 –13.628
(.778) (.802) (.793) (.807) (.802)
edu madre tecnica in 17.779 16.789 18.934 17.578 20.106
(2.486) (2.530) (2.517) (2.707) (2.711)
edu madre tecnica 16.023 14.039 17.109 16.853 21.805
(1.026) (1.052) (1.043) (1.161) (1.154)
edu madre univ 20.080 19.289 18.014 23.233 24.086
(.886) (.932) (.908) (1.066) (1.067)
edu madre univ in 18.606 17.540 17.044 22.175 23.908
(1.360) (1.400) (1.383) (1.630) (1.632)
edu madre otro 5.300 3.986 4.318 5.719 8.297
(1.904) (1.946) (1.932) (2.247) (2.250)
Ingreso 1 18.081 19.369 20.794 19.954 19.834
(6.025) (6.137) (6.102) (6.474) (6.484)
Ingreso 2 42.425 38.087 48.212 36.372 47.562
(6.031) (6.146) (6.107) (6.494) (6.496)
Ingreso 3 58.134 49.496 53.519 48.443 66.480
(6.098) (6.299) (6.216) (6.624) (6.614)
Ingreso 4 66.668 56.322 52.114 53.840 75.621
(6.221) (6.647) (6.425) (7.090) (7.074)
Ingreso 5 71.315 60.707 52.330 53.295 73.884
(6.310) (6.862) (6.560) (7.790) (7.780)
Ingreso 6 89.425 78.561 67.146 58.708 76.611
(6.224) (6.894) (6.516) (7.887) (7.883)
genero –21.733 –22.247 –21.141 –21.521 –20.138
(.478) (.488) (.484) (.524) (.524)
Constant 458.512 442.613 471.281 435.598 467.575
(6.019) (6.215) (6.128) (6.557) (6.503)
Adj. R2 .470 .451 .457 .361 .359
No. of cases 105126 105126 105126 90676 90676

26
Cuadro 9: Comparación Resultados

Metodologia ATE TT LATE Subv LATE PP

Contreras (2001) * [
OLS PAA 1998 13.7 48.7
TSLS PAA 1998 89 130.3
Regresiones Actuales
Muestra Completa
OLS PSU 2006 10.8 68.2
TSLS Mlogit Contreras PSU 2006 40.3 97
TSLS Mlogit S & V PSU 2006 -22.4 83.5
Muestra Sin P.Pagados
Heckman PSU 2006 -14.8 -16.1
TSLS Mlogit Contreras PSU 2006 49.3
TSLS Mlogit S & V PSU 2006 -16.6
*Prueba Matemáticas
[ Hombres

Dejaremos momentáneamente de lado el sesgo en la PSU, causado por el


proceso de autoselección, para poder leer de manera simple los resultados del
Cuadro(9).
En el Cuadro (9) están expuestos los resultados del trabajo de Contreras(2001),
el cual obtiene un LATE de 89 para colegios subvencionados, que postula una
mayor eficacia por parte de los colegios subvencionados. Contreras, basado en
estos resultados, postula que el sistema de vouchers ayuda a la movilidad social
y deberı́a ser promovido.
En la segunda parte del Cuadro (9) vemos los resultados de este trabajo con
una muestra completa de colegios: Para el TSLS Mlogit Contreras obtenemos
LATE de 40.3 para colegios subvencionados. Este resultados nos dicen que los
colegios subvencionados son más eficaces que los municipales en la entrega de
puntaje de la PSU.17
En la tercera parte del Cuadro (9) vemos los resultados de la metodologı́a
Heckman y de los TSLS Mlogit S & V. En ellos podemos ver un LATE, ATE y
TT de -16.6, 14.8 y 16.1 respectivamente. Lo último indicarı́a que los colegios
subvencionados son menos eficaces que los municipales, llevando a conclusiones
de polı́ticas públicas opuestas a las de Contreras(2001).18
Las diferencias entre el LATE para colegios subvencionados (LATE Subv)
de los TSLS Mlogit Contreras y el TSLS Mlogit S & V, en ambas muestras, son
extremas, y nos hacen pensar que uno de los Mlogits puede no ser el correcto,
ya que las únicas diferencias de los TSLS son las variables de exclusión en los
Mlogit.
17 Esto, dejando de lado que la PSU está sesgada por un proceso de autoselección.
18 Nuevamente, asumiendo que la PSU está exenta de sesgo por un proceso de autoselección.

27
El Mlogit Contreras usa una variable binaria si hay o no colegios subven-
cionados en la comuna y el TSLS Mlogit S & V usa una variable correspondiente
a la proporción de alumnos que van a colegios subvencionados en la comuna. En
un caso tenemos variables de exclusión que contienen menor información que en
el otro, generando fuertes alteraciones en los resultados.
Por todo lo expuesto, podemos concluir que la definición de las variables de
exclusión, y no el método de estimación, es la mayor la causante de las discrep-
ancias de este trabajo y el de Contreras (2001). Dejamos de lado, entonces, la
diferencia en las pruebas, un cambio estructural en la educación o problemas en
la muestra de los alumnos analizados, como fuentes primordiales de diferencias
de este trabajo con el de Contreras (2001).
Con respecto a estas diferencias, los Mlogit asignan probabilidades distintas
a los individuos en diferentes localidades. Esto generará LATEs distintos en
ambas estimaciones, entonces, cada LATE se referirá a alumnos con distintas
caracterı́sticas: evaluando localidades que pueden no ser las más adecuadas para
estudiar la eficacia del sistema de vouchers en Chile. En un caso podemos estar
evaluando alumnos que presentarı́an mejoras importantes por cambiarse de un
colegio municipal a uno subvencionado, y en el otro estamos evaluando alumnos
que tienen mejor desempeño en colegios municipalizados.
Encontrar distintas eficacias en la entrega de educación en localidades distin-
tas es algo presente en la literatura nacional. Al analizar el efecto del sistema de
vouchers, Tokman (2002) encuentra que los colegios municipales son eficientes
entregando educación a alumnos de estratos socioeconómicos más bajos.
Una desventaja de las regresiones realizadas por Contreras(2001), es que no
obtiene ecuaciones de producción distintas para cada tipo de establecimiento, lo
que le impide tener diferencias en pendiente y/o evaluar si un tipo de establec-
imiento es más eficaz al educar a un tipo de estudiante u a otro. 19 De este
modo, el autor sólo obtiene una diferencia promedio de productividades entre
ambos establecimientos (LATE) con la cual no puede estimar las diferencias en
la educación para subgrupos.
La distribución de las probabilidades obtenidas por el Mlogit-Contreras, el
cual usa variables de exclusión binarias, parece no ser la correcta. Esto, porque
la distribución no es contı́nua, lo que es muy difı́cil de argumentar. Se estarı́a
analizando ası́ una localidad que no es relevante o de interés para un estudio
que desea evaluar el universo completo de colegios subvencionados y munici-
pales. La elección de las variables de exclusión en el trabajo de Contreras (2001)
redundarı́a en la evaluación una localidad que no cumplirı́a los objetivos de su
estudio.
Además, nuestros resultados sugieren que la elección de las variables de ex-
clusión por parte de Contreras(2001) lleva a su estudio a concluir que los colegios
subvencionados son muy exitosos en la obtención de resultados en la PAA, más
que compensando el sesgo presente las pruebas de selección universitaria.
19 Mediante TSLS es posible evaluar cambios en las pendientes de producción mediante la
interacción de las variables (variables multiplicativas). Es entonces un problema de especifi-
cación y no de metodologı́a.

28
Del análisis descrito, podemos decir entonces que el sesgo de selección en la
PAA (PSU) y una deficiente elección de variables de exclusión lleva a Contreras
(2001) a entregar propuestas de polı́ticas públicas en el sentido correcto, pero
en base a evidencia equivocada.

29
6. Conclusiones
En este trabajo se analizó la investigación de Contreras (2001), la cual evalúa
la eficacia en la entrega de educación por parte de los colegios, utilizando la
PAA. Se compararon sus resultados con los obtenidos en la literatura nacional,
encontrándose que eran atı́picos. Éstos postulaban una mayor eficacia para los
colegios municipales, al contrario de lo que indica la evidencia disponible.
Este estudio replica y actualiza la metodologı́a de estimación utilizada por
dicho autor (usando la PSU), además de evaluar distintas variables de exclusión.
Adicionalmente, se compara lo anterior con las metodologı́a desarrollada en el
trabajo de Tokman (2002).
En una primera etapa se contraponen distintos métodos de estimación para
comparar el desempeño de colegios municipales y particulares subvencionados
de acuerdo a la PSU. En particular, se realizan dos tipos de regresiones; de
Mı́nimos Cuadrados en dos Etapas , y regresiones usando la metodologı́a de
Heckman (1979). Con ambos métodos se corrige la endogeneidad en la elección
de colegios.
Los resultados indican que las variables de exclusión, y no la metodologı́a de
estimación, son la fuente principal de diferencias en los resultados de este traba-
jo con el de Contreras (2001). Las distintas elecciones de variables de exclusión
pueden llevar a que estudios similares obtengan resultados diametralmente difer-
entes, lo podrı́a redundar en propuestas de polı́ticas públicas erróneas.
Por último, una debilidad que comparte este trabajo con el de Contreras
(2001) consiste en que no se pueden utilizar las pruebas de selección universitaria
para evaluar el desempeño de los establecimientos de todo el sistema, debido al
proceso de autoselección por parte de los alumnos que rinden la PSU (PAA).
Este sesgo generarı́a entonces resultados a favor de los colegios municipales. Ası́,
esta Tesis, al igual que el trabajo de Contreras (2001) analiza una muestra que
no representa al sistema de vouchers chileno completo.

30
Referencias
[1] Benavente J.M., Meller, P. y D. Rappoport, “Ranking de las Universidades
Chilenas según los Ingresos de sus Titulados ”, Documento de Trabajo No
306, Banco Central de Chile, Diciembre. Artı́culo en revision Economics
of Education Review (2004).
[2] Beyer, Harald, “Educación y desigualdad de ingresos: una nueva mirada ”,
Estudios Publicos n. 77 (2000).
[3] Bravo D. y A.Marinovic, “La educación en Chile: una mirada desde la
economia, Persona y sociedad, ”, Ilades, 155-165 (1997)
[4] Contreras, Dante “Evaluating a Voucher System in Chile. Individual, Fam-
ily and School Characteristics”, Working Paper No. 175, Facultad de Cien-
cias Económicas y Administrativas, Universidad de Chile, March (2001).
[5] Contreras, D., Bustos, S. y P. Sepulveda, “When schools are the ones that
choose: the effect of screening in Chile”, Series Documentos de Trabajo
del Departamento de Economia de la Universidad de Chile No 242, junio
(2007).
[6] Heckman, Jame, “Sample Selection Bias as a Specification Error”, Econo-
metrica, Econometric Society, vol. 47(1), pages 153-61, (1979)
[7] Heckman, J., J. Tobias & E. Vytlacil, “Simple Estimators Treatment Pa-
rameters in a latent variable framework with an application estimating the
returns to schooling”, NBER Working Paper 7950, (2000).
[8] Mizala, A., & Romaguera, P. , “School performance and choice”, Journal
of Human Resources, 35(2), 392-417. (2000a)
[9] Mizala, A., & Romaguera, P. , “Determinación de factores explicativos de
los resultados escolares en educación media en Chile”, Serie Economı́a No
85, Centro de Economı́a Aplicada, Departamento de Ingenierı́a Industrial,
Facultad de Ciencias Fı́sicas y Matemáticas, Universidad de Chile. (2000b)
[10] Sapelli, C. & Vial, B., “The performance of private and public schools in
the chilean voucher system”, Cuadernos de Economı́a, 39(118), 423-454.
(2002)
[11] Sapelli, C. & Vial,B., “Private vs public voucher schools in Chile: New
evidence on efficiency and peer effects”, Documento de trabajo N◦ 289,
Instituto de Economı́a, P. Universidad Católica de Chile (2004)
[12] Sapelli, Claudio (2003), “Ecuaciones de Mincer y las tasas de retorno a la
educación en en Chile: 1990-1998. ” Documento de Trabajo IE-PUC, N◦
254, (2003)

31
[13] Tokman, Andrea “Is Private Education Better? Evidence from Chile”,
Working Papers Central Bank of Chile, No. 147, Central Bank of Chile,
(2002).

7. Anexo
7.1. Tablas Descriptivas

Cuadro 10: Descripcion Datos


Variables PP SUV MUV
nemst -0.00 0.00 -0.00
simce 310.15 267.56 247.62
edu padre sin 0.00 0.00 0.01
edu padre basica in 0.00 0.06 0.13
edu padre basica 0.01 0.06 0.10
edu padre media in 0.01 0.11 0.15
edu padre media 0.01 0.01 0.01
edu padre tecnica in 0.06 0.07 0.03
edu padre tecnica 0.30 0.49 0.46
edu padre univ 0.50 0.13 0.06
edu padre univ in 0.08 0.05 0.03
edu padre otro 0.04 0.02 0.01
edu madre sin 0.00 0.00 0.01
edu madre basica in 0.00 0.06 0.14
edu madre basica 0.01 0.06 0.11
edu madre media in 0.01 0.13 0.17
edu madre media 0.01 0.01 0.01
edu madre tecnica in 0.11 0.09 0.04
edu madre tecnica 0.35 0.49 0.44
edu madre univ 0.39 0.11 0.06
edu madre univ in 0.08 0.03 0.02
edu madre otro 0.03 0.02 0.01
Ingreso 1 0.04 0.51 0.75
Ingreso 2 0.25 0.40 0.23
Ingreso 3 0.24 0.07 0.02
Ingreso 4 0.15 0.01 0.00
Ingreso 5 0.11 0.01 0.00
Ingreso 6 0.20 0.00 0.00
genero 0.49 0.55 0.55
PSU 597.33 489.87 460.94

7.2. Regresiones Mlogit


Se adjuntan los resultados de las ecuaciones Mlogit, correspondientes a re-
gresiones para toda la población estudiantil analizada.

32
Cuadro 11: MLOGIT y variables de exclusión
Mlogit Contreras Mlogit S & V
Selección Subv Selección PP Selección Subv Selección PP
Coef./se Coef./se Coef./se Coef./se
nemst .010 –.083 .002 –.077
(.007) (.013) (.007) (.013)
edu padre sin –.380 –.348 –.414 –.244
(.096) (.389) (.102) (.381)
edu padre basica in –.351 –.795 –.330 –.752
(.030) (.161) (.031) (.157)
edu padre basica –.229 –.605 –.221 –.584
(.029) (.122) (.031) (.123)
edu padre media in –.119 –.793 –.145 –.723
(.023) (.090) (.025) (.091)
edu padre tecnica in .190 .210 .244 .197
(.068) (.122) (.074) (.129)
edu padre tecnica .296 .113 .298 .229
(.032) (.053) (.034) (.055)
edu padre univ –.103 .569 –.045 .545
(.024) (.036) (.026) (.038)
edu padre univ in –.018 .427 .050 .417
(.032) (.051) (.035) (.054)
edu padre otro .092 .405 .118 .363
(.047) (.070) (.050) (.075)
edu madre sin –.627 .329 –.611 .320
(.131) (.419) (.141) (.412)
edu madre basica in –.514 –1.096 –.513 –1.096
(.029) (.166) (.031) (.164)
edu madre basica –.314 –.919 –.305 –.914
(.028) (.122) (.030) (.123)
edu madre media in –.132 –1.034 –.133 –.934
(.021) (.081) (.023) (.082)
edu madre tecnica in .148 .139 .220 .138
(.068) (.118) (.073) (.122)
edu madre tecnica .185 .335 .253 .330
(.028) (.045) (.030) (.047)
edu madre univ –.155 .591 –.016 .518
(.025) (.035) (.027) (.037)
edu madre univ in –.085 .631 .052 .527
(.038) (.055) (.041) (.058)
edu madre otro –.017 .549 .062 .441
(.053) (.075) (.058) (.081)
Ingreso 1 .249 –1.360 .467 –1.395
(.160) (.257) (.180) (.272)
Ingreso 2 .745 .389 1.001 .380
(.160) (.254) (.181) (.270)
Ingreso 3 .057 1.998 .413 1.900
(.162) (.255) (.182) (.271)
Ingreso 4 –.784 3.029 –.389 2.824
(.166) (.258) (.187) (.274)
Ingreso 5 –1.383 3.670 –.824 3.276
(.173) (.262) (.194) (.278)
Ingreso 6 –2.089 4.421 –1.245 3.606
(.174) (.263) (.195) (.278)
n c grupo familiar –.012 –.152 –.005 –.141
(.003) (.007) (.004) (.007)
ddsuv 20.339 –1.350
(.160) (.171)
ddpp –.428 4.403
(.018) (.194)
genero .084 –.011 .130 –.065
(.013) (.025) (.014) (.027)
psuv 7.185 –7.028
(1.257) (2.271)
pmun 2.752 –6.280
(1.254) (2.268)
ppp 1.917 –2.064
(1.251) (2.254)
Constant –20.202 –5.016 –5.110 3.920
(.000) 33
(.336) (1.265) (2.278)
No. of cases 105126 105126 105126 105126

Вам также может понравиться