Evaluacion Al Sistema de Vouchers Chileno Por Medio de La Psu

SEMINARIO DE TÍTULO
TÍTULO DE INGENIERO COMERCIAL

MENCIÓN ECONOMÍA.
DEPARTAMENTO DE ECONOMÍA
PONTIFICIA UNIVERSIDAD CATÓLICA DE CHILE
EVALUACIÓN DEL SISTEMA DE VOUCHERS

CHILENO POR MEDIO DE LA PRUEBA DE
SELECCIÓN UNIVERSITARIA (PSU)
COMPARACIÓN DE METODOLOGÍAS Y VARIABLES DE
EXCLUSIÓN
Francisco Meneses
11 de enero de 2008
En esta tesis se analiza una investigación, la cual obtiene resultados atı́picos

dentro de la literatura nacional. La investigación en cuestión, Contreras (2001),
evalúa la eficacia en la entrega de educación por parte de los colegios, utilizando
la PAA. Se compara la metodologı́a de estimación utilizada por Contreras con la
de otro autor, se actualiza la muestra utilizada y se evalúan distintas variables
de exclusión.
Se evidencia que no se pueden utilizar las pruebas de selección universitaria
para evaluar el desempeño de los establecimientos, ya que los resultados estarı́an
sesgados debido a que la PSU esta afectada por un proceso de autoselección en
los alumnos que rinden la prueba.
Además se concluye que las variables de exclusión, y no la metodologı́a de
estimación, son la fuente principal de diferencias en los resultados de este trabajo
con el de Contreras(2001) y con otros estudios.
1
Índice
1. Introducción 3
2. Revisión Literaria 3
3. Datos 7
4. Modelo 10
4.1. Regresiones con IV/TSLS . . . . . . . . . . . . . . . . . . . . . 11
4.2. Regresiones tipo Heckman . . . . . . . . . . . . . . . . . . . . . 13
4.3. Tratamiento promedio (ATE) y de los Tratados (TT) . . . . . . 16
4.4. Test de Hausman . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
5. Discusión de los resultados 19

5.1. Merma en datos PSU y SIMCE . . . . . . . . . . . . . . . . . . . 19
5.2. Diferencias con el trabajo de Contreras . . . . . . . . . . . . . . 22
5.3. Análisis a las variables de exclusión . . . . . . . . . . . . . . . . 23
6. Conclusiones 30
7. Anexo 32
7.1. Tablas Descriptivas . . . . . . . . . . . . . . . . . . . . . . . . . . 32
7.2. Regresiones Mlogit . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2
1. Introducción
La educación es un factor decisivo en la determinación de los ingresos futuros
de las personas. En Chile, en particular, la enseñanza universitaria es la que
genera los mayores retornos.1 Con esto en mente, se ha desarrollado un debate
sobre opciones para mejorar la eficacia y la eficiencia en la entrega de educación.
El objetivo de este trabajo es analizar, actualizar y mejorar el trabajo desar-
rollado por Contreras(2001), el cual hace un análisis al sistema educacional en
Chile. Este sistema está compuesto por establecimientos que reciben sus ingre-
sos de distintas fuentes; siendo éstos municipales, particulares subvencionados,
y particulares pagados. Este sistema fue introducido en 1982 y está caracteri-
zado por una subvención por alumno o voucher para los colegios municipales y
particulares subvencionados.
El trabajo de Contreras(2001) es un outlier en literatura nacional, ya que
es el primero en utilizar una prueba de selección universitaria para evaluar el
desempeño de los colegios. Este autor obtiene resultados relativos a la eficacia
de los colegios subvencionados cuyas magnitudes son bastante superiores a las
existentes en la literatura nacional. Esta tesis es un aporte a la discusión ya que
evalúa las causas de la diferencia del trabajo de Contreras con el resto de las
investigaciones nacionales.
Para examinar el trabajo de Contreras(2001) repetiremos sus estimaciones
utilizando la Prueba de Selección Universitaria (PSU). En primer lugar, se
evalúan los datos a utilizar y, luego, dos metodologı́as de estimación: la utiliza-
da por Contreras(2001) y la usada por Tokman(2002). Finalmente se comparan
distintas variables de exclusión.
Este trabajo se divide de la siguiente manera. En la sección 2 se realiza una
breve revisión de la literatura nacional. En la sección 3 se describen los datos.
En la sección 4 se desarrollan los modelos a utilizar. En la sección 5 se presentan
y discuten los resultados. Finalmente, en la sección 6 se concluye.
2. Revisión Literaria
En Chile se ha desarrollado un debate respecto a las variables que explican el
buen rendimiento de los colegios, y sus alumnos, en las pruebas estandarizadas.
1 Esto se encuentra ampliamente documentado en la literatura nacional. Algunos ejemplos
son Sapelli (2003), Bravo y Marinovic (1997), Benavente, Meller y Rappoport (2004), y Beber
(2001)
3
A continuación, realizamos una breve revisión de la literatura reciente.
Mizala & Romaguera (2000a), evalúan el sistema de vouchers de Chile. Uti-
lizando la prueba SIMCE rendida por los alumnos de 4to año básico en 1996.
Controlan la producción de la educación por medio de variables socioeconómi-
cas, caracterı́sticas de los alumnos del colegio, y de desempeño pasado del colegio
en las pruebas SIMCE. Concluyendo que la diferencia de eficiencia entre colegios
municipales y subvencionados es pequeña o inexistente, al ser mucho menor a
lo que sugieren los análisis basados en los promedios ponderados.
Las mismas autoras, Mizala & Romaguera (2000b), utilizan datos de alum-
nos de 2do año de enseñanza media del SIMCE 1998. Estiman una función de
producción para establecimientos de enseñanza media y realizan estimaciones
a nivel de alumnos, incluyendo variables de contexto, socioeconómica y carac-
terı́sticas del alumno y del establecimiento.
Concluyen que los alumnos que se educaron en colegios municipales, tienen
menores resultados en el SIMCE que sus pares de iguales caracterı́sticas que
accedieron a colegios subvencionados.
En los trabajos recién expuestos los coeficientes estimados podrı́an estar
sesgados, ya que Mizala & Romaguera (2000a y 2000b) no corrigen el problema
de la endogeneidad en la selección de colegios por parte de los individuos.
Tokman (2002), realiza un análisis con los datos del SIMCE 1996 de 4to
básico. La autora, controla por sesgo de selección realizando regresiones y cor-
rigiendo sesgo de selección por medio de la metodologı́a desarrollada por Heck-
man(1979), para cada muestra, agregando no sólo el efecto aditivo y multiplica-
tivo al efecto de tratamiento de los tratados (TT), sino que también agregando
efectos diferenciales para distintas caracterı́sticas de los colegios. Siendo ası́ las
variables de exclusión utilizadas para corregir la endogeneidad, las caracterı́sti-
cas socioeconómicas de las familias de los alumnos. El trabajo concluye que los
colegios municipales suelen ser relativamente más eficientes en la educación de
alumnos de menores ingresos.
Sapelli & Vial (2002), usan la misma base de datos de Mizala & Romaguera
(2000b) para evaluar el sistema de vouchers considerando las diferencias en los
ingresos de los colegios, separados por áreas geográficas, y tomando en consid-
eración las diferencias de ingresos. Utilizan el modelo de Roy generalizado para
caracterizar el proceso de autoselección según el tipo de colegio. Controlando
de manera parcial la oferta de la educación e incluyendo en sus estimaciones las
transferencias del gobierno a los colegios municipales.
Estiman el efecto de tratamiento promedio (Average treatment effect, ATE)
4
y el efecto de tratamiento de los tratados (TT)2 , descubriendo ganancias aso-
ciadas al asistir a colegios subvencionados. Como variable de exclusión para
corregir el sesgo de selección, los autores utilizan el número de colegios sub-
vencionados y municipales por kilómetro cuadrado, y el ratio entre alumnos
de colegios subvencionados y alumnos en colegios subvencionados más munici-
pales. De esta manera, los autores asumen que además del nivel de ingresos y
educación de los padres, la elección de colegio depende de la disponibilidad de
colegios en área geográfica.
Ambos autores, Sapelli & Vial (2004), realizan un análisis similar al hecho el
año 2002 utilizando una base de datos individual de estudiantes de 4to básico que
rindieron el SIMCE 2002. Concentran su estudio en colegios que reciben bajos
aportes económicos por parte de los padres. Ası́, encuentran un efecto de los
tratamiento de los tratados positivo, grande en magnitud y significativo. Como
variable de exclusión para corregir el sesgo de selección, los autores utilizan
dos indicadores del ratio resultados de prueba SIMCE y costo del colegio de
esa área geográfica, desarrollando una serie para establecimientos municipales
y otra para colegios subvencionados, siendo su idea el tener un proxy del costo
de una unidad de prueba SIMCE.
Este segundo enfoque asume que la selección del establecimiento por parte
de los padres de los educandos y tiene relación con la productividad media del
dinero invertido en educación. Viendo los resultados, los signos de la ecuación
de selección son los esperados, donde al disminuir (aumentar) el costo medio de
la educación subvencionada (municipal), aumenta (disminuye) la posibilidad de
ingresar a un colegio subvencionado (municipal). El estudio también evidencia
que las mujeres obtienen mejores resultados en el SIMCE, comparados con sus
pares de distinto género.
Un enfoque distinto es desarrollado por Contreras, Bustos & Sepúlveda
(2007) al emplear el SIMCE 2005 para 4to año básico, con datos individuales.
Utilizan variables de contexto, socioeconómicas, caracterı́sticas del colegio y de
los profesores para explicar los resultados en la prueba SIMCE. Para controlar
la endogeneidad del colegio de origen utilizan variables instrumentales. Como
variables de exclusión consideran si los colegios seleccionan a sus educandos y
el origen socioeconómico de los alumnos para estimar la endogeneidad en la
elección de tipo de establecimiento (IV/LATE). Los autores concluyen una vez
considerado el factor de selección del colegio y origen socioeconómico, la difer-
2 Utilizan la metodologı́a propuesta por Heckman, Tobias & Vytlacil (2000) para la esti-
mación de los errores estándares y el cálculo del ATE y TT
5
encia de productividad entre los colegios se acaba, sugiriendo que la diferencia
de puntajes en el SIMCE, es atribuible al sistema de selección de los colegios.
Contreras et al. no explı́cita el origen de los sistemas de selección utilizados,
punto clave en el análisis, ya que éstos podrı́an ser endógenos a la calidad de los
colegios.
La diferencia de los enfoques de Sapelli & Vial y Contreras et al.(2007)
lleva a conclusiones distintas. Sapelli & Vial asumen que la elección de colegio
se da por los padres y la metodologı́a utilizada para corregir la endogeneidad
consiste en la probabilidad de estar en un grupo u otro. Mientras que Contreras
et al(2007) asumen que los colegios son los que seleccionan alumnos y utilizan
variables instrumentales para corregir la endogeneidad.
Un trabajo outlier en la literatura nacional, tanto por la variable a explicar,
como por sus resultados, es el de Contreras (2001). El autor evalúa el desempeño
de los alumnos en la Prueba de Aptitud Académica (PAA). La PAA, es una
prueba rendida de manera voluntaria por los alumnos al finalizar la educación
escolar media y es el instrumento principal del sistema de selección universitario
chileno. Contreras en una primera etapa desarrolla un modelo OLS y encuen-
tra que el asistir a un colegio particular subvencionado, no implica un aumento
en los puntajes obtenidos en la PAA. Luego, con un set de caracterı́sticas in-
dividuales del alumno y variables del establecimiento (variables de contexto y
origen socioeconómico) controla la endogeneidad en la elección del establec-
imiento de los estudiantes. Esto lo realiza a través de Mı́nimos Cuadrados en
dos Etapas (TSLS) o (IV/LATE), encontrando diferencias significativas entre
colegios municipales y subvencionados. Además manifiesta que las caracterı́sti-
cas de contexto y origen disminuyen su impacto en la PAA, una vez controlada
la endogeneidad causada por el colegio de origen, siendo estos factores decisivos
en la elección de colegio. Contreras, también encuentra evidencia que indica que
los resultados de las mujeres en la PAA son inferiores al de los hombres.
6
Cuadro 1: Resumen Resultados Literatura
Autor Estimación Prueba ATE / SD TT / SD LATE /SD
Mizala & Romaguera (2000a) OLS SIMCE 0

Mizala & Romaguera (2000b) OLS SIMCE 23.7 %*
Tokman (2002) Heckman SIMCE
Sapelli & Vial (2002) Treatment Reg. SIMCE -5 %** 15 %**
Sapelli & Vial (2004) Treatment Reg. SIMCE 33 %** 37 %**
Contreras et al (2007) IV/TSLS SIMCE 32 %
Contreras (2001) IV/TSLS PAA 89 %*[
*Prueba Matemáticas
** Prueba Lenguaje
[ Hombres
En el Cuadro (1) se resumen los trabajos de la literatura nacional reciente.

Los LATE, TT y ATE han sido divididos por la desviación estándar de la prue-
ba utilizada, para poder hacer comparables los resultados. Se puede ver que el
trabajo de Contreras(2001) es el único que utiliza una prueba de selección uni-
versitaria para evaluar el sistema educacional. Además sus resultados resultan
ser atı́picos, dada la magnitud del la efectividad en la entrega de educación por
parte de los colegios subvencionados. Este dato llega ser incluso superior a una
desviación estándar para algunos de los casos analizados por este autor.
En este trabajo evaluaremos los motivos que causan las diferencias en los
resultados de Contreras (2001) con el resto de la literatura nacional. En primera
instancia evaluaremos dos metodologı́as de estimación; la metodologı́a usada
por Contreras (2001), para luego desarrollar la metodologı́a usada por Tokman
(2002), la cual es similar a la de Sapelli & Vial. En ambos casos se evalúa el
rendimiento en la PSU de los alumnos de distintos establecimientos.
En una segunda parte de este trabajo se evaluarán los datos de esta tesis y
las variables de exclusion usadas por Contreras(2001), comparándolas con las
usadas por Sapelli & Vial (2002).
3. Datos
Contamos con los datos SIMCE del año 2003 por establecimiento, el cual fue
rendido por 239.195 alumnos de 2do año de enseñanza media en 2.117 colegios
de Chile.
7
El SIMCE fue rendido de manera obligatoria por todos los estudiantes que se
encontraban en segundo medio en Chile. Contamos con los puntajes de la prueba
de lenguaje y la prueba de matemáticas SIMCE por colegio; promediamos ambos
puntajes y de esta manera obtendremos el promedio del SIMCE por colegio.
Cuadro 2: Datos por tipo de colegio

Colegio Simce PSU Porcentaje
Mun 123.797 42.520 34 %
Subv 97.087 48.157 50 %
PP 18.311 14.450 79 %
Total 239.195 105.127 44 %
fuente: Elaboración propia

Disponemos de los datos de la PSU 2006 por alumno3 . La PSU es la contin-
uación del la PAA, prueba que fue rendida en el proceso de admisión del año
1998 por 142.382 alumnos 4
Promediamos las pruebas de lenguaje y matemática obteniendo la PSU
promedio por estudiante. Esta prueba fue rendida por 176.901 individuos de
manera voluntaria, de los cuales 125.371 habı́an egresado el año 2006. La primera
y más importante merma en los datos es de 113.824 educandos que dieron el
SIMCE 2003 de manera obligatoria, pero que no rindieron la prueba PSU 2006.
Una caracterı́stica importante de esta pérdida de datos, es que no es homogénea
a través de los colegios, siendo los colegios municipales los que presentan la may-
or merma en los datos, punto que deber ser considerado al momento de evaluar
los resultados de este trabajo.
Al empalmar ambas bases de datos, SIMCE y PSU, contamos con informa-
ción disponible para 105.262 alumnos, existiendo una merma de información
para 20.109 alumnos, la cuál se refiere principalmente a la diferencia de códigos
entre el Ministerio de Educación y el DEMRE. Esta última pérdida de infor-
mación está distribuida homogéneamente según los distintos tipos de establec-
imientos, y continuaremos el trabajo considerando los datos como una muestra
representativa de la población que rinde la PSU. No esta demás mencionar que
la base considera un número mayor de alumnos que la usada por Sapelli & Vial
(2002) y (2004), pero un número menor a la utilizada por Contreras et al.(2001)
3 La PSU 2006 fue rendida en diciembre del 2005 por los alumnos de 4to medio
4 De los cuales 97.935 se graduaron ese mismo año, Contreras(2001) realiza regresiones
sobre 119.450 alumnos.
8
Cuadro 3: Cuadro de Correlaciones
Variables NEM PSU SIMCE MeanNEM nemst
NEM 1.000
PSU 0.547 1.000
SIMCE 0.216 0.639 1.000
MeanNEM 0.445 0.352 0.485 1.000
nemst 0.885 0.451 -0.000 0.000 1.000
Para facilitar la interpretación de los resultados en este trabajo generamos

una serie de variables.
La primera variable es el promedio de notas de los alumnos por promoción
por colegio. Es decir el promedio las notas de enseñanza media de todos los
alumnos de un mismo colegio, definida como MeanNEM.5
Con el objetivo de tener un indicador de rendimiento escolar que tenga la
misma media y varianza a través de todos los colegios generamos la variable
NEMST (las NEM estandarizadas por colegio), las cuales tienen media 0 y
varianza 1 para cada establecimiento educacional chileno.6
Luego evaluamos las correlaciones del NEM, SIMCE, PSU, NEMST y Mean-
NEM. Podemos ver, que existe una correlación positiva entre PSU y SIMCE,
ya que a mayor calidad del colegio de origen (SIMCE), son mejores los punta-
jes en la prueba de selección universitaria. Encontramos también correlaciones
positivas entre SIMCE y NEM , SIMCE y MeanNEM, y MeanNEM y PSU.
Al ser la PSU y SIMCE variables que miden calidad en los colegios, evidenci-
amos que existe una correlación entre los colegios con notas más altas, los cuales
entregan educación de mejor calidad. 7 Esta correlación, la cual podrı́a ser es-
puria, generará ruido en las regresiones, sı́ agregamos las NEM como variables
explicativas. Esta correlación positiva nos indica que al utilizar las NEM para
explicar la PSU, incluirı́amos una variable que contendrı́a información sobre la
calidad del colegio. Esto causarı́a problemas, ya que las NEM serı́an una variable
endógena a la calidad del colegio cuando lo que se desea es evaluar la calidad
en la educación. Para solucionar este problema, utilizaremos en las regresiones
5 M eanN EM
P
j = NEM promedio para colegio j, M eanN EMj = i N EMi / Nj para cole-
gio j, sumamos las notas de los alumnos y las dividimos por el total de alumnos del colegio
6 N EM ST = ((N EM -M eanN EM )/S.D.N EM ) las NEMST se calcula al restarle a las
i i j j
NEM de un alumno i las NEM promedio del colegio j y dividiendo por la desviación estándar
de NEM del colegio
7 Si las NEM reflejaran la calidad de los alumnos, “podemos pensar, entonces, que en cole-
gios de elite tener notas más altas es justo y más informativo ya que se reflejan las habilidades
superiores de sus alumnos comparados con el resto” en Chan, Hao & Suen. “A signaling
Theory of Grade inflation”
9
una variable de desempeño escolar basada en las notas de enseñanza media es-
tandarizadas (NEMST). En la tabla de correlaciones vemos que NEMST no esta
correlacionada con SIMCE o MeanNEM, pero si con las NEM y con la PSU.
4. Modelo
Deseamos replicar y evaluar el trabajo de Contreras(2001), en el cual se
evalúan las variables que explican el desempeño de los alumnos en la prueba
de selección PAA, considerando que es necesario controlar la endogeneidad ex-
istente en el colegio de origen de los estudiantes.
Contreras en su trabajo pretende explicar el rendimiento de los alumnos en
las pruebas de selección universitaria, en este caso usaremos la PSU, utilizando
como variables explicativas las caracterı́sticas académicas y variables de contexto
de los alumnos, educación de los padres y variables de origen del establecimiento.
Al evaluar los puntajes PSU obtenidos por los distintos tipos de colegios,
consideramos que existe un proceso de selección o elección en el tipo de colegio
en el cual se encuentran los alumnos. Este proceso tendrı́a relación con carac-
terı́sticas del alumno que no son directamente observables, ya que los estudiantes
son admitidos o matriculados en los colegios de una manera no aleatoria.
Realizar regresiones OLS sobre una muestra seleccionada de manera no
aleatoria generarı́a coeficientes que estarı́an sesgados. Para solucionar este prob-
lema utilizaremos dos metodologı́as; la primera es la utilización de Variables
Instrumentales (IV) en un proceso de dos etapas TSLS, al igual que Contr-
eras(2001). La segunda metodologı́a es la desarrollada por Heckman (1979), la
cual también es utilizada por Tokman (2002).
Es importante hacer hincapié, que no controlaremos por factores de eficiencia
en la oferta como lo hace Sapelli & Vial (2004) o por factores como el los sistemas
de selección de los colegios como lo poseen Contreras et al. (2007).
Utilizaremos dos variables exclusión para corregir la endogeneidad en la elec-
ción del tipo de colegio. Éstas deben tener la caracterı́stica de no influir en la
variable explicada, pero si ser relevantes en la modelación de la elección de cole-
gio. La primera variable a utilizar es el “Número de integrantes de la familia”,
lo cual serı́a similar a utilizar como variable de exclusión al “Numero de her-
manos”, la que fue usada por Heckman et al (2002), esto bajo la premisa que a
mayor “Numero de hermanos”, mayor es la probabilidad de que los padres ma-
triculen al hijo en un colegio municipal. Una segunda variable de exclusión es
10
“Porcentaje de alumnos en colegios Subvencionados” y “Porcentaje de alumnos
en colegios Municipales”, esto siguiendo el ejemplo de Sapelli & Vial (2002). Es-
ta variable hace referencia al porcentaje de alumnos de cierto tipo de colegio por
comuna, con lo cual existirı́an mayores posibilidades de incorporar a un alum-
no a un colegio subvencionado, si existe una mayor oferta de establecimientos
subvencionados en la comuna de residencia del alumno. 8
De esta manera tendrı́amos dos variables de exclusión, una de demanda (in-
tegrantes en la familia) y una de oferta ( proporción de colegios subvencionados),
las cuales serán evaluadas en la próxima sección del trabajo.
4.1. Regresiones con IV/TSLS

En esta sección se rehace la metodologı́a empleada por Contreras (2001) en
su paper. Este ejercicio se hará mediante los datos de la PSU 2006.
Contreras (2001) utiliza mı́nimos cuadrados en dos etapas (TSLS), realizan-
do en la primera un Multinominal Logit (Mlogit) para explicar la elección del
colegio del alumno. Una vez obtenidas las probabilidades de estar en uno u
otro colegio, las integra en las regresiones, las cuales se realizan sobre toda la
población e identifican el tipo de colegio de origen con variables binarias. Los
pasos del proceso de estimación del TSLS se enumeran a continuación:
• Estimación del Mlogit.

• Predicción de la probabilidad de estar en colegio Subvencionado, utilizando
los resultados del Mlogit.
• Se reemplaza la variable Dummy de colegio subvencionado por la proba-
bilidad antes predicha.
• Estimación en OLS de los puntajes de la PSU, utilizando la probabilidad
antes predicha.
En una primera etapa realizamos los Mlogit para las Dummy de tipo de
colegio utilizando las variables de elección. Luego obtenemos las probabilidades
de ser de un tipo de colegio u otro e integramos estas probabilidades a las
regresiones completando el TSLS. Las tablas con los resultados del Mlogit se
encuentran en el anexo.
8 Se define la variable como Por Suv = (Nro Alumnos Colegio Subv / Nro Total alumnos
en la Comuna), y de manera análoga para los colegios municipales
11
Cuadro 4: IV/ TSLS
1 2 3
Muestra Completa Muestra Sin P. Pagados
OLS TSLS TSLS
Coef./se Coef./se Coef./se
nemst 48.044 48.192 46.373
(.240) (.243) (.262)
Pr(d suv==1) 10.826 –22.383 –16.629
(.534) (1.289) (1.279)
Pr(d pp==1) 68.248 83.595
(1.011) (2.648)
edu padre sin –25.799 –29.302 –29.071
(3.197) (3.239) (3.282)
edu padre basica in –17.909 –20.844 –19.701
(1.034) (1.053) (1.062)
edu padre basica –14.640 –16.501 –15.439
(1.034) (1.050) (1.062)
edu padre media in –8.042 –8.683 –7.972
(.833) (.846) (.857)
edu padre tecnica in 17.556 19.107 22.231
(2.507) (2.538) (2.704)
edu padre tecnica 14.202 16.521 19.718
(1.149) (1.166) (1.259)
edu padre univ 16.280 14.575 22.632
(.866) (.885) (1.027)
edu padre univ in 20.558 19.977 26.806
(1.177) (1.193) (1.334)
edu padre otro 1.900 2.023 5.336
(1.696) (1.719) (1.947)
edu madre sin –33.329 –37.774 –37.108
(4.408) (4.465) (4.547)
edu madre basica in –28.378 –32.460 –31.164
(1.021) (1.048) (1.056)
edu madre basica –21.540 –23.972 –23.089
(1.002) (1.022) (1.032)
edu madre media in –13.129 –13.837 –13.628
(.778) (.793) (.802)
edu madre tecnica in 17.779 18.934 20.106
(2.486) (2.517) (2.711)
edu madre tecnica 16.023 17.109 21.805
(1.026) (1.043) (1.154)
edu madre univ 20.080 18.014 24.086
(.886) (.908) (1.067)
edu madre univ in 18.606 17.044 23.908
(1.360) (1.383) (1.632)
edu madre otro 5.300 4.318 8.297
(1.904) (1.932) (2.250)
Ingreso 1 18.081 20.794 19.834
(6.025) (6.102) (6.484)
Ingreso 2 42.425 48.212 47.562
(6.031) (6.107) (6.496)
Ingreso 3 58.134 53.519 66.480
(6.098) (6.216) (6.614)
Ingreso 4 66.668 52.114 75.621
(6.221) (6.425) (7.074)
Ingreso 5 71.315 52.330 73.884
(6.310) (6.560) (7.780)
Ingreso 6 89.425 67.146 76.611
(6.224) (6.516) (7.883)
genero –21.733 –21.141 –20.138
(.478) (.484) (.524)
Constant 458.512 471.281 467.575
(6.019) ( (6.128) (6.503)
Adj. R2 .470 .457 .359
No. of cases 105126 105126 90676
12
En el Cuadro 4 se entregan los resultados de los TSLS. En la primera columna
se entregan los resultados de un OLS. En la segunda columna se entregan los
resultados del TSLS. En las columna 3 se entregan resultados para los TSLS
para una muestra sin colegios particulares pagados.
En el OLS podemos ver que la Dummy de colegios subvencionado es positiva
y estadı́sticamente significativa. Obtenemos un valor parecido al de Contreras
(2001) Cuadro 9, pero significativo. Luego realizamos el TSLS corrigiendo la
endogeneidad de tipo de colegio y vemos que el valor de las Dummy de colegio
subvencionado disminuye llegando a ser -22 para la muestra completa y -16 al
eliminar a los colegios particulares pagados. Estos resultados son muy distin-
tos a los presentados por Contreras(2001), lo cual será evaluado en secciones
posteriores. Para evaluar una diferente metodologı́a, en la siguiente sección de-
sarrollamos regresiones a la Heckman.
4.2. Regresiones tipo Heckman

En esta sección evaluaremos lo puntajes PSU obtenidos por los colegios,
utilizando la metodologı́a desarrollada por Heckman.
La corrección del sesgo de selección de Heckman (1979), en su version orig-
inal, consiste en una primera etapa en desarrollar una regresión Probit, donde
se identifica si el individuo está o no fuera de la muestra de los individuos.
Luego se incluye el ratio del inverso de mills (obtenido de las Probits) en las
regresiones OLS. Es importante que en las regresiones Probit existan variables
que no estén incluidas en las regresiones OLS de la segunda etapa. Ellas deben
influir en la elección del Probit (estar o no en la muestra tratada) pero no influir
en la variable dependiente que se desea analizar.
Se definen ecuaciones que representan el comportamientos de los alumnos
de colegios Municipales (Mun), Subvencionados (Subv) y Particulares Pagados
(PP). Teniendo ası́ dos grupos de ecuaciones, primero una de selección bina-
ria (está el alumno o no en el tipo de colegio i) y un segundo set de ecua-
ciones lineales que explicarı́an los puntajes de la PSU. Un cambio respecto
a la metodologı́a de Heckman (1979) serı́a el uso de estimadores de Máxima
verosimilitud en la ecuación de selección, en reemplazo de los Probits, debido
a las mejores propiedades de estimación utilizando Máxima-Verosimilitud. Por
tanto,
Di = 1 si Di = αi ∗ Z > 0; D = 0 (1)
13
Con i =1,2,3 = Tipo de Colegio(PP, Subv, Mun).
Utilizando en los tres casos al número de integrantes en la familia y la pro-
porción de alumnos de colegios subvencionados y municipales por comuna como
variables de exclusión .
P SUi = βi + β1,i X + µi (2)
Con X =variables de contexto del alumno y el colegio.

Con Z=X+ Variables de Exclusión
Se realizan regresiones a las Ecuaciones (1) y (2), utilizando la metodologı́a
desarrollada por Heckman (1979). Los resultados se adjuntan en el cuadro(5).
En las columnas 1, 2 y 3 se entregan los resultados para la muestra completa
de alumnos. Analizando según procedencia, alumnos de colegios (1) particulares
pagados, (2) subvencionados y (3) municipales. En las columnas 4 y 5 se entregan
resultados para una muestra que excluye a los alumnos de colegios particulares
pagados, analizando solo alumnos de colegios subvencionados (4) y municipales
(5).
Obtenemos los coeficientes esperados para NEMST, donde a mayor rendimien-
to del alumno en su colegio, mejores son los resultados en la PSU. Vemos lo
mismo para todos los niveles de educación, donde la “educación media comple-
ta” de padre y madre es la variable Dummy omitida. Al aumentar los niveles
de educación de los padres, mejoran los resultados de los alumnos, resultados
similares para la Dummy de ingresos.
Al igual que Contreras (2001), vemos que una vez controlado por factores de
contexto y educación, las mujeres obtienen menores puntajes que los hombres,
lo que deberı́a ser abordados por otros estudios.
Cuadro 5: Regresiones Modelo 1 y 2: PSU 2006
1 2 3 4 5
Muestra Completa Muestra sin P.Pagados
PP Subv Mun Subv Mun

Coef./se Coef./se Coef./se Coef./se Coef./se
nemst 58.310 47.705 44.882 47.560 44.869
(.575) (.350) (.394) (.350) (.394)
edu padre sin 16.030 –31.195 –23.412 –31.497 –24.632
(20.643) (5.655) (4.073) (5.649) (4.083)
edu padre basica in 6.360 –19.896 –16.253 –20.055 –17.202
(9.945) (1.687) (1.390) (1.686) (1.393)
edu padre basica –18.030 –16.708 –11.845 –16.955 –12.522
(7.578) (1.587) (1.442) (1.586) (1.444)
edu padre media in –12.546 –9.214 –5.791 –9.646 –6.160
14
Cuadro 5
Continuación

(5.515) (1.214) (1.211) (1.214) (1.212)
edu padre tecnica in –14.983 18.496 27.599 18.695 28.124
(6.463) (3.255) (4.699) (3.261) (4.702)
edu padre tecnica –10.621 15.839 26.583 16.178 27.566
(2.779) (1.473) (2.350) (1.476) (2.351)
edu padre univ –4.416 19.727 23.552 21.461 23.627
(1.660) (1.238) (1.795) (1.242) (1.794)
edu padre univ in –8.687 20.776 34.955 21.502 35.205
(2.431) (1.638) (2.247) (1.642) (2.248)
edu padre otro –15.145 4.044 5.188 5.074 5.647
(3.276) (2.348) (3.384) (2.356) (3.386)
edu madre sin 5.393 –28.066 –35.976 –28.287 –37.392
(22.760) (7.957) (5.639) (7.950) (5.653)
edu madre basica in –18.791 –29.614 –28.551 –30.019 –29.916
(10.560) (1.690) (1.381) (1.689) (1.382)
edu madre basica –14.844 –21.591 –21.667 –22.016 –22.605
(7.692) (1.540) (1.405) (1.539) (1.406)
edu madre media in –8.121 –12.103 –13.394 –12.733 –13.879
(4.955) (1.117) (1.154) (1.118) (1.154)
edu madre tecnica in 11.289 17.254 23.651 17.453 24.293
(5.979) (3.264) (4.695) (3.270) (4.698)
edu madre tecnica 3.329 18.235 27.761 19.361 28.870
(2.197) (1.353) (2.138) (1.358) (2.138)
edu madre univ 11.532 21.347 24.511 23.293 24.694
(1.636) (1.276) (1.897) (1.280) (1.896)
edu madre univ in 6.068 20.153 26.309 21.891 26.624
(2.388) (1.978) (2.798) (1.985) (2.799)
edu madre otro –2.340 5.728 10.475 7.211 10.860
(3.362) (2.688) (3.970) (2.698) (3.972)
Ingreso 1 63.897 23.326 16.995 21.978 17.556
(14.505) (8.931) (9.287) (8.936) (9.301)
Ingreso 2 70.026 46.787 46.898 47.115 49.084
(14.223) (8.938) (9.318) (8.943) (9.335)
Ingreso 3 74.211 58.093 69.078 66.929 71.751
(14.247) (9.030) (9.748) (9.044) (9.748)
Ingreso 4 81.358 56.865 90.684 75.310 93.250
(14.327) (9.395) (11.977) (9.421) (11.940)
Ingreso 5 85.827 54.874 68.687 77.787 70.435
(14.375) (9.997) (14.111) (10.041) (14.063)
Ingreso 6 101.693 54.391 67.671 80.030 67.921
(14.353) (10.170) (13.592) (10.212) (13.524)
genero –28.093 –19.398 –20.826 –19.326 –20.613
(1.132) (.695) (.788) (.696) (.789)
Constant 542.195 446.165 456.831 446.786 460.805
(14.334) (8.945) (9.315) (8.945) (9.319)
select
nemst –.038 .001 .011 –.007 .008
(.007) (.004) (.004) (.005) (.005)
edu padre sin –.060 –.243 .225 –.237 .240
(.164) (.060) (.061) (.062) (.062)
edu padre basica in –.269 –.196 .175 –.178 .179
(.064) (.019) (.019) (.019) (.019)
edu padre basica –.216 –.132 .126 –.126 .124
(.053) (.018) (.019) (.019) (.019)
edu padre media in –.306 –.090 .113 –.103 .100
(.040) (.015) (.015) (.015) (.015)
edu padre tecnica in .141 .143 –.180 .170 –.181
(.064) (.044) (.047) (.048) (.048)
edu padre tecnica .133 .173 –.232 .232 –.239
(.029) (.020) (.022) (.023) (.023)
edu padre univ .312 –.029 –.169 .105 –.110
(.020) (.015) (.017) (.018) (.018)
15
Cuadro 5
Continuación

edu padre univ in .234 .024 –.112 .083 –.091
(.028) (.021) (.022) (.023) (.024)
edu padre otro .205 .063 –.165 .142 –.149
(.040) (.030) (.033) (.035) (.035)
edu madre sin .116 –.350 .310 –.329 .334
(.191) (.083) (.084) (.086) (.086)
edu madre basica in –.448 –.306 .311 –.305 .307
(.067) (.019) (.019) (.019) (.019)
edu madre basica –.393 –.178 .202 –.191 .192
(.053) (.018) (.018) (.018) (.018)
edu madre media in –.396 –.080 .127 –.110 .109
(.036) (.014) (.014) (.014) (.014)
edu madre tecnica in .074 .137 –.159 .166 –.170
(.063) (.043) (.047) (.048) (.048)
edu madre tecnica .180 .150 –.262 .253 –.261
(.025) (.018) (.020) (.021) (.021)
edu madre univ .293 –.018 –.192 .131 –.134
(.020) (.016) (.018) (.019) (.019)
edu madre univ in .292 .027 –.190 .149 –.155
(.031) (.024) (.027) (.029) (.029)
edu madre otro .250 .039 –.181 .134 –.144
(.043) (.034) (.038) (.040) (.040)
Ingreso 1 –.680 .310 –.153 .307 –.313
(.134) (.105) (.103) (.111) (.111)
Ingreso 2 .120 .637 –.653 .750 –.759
(.133) (.105) (.103) (.112) (.112)
Ingreso 3 .979 .282 –1.272 1.097 –1.106
(.134) (.106) (.105) (.114) (.114)
Ingreso 4 1.536 –.195 –1.763 1.312 –1.330
(.136) (.109) (.112) (.126) (.126)
Ingreso 5 1.777 –.431 –1.907 1.266 –1.267
(.139) (.112) (.119) (.141) (.141)
Ingreso 6 1.968 –.669 –2.007 1.095 –1.109
(.138) (.111) (.116) (.140) (.140)
n c grupo familiar –.071 –.001 .026 –.016 .017
(.004) (.002) (.002) (.002) (.002)
psuv –2.698 3.050 –1.360 2.115 –2.244
(.043) (.034) (.041) (.045) (.047)
pmun –2.346 .380 1.533 –.825 .689
(.042) (.034) (.040) (.045) (.047)
genero –.046 .073 –.074 .084 –.087
(.014) (.008) (.009) (.009) (.009)
Constant 1.027 –1.856 –.121 –.777 .908
(.136) (.108) (.108) (.118) (.119)
athrho
Constant –.236 .328 –.054 .351 –.143
(.026) (.013) (.015) (.013) (.015)
lnsigma
Constant 4.231 4.341 4.391 4.342 4.395
(.006) (.004) (.003) (.004) (.004)
No. of cases 106351 106351 106351 91598 91598
4.3. Tratamiento promedio (ATE) y de los Tratados (TT)

Para evaluar los puntajes de unos u otros colegios en la PSU evaluamos tanto
el efecto promedio de ser tratado (ATE) como el efecto del tratamiento en los
tratados (TT), considerando la educación subvencionada como el tratamiento.
16
Al comparar los colegios vemos que las familias que inscriben a sus hijos
en establecimientos particulares pagados tienen diferencias fundamentales con
las familias que inscriben a sus hijos en los otros dos tipos de colegios, munici-
pales y subvencionados. Entonces, para evaluar de forma más limpia el sistema
de “vouchers” en el sistema educacional chileno, se excluyen los colegios par-
ticulares pagados del análisis. De esta manera obtendrı́amos valores que son
comparables a los obtenidos bajo estimaciones tipo IV/LATE.
Para evaluar el efecto de tratamiento promedio (ATE) estimaremos la difer-
encia entre los coeficientes, por el promedio de las variables explicativas:
AT Ei = E(4)=X(βi - βj )
P
ATE = 1/n i X(βi - βj )
La obtención de la estimación del (TT) la hacemos evaluando la ganancia

promedio esperada para los establecimientos que fueron efectivamente elegidos
en el programa.
T Ti = E(4 | D(Z) = 1)=Xt (βi - βj )

P
TT = 1/nt i Di T T (xi , zi , D(Z) = 1)
Conj 6= i
Realizamos regresiones a las ecuaciones (1) y (2) para colegios subvenciona-
dos y municipales. Ası́, obtenemos las desviaciones estándares del ATE y TT
por medio de bootstrapping no paramétrico utilizando 1000 muestras.
Vemos en el Cuadro 6 que el ATE y TT son -14.78 y -16.09 respectivamente,
siendo los resultados estadı́sticamente significativos al 1 %.
Se advierte que los puntajes PSU parte de los colegios municipales es superior
a la de los colegios subvencionados, lo cual implicarı́a que los colegios municipales
serı́an más eficaces en la producción de puntajes PSU.
Cuadro 6: Tratamiento promedio (ATE) y de los Tratados (TT)

ATE (Subv-Mun) TT(Suv-Mun)
-14.775 -16.087
(1.239)* (1.313)*
* SD. Calculada usando Bootstrap noparametrico N=1000
4.4. Test de Hausman

Para comprobar la utilidad de las variables de exclusión, se utilizó un test
de Hausman, el cual compara las propiedades asintóticas de los estimadores.
Suponemos que uno de los estimadores tienen varianza mı́nima, lo cual eval-
uamos con respecto a un segundo estimador. Este proceso lo realizamos para
evaluar el uso de las variables de exclusión en las regresiones a la Heckman.
17
Evaluamos el cambio definiendo la matriz Z como:
• Z=X+ Variables de exclusión verdaderas + variables de exclusión evalu-
adas.
• Z=X+ Variables de exclusión verdaderas

Para realizar el test de Hausman, se realizan regresiones que corrigen sesgo
de selección, donde hay que asumir al menos una variable de exclusión como
verdadera. 9 En el cuadro (5) mostramos las variables de exclusión que fueron
consideradas como verdaderas y cuáles fueron evaluadas.
En el primer caso se asumió que la variable de exclusión verdadera es el
Numero de integrantes de la familia y se evaluó el porcentaje de alumnos en
colegios municipales en la comuna (Pmun) y el porcentaje de alumnos en colegios
subvencionados en la comuna (Psuv). Luego de realizar ambas regresiones a la
Heckman realizamos el test de Hausman.
Al revisar el cuadro (5) podemos ver en la fila (1) que se rechaza la hipótesis
nula: la diferencia en los coeficientes no es sistemática. Aceptamos la variable
proporción de alumnos de colegios subvencionado en la comuna (Psuv) y propor-
ción de alumnos de colegios municipales en la comuna (Pmun) como variables
de exclusión válidas, ya que minimizan la varianza de los estimadores.
Cuadro 7: Test de Hausman

N Variables evaluadas Variables verdaderas Chi2 Prob > chi2
1 Pmun Psuv N.familia 986.9 0.0
2 Pmun N.familia Psuv 1538.0 0.0
3 Psuv N.familia Pmun -3.2 **
4 N.familia Pmun Psuv 2.2 1
Al evaluar las variables de exclusión una a una, podemos ver en la fila (2)
que Pmun es una variable de exclusión válida. En la fila (3) vemos que podemos
prescindir de Psuv como variable de exclusión, una vez incluida Pmun. 10 En la
fila (4) vemos que N.familia no es una variable de exclusión valida.
Debemos recordar que el test de Hausman no es concluyente, ya que debe
asumir que las otras variables de exclusión son verdaderas y se basa en criterios
asintóticos que pueden no ser adecuados en este caso particular, pero nos entrega
una idea de la utilidad de las variables de exclusión. Continuaremos el trabajo
considerando todas las variables de exclusión como válidas.
9 Esto para que puedan hacer las regresiones corrigiendo sesgo de selección. Esta información
fue confirmada al autor por Justin L. Tobias, co-autor de J. Heckman y E. Vytlacil

10 Debido a que la varianza de las variables aumenta en vez de disminuir. Esto tendrı́a cierta
lógica, ya que Pmun es el complemento de Psuv. Incluir Psuv implicarı́a incluir la misma
información dos veces, ya que P mun = 1 − P suv.
18
5. Discusión de los resultados
Una vez obtenidos los resultados del LATE, ATE y TT, cabe preguntarse él
por qué de las diferencias con los resultados de la literatura nacional. Obtuvimos
LATE, ATE y TT en torno a -16, lo que es muy distinto a lo obtenido por otros
autores en la literatura nacional, donde los LATE, ATE y TT tienden a ser
positivos. En una primera etapa se explicaran las diferencias de este trabajo
con la literatura nacional y en una segunda las diferencias con el trabajo de
Contreras (2001).
5.1. Merma en datos PSU y SIMCE

En la literatura nacional Mizala & Romaguera (2000a) & (2000b) , Tokman
(2002), Sapelli & Vial (2002) & (2004) y Contreras et al.(2007) utilizan la prueba
SIMCE para evaluar la eficacia en la entrega de la educación.
El SIMCE es una prueba obligatoria, que se realiza en 4to básico, 8vo básico
o 2do medio, y es una prueba que no tiene incidencia para los alumnos. La
PSU, al igual que la PAA, es una prueba voluntaria que se rinde al finalizar
la educación escolar media y que tiene, a diferencia del SIMCE, repercusiones
en el futuro educacional del estudiante. Esto nos puede hacer pensar que la
PSU reflejarı́a de mejor manera lo aprendido por los estudiantes, ya que tienen
incentivos a demostrar sus habilidades y conocimientos.
Es sabido que un número importante de los alumnos que rindió el SIMCE
no rindió la PSU. Un análisis de los datos nos permite ver que los estudiantes
que no rinden la PSU, no fueron seleccionados de manera aleatoria, a través de
los colegios, sino que fueron seleccionados en mayor proporción de los colegios
municipales (Cuadro (2)). En esta sección mostraremos algunas caracterı́sticas
de esta selección y comentaremos las consecuencias de esto.
Analizamos los datos de los colegios, cuyos alumnos rinden la PSU y SIMCE,
diferenciándolos por tipo de dependencia.11 En particular evaluamos la propor-
ción de alumnos que fueron examinados por el SIMCE y la PSU. En las figuras
1 y 2 graficamos la proporción de alumnos de cada colegio que rindió la PSU y
los promedios de PSU y SIMCE por colegio.12
11 para simplificar el análisis, eliminamos a los colegios particulares pagados de la muestra
12 Prop = N o.AlumnosP SUj /N o.AlumnosSIM CEj = La proporción de alumnos del cole-
gio j que rindieron la PSU.
19
SIMCE y proporción de alumnos que rinden la PSU PSU y proporción de alumnos que rinden la PSU
700
350
600
300
500
SIMCE
PSU
250
400
200
300
150
0 .2 .4 .6 .8 1 0 .2 .4 .6 .8 1
Proporción alumnos que rinden la PSU por colegio Proporción alumnos que rinden la PSU por colegio
subvencionados municipales subvencionados municipales
Figura 1: Figura 2:
fuente: Elaboración propia, datos PSU 2006 y SIMCE 2003.
En la Figura (1) evidenciamos que existe una correlación, entre los puntajes
promedios del SIMCE por colegio y la proporción de los alumnos de los colegios
que rinden la PSU. Se observa una relación entre la calidad de los colegios, me-
dida en SIMCE, y la proporción de alumnos que da la PSU. Siendo que a mayor
calidad de un colegio, mayor es la cantidad de alumnos que rinden la prueba de
selección universitaria. Esto evidencia que existe un proceso de autoselección de
los estudiantes que rinden la PSU donde los alumnos provenientes de colegios
de menor calidad, tienden en menor proporción a rendir la prueba.
La relación entre la PSU promedio por colegio y la proporción de alumnos
chilenos de establecimientos que rindió la PSU, la podemos presenciar en la
Figura (2), siendo esta correlación similar a la evidenciada en el SIMCE. De
este modo, los alumnos de colegios que tienen menores puntaje de PSU, tendrán
menos estudiantes rindiendo la prueba.
Este problema se acentúa, al evaluar las proporciones de alumnos que no dan
la PSU según tipo de colegios. En las Figuras (3) y (4) realizamos histogramas
de la proporción de estudiantes que rinden la PSU, según tipo de colegio. Se
evidencia que es importante la proporción de estudiantes de colegios municipales
que no es examinado por la PSU.
20
Histograma proporción alumnos que rinde la PSU Histograma proporción alumnos que rinde la PSU
Proporción de alumnos que rinden la PSU de colegios Subvencionados Proporción de alumnos que rinden la PSU de colegios Municipales
2
2
1.5
1.5
Densidad
Densidad
1
1
.5
.5
0
0
0 .2 .4 .6 .8 1 0 .2 .4 .6 .8 1
Proporción alumnos que rinde la PSU por colegio Proporción alumnos que rinde la PSU por colegio
Figura 3: Figura 4:
fuente: Elaboración propia, datos PSU 2006 y SIMCE 2003.
Ahora cabe hacerse la pregunta, ¿Cómo se seleccionan dentro de los colegios

los alumnos que no rinden la PSU?.
Si los estudiantes fueron elegidos de manera aleatoria dentro de los colegios,
incluirlos en la estimación de una función de producción de educación puede tra-
ducirse en resultados sesgados. Ello, ya que se considerarı́a en menor proporción
a los colegios donde pocos alumnos rindieron la PSU. La solución a este tipo de
problemas se analiza en la literatura, donde se presentan soluciones estadı́sticas
para este problema.13
Suponer una selección aleatoria podrı́a no ser acertado, ya que existirı́a una
lógica en dar o no dar la prueba, que se presentarı́a también en los colegios. Al
observar en los colegios con bajo SIMCE una menor proporción de estudiantes
rindiendo la PSU, podemos pensar que se da la misma lógica para los alumnos
en estos establecimientos. Es decir, los alumnos que rinden la PSU son los que
tienen los mayores puntajes esperados, y los que no la rinden serı́an los que
tendrı́an menores puntajes esperados. Esto podrı́a ocurrir por factores como lo
son los costos de preparar y rendir la prueba, para un alumno que tiene una
PSU esperada muy baja.
Bajo este esquema, si los alumnos que no rindieron la PSU eran los peores
alumnos de sus colegios, los cuales tendrı́an una PSU esperada baja, podemos
pensar que la PSU promedio por colegio está sobre estimada para los establec-
imientos con baja tasa de alumnos en la PSU, siendo estos los colegios munici-
pales. Para solucionar este problema de autoselección necesitamos información
13 Para obtener estimadores insesgados, una solución para este problema serı́a realizar un
OLS generalizado dando más peso a los alumnos cuyos colegios están sub-representados. Una
segunda forma de resolver el problema, es generar alumnos representativos por colegio, y
repetirlos la cantidad de veces que sea necesario para poder obtener la representatividad real
de los alumnos que estudiaron en estos establecimientos. (Esta solución tienen la ventaja de
que dejarı́a los datos aptos para ser evaluados con metodologı́as que corrijan la endogeneidad
en la elección de colegio, tipo Heckits, IV, Matching etc.)
21
sobre todos los estudiantes, incluidos los que no rindieron la PSU, información
con la que no contamos en este trabajo.
Al no poder corregir la autoselección de los alumnos en la PSU, en este
trabajo no se pueden generar conclusiones insesgadas para toda la población
estudiantil o sistema educacional chileno, por lo cual su injerencia se atañe sólo
a los alumnos examinados, es decir, sólo los alumnos que son examinados por
la PSU. Dado lo anterior, los resultados de este trabajo estarı́an sesgados por el
sesgo de selección presente en la PSU. Esta limitación también la tiene el trabajo
de Contreras(2001), el cual ocupa la Prueba de Aptitud Académica (PAA).
Cualquier estudio que no controle el sesgo de selección en la PSU presentara
resultados sesgados. En consecuencia el trabajo desarrollado en esta tesis, al
igual que el de Contreras(2001) no cumple el objetivo de evaluar el sistema de
vouchers en Chile, y los resultados de las estimaciones no pueden ser utilizados
para fundamentar polı́ticas públicas.
5.2. Diferencias con el trabajo de Contreras

En la sección anterior se mostró que una sobre estimación del puntaje PSU
de los colegios municipales explicarı́a un TT y ATE menores a los obtenidos en
la literatura nacional, los cuales en sus estudios utilizan el SIMCE como medida
de rendimiento escolar. Ahora bien, la diferencia entre PSU y SIMCE, y el sesgo
de la PSU, no explica las diferencias de este trabajo con el de Contreras(2001),
el cual usa la PAA para evaluar a los colegios.
Contreras(2001) encuentra mayores puntajes PAA por parte de los establec-
imientos subvencionados, resultado opuesto al encontrado en esta tesis, donde
los colegios municipales serı́an más eficaces. Las principales diferencias de este
trabajo con el de Dante Contreras son: el tipo de prueba, el momento del tiempo,
caracterı́sticas de los alumnos analizados, las variables y método de estimación.
Como se mencionó anteriormente, el trabajo de Contreras se realiza utilizan-
do la PAA, prueba centrada en medir las aptitudes y habilidades desarrolladas
por los alumnos considerando los conocimientos trabajados hasta 8vo año básico.
La PSU, en cambio, busca medir conocimientos mı́nimos desarrollados hasta 4to
año de enseñanza media. Ante lo cual los distintos enfoques de medición de ca-
da una de las pruebas pueden haber afectado el rendimiento de los alumnos de
distintos establecimientos.
En su paper, Contreras considera a los alumnos rezagados como los que
egresarón con más de un año de diferencia de enseñanza media al momento de
rendir la PAA. En la figura 5 podemos ver los puntajes de los individuos que
rindieron la PSU 2006, siendo los alumnos rezagados quienes obtienen en prome-
dio de puntajes más altos, lo que es acorde con los resultados de las regresiones
de Contreras. Este autor utiliza la variable “madurez”, la cual busca contro-
lar hace cuántos años se graduaron los alumnos del colegio y agrega la edad
de los alumnos y su edad al cuadrado. Con estas variables se podrı́a controlar
este factor, pero no hacen interactuar estas variable con las Dummy de colegios
22
subvencionados o particulares pagados.14 La diferencia de resultados podrı́a ser
argumentada en base a un cambio estructural en la educación chilena. Este ar-
gumento pierde fuerza debido a que no se apreciarı́an cambios importantes en
la estructura de la educación recibida por parte de los alumnos.15
Como se menciono anteriormente, obtuvimos LATE, ATE y TT en torno a
-16 . Este resultado está en lı́nea con lo expuesto por Heckman et al (2000),
un LATE levemente distinto a un ATE cuando las variables de exclusión son
las mismas. Ahora bien, las diferencias expuestas por Heckman et al(2000) en
ningún caso son comparables a las diferencias vistas en los resultados de este
trabajo con el de Contreras(2001), y menos explicarı́an un cambio de signo y
las diferencias de magnitud entre los resultados.
Heckman et al. (2000) comentan que las diferencias en los resultados de las
distintas metodologı́as de estimación aumentarán en la medida que la selección
de los modelos, sea más importante. Será la selectividad y la forma de corregirla
por medio de las variables de exclusión una fuente de diferencias, entre este
estudio y el de Contreras(2001).
Las variables de exclusión utilizadas por Contreras(2001) son variables Dum-
my (si hay o no un colegio subvencionado o particular pagado en la comuna).
Cabe señalar que estas variables de exclusión son en extremo simples y entregan
información limitada al sistema de elección de colegios.
Como las diferencias de estimación no parecen ser desde el punto de vista
teórico, éstas podrı́an provenir de (1) la diferencia en las pruebas, (2) un cambio
estructural en la educación, (3) la muestra de los alumnos analizados o (4) las
variables de exclusión usadas.
Con el objetivo de comparar las variables de exclusión tanto de Contreras
(2001) como de este trabajo a continuación desarrollamos un TSLS, utilizando
las variables de exclusion utilizadas por Contreras (2001).
5.3. Análisis a las variables de exclusión

En esta sección se evalúan las variables de exclusión usadas por Contreras
(2001) en su paper. Las variables de exclusión usadas por este autor son variables
binarias que indicaban si habı́an o no colegios p. subvencionados, o particulares
pagados en la comuna.
Variables de Exclusión: Podemos separar las variables de exclusión según
como las han propuesto los autores en la literatura nacional. Primero la utilizada
en esta tesis y luego la utilizada por Contreras(2001).
Sapelli & Vial ⇒ Proporción de colegios subvencionados en la comuna,

14 Los alumnos rezagados son alumnos que deciden volver a intentar ingresar a la educación
superior, estos son alumnos que (1) se auto seleccionaron y esperan obtener un buen resultado
en la prueba (2) pudieron haberse preparado en un instituto o preuniversitario. Ambos puntos
harı́an que la inclusión de estos individuos en el análisis generarán resultados sesgados, tanto
por un efecto de sesgo de selección, como porque no se estarı́an evaluando la calidad de los
colegios, ya que existirı́a un input incontrolable en la educación de los estudiantes.
15 De existir un cambio, este deberı́a haber sido nota por estudios anteriores, basados en la
prueba SIMCE.
23
Proporción de colegios particulares pagados en la comuna
Contreras ⇒ Dummy si hay colegios subvencionados en la comuna,

Dummy si hay colegios particulares pagados en la comuna
En una primera etapa estimamos modelos Mlogit para las Dummy de tipo de
colegio, utilizando las variables de elección de Contreras (2001). Luego, obten-
emos las probabilidades de ser de un tipo de colegio u otro y las integramos a
las regresiones, de modo de completar el TSLS. Finalmente, comparamos estos
resultados con los obtenidos en la sección 4.1.
De los resultados de los Mlogit, se desprende que, en ambos, las variables
de exclusión son significativas y con los signos esperados. Al evaluar los Log
likelihood se encuentra que el MLogit utilizando las variables de exclusión prop-
uestas por Contreras (MLogit Contreras) tiene una Log likelihood -56496.696 y
el Mlogit usando variables de exclusión propuestas por Sapelli & Vial (Mlogit
S&V) tiene una Log likelihood -50265.592, al ser el segundo más cercano a cero,
deberı́amos preferir esta especificación.16
En la Figura 6 se grafican las probabilidades, obtenidas de los Mlogit, de
estar en colegio subvencionado. En color rojo se encuentra la probabilidad de
estar en colegio subvencionado proveniente del MLogit Contreras y en azul del
Mlogit S&V. Estas probabilidades fueron calculadas en una muestra sin alum-
nos de colegio particular pagado (Cuadro 8, regresiones columnas 4 y 5). Vemos
que la distribución de las probabilidades con las variables de exclusión propues-
tas por Contreras están agrupadas en torno a 0.6, no ası́ la distribución de las
variables de exclusión propuestas por Sapelli & Vial, la cual es más uniforme.
Al evaluar las diferencias entre ambas distribuciones se puede presenciar que
Contreras encuentra que hay alumnos que con probabilidad 0 irán a un colegio
subvencionado, lo que es correcto; pero no tiene alumnos con probabilidad entre
0 y 0.22, o con probabilidad mayor a 0.9. Esta no continuidad en la distribución
de probabilidades es difı́cil de justificar, lo que nos hace pensar que es un prob-
lema de especificación. La correlación de ambas probabilidades es de 0.682. Las
diferencias entre ambas probabilidades es importante.
Para evaluar el efecto de estas probabilidades realizamos a continuación las
regresiones. Los resultados de las regresiones son entregados en el Cuadro (8),
donde se incluyen los resultados de la sección 4.1.
16 Se intentó además realizar regresiones tipo Heckman con las variables de exclusión prop-
uestas por Contreras, pero las ecuaciones de selección no convergı́an debido a la no concavidad
de la función de Máxima-Verosimilitud
24
Histograma puntajes PSU segun año de egreso Probabilidad de los alumnos de ir a colegio subvencionado
(En azul egresados 2005, en rojo alumnos rezagados) (Rojo: Exclusión a lo Contreras, Azul: Exclusión a lo Sapelli)
.005
4
.004
3
.003
Density
Density
2
.002
1
.001
0
0
0 .2 .4 .6 .8 1
0 200 400 600 800 Pr(d_suv==1)
Density Density Density Density
Figura 5: Figura 6:
fuente: Elaboración propia, datos PSU 2006.
En la primera columna del Cuadro (8) se entregan los resultados del OLS. En
la segunda columna se entrega un TSLS con variables de exclusión del Mlogit
Contreras, mientras que en la columna tres se muestran los resultados de un
TSLS con variables de exclusión del Mlogit S & V. En las columnas 4 y 5 se
entregan resultados para los TSLS para una muestra sin colegios particulares
pagados.
Al realizar el TSLS con las variables de exclusión del Mlogit Contreras, vemos
que la variable Dummy de colegios subvencionados es positiva y significativa,
condiciones que comparten con la variable dicotómica asociada a los colegios
particulares pagados. Para los TSLS Mlogit S & V obtenemos una dummy de
colegios subvencionados negativa y significativa. El uso de distintas variables de
exclusión generó en un caso un LATE positivo y en el otro caso un LATE negati-
vo. La diferencia en resultados obtenidos por la utilización de distintas
variables de exclusión es dramática, y lleva a conclusiones diametralmente
distintas.
Al revisar los resultados de las columnas (4) y (5), donde se eliminan los
colegios particulares pagados, vemos que los resultados se mantienen.
En el Cuadro (9) se resumen los resultados de este trabajo y el de Contreras
(2001), En la primera parte se entregan los resultados de Contreras(2001) para
la muestra de hombres en la prueba de matemáticas. Además se entregan los
resultados de este trabajo, primero para la muestra completa de los alumnos,
luego se entregan los resultados excluyendo del análisis a los alumnos de colegios
particulares pagados.
25
Cuadro 8: TSLS y variables de exclusión
1 2 3 4 5
Muestra Completa Muestra Sin P. Pagados
OLS TSLS-Contreras TSLS-Sapelli TSLS-Contreras TSLS-Sapelli
nemst 48.044 48.120 48.192 46.478 46.373
(.240) (.245) (.243) (.262) (.262)
Pr(d suv==1) 10.826 40.323 –22.383 49.310 –16.629
(.534) (2.322) (1.289) (2.285) (1.279)
Pr(d pp==1) 68.248 97.007 83.595
(1.011) (3.789) (2.648)
edu padre sin –25.799 –22.390 –29.302 –21.424 –29.071
(3.197) (3.262) (3.239) (3.284) (3.282)
edu padre basica in –17.909 –14.917 –20.844 –13.278 –19.701
(1.034) (1.073) (1.053) (1.077) (1.062)
edu padre basica –14.640 –12.442 –16.501 –10.825 –15.439
(1.034) (1.062) (1.050) (1.069) (1.062)
edu padre media in –8.042 –6.631 –8.683 –5.257 –7.972
(.833) (.853) (.846) (.859) (.857)
edu padre tecnica in 17.556 16.039 19.107 18.741 22.231
(2.507) (2.553) (2.538) (2.701) (2.704)
edu padre tecnica 14.202 12.287 16.521 14.874 19.718
(1.149) (1.179) (1.166) (1.264) (1.259)
edu padre univ 16.280 15.495 14.575 21.708 22.632
(.866) (.904) (.885) (1.026) (1.027)
edu padre univ in 20.558 19.882 19.977 25.722 26.806
(1.177) (1.202) (1.193) (1.332) (1.334)
edu padre otro 1.900 .581 2.023 2.333 5.336
(1.696) (1.729) (1.719) (1.946) (1.947)
edu madre sin –33.329 –29.289 –37.774 –27.958 –37.108
(4.408) (4.495) (4.465) (4.547) (4.547)
edu madre basica in –28.378 –24.018 –32.460 –21.849 –31.164
(1.021) (1.082) (1.048) (1.088) (1.056)
edu madre basica –21.540 –18.494 –23.972 –16.743 –23.089
(1.002) (1.039) (1.022) (1.046) (1.032)
edu madre media in –13.129 –11.269 –13.837 –10.070 –13.628
(.778) (.802) (.793) (.807) (.802)
edu madre tecnica in 17.779 16.789 18.934 17.578 20.106
(2.486) (2.530) (2.517) (2.707) (2.711)
edu madre tecnica 16.023 14.039 17.109 16.853 21.805
(1.026) (1.052) (1.043) (1.161) (1.154)
edu madre univ 20.080 19.289 18.014 23.233 24.086
(.886) (.932) (.908) (1.066) (1.067)
edu madre univ in 18.606 17.540 17.044 22.175 23.908
(1.360) (1.400) (1.383) (1.630) (1.632)
edu madre otro 5.300 3.986 4.318 5.719 8.297
(1.904) (1.946) (1.932) (2.247) (2.250)
Ingreso 1 18.081 19.369 20.794 19.954 19.834
(6.025) (6.137) (6.102) (6.474) (6.484)
Ingreso 2 42.425 38.087 48.212 36.372 47.562
(6.031) (6.146) (6.107) (6.494) (6.496)
Ingreso 3 58.134 49.496 53.519 48.443 66.480
(6.098) (6.299) (6.216) (6.624) (6.614)
Ingreso 4 66.668 56.322 52.114 53.840 75.621
(6.221) (6.647) (6.425) (7.090) (7.074)
Ingreso 5 71.315 60.707 52.330 53.295 73.884
(6.310) (6.862) (6.560) (7.790) (7.780)
Ingreso 6 89.425 78.561 67.146 58.708 76.611
(6.224) (6.894) (6.516) (7.887) (7.883)
genero –21.733 –22.247 –21.141 –21.521 –20.138
(.478) (.488) (.484) (.524) (.524)
Constant 458.512 442.613 471.281 435.598 467.575
(6.019) (6.215) (6.128) (6.557) (6.503)
Adj. R2 .470 .451 .457 .361 .359
No. of cases 105126 105126 105126 90676 90676
26
Cuadro 9: Comparación Resultados
Metodologia ATE TT LATE Subv LATE PP
Contreras (2001) * [
OLS PAA 1998 13.7 48.7
TSLS PAA 1998 89 130.3
Regresiones Actuales
Muestra Completa
OLS PSU 2006 10.8 68.2
TSLS Mlogit Contreras PSU 2006 40.3 97
TSLS Mlogit S & V PSU 2006 -22.4 83.5
Muestra Sin P.Pagados
Heckman PSU 2006 -14.8 -16.1
TSLS Mlogit Contreras PSU 2006 49.3
TSLS Mlogit S & V PSU 2006 -16.6
*Prueba Matemáticas
[ Hombres
Dejaremos momentáneamente de lado el sesgo en la PSU, causado por el

proceso de autoselección, para poder leer de manera simple los resultados del
Cuadro(9).
En el Cuadro (9) están expuestos los resultados del trabajo de Contreras(2001),
el cual obtiene un LATE de 89 para colegios subvencionados, que postula una
mayor eficacia por parte de los colegios subvencionados. Contreras, basado en
estos resultados, postula que el sistema de vouchers ayuda a la movilidad social
y deberı́a ser promovido.
En la segunda parte del Cuadro (9) vemos los resultados de este trabajo con
una muestra completa de colegios: Para el TSLS Mlogit Contreras obtenemos
LATE de 40.3 para colegios subvencionados. Este resultados nos dicen que los
colegios subvencionados son más eficaces que los municipales en la entrega de
puntaje de la PSU.17
En la tercera parte del Cuadro (9) vemos los resultados de la metodologı́a
Heckman y de los TSLS Mlogit S & V. En ellos podemos ver un LATE, ATE y
TT de -16.6, 14.8 y 16.1 respectivamente. Lo último indicarı́a que los colegios
subvencionados son menos eficaces que los municipales, llevando a conclusiones
de polı́ticas públicas opuestas a las de Contreras(2001).18
Las diferencias entre el LATE para colegios subvencionados (LATE Subv)
de los TSLS Mlogit Contreras y el TSLS Mlogit S & V, en ambas muestras, son
extremas, y nos hacen pensar que uno de los Mlogits puede no ser el correcto,
ya que las únicas diferencias de los TSLS son las variables de exclusión en los
Mlogit.
17 Esto, dejando de lado que la PSU está sesgada por un proceso de autoselección.
18 Nuevamente, asumiendo que la PSU está exenta de sesgo por un proceso de autoselección.
27
El Mlogit Contreras usa una variable binaria si hay o no colegios subven-
cionados en la comuna y el TSLS Mlogit S & V usa una variable correspondiente
a la proporción de alumnos que van a colegios subvencionados en la comuna. En
un caso tenemos variables de exclusión que contienen menor información que en
el otro, generando fuertes alteraciones en los resultados.
Por todo lo expuesto, podemos concluir que la definición de las variables de
exclusión, y no el método de estimación, es la mayor la causante de las discrep-
ancias de este trabajo y el de Contreras (2001). Dejamos de lado, entonces, la
diferencia en las pruebas, un cambio estructural en la educación o problemas en
la muestra de los alumnos analizados, como fuentes primordiales de diferencias
de este trabajo con el de Contreras (2001).
Con respecto a estas diferencias, los Mlogit asignan probabilidades distintas
a los individuos en diferentes localidades. Esto generará LATEs distintos en
ambas estimaciones, entonces, cada LATE se referirá a alumnos con distintas
caracterı́sticas: evaluando localidades que pueden no ser las más adecuadas para
estudiar la eficacia del sistema de vouchers en Chile. En un caso podemos estar
evaluando alumnos que presentarı́an mejoras importantes por cambiarse de un
colegio municipal a uno subvencionado, y en el otro estamos evaluando alumnos
que tienen mejor desempeño en colegios municipalizados.
Encontrar distintas eficacias en la entrega de educación en localidades distin-
tas es algo presente en la literatura nacional. Al analizar el efecto del sistema de
vouchers, Tokman (2002) encuentra que los colegios municipales son eficientes
entregando educación a alumnos de estratos socioeconómicos más bajos.
Una desventaja de las regresiones realizadas por Contreras(2001), es que no
obtiene ecuaciones de producción distintas para cada tipo de establecimiento, lo
que le impide tener diferencias en pendiente y/o evaluar si un tipo de establec-
imiento es más eficaz al educar a un tipo de estudiante u a otro. 19 De este
modo, el autor sólo obtiene una diferencia promedio de productividades entre
ambos establecimientos (LATE) con la cual no puede estimar las diferencias en
la educación para subgrupos.
La distribución de las probabilidades obtenidas por el Mlogit-Contreras, el
cual usa variables de exclusión binarias, parece no ser la correcta. Esto, porque
la distribución no es contı́nua, lo que es muy difı́cil de argumentar. Se estarı́a
analizando ası́ una localidad que no es relevante o de interés para un estudio
que desea evaluar el universo completo de colegios subvencionados y munici-
pales. La elección de las variables de exclusión en el trabajo de Contreras (2001)
redundarı́a en la evaluación una localidad que no cumplirı́a los objetivos de su
estudio.
Además, nuestros resultados sugieren que la elección de las variables de ex-
clusión por parte de Contreras(2001) lleva a su estudio a concluir que los colegios
subvencionados son muy exitosos en la obtención de resultados en la PAA, más
que compensando el sesgo presente las pruebas de selección universitaria.
19 Mediante TSLS es posible evaluar cambios en las pendientes de producción mediante la
interacción de las variables (variables multiplicativas). Es entonces un problema de especifi-
cación y no de metodologı́a.
28
Del análisis descrito, podemos decir entonces que el sesgo de selección en la
PAA (PSU) y una deficiente elección de variables de exclusión lleva a Contreras
(2001) a entregar propuestas de polı́ticas públicas en el sentido correcto, pero
en base a evidencia equivocada.
29
6. Conclusiones
En este trabajo se analizó la investigación de Contreras (2001), la cual evalúa
la eficacia en la entrega de educación por parte de los colegios, utilizando la
PAA. Se compararon sus resultados con los obtenidos en la literatura nacional,
encontrándose que eran atı́picos. Éstos postulaban una mayor eficacia para los
colegios municipales, al contrario de lo que indica la evidencia disponible.
Este estudio replica y actualiza la metodologı́a de estimación utilizada por
dicho autor (usando la PSU), además de evaluar distintas variables de exclusión.
Adicionalmente, se compara lo anterior con las metodologı́a desarrollada en el
trabajo de Tokman (2002).
En una primera etapa se contraponen distintos métodos de estimación para
comparar el desempeño de colegios municipales y particulares subvencionados
de acuerdo a la PSU. En particular, se realizan dos tipos de regresiones; de
Mı́nimos Cuadrados en dos Etapas , y regresiones usando la metodologı́a de
Heckman (1979). Con ambos métodos se corrige la endogeneidad en la elección
de colegios.
Los resultados indican que las variables de exclusión, y no la metodologı́a de
estimación, son la fuente principal de diferencias en los resultados de este traba-
jo con el de Contreras (2001). Las distintas elecciones de variables de exclusión
pueden llevar a que estudios similares obtengan resultados diametralmente difer-
entes, lo podrı́a redundar en propuestas de polı́ticas públicas erróneas.
Por último, una debilidad que comparte este trabajo con el de Contreras
(2001) consiste en que no se pueden utilizar las pruebas de selección universitaria
para evaluar el desempeño de los establecimientos de todo el sistema, debido al
proceso de autoselección por parte de los alumnos que rinden la PSU (PAA).
Este sesgo generarı́a entonces resultados a favor de los colegios municipales. Ası́,
esta Tesis, al igual que el trabajo de Contreras (2001) analiza una muestra que
no representa al sistema de vouchers chileno completo.
30
Referencias
[1] Benavente J.M., Meller, P. y D. Rappoport, “Ranking de las Universidades
Chilenas según los Ingresos de sus Titulados ”, Documento de Trabajo No
306, Banco Central de Chile, Diciembre. Artı́culo en revision Economics
of Education Review (2004).
[2] Beyer, Harald, “Educación y desigualdad de ingresos: una nueva mirada ”,
Estudios Publicos n. 77 (2000).
[3] Bravo D. y A.Marinovic, “La educación en Chile: una mirada desde la
economia, Persona y sociedad, ”, Ilades, 155-165 (1997)
[4] Contreras, Dante “Evaluating a Voucher System in Chile. Individual, Fam-
ily and School Characteristics”, Working Paper No. 175, Facultad de Cien-
cias Económicas y Administrativas, Universidad de Chile, March (2001).
[5] Contreras, D., Bustos, S. y P. Sepulveda, “When schools are the ones that
choose: the effect of screening in Chile”, Series Documentos de Trabajo
del Departamento de Economia de la Universidad de Chile No 242, junio
(2007).
[6] Heckman, Jame, “Sample Selection Bias as a Specification Error”, Econo-
metrica, Econometric Society, vol. 47(1), pages 153-61, (1979)
[7] Heckman, J., J. Tobias & E. Vytlacil, “Simple Estimators Treatment Pa-
rameters in a latent variable framework with an application estimating the
returns to schooling”, NBER Working Paper 7950, (2000).
[8] Mizala, A., & Romaguera, P. , “School performance and choice”, Journal
of Human Resources, 35(2), 392-417. (2000a)
[9] Mizala, A., & Romaguera, P. , “Determinación de factores explicativos de
los resultados escolares en educación media en Chile”, Serie Economı́a No
85, Centro de Economı́a Aplicada, Departamento de Ingenierı́a Industrial,
Facultad de Ciencias Fı́sicas y Matemáticas, Universidad de Chile. (2000b)
[10] Sapelli, C. & Vial, B., “The performance of private and public schools in
the chilean voucher system”, Cuadernos de Economı́a, 39(118), 423-454.
(2002)
[11] Sapelli, C. & Vial,B., “Private vs public voucher schools in Chile: New
evidence on efficiency and peer effects”, Documento de trabajo N◦ 289,
Instituto de Economı́a, P. Universidad Católica de Chile (2004)
[12] Sapelli, Claudio (2003), “Ecuaciones de Mincer y las tasas de retorno a la
educación en en Chile: 1990-1998. ” Documento de Trabajo IE-PUC, N◦
254, (2003)
31
[13] Tokman, Andrea “Is Private Education Better? Evidence from Chile”,
Working Papers Central Bank of Chile, No. 147, Central Bank of Chile,
(2002).
7. Anexo
7.1. Tablas Descriptivas
Cuadro 10: Descripcion Datos

Variables PP SUV MUV
nemst -0.00 0.00 -0.00
simce 310.15 267.56 247.62
edu padre sin 0.00 0.00 0.01
edu padre basica in 0.00 0.06 0.13
edu padre basica 0.01 0.06 0.10
edu padre media in 0.01 0.11 0.15
edu padre media 0.01 0.01 0.01
edu padre tecnica in 0.06 0.07 0.03
edu padre tecnica 0.30 0.49 0.46
edu padre univ 0.50 0.13 0.06
edu padre univ in 0.08 0.05 0.03
edu padre otro 0.04 0.02 0.01
edu madre sin 0.00 0.00 0.01
edu madre basica in 0.00 0.06 0.14
edu madre basica 0.01 0.06 0.11
edu madre media in 0.01 0.13 0.17
edu madre media 0.01 0.01 0.01
edu madre tecnica in 0.11 0.09 0.04
edu madre tecnica 0.35 0.49 0.44
edu madre univ 0.39 0.11 0.06
edu madre univ in 0.08 0.03 0.02
edu madre otro 0.03 0.02 0.01
Ingreso 1 0.04 0.51 0.75
Ingreso 2 0.25 0.40 0.23
Ingreso 3 0.24 0.07 0.02
Ingreso 4 0.15 0.01 0.00
Ingreso 5 0.11 0.01 0.00
Ingreso 6 0.20 0.00 0.00
genero 0.49 0.55 0.55
PSU 597.33 489.87 460.94
7.2. Regresiones Mlogit

Se adjuntan los resultados de las ecuaciones Mlogit, correspondientes a re-
gresiones para toda la población estudiantil analizada.
32
Cuadro 11: MLOGIT y variables de exclusión
Mlogit Contreras Mlogit S & V
Selección Subv Selección PP Selección Subv Selección PP
Coef./se Coef./se Coef./se Coef./se
nemst .010 –.083 .002 –.077
(.007) (.013) (.007) (.013)
edu padre sin –.380 –.348 –.414 –.244
(.096) (.389) (.102) (.381)
edu padre basica in –.351 –.795 –.330 –.752
(.030) (.161) (.031) (.157)
edu padre basica –.229 –.605 –.221 –.584
(.029) (.122) (.031) (.123)
edu padre media in –.119 –.793 –.145 –.723
(.023) (.090) (.025) (.091)
edu padre tecnica in .190 .210 .244 .197
(.068) (.122) (.074) (.129)
edu padre tecnica .296 .113 .298 .229
(.032) (.053) (.034) (.055)
edu padre univ –.103 .569 –.045 .545
(.024) (.036) (.026) (.038)
edu padre univ in –.018 .427 .050 .417
(.032) (.051) (.035) (.054)
edu padre otro .092 .405 .118 .363
(.047) (.070) (.050) (.075)
edu madre sin –.627 .329 –.611 .320
(.131) (.419) (.141) (.412)
edu madre basica in –.514 –1.096 –.513 –1.096
(.029) (.166) (.031) (.164)
edu madre basica –.314 –.919 –.305 –.914
(.028) (.122) (.030) (.123)
edu madre media in –.132 –1.034 –.133 –.934
(.021) (.081) (.023) (.082)
edu madre tecnica in .148 .139 .220 .138
(.068) (.118) (.073) (.122)
edu madre tecnica .185 .335 .253 .330
(.028) (.045) (.030) (.047)
edu madre univ –.155 .591 –.016 .518
(.025) (.035) (.027) (.037)
edu madre univ in –.085 .631 .052 .527
(.038) (.055) (.041) (.058)
edu madre otro –.017 .549 .062 .441
(.053) (.075) (.058) (.081)
Ingreso 1 .249 –1.360 .467 –1.395
(.160) (.257) (.180) (.272)
Ingreso 2 .745 .389 1.001 .380
(.160) (.254) (.181) (.270)
Ingreso 3 .057 1.998 .413 1.900
(.162) (.255) (.182) (.271)
Ingreso 4 –.784 3.029 –.389 2.824
(.166) (.258) (.187) (.274)
Ingreso 5 –1.383 3.670 –.824 3.276
(.173) (.262) (.194) (.278)
Ingreso 6 –2.089 4.421 –1.245 3.606
(.174) (.263) (.195) (.278)
n c grupo familiar –.012 –.152 –.005 –.141
(.003) (.007) (.004) (.007)
ddsuv 20.339 –1.350
(.160) (.171)
ddpp –.428 4.403
(.018) (.194)
genero .084 –.011 .130 –.065
(.013) (.025) (.014) (.027)
psuv 7.185 –7.028
(1.257) (2.271)
pmun 2.752 –6.280
(1.254) (2.268)
ppp 1.917 –2.064
(1.251) (2.254)
Constant –20.202 –5.016 –5.110 3.920
(.000) 33
(.336) (1.265) (2.278)
No. of cases 105126 105126 105126 105126

Evaluacion Al Sistema de Vouchers Chileno Por Medio de La Psu

Загружено:

Сведения о документе

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Evaluacion Al Sistema de Vouchers Chileno Por Medio de La Psu

Загружено:

Авторское право:

Доступные форматы

SEMINARIO DE TÍTULO

TÍTULO DE INGENIERO COMERCIAL

EVALUACIÓN DEL SISTEMA DE VOUCHERS

En esta tesis se analiza una investigación, la cual obtiene resultados atı́picos

5. Discusión de los resultados 19

mación de los errores estándares y el cálculo del ATE y TT

Autor Estimación Prueba ATE / SD TT / SD LATE /SD

Mizala & Romaguera (2000a) OLS SIMCE 0

En el Cuadro (1) se resumen los trabajos de la literatura nacional reciente.

Cuadro 2: Datos por tipo de colegio

fuente: Elaboración propia

Para facilitar la interpretación de los resultados en este trabajo generamos

4.1. Regresiones con IV/TSLS

• Estimación del Mlogit.

en la Comuna), y de manera análoga para los colegios municipales

4.2. Regresiones tipo Heckman

P SUi = βi + β1,i X + µi (2)

Con X =variables de contexto del alumno y el colegio.

Cuadro 5: Regresiones Modelo 1 y 2: PSU 2006

PP Subv Mun Subv Mun

PP Subv Mun Subv Mun

PP Subv Mun Subv Mun

4.3. Tratamiento promedio (ATE) y de los Tratados (TT)

La obtención de la estimación del (TT) la hacemos evaluando la ganancia

T Ti = E(4 | D(Z) = 1)=Xt (βi - βj )

Cuadro 6: Tratamiento promedio (ATE) y de los Tratados (TT)

* SD. Calculada usando Bootstrap noparametrico N=1000

4.4. Test de Hausman

• Z=X+ Variables de exclusión verdaderas

Cuadro 7: Test de Hausman

fue confirmada al autor por Justin L. Tobias, co-autor de J. Heckman y E. Vytlacil

5.1. Merma en datos PSU y SIMCE

subvencionados municipales subvencionados municipales

fuente: Elaboración propia, datos PSU 2006 y SIMCE 2003.

fuente: Elaboración propia, datos PSU 2006 y SIMCE 2003.

Ahora cabe hacerse la pregunta, ¿Cómo se seleccionan dentro de los colegios

5.2. Diferencias con el trabajo de Contreras

5.3. Análisis a las variables de exclusión

Sapelli & Vial ⇒ Proporción de colegios subvencionados en la comuna,

Contreras ⇒ Dummy si hay colegios subvencionados en la comuna,

Density Density Density Density

fuente: Elaboración propia, datos PSU 2006.

Metodologia ATE TT LATE Subv LATE PP

Dejaremos momentáneamente de lado el sesgo en la PSU, causado por el

Cuadro 10: Descripcion Datos

7.2. Regresiones Mlogit

Вам также может понравиться