Вы находитесь на странице: 1из 32

Página 1

Journal of Economic Perspectives-Volumen 31, Número 2-Primavera 2017-


Páginas 125-144
A s the Stones 'Age dio paso a la era de la informática, la econometría aplicada fue
principalmente preocupado por estimar los parámetros que gobiernan
ampliamente
descripción teórica de la economía. Ejemplos canónicos incluyen multi-
modelos macro de ecuaciones que describen variables de toda la economía
como el desempleo y
producción y micro modelos que caracterizan las elecciones de agentes
individuales o
equilibrios de nivel. El marco empírico de los años 60 y 70 típicamente
buscaba
explicar los resultados económicos con la ayuda de una lista larga y diversa de
explicaciones
variables, pero ninguna variable individual de especial interés.
Gran parte de la agenda empírica contemporánea busca responder preguntas
específicas
ciones, en lugar de proporcionar una comprensión general de, por ejemplo, el
crecimiento del PIB. Esta
agenda se enfoca en los efectos causales de un solo factor, como los efectos de
la inmigración.
sobre los salarios o los efectos de la democracia en el crecimiento del PIB, a
menudo centrándose en la política
preguntas como los efectos en el empleo de los subsidios para pequeñas
empresas o los efectos
de la política monetaria. Los investigadores aplicados hoy buscan estrategias
creíbles para responder
tales preguntas.
La economía empírica ha cambiado notablemente en las últimas décadas,
pero, como nosotros
documento a continuación, la instrucción econométrica ha cambiado
poco. Economía líder en el mercado
textos de métricas todavía se centran en suposiciones y preocupaciones
motivadas por un modelo impulsado
enfoque a la regresión, destinado a ayudar a los estudiantes a producir una
estadística estadísticamente precisa
Instrucción de Econometría de Pregrado:
A través de nuestras clases, oscuramente
■ Joshua D. Angrist es profesor de Economía de Ford, Instituto de Tecnología de Massachusetts,
Cambridge, Massachusetts. Jörn-Steffen Pischke es profesor de economía,
London School
de Economics, Londres, Reino Unido. Sus direcciones de correo electrónico
son angrist@mit.edu y
s.pischke@lse.ac.uk.
† Para materiales complementarios, tales como apéndices, conjuntos de datos y declaraciones de divulgación del autor, vea el
página del artículo en
https://doi.org/10.1257/jep.31.2.125
doi = 10.1257 / jep.31.2.125
Joshua D. Angrist y Jörn-Steffen Pischke

Página 2
126 Journal of Economic Perspectives
cuenta de los procesos que generan resultados económicos. Gran parte de este
material
prioriza las preocupaciones técnicas sobre asuntos conceptuales. Todavía
vemos, por ejemplo,
discusiones extensas de libros de texto de forma funcional, supuestos de
distribución y
cómo corregir la correlación serial y la heterocedasticidad. Sin embargo, esta
instrucción
El edificio no es de importancia primaria para la agenda empírica moderna. Al
mismo
herramientas de tiempo, más nuevas y ampliamente utilizadas para el análisis
causal, como diferencias en las diferencias
y métodos de discontinuidad de regresión, obtengan un tratamiento de libros
de texto rápido si están
mencionado en absoluto.
¿Cómo deberían cambiar los cambios en nuestro uso de econometría la forma
en que enseñamos?
¿econometría?
Nuestra opinión sobre esto es simple. Comenzamos con estrategias empíricas
basadas en
ensayos y métodos cuasi-experimentales porque proporcionan una plantilla
que
revela los desafíos de la inferencia causal, y la forma en que econométrica
las herramientas cumplen estos desafíos. Llamamos a este marco
el enfoque basado en el diseño para
econometría porque las habilidades y estrategias requeridas para usarlo con
éxito son
relacionado con el diseño de investigación. Este punto de vista conduce a
nuestra primera prescripción concreta
para cambio de instrucción: una revisión de la manera en que enseñamos la
regresión.
La regresión debería enseñarse de la manera que ahora se usa con más
frecuencia: como una herramienta para
control de los factores de confusión. Este enfoque abandona la regresión
tradicional
marco en el que todos los regresores son tratados por igual. El énfasis
pedagógico en
la eficiencia estadística y la forma funcional, junto con la narración
sophomoric que
pone a los estudiantes en busca de "modelos verdaderos" como se define por
una estadística aparentemente precisa
ajuste tical, está listo para la jubilación. En cambio, el foco debe estar en el
conjunto de control
variables necesarias para asegurar que el efecto de regresión estimada de la
varianza económica
capaz de interés tiene una interpretación causal.
Además de una revisión radical de la pedagogía de regresión, el crecimiento
exponencial
en el uso de los economistas de métodos cuasiexperimentales y ensayos
aleatorios en seguimiento
de los efectos causales deben mover estas herramientas al centro del escenario
en el aula. los
el enfoque basado en el diseño enfatiza la estimación de variables
instrumentales de una sola ecuación
métodos de regresión-discontinuidad y variaciones en diferencias-en-
diferencias
estrategias, centrándose en amenazas específicas a una interpretación causal
de la
estimaciones generadas por estas herramientas fundamentales.
Finalmente, el trabajo empírico real juega un papel central en nuestras
clases. Econometría es
mejor enseñado por el ejemplo que la abstracción.
Las preguntas causales y el diseño de investigación no son el único tipo de
trabajo econométrico
eso sigue siendo relevante. Pero nuestra experiencia como profesores e
investigadores nos lleva a
enfatiza estas habilidades en el aula. Por un lado, tales habilidades ahora están
mucho en
demanda: las postulaciones de Google y Netflix marcadas por palabras clave
como infidelidad causal
efectividad, diseño experimental y eficacia publicitaria; Ciencia de datos de
Facebook
el equipo se enfoca en ensayos controlados aleatorios e inferencia
causal; Amazon ofrece
empleados potenciales una pista de evaluación de forma / causal / programa
reducida . 1
1 Ver también las descripciones del trabajo econométrico moderno del sector privado en Ayres (2007), Brynjolfsson y
McAfee (2011), Christian (2012) y Kohavi (2015).
Página 3
Joshua D. Angrist y Jörn-Steffen Pischke 127
Por supuesto, hay econometría para hacer más allá de la aplicación micro
aplicada
cationes de interés para Silicon Valley y la economía laboral empírica con
estamos personalmente más comprometidos. Pero las herramientas que
favorecemos son fundamentales para casi
cualquier agenda empírica. Discusiones profesionales de eventos económicos
importantes como el
La gran recesión y las importantes fusiones de telecomunicaciones son casi
siempre
sobre los efectos causales. Del mismo modo, Janet Yellen y los cientos de
investigadores
quienes la apoyan en la Reserva Federal ansían evidencia confiable sobre
si X causa Y. Puramente
la investigación descriptiva sigue siendo importante, y hay un papel para el
fundición. Los econometristas aplicados se han dedicado desde hace tiempo a
estas áreas, pero estos
habilidades valiosas son el pan de cada día de disciplinas como las estadísticas
y, cada vez más,
Ciencias de la Computación. Estos esfuerzos no son donde nuestra ventaja
comparativa como
los economistas mienten. Econometría en su mejor momento se distingue de
otras ciencias de datos
por un claro pensamiento causal. Este tipo de pensamiento es, por lo tanto, lo
que enfatizamos en nuestro
clases
Después de una breve descripción del cambio hacia el trabajo empírico basado
en el diseño,
desarrollamos el argumento del cambio considerando los fundamentos de la
economía
instrucción métrica, centrándose en enfoques antiguos y nuevos para la
regresión. Entonces miramos
en una colección de libros de texto clásicos y contemporáneos, y una muestra
de contempo-
rary leyendo listas y esquemas de cursos. Las listas de lectura en nuestra
muestra son más propensas a
cubra los métodos empíricos modernos que son los libros líderes en el
mercado actual. Pero más
los cursos permanecen empantanados en material técnico aburrido y obsoleto.
Buenos y malos tiempos
El crecimiento exponencial en el uso de métodos cuasiexperimentales por
parte de los economistas
y los ensayos aleatorizados están documentados en Panhans y Singleton (de
próxima aparición).
Angrist y Krueger (1999) describieron una tendencia empírica anterior para la
economía laboral,
pero esta tendencia ahora se ve en campos microeconómicos aplicados de
manera más amplia. En un ensayo
en el cambio de trabajo empírico (Angrist y Pischke 2010), nos quejamos de
la
moderna agenda de investigación macro, por lo que estamos felices de ver
avances recientes basados en el diseño
incluso en macroeconomía empírica (como se describe en Fuchs-Schündeln y
Hassan
2016). Bowen, Frésard y Taillard (de próxima publicación) informan sobre la
aceleración de la adopción
ción de métodos cuasiexperimentales en las finanzas corporativas empíricas.
El análisis empírico basado en el diseño naturalmente enfoca la atención del
analista en el
herramientas econométricas presentadas en este trabajo. Una consecuencia
intelectual menos obvia
del cambio hacia la investigación impulsada por el diseño es un cambio en la
forma en que usamos nuestro lineal
Caballo de batalla de regresión.
Documentos de ayer (y de hoy)
La interpretación cambiada de las estimaciones de regresión se ejemplifica en
contraste entre dos estudios de producción educativa, Summers y Wolfe
(1977)
y Dale y Krueger (2002). Ambos trabajos se refieren al papel de las escuelas
en la generación de capital humano: Summers y Wolfe con los efectos de la
elemental

Página 4
128 Journal of Economic Perspectives
características de la escuela en el rendimiento del estudiante; Dale y Krueger
con los efectos de
características de la universidad en las ganancias de los graduados. Estas
preguntas son similares en
naturaleza, pero los análisis en los dos documentos difieren notablemente.
Summers y Wolfe (1977) interpretan que su misión es modelar el
proceso complejo que genera logros estudiantiles. Comienzan con un general
modelo de producción educativa que incluye características no especificadas
de los estudiantes,
características del docente, insumos escolares y composición por pares. El
modelo es flojo
motivado por un llamado a la teoría del capital humano, pero los autores
reconocen
borde que los detalles de cómo se produce el logro siguen siendo
misteriosos. Qué
se destaca en este marco la falta de especificidad: los regresos de Summers y
Wolfe
sion pone el cambio en los puntajes de los exámenes de 3 ° a 6 ° grado en el
lado izquierdo, con
una lista de 29 características de estudiantes y escuelas a la derecha. Esta lista
incluye familia
ingresos, IQ de los estudiantes, sexo y raza; la calidad de la universidad a la
que asiste el maestro
y experiencia del maestro; tamaño de la clase e inscripción escolar; y medidas
de pares
composición y comportamiento.
El documento de Summers y Wolfe (1977) es fiel a la misión empírica de los
años setenta.
la búsqueda de un verdadero modelo con un gran número de variables
explicativas:
Confiamos en que los coeficientes describan de manera razonable la relación
nave entre logro y GSES [dotación genética y socioeconómica
estado], TQ [calidad del docente], SQ [calidad de la escuela no docente] y PG
[igual
características del grupo], para esta colección de 627 estudiantes de escuela
primaria.
En el espíritu de los análisis de regresión de amplio alcance de su tiempo,
Summers y
Wolfe no ofrece ningún lugar de honor a ningún conjunto particular de
variables. Al mismo tiempo,
su narrativa interpreta las estimaciones de regresión como la captura de
efectos causales. Dibujan
conclusiones de políticas a partir de resultados empíricos, sugiriendo, por
ejemplo, que las escuelas no
use el puntaje del Examen Nacional de Maestros para guiar las decisiones de
contratación.
Esta interpretación de la regresión está en el espíritu de Stones 'Age
economet-
rics, que generalmente comienza con una ecuación de regresión lineal
destinada a describir un
proceso económico, lo que algunos llamarían una "relación estructural".
Muchos autores de este
La edad continúa diciendo que para obtener estimaciones imparciales o
consistentes, el analista
debe suponer que los errores de regresión son independientes de media de los
regresores. Pero desde
todas las regresiones producen un residuo con esta propiedad de
ortogonalidad, para cualquier regresor
incluido en el modelo, es difícil ver cómo esta afirmación promueve el
pensamiento claro
sobre los efectos causales.
La investigación de Dale y Krueger (2002) también comienza con una
pregunta
acerca de las escuelas, preguntando si los estudiantes que asisten a una
universidad más selectiva ganan
más como resultado, y, como Summers y Wolfe (1977), usa mínimos
cuadrados ordinarios
métodos de regresión para construir una respuesta. Sin embargo, el análisis
aquí difiere en tres
formas importantes. El primero es un enfoque en efectos causales específicos:
no hay ningún esfuerzo para
"Explique los salarios". El estudio de Dale y Krueger compara a los
estudiantes que asisten a más-
y universidades menos selectivas. Calidad de la universidad (medida por el
puntaje SAT promedio de las escuelas)
es solo un factor que puede cambiar los salarios, seguramente menor en
un sentido R 2 . Esto altamente

Página 5
Instrucción de Econometría de pregrado: a través de nuestras clases,
oscuramente 129
la investigación enfocada se justifica por el hecho de que el análisis aspira a
responder una causal
cuestión de preocupación para los estudiantes, padres y políticos.
La segunda característica distintiva es una estrategia de investigación
destinada a eliminar
sesgo de selección: los graduados de las escuelas de élite sin duda ganan más
(en promedio)
que aquellos que fueron a otro lado. Dado que las escuelas de élite seleccionan
el cuidado de sus estudiantes
completamente, sin embargo, está claro que esta diferencia puede reflejar un
sesgo de selección. The Dale y
El artículo de Krueger (2002) bosqueja una estrategia de investigación de
selección en observables
para superar este problema central.
El diseño de investigación de Dale y Krueger (2002) compara las personas
que enviaron
aplicaciones al mismo conjunto de universidades y recibió las mismas
decisiones de admisión.
Dentro de los grupos definidos por las decisiones de solicitud y admisión, los
estudiantes que asisten
diferentes tipos de escuelas son mucho más similares de lo que serían en un
irrestricto
muestra. El estudio de Dale y Krueger argumenta que cualquier variación
dentro del grupo restante
en la selectividad de la escuela a la que asistió es esencialmente fortuito, tan
bueno
como asignados aleatoriamente y, por lo tanto, no relacionados con la
capacidad, la motivación, el respaldo familiar
suelo y otros factores relacionados con el potencial de ganancias
intrínsecas. Este argumento
constituye el contenido econométrico más importante del documento de Dale
y Krueger.
Una tercera característica importante del estudio de Dale y Krueger (2002) es
una clara
distinción entre causas y controles en el lado derecho de las regresiones
en el corazón de su estudio. En el paradigma moderno, los regresores no son
todos creados
igual. Más bien, se considera que solo una variable a la vez tiene efectos
causales. Todos los otros
son los controles incluidos en el servicio de esta agenda causal enfocada. 2
En producción educativa, por ejemplo, coeficientes sobre variables
demográficas y
es poco probable que otras características de los estudiantes tengan una
interpretación económica clara. por
ejemplo, ¿qué deberíamos hacer con el coeficiente de IQ en los primeros
Summers-Wolfe
¿regresión? Este coeficiente revela solo que dos medidas de habilidad
intelectual-
IQ y la variable dependiente: se correlacionan positivamente después del
ajuste de regresión
para otros factores Por otro lado, características del entorno escolar, como
clase
tamaños, a veces pueden ser cambiados por los administradores de la
escuela. De hecho, es posible que deseemos
considerar las implicaciones de los coeficientes de tamaño de clase para la
política educativa.
La distinción moderna entre variables causales y control en el derecho
lado de la mano de una ecuación de regresión requiere suposiciones más
matizadas que la
declaración general de ortogonalidad de regresión-error que es emblemática
de la tradición
presentación econométrica regional de la regresión. Esta diferencia en los
roles entre
las variables de la mano derecha que pueden ser causales y las que son solo
controles deberían
emerger claramente en las historias de regresión que les contamos a nuestros
estudiantes.
Fuera de control
El paradigma econométrico moderno ejemplificado por Dale y Krueger
(2002)
trata la regresión como una estrategia de control empírico diseñada para
capturar los efectos causales.
Específicamente, la regresión es una casamentera automatizada que produce
dentro del grupo
2 Decimos "una variable a la vez", porque algunos de los modelos de Dale y Krueger (2002) reemplazan a la universidad
selectividad con la matrícula como la variable causal de interés.

Página 6
130 Journal of Economic Perspectives
comparaciones: hay una sola variable causal de interés, mientras que otros
regresores
medir las condiciones y circunstancias que nos gustaría mantener fijas cuando
estudiando los efectos de esta causa. Al mantener fijas las variables de control,
es decir,
incluyéndolos en un modelo de regresión multivariable; esperamos dar la
regresión
coeficiente sobre la variable causal a ceteris paribus , interpretación de
manzanas a manzanas.
Contamos esta historia a estudiantes sin matemáticas elaboradas, pero las
ideas
son sutiles y nuestros estudiantes los encuentran desafiantes. Ejemplos
empíricos detallados
mostrando cómo la regresión puede usarse para generar resultados
interesantes, útiles y sorprendentes
Las conclusiones causales ayudan a aclarar estas ideas.
Nuestra versión instructiva de la aplicación Dale and Krueger (2002) pregunta
si vale la pena asistir a una universidad privada, Duke, por ejemplo, en lugar
de una escuela estatal como
la Universidad de Carolina del Norte. Esto convierte la selectividad
universitaria en una más simple,
tratamiento binario, para que podamos emitir los efectos de interés generados
por simple
comparaciones de encendido / apagado. Específicamente, preguntamos si el
dinero gastado en la universidad privada
la matrícula se justifica por las ganancias de ganancias futuras. Esto lleva a la
pregunta de cómo usar
regresión para estimar el efecto causal de la asistencia privada a la universidad
en las ganancias.
Para empezar, usamos la notación que distingue entre causa y control.
En este caso, el regresor causal es P i , una variable ficticia que indica
asistencia
en una universidad privada para individuo i . Las variables de control son
denotadas por X i , o dadas
otros nombres cuando los controles específicos son dignos de atención, pero
en todos los casos distintos de los
variable causal privilegiada, P i . El resultado de interés, Y i , es una medida de
las ganancias
aproximadamente 20 años después de la inscripción.
La relación causal entre la asistencia a la universidad privada y las ganancias
es
descrito en términos de resultados potenciales: Y 1 i , que representa las
ganancias de indi-
vidual yo fui él o ella a ser privado ( P i = 1), e Y 0 i , lo que
representa i ganancias
después de una educación pública ( P i = 0). El efecto causal de asistir a una
universidad privada para
el individuo i es la diferencia, Y 1 i - Y 0 i . Esta diferencia nunca se puede
ver; más bien, nosotros
ver solo Y 1 i o Y 0 i , dependiendo del valor de P i . El objetivo del analista es,
por lo tanto,
medir un efecto causal promedio, como E ( Y 1 i - Y 0 i ).
En MIT (donde ambos hemos enseñado), le preguntamos a nuestra
econometría de la universidad privada
estudiantes a considerar su contrafactual personal si hubieran hecho una
escuela pública
elección en lugar de venir al MIT Algunos de nuestros estudiantes son
personas mayores que se han alineado
puestos de trabajo con los gustos de Google y Goldman. Muchas de las
personas con las que trabajan
en estas empresas, tal vez la mayoría, habrá ido a las escuelas estatales. En
vista de esto
De hecho, les pedimos a nuestros estudiantes que consideren si las
universidades privadas de estilo MIT realmente
una diferencia en lo que respecta al éxito profesional.
La primera contribución de un marco causal basado en resultados potenciales
es
explicar por qué es probable que las comparaciones ingenuas de graduados
universitarios públicos y privados
ser engañoso. El segundo es explicar cómo una regresión apropiadamente
construida
La estrategia de Sion nos lleva a algo mejor.
Las ingenuas comparaciones entre ex alumnos de universidades públicas y
privadas
confundir el efecto causal promedio de la asistencia privada con el sesgo de
selección. los
el sesgo de selección aquí refleja el hecho de que los estudiantes que van a
universidades privadas son, en
promedio, de familias más fuertes y probablemente más motivado y mejor

Página 7
Joshua D. Angrist y Jörn-Steffen Pischke 131
preparado para la universidad. Estas características se reflejan en
sus ganancias potenciales ,
es decir, en cuánto podrían ganar sin el beneficio de un título universitario
privado.
Si aquellos que terminan asistiendo a escuelas privadas hubieran asistido a
escuelas públicas,
probablemente habrían tenido mayores ingresos de todos modos. Esto refleja
el hecho de que
los estudiantes públicos y privados tienen diferentes Y 0 i , en promedio.
Para nosotros, la presentación más natural y útil de la regresión es como un
modelo
de posibles resultados Escriba las ganancias potenciales en el escenario de la
universidad pública como
Y 0 i = α + η i , donde α es la media de Y 0 i , y η i es la diferencia entre este
potencial
resultado y su media Supongamos además que la diferencia en los resultados
potenciales es
una constante, β, entonces podemos escribir β = Y 1 i - Y 0 i . Juntar las piezas
da un efecto causal
modelo de ganancias observadas
Yi=α+βPi+ηi.
El sesgo de selección equivale a la afirmación de que Y 0 i (ganancias
potenciales después de ir a
una universidad pública) y, por lo tanto, η i depende (en un sentido estadístico)
de P i , es decir, en el
tipo de escuela que uno elige.
Comienza el camino hacia una solución basada en la regresión al problema del
sesgo de selección
con la afirmación de que el analista tiene información que puede usarse para
eliminar selecciones
sesgo de decisión, es decir, purgar Y 0 i de su correlación con P i . En
particular, el moderno
El modelador de regresión postula una variable de control X i (o quizás un
conjunto de controles).
Condicional en esta variable de control, la comparación de ganancias privadas
y públicas es
manzanas con manzanas, al menos en promedio, por lo que los que se
comparan tienen el mismo promedio
Y 0 i 's o η i ' s. Este reclamo ceteris paribus- type está incorporado en
la independencia condicional
suposición de que, en última instancia, las estimaciones de regresión son una
interpretación causal:
E (η i | P i , X i ) = E (η i | X i ).
Tenga en cuenta que esta es una suposición más débil y más centrada que la
tradicional
presentación, que dice que el término de error es independiente de todos
los regresores,
es decir, E (η i | P i , X i ) = 0.
En el estudio de Dale y Krueger (2002), la variable X i identifica las escuelas
a la cual se graduaron los graduados de la muestra y fueron admitidos. los
Supuesto de independencia condicional dice que, habiendo aplicado a Duke y
UNC
y habiendo sido admitidos en ambos, aquellos que eligieron asistir a Duke
tienen el mismo
potencial de ganancias como aquellos que fueron a la escuela estatal. Aunque
tal condicionamiento
no convierte la asistencia a la universidad en un ensayo aleatorizado, sino que
brinda un atractivo
fuente de control para las principales fuerzas que confunden la inferencia
causal. Solicitantes
dirigirse a las escuelas en vista de su ambición y voluntad de realizar el
trabajo requerido;
Las oficinas de admisiones miran cuidadosamente la capacidad del solicitante.
Cerramos el ciclo que vincula la inferencia causal con la regresión lineal
mediante la introducción de
una hipótesis de forma funcional, específicamente que el medio condicional
de potencial
las ganancias cuando asiste a una escuela pública es una función lineal
de X i . Esto puede ser
escrito formalmente como E (η i | X i ) = γ X i . Los textos econométricos se
preocupan por la linealidad

Página 8
132 Journal of Economic Perspectives
y sus limitaciones, pero consideramos que escurrir tan mal. En el Dale y
Diseño de investigación Krueger, los controles son un gran conjunto de
muñecos para todos los posibles
grupos de solicitantes Los controles clave en este caso vienen en la forma de
una saturación
modelo, es decir, un conjunto exhaustivo de variables ficticias para todos los
valores posibles de las condiciones
variable de variación Dichos modelos son intrínsecamente lineales. En otros
casos, podemos venir
tan cerca como nos gusta a la función media condicional subyacente mediante
la adición de polyno-
términos e interacciones miales. Cuando las muestras son pequeñas,
felizmente usamos la linealidad para
interpolar, utilizando de esta forma los datos más eficientemente. En algunos
de los Dale
y los modelos Krueger, por ejemplo, los maniquíes para grupos de escuelas
son reemplazados por
control lineal para la selectividad promedio de las escuelas (es decir, los
puntajes SAT promedio de
Sus estudiantes).
Combinando estos tres ingredientes, efectos causales constantes,
indeterminación condicional
pendencia, y un modelo lineal para posibles resultados condicionados a los
controles,
produce el modelo de regresión
Yi=α+βPi+γXi+ei,
que se puede usar para construir estimaciones imparciales y consistentes de la
causal
efecto de la asistencia a la escuela privada, β. La historia causal que nos lleva
a este punto
revela lo que queremos decir con β y por qué estamos usando la regresión
para estimarlo.
Esta ecuación final se parece a muchas vistas en textos líderes en el
mercado. Pero esto
la aparente similitud es menos útil que una fuente de confusión. En nuestra
experiencia,
presentar esta ecuación y recitar suposiciones sobre la correlación de
regresores
E I y las nubes más de desentrañar las bases para la inferencia causal. En
cuanto al control
las variables van, la ortogonalidad regresiva-residual está asegurada en lugar
de asumida; ese
Es decir, el álgebra de regresión hace que esto suceda. Al mismo tiempo,
mientras que los controles son
seguramente no correlacionado con los residuos, es poco probable que los
coeficientes de regresión
multiplicar los controles tiene una interpretación causal. No imaginamos que
el
los controles son tan buenos como los asignados al azar y no nos importa si lo
son o no.
Los controles tienen un trabajo que hacer: son la base de la independencia
condicional
reclamo que es central en el marco de regresión moderno . Siempre que los
controles
hacer esta afirmación plausible, el coeficiente β puede verse como un efecto
causal.
El paradigma de regresión moderno gira en torno a la idea de que el analista
tiene datos
sobre variables de control que generan comparaciones de manzanas para
manzanas para la variable de
interesar. Dale y Krueger (2002) explican lo que esto significa en su estudio:
Si, con la condición de obtener la admisión, los estudiantes eligen asistir a las
escuelas para
razones que son independientes de [determinantes de ganancias no
observadas] entonces
los estudiantes que fueron aceptados y rechazados por el mismo conjunto de
escuelas
tienen el mismo valor esperado de [estos determinantes, el término de error en
su
modelo]. En consecuencia, nuestra solución propuesta para el problema de
selección de escuelas
es incluir un conjunto irrestricto de variables ficticias que indiquen grupos de
estudiantes
las personas que recibieron las mismas decisiones de admisión (es decir, la
misma combinación)
de aceptaciones y rechazos) del mismo conjunto de universidades.

Página 9
Instrucción de Econometría de pregrado: a través de nuestras clases, Darkly
133
En nuestro análisis de los datos de Dale y Krueger (informados en el Capítulo
2 de Angrist
y Pischke 2015), las estimaciones de una regresión sin controles muestran un
gran sector privado
efecto escolar de 13.5 puntos de registro. Este efecto se reduce a 8.6 puntos de
registro después de controlar
para los puntajes del SAT del propio alumno, los ingresos de su familia y
algunos más demo-
variables gráficas. Pero controlando para las escuelas a las cuales un
estudiante solicitó y fue
admitido (utilizando muchas variables ficticias) produce un pequeño y
estadísticamente insignificante
efecto de la escuela privada de menos del 1 por ciento.
Comparando los resultados de la regresión con un número creciente de
controles de esta manera:
es decir, comparar resultados no controlados, resultados con controles crudos
y resultados con
una variable de control que aborda de manera más plausible el problema de
las ofertas de sesgo de selección
ideas poderosas Estas ideas ayudan a los estudiantes a comprender por qué es
el último modelo
más probabilidades de tener una interpretación causal que los dos primeros.
En primer lugar, observamos al discutir estos resultados que las grandes
diferencias privadas no controladas
en los salarios parece ser impulsado por el sesgo de selección. Aprendemos
esto del hecho de que
el efecto bruto desaparece después de controlar los atributos precolombinos de
los estudiantes, en este
caso, ambición y capacidad, tal como se refleja en el conjunto de escuelas a
las que un estudiante se aplica y
califica para. Por supuesto, aún puede haber un sesgo de selección en el
contraste público-privado
condicional en estos controles. Pero debido a que los controles están
codificados desde la aplicación
y las decisiones de admisión que preceden a las decisiones de inscripción a la
universidad, no pueden
ellos mismos son una consecuencia de la asistencia a la escuela
privada. Deben estar asociados
con diferencias en Y 0 i que generan sesgo de selección. Eliminando estas
diferencias, eso
es decir, al comparar estudiantes con Y 0 i similares , es probable que genere
una escuela privada
efectos que son menos engañosos que los modelos más simples que omiten
estos controles.
También mostramos a nuestros estudiantes que después de condicionar la
solicitud y admisión
variables, habilidades y variables de antecedentes familiares en forma de
puntajes SAT
y los ingresos familiares no están correlacionados con la asistencia a la
escuela privada. El hallazgo de
un retorno cero de la escuela privada es por lo tanto notablemente insensible a
un mayor control
más allá de un conjunto básico. Este argumento usa la fórmula de sesgo de
variables omitidas, que
ver como una especie de regla de oro para el practicante de regresión
moderna. Nuestra regresión
las estimaciones revelan robustez para un mayor control que esperaríamos ver
en un buen funcionamiento
prueba aleatoria.
Usando un argumento similar de tipo de variables omitidas, observamos que
incluso si hay
otros factores de confusión que no hemos controlado, aquellos que están
correlacionados positivamente
con la asistencia a la escuela privada es probable que se correlacionen
positivamente con las ganancias
también. Incluso si estas variables permanecen omitidas, su omisión conduce
a las estimaciones
calculado con las variables disponibles para sobreestimar la prima de la
escuela privada,
pequeño como ya es.
Las aplicaciones empíricas como esta demuestran el enfoque moderno de
regresión
sión, destacando las suposiciones matizadas necesarias para una interpretación
causal de
parámetros de regresión. 3 Si se viola el supuesto de independencia
condicional,
3 En una publicación reciente, Arcidiacono, Aucejo y Hotz (2016) usan el condicionamiento de Dale y Krueger
estrategia para estimar los efectos causales de la inscripción en diferentes
campus de la Universidad de California en gradua-
ción y especialización universitaria.

Página 10
134 Journal of Economic Perspectives
los métodos de regresión no logran descubrir los efectos causales y es
probable que sean engañosos.
De lo contrario, hay esperanza para la inferencia causal. Por desgracia, los
temas de regresión que dominan
nate econometría enseñanza, incluyendo extensas discusiones de regresión
clásica
supuestos, forma funcional, multicolinealidad y cuestiones relacionadas con
estadísticas
la inferencia y la eficiencia, palidecen en importancia al lado de este hecho de
vivir o morir
diseños de investigación basados en regresión.
Lo cual no quiere decir que la inferencia causal usando métodos de regresión
haya sido ahora
hecho facil. La pregunta de qué hace una buena variable de control es una de
las más
desafiante en la práctica empírica. Las variables de control candidatas deben
ser juzgadas
por si hacen que el supuesto de independencia condicional sea más plausible,
y a menudo es difícil de decir. Por lo tanto, discutimos muchos ejemplos de
regresión con nuestro
estudiantes, todos interesantes, pero algunos más convincentes que otros. Una
preocupación particular
es que no todos los controles son buenos controles, incluso si están
relacionados tanto con P i como con Y i .
Ejemplos específicos y preguntas de discusión: "¿Deberías controlar la
ocupación?
en una ecuación salarial destinada a medir los rendimientos económicos de la
educación? "- illumi
nate el problema del mal control y, por lo tanto, garantiza tiempo en el aula (y
en nuestro
libros, Angrist y Pischke 2009, 2015).
Tómelo o déjelo: preocupaciones de regresión clásicas
Es más fácil usar la suposición de independencia condicional para derivar un
causal
modelo de regresión cuando el efecto causal es el mismo para todos, como se
supone anteriormente.
Si bien esta es una simplificación atractiva para fines expositivos, el resultado
clave
es notablemente general. Siempre que la función de regresión sea
adecuadamente flexible, la
parámetro de regresión que captura el efecto causal de interés es un promedio
ponderado
de los efectos causales específicos de covariables subyacentes. De hecho, con
controles discretos, regresión
sion se puede ver como un estimador de coincidencia que automatiza la
estimación de muchos
efectos del tratamiento específicos de covariables posiblemente heterogéneos,
produciendo un único
promedio ponderado en un solo paso fácil.
De manera más general, la linealidad de la función de regresión se ve mejor
como una convección
aproximación niente a formas funcionales posiblemente no lineales. Este
reclamo es
apoyado por estudios teóricos pioneros como White (1980a) y Chamber-
Lain (1982). A nuestro leal saber y entender, el primer libro de texto para
resaltar estos
propiedades es Goldberger (1991), un texto de posgrado nunca de amplio uso
y uno raramente
visto en cursos de pregrado. Angrist (1998), Angrist y Krueger (1999), y
nuestro texto de posgrado (Angrist y Pishke 2009) desarrolla el argumento
teórico
esa regresión es un estimador coincidente para los efectos promedio del
tratamiento (ver también
Yitzhaki 1996).
Una consecuencia importante de esta aproximación y vista de emparejamiento
de
La regresión es que las suposiciones detrás del modelo de regresión lineal del
libro de texto son
ambos inverosímiles e irrelevantes. La heterocedasticidad surge naturalmente
como resultado de
variación en la cercanía entre un ajuste de regresión y el condicional
subyacente
la función media se aproxima. Pero el hecho de que la calidad del ajuste puede
variar
no obviar el valor de la regresión como un resumen de lo económicamente
significativo
relaciones causales

Página 11
Joshua D. Angrist y Jörn-Steffen Pischke 135
Las suposiciones de regresión clásica son útiles para la derivación de la
regresión
errores estándar Simplifican las matemáticas y la fórmula resultante revela la
características de los datos que determinan la precisión estadística. Esta
derivación toma poco
de nuestro tiempo de clase, sin embargo. No nos detenemos en las pruebas
estadísticas para la validez de las clasificaciones
Suposiciones básicas o sobre reparaciones generalizadas de mínimos
cuadrados para sus fallas. Parece
para nosotros que la mayoría de lo que generalmente se enseña en la
inferencia en un curso introductorio
la clase de posgrado puede reemplazarse con la frase "usar errores estándar
robustos". Con un
precaución sobre la dependencia ciega de las aproximaciones asintóticas,
sugerimos a nuestros estudiantes
seguir la práctica de investigación actual. Como señalan White (1980b) y
otros, el robusto
fórmula aborda las consecuencias estadísticas de heterocedasticidad y no
ganancia en datos transversales. La autocorrelación en datos de series de
tiempo puede ser similarmente
manejado por los errores estándar de Newey y West (1987), mientras que los
métodos de agrupamiento
correlación entre unidades de corte transversal o en datos de panel (Moulton
1986; Arellano
1987; Bertrand, Duflo y Mullainathan 2004).
En otra tierra: textos econométricos y enseñanza
Los libros de texto tradicionales de econometría son escasos en ejemplos
empíricos. En John-
El texto clásico de ston (1972), la primera aplicación empírica es una
regresión bivariada
vincular las bajas en la carretera con la cantidad de vehículos
autorizados. Este ejemplo se centra en
computación, una preocupación comprensible en ese momento, pero Johnston
no explica
por qué la relación entre bajas y licencias es interesante o cuál es la estimación
los compañeros pueden significar. El primer ejemplo empírico de Gujarati
(1978) es más sustantivo,
una función de producción de Cobb-Douglas estimada con algunas
observaciones anuales.
Las funciones de producción, relaciones causales implícitas, son un edificio
fundamental
bloque de la teoría económica. La discusión de Gujarati interpreta
amablemente las magnitudes y
considera si las estimaciones pueden ser consistentes con rendimientos
constantes a escala.
Pero esta aplicación no aparece hasta la página 107.
Décadas más tarde, el trabajo empírico real todavía era escaso en los textos
principales, y el
presentación de ejemplos empíricos a menudo se mantuvo enfocado en
matemática y
tecnicismos estadísticos. En un ensayo publicado hace 16 años en esta revista,
Becker
y Greene (2001) estudiaron textos de econometría y la enseñanza en el cambio
de
milenio:
La econometría y la estadística a menudo se enseñan como ramas de las
matemáticas, incluso
cuando se enseña en las escuelas de negocios ... el enfoque en los libros de
texto y la enseñanza
materiales está en presentar y explicar la teoría y detalles técnicos con
atención secundaria a las aplicaciones, que a menudo se fabrican para
adaptarse
el procedimiento en cuestión ... las aplicaciones rara vez se basan en eventos
informados en
periódicos financieros, revistas de negocios o revistas académicas en
economía.
Siguiendo una tendencia más amplia hacia el empirismo en la investigación
económica (docu-
en Hammermesh 2013 y Angrist, Azoulay, Ellison, Hill y Lu
Pagina 12
136 Journal of Economic Perspectives
próximamente), los textos de hoy son más empíricos que los que han
reemplazado. En particular,
ular, los textos econométricos modernos son más probables que los descritos
por Becker y
Greene para integrar ejemplos empíricos en todas partes, y a menudo vienen
con acceso a
sitios web donde los estudiantes pueden encontrar datos económicos reales
para los conjuntos de problemas y la práctica.
Pero las noticias en el frente de los libros de texto no son todas
buenas. Muchos de los libros de texto de hoy
los ejemplos todavía son artificiales o están poco motivados. Más
decepcionante para nosotros que el
calidad desigual de las aplicaciones empíricas en la biblioteca econométrica
contemporánea
es el fracaso para discutir las herramientas empíricas modernas. Aparte de
Stock y Watson
(2015), que se acerca más a abrazar la agenda moderna, ninguno de los
modernos
los textos de econometría de pregrado encuestados a continuación mencionan
regresión-disconti-
métodos de nuidad, por ejemplo. Del mismo modo, vemos poca o ninguna
discusión sobre las amenazas
a la validez que podría confundir el análisis de políticas de estilo diferencias
en las diferencias, incluso
aunque el trabajo empírico de este tipo ahora es omnipresente. Textos
econométricos permanecen
enfocado en material que es cada vez más irrelevante para la práctica
empírica.
Para poner estas y otras afirmaciones sobre el contenido de libros de texto en
una base empírica más firme,
dación, clasificamos el contenido de 12 libros (enumerados en el Apéndice
Tabla A1 en línea), seis
de la década de 1970 y seis actualmente en uso amplio. Nuestra lista de
clásicos fue construida por
identificar las ediciones de los años 70 de los volúmenes incluidos en
la Tabla 1 de Becker and Green
(2001), que enumera los libros de texto de licenciatura de amplio uso cuando
escribieron su ensayo.
Compramos copias de estos primeros libros de primera o segunda
edición. Nuestra lista de textos clásicos
contiene Kmenta (1971), Johnston (1972), Pindyck y Rubinfeld (1976),
Gujarati
(1978), Intriligator (1978) y Kennedy (1979). La división entre graduado y
los libros de pregrado eran más turbios en la década de 1970: a diferencia de
los libros de pregrado de hoy en día,
algunos de estos textos más antiguos usan álgebra lineal. Intriligator (1978),
Johnston (1972),
y Kmenta (1971) son notablemente más avanzados que los otros
tres. Nosotros por lo tanto
resuma el contenido del libro de los 70 con y sin estos tres incluidos.
Nuestros textos contemporáneos son los seis libros más mencionados en listas
de lectura
encontrado en el sitio web Open Syllabus Project
(http://opensyllabusproject.org/).
Específicamente, nuestros líderes modernos del mercado son los que se
encuentran en la parte superior de una lista gene-
filtrando el motor de búsqueda "syllabus explorer" del Proyecto para
"Economía" y
luego buscando "Econometría". La lista resultante consiste en Kennedy
(2008),
Gujarati y Porter (2009), Stock y Watson (2015), Wooldridge (2016), Masa-
erty (2016) y Studenmund (2017). 4
Reconociendo que tal esfuerzo siempre será imperfecto, clasificamos el libro
contenido en las categorías que se muestran en la Tabla 1. Este esquema cubre
la gran mayoría de
el material en los libros en nuestra lista, así como en muchos otros que hemos
usado o leído. Nuestra
El esquema de clasificación también cubre tres de las herramientas para las
cuales aparece un crecimiento en el uso
más impresionante en los datos bibliométricos tabulados por Panhans y
Singleton (cuarto
próximamente), específicamente, variables instrumentales, métodos de
regresión-discontinuidad,
4 Estos libros también se clasifican altamente en la categoría econometría de Amazon y (en una edición eliminada) son
líderes del mercado en datos de ventas de Nielsen para 2013 y 2014.
Dougherty (2016) es el número ocho en la lista
cedido por Open Syllabus, pero el sexto libro, Hayashi (2000), es claramente
un texto de posgrado, y el séptimo,
Maddala (1977), no es particularmente reciente.

Página 13
Instrucción de Econometría de pregrado: a través de nuestras clases, Darkly
137
tabla 1
Descripciones de tema
Tema
Que incluye …
Regresión bivariado
Exposición básica del modelo de regresión bivariada, interpretación
ción de los parámetros del modelo bivariado
Propiedades de regresión
Derivación de estimadores, suposición clásica de regresión lineal
ciones, propiedades matemáticas de los estimadores de regresión como
esterilidad y anatomía de regresión, Gauss-Markov
Teorema
Inferencia de regresión
Derivación de errores estándar para coeficientes y predicha
valores, pruebas de hipótesis e intervalos de confianza, R , análisis
2

de varianza, discusión e ilustración del razonamiento inferencial


Regresión multivariante
Discusión general del modelo de regresión multivariante,
interpretación de parámetros multivariados
Sesgo de variables omitidas
Sesgo de variables omitidas en los modelos de regresión
Fallas de asunción y reparaciones Discusión de fallas clásicas de supuestos,
incluyendo hetero-
escepticidad, correlación serial, no normalidad y estocástica
regresores; multicolinealidad, inclusión de variables irrelevantes,
reparaciones generalizadas de mínimos cuadrados (GLS)
Forma funcional
Discusión de la forma funcional y parametrización del modelo
problemas relacionados con el uso de variables ficticias, registros en
la izquierda y la derecha, modelos de variables dependientes limitadas,
otros modelos de regresión no lineal
Variables instrumentales
Variables instrumentales (IV), mínimos cuadrados de dos etapas (2SLS), y
otros estimadores IV de ecuación única como información limitada
maximium likelihood (LIML) y estimadores de clase k , el uso de
IV para variables omitidas y problemas de errores en variables
Modelos de ecuaciones simultáneas Discusión de modelos y estimadores de
multi-ecuación, incluyendo
identificación de sistemas de ecuaciones simultáneas y
estimadores del sistema como regresiones aparentemente no relacionadas
(SUR)
y mínimos cuadrados de tres etapas (3SLS)
Panel de datos
Técnicas y temas del panel, incluida la definición y
estimación de modelos con efectos fijos y aleatorios, agrupación
series de tiempo y datos de sección transversal, y datos agrupados
Series de tiempo
Problemas de series de tiempo, incluidos modelos de demora distribuidos,
procesos chastic, media móvil integrada autoregresiva
(ARIMA) modelado, autorregresiones vectoriales y raíz unitaria
pruebas. Esta categoría omite discusiones estrechas de correlaciones seriales
como una violación de supuestos clásicos
Efectos causales
Discusión de los efectos causales y la interpretación causal de
estimaciones econométricas, el propósito y la interpretación de rangos
experimentos dominados y amenazas a una interpretación causal
de las estimaciones econométricas, incluidos los problemas de selección de
muestras
Diferencias en las diferencias
Supuestos y estimadores de diferencias en diferencias
Discontinuidad de regresión
métodos
Diseños de discontinuidad de regresión aguda y difusa y
estimadores

Página 14
138 Journal of Economic Perspectives
y estimadores de diferencias en diferencias. 5 Nuestra estrategia de
clasificación cuenta páginas
dedicado a cada tema, omitiendo material en apéndices y ejercicios, y
omitiendo
material de corrección en matemáticas y estadística. Independientemente,
también contamos
páginas dedicadas a ejemplos empíricos reales, es decir, presentaciones de
econométricas
resultados calculados utilizando datos económicos genuinos. Este esquema
para contar exámenes
ples omite las muchas ilustraciones de libros de texto que usan números
inventados.
No se desvanecen
En su mayor parte, los textos heredados tienen una estructura uniforme:
comienzan por
introduciendo un modelo lineal para una variable de resultado económico,
seguido de cerca
al afirmar que se supone que el término de error es independiente de la media,
o
no correlacionado con, regresores. El propósito de este modelo, ya sea un
efecto causal
relación en el sentido de describir las consecuencias de la manipulación del
regresor
lation, una herramienta de previsión estadística o una expectativa condicional
parametrizada
función: generalmente no está claro.
La introducción de un libro de texto de un modelo lineal con ortogonal o
los errores independientes generalmente son seguidos por una lista de
suposiciones técnicas como
homoscedasticidad, regresores variables (¡aún no estocásticos!) y falta de
multicolores
linealidad Estas suposiciones se utilizan para derivar las buenas propiedades
estadísticas de
el estimador ordinario de mínimos cuadrados en el modelo lineal clásico:
imparcialidad,
fórmulas simples para errores estándar, y el Teorema de Gauss-Markov, (en el
cual
los mínimos cuadrados ordinarios se muestran como el mejor estimador lineal
insesgado, o AZUL).
Como informamos en la Tabla 2, esta discusión inicial de
las propiedades de Regresión consume
un promedio de 11 a 12 por ciento de los libros de texto clásicos. Inferencia
de regresión , que
usualmente viene después, obtiene un promedio de aproximadamente 13 por
ciento del espacio de página en estos
libros tradicionales.
El tema más ampliamente cubierto en nuestra taxonomía, que representa
aproximadamente 20
Por ciento del material en los libros de texto clásicos, es fallas de Asunción y
reparaciones . Esta
incluye diagnósticos y primeros auxilios para problemas como
autocorrelación, heteroskedas-
ticity y multicolinealidad. La relevación para la mayoría de estas
enfermedades viene bajo la forma de
mínimos cuadrados generalizados. Otro tema importante en los textos
heredados es Simultáneo
modelos de ecuaciones , que consumen 14 por ciento del espacio de página en
el más elemental
textos. El porcentaje dado a modelos de ecuaciones simultáneas ortodoxas
aumenta
al 18 por ciento cuando la muestra incluye textos más
avanzados. Irónicamente, tal vez,
Las fallas de asunción y reparaciones reclaman una parte aún mayor de los
clásicos cuando más
libros avanzados están excluidos. Estos libros más antiguos también dedican
un espacio considerable a
Series de tiempo , mientras que los datos del Panel obtienen poca atención en
todos los ámbitos.
Una característica llamativa de la Tabla 2 es cuán similar es la distribución de
la cobertura temática
en textos econométricos líderes del mercado contemporáneo es a la
distribución en el
Clásicos. Como en la Edad de las Piedras, más de la mitad del material en
textos contemporáneos
se ocupa de las propiedades de regresión , la inferencia de regresión , forma
funcional , y
5 Panhans y Singleton (de próxima aparición) también documentan el crecimiento en el número de artículos que utilizan los términos
"Experimento natural" y "ensayo de control aleatorizado".

Página 15
Joshua D. Angrist y Jörn-Steffen Pischke 139
Fallas de asunción y reparaciones. El cambio más claro a través de las
generaciones de libros es el
espacio reducido asignado a los modelos de ecuaciones simultáneas . Esto
presumiblemente refleja
disminución del uso de un marco ortodoxo de multi-ecuaciones,
especialmente en macroeco-
NOMICS La cobertura reducida de ecuaciones simultáneas ha dejado espacio
para modestos
atención a los datos del panel y efectos causales , pero la mayor expansión
individual ha sido
en la cobertura de la forma funcional (en su mayoría elección discreta y
dependiente limitado
modelos variables).
Algunos de los volúmenes en nuestra lista actual de libros han sido a través de
muchas ediciones,
con primeras ediciones publicadas en Stones 'Age. Tal vez no sea
sorprendente que el
distribución de temas en Gujarati y Porter (2009) se parece mucho a eso en
Gujarati
(1978). Pero los participantes más recientes en el mercado de libros de texto
también se apartan poco del
plantilla clásica. En el lado positivo, los nuevos participantes del mercado son
más propensos a
menos mencionar temas modernos.
La fila inferior de la Tabla 2 revela el uso moderado de ejemplos empíricos en
La edad de las piedras: aproximadamente el 15 por ciento de las páginas de
los clásicos están dedicadas a ilustraciones
Tabla 2
Cobertura de temas en Econometría Textos clásicos y contemporáneos
(la página cuenta como porcentaje)
1970
1970
Excluyendo
textos más avanzados
Contemporáneo
(1)
(2)
(3)
Tema
Regresión bivariado
2.5
3.6
2.8
Propiedades de regresión
10.9
11.9
9.9
Inferencia de regresión
13.2
13.3
14.6
Regresión multivariante
3.7
3.7
6.4
Sesgo de variables omitidas
0.6
0.5
1.8
Fallas de asunción y reparaciones
18.4
22.2
16.0
Forma funcional
10.2
9.3
15.0
Variables instrumentales
7.4
5.1
6.2
Modelos de ecuaciones simultáneas
17.5
13.9
3.6
Panel de datos
2.7
0.7
4.4
Series de tiempo
12.3
15.2
15.6
Efectos causales
0.7
0.7
3.0
Diferencias en las diferencias
-
-
0.5
Métodos de discontinuidad de regresión
-
-
0.1
Ejemplos empíricos
14.0
15.0
24.4
Nota: clasificamos el contenido de 12 textos econométricos, seis de los años
1970 y seis actualmente en
amplio uso (ver texto para más detalles): nuestros textos clásicos son Kmenta
(1971), Johnston (1972), Pindyck y
Rubinfeld (1976), Gujarati (1978), Intriligator (1978) y Kennedy
(1979). Nuestro contemporáneo
los textos son Kennedy (2008), Gujarati y Porter (2009), Stock y Watson
(2015), Wooldridge
(2016), Dougherty (2016) y Studenmund (2017). Informamos porcentajes de
recuentos de páginas por
tema. Todos los temas suman al 100 por ciento. Los ejemplos empíricos son
como un porcentaje de todo el libro.
La columna 2 excluye Kmenta (1971), Johnston (1972) e Intriligator (1978),
el más avanzado
textos clásicos de econometría. Los guiones indican que no hay cobertura.

Página 16
140 Journal of Economic Perspectives
involucrando datos reales. Este promedio oculta una buena variación, que va
desde cero
(sin ejemplos) a más de un tercio del espacio de página que cubre
aplicaciones.
Sorprendentemente, el libro de texto con mayor orientación empírica en
nuestra muestra de 12 libros permanece
Pindyck y Rubinfeld (1976), uno de los clásicos. Aunque el campo se ha
movido a
un contenido empírico promedio de más del 24 por ciento, ningún texto
contemporáneo en esta lista
coincide bastante con su cobertura de ejemplos. 6
AZUL se convierte en gris: cobertura del curso de econometría
Muchos instructores de econometría se basan en gran medida en sus notas de
clase, utilizando textos
libros solo como un suplemento o una fuente de ejercicios. Por lo tanto,
podríamos ver más
del paradigma empírico moderno en los contornos de los cursos y las listas de
lectura que vemos
en libros de texto. Para explorar esta posibilidad, recopilamos planes de
estudio y conferencias
de cursos de econometría de pregrado de una amplia variedad de
universidades y
universidades. 7
Nuestro marco de muestreo para el estudio de plan de estudios cubre los diez
campus más grandes en
cada uno de los ocho tipos de instituciones. Los ocho grupos son
universidades de investigación (muy
alta actividad), universidades de investigación (alta actividad), universidades
de doctorado / investigación,
y universidades de bachillerato, con cada uno de estos cuatro divididos en
públicos y privados
escuelas. La muestra resultante incluye diversas instituciones como Ohio State
Univer-
sity, New York University, Harvard University, East Carolina University,
American
Universidad, Academia Militar de EE. UU., Universidad Cristiana de Texas,
Calvin College, y
Hope College. Logramos recolectar programas de 38 de estas 80
escuelas. Cada
de los ocho tipos de escuelas a las que apuntamos está representado en la
muestra, pero más grande y
las instituciones más prestigiosas están sobrerrepresentadas. La mayoría de los
planes de estudio son para cursos
enseñó desde 2014, pero el más antiguo es de 2009. Algunas escuelas
contribuyen más de
un plan de estudios, pero estos se promedian, por lo que cada escuela
contribuye con una sola observación
a nuestras tabulaciones. El apéndice disponible con este documento en http:
//e-jep.or g
enumera las 38 escuelas incluidas en el conjunto de datos del plan de estudios.
Para cada escuela que contribuye información del curso, registramos si el
Los temas enumerados en la Tabla 1 están cubiertos. Un subconjunto de
escuelas también brindó conferencias detalladas
horarios por conferencia que muestran el tiempo dedicado a cada tema. Vale
la pena señalar que
la cantidad de información que puede obtenerse de las listas de lectura y del
programa
varía según los cursos. Por ejemplo, la mayoría de los planes de estudio
cubren material que hemos clasificado
como regresión multivariable , pero algunos no enumeran la inferencia de
regresión por separado , presumiblemente
cubriendo la inferencia como parte del módulo de regresión sin explicarlo en
el
leyendo lista. Como resultado, los temas más amplios parecen obtener más
cobertura.
Con esta advertencia en mente, la primera columna de la Tabla 3 sugiere una
distribución de
tiempo de conferencia econométrica que tiene mucho en común con la
distribución del tema en
libros de texto. En particular, más de la mitad del tiempo de clase va a
conferencias sobre Regresión
6 El promedio se reduce por el hecho de que un libro en la lista no tiene contenido empírico. Nuestra visión de
cómo un texto de econometría de pregrado contemporáneo se puede
estructurar en torno a ejemplos empíricos es
reflejado en nuestro libro, Angrist y Pischke (2015).
7 Nuestro agradecimiento a Enrico Moretti por sugerir una consulta de plan de estudios.

Página 17
Instrucción de Econometría de pregrado: a través de nuestras clases, Darkly
141
propiedades , Inferencia de regresión , Suposición de fallas y reparaciones ,
y Forma funcional.
De acuerdo con esta distribución, la segunda columna en la tabla revela que,
excepto
para las propiedades de Regresión , estos temas están cubiertos por la mayoría
de las listas de lectura. La regresión
Es muy probable que el tema de propiedades esté cubierto por otros
encabezados de regresión.
También en paralelo con el material del libro de texto descrito en la Tabla 2,
nuestra tabulación
del tiempo de la conferencia muestra que poco menos del 6 por ciento de los
horarios del curso se dedica a
cobertura de temas relacionados con efectos causales , diferencias en las
diferencias y regresión
métodos de discontinuidad . Esto es solo un modesto paso más allá del
promedio de los libros de texto modernos
del 3.6 por ciento para este conjunto de temas. Métodos de variables
instrumentales de una sola ecuación
obtenga solo el 3.9% del tiempo de lectura, menos de lo que vemos en el
promedio de los libros de texto,
tanto viejo como nuevo.
Siempre mirando el lado positivo de la vida, felizmente notamos que la Tabla
3 muestra
que más de una cuarta parte de nuestros instructores muestreados asignan al
menos un poco de tiempo de conferencia
a efectos Causales y Diferencias en diferencias. Una minoría saludable (casi
el 17 por ciento)
también encuentre tiempo para al menos alguna discusión sobre los métodos
de discontinuidad de regresión .
Esto sugiere que los instructores econométricos están por delante del libro de
econometría
mercado. Muchos instructores más jóvenes habrán utilizado métodos
empíricos modernos en
su trabajo de doctorado, por lo que probablemente quieran compartir este
material con sus alumnos.
Los autores de libros de texto son probablemente más viejos, en promedio,
que los instructores, y
es menos probable que tenga experiencia personal con herramientas
enfatizadas por los modernos
agenda causal.
Tabla 3
Cobertura del curso
Tiempo de conferencia
(por ciento)
Cursos que cubren el tema
(por ciento)
Tema
Regresión bivariado
11.7
100.0
Propiedades de regresión
8.7
43.4
Inferencia de regresión
12.4
92.1
Regresión multivariante
10.5
94.7
Sesgo de variables omitidas
1.9
28.5
Fallas de asunción y reparaciones
20.2
73.7
Forma funcional
15.7
92.1
Variables instrumentales
3.9
51.8
Modelos de ecuaciones simultáneas
0.4
19.3
Panel de datos
3.6
36.8
Series de tiempo
5.0
45.6
Efectos causales
2.5
25.4
Diferencias en las diferencias
2.0
27.2
Métodos de discontinuidad de regresión
1.4
16.7
Número de instituciones
15
38
Notas: La primera columna informa el porcentaje de tiempo de clase dedicado
a cada
El tema se encuentra a la izquierda para las 15 escuelas para las cuales
obtuvimos un cronograma detallado.
Esta columna suma al 100 por ciento. La columna 2 informa el porcentaje de
cursos
cubriendo temas particulares para las 38 escuelas para las cuales obtuvimos
una lista de lectura.
Página 18
142 Journal of Economic Perspectives
Fuera de tiempo
Las instrucciones de econometría de pregrado están atrasados para un cambio
de paradigma en
tres direcciones Uno es un enfoque en preguntas causales y ejemplos
empíricos, más bien
que los modelos y las matemáticas. Otra es una revisión de la regresión clásica
anacrónica
marco lejos de la modelización multivariante de los procesos económicos y
hacia
comparaciones estadísticas controladas. El tercero es un énfasis en cuasi-
experimentación moderna
herramientas imental.
Reconocemos que el cambio es difícil. Nuestras propias listas de lectura de
hace una década
se parecen mucho a los que hemos resumido aquí. Pero nuestro enfoque a la
instrucción tiene
evolucionado a medida que nos enfrentamos a la brecha inquietante entre lo
que hacemos y lo que
enseñar. La econometría que utilizamos en nuestra investigación es
interesante, relevante y satisfactoria.
¿Por qué nuestros alumnos tampoco deberían obtener algo de satisfacción?
■ Agradecemos a Jasper Clarkberg, Gina Li, Beata Shuster y Carolyn Stein por su experiencia.
asistencia de investigación, a los editores Mark Gertler, Gordon Hanson,
Enrico Moretti y Timothy
Taylor, y para Alberto Abadie, Daron Acemoglu, David Autor, Dan Fetter,
Jon Gruber, Bruce
Hansen, Derek Neal, Parak Pathak y Jeffrey Wooldridge para comentarios

Вам также может понравиться