Вы находитесь на странице: 1из 14

Temas Selectos en Mtodos Cuantitativos Introduccin

Javier Aparicio Divisin de Estudios Polticos, CIDE javier.aparicio@cide.edu Otoo 2008


http://www.cide.edu/investigadores/aparicio/metodos.html

Para qu sirven los mtodos cuantitativos?

Ante la dificultad de allegarse datos experimentales en Ciencias Sociales, utilizamos datos NO experimentales (observational data) para hacer inferencias Para verificar las hiptesis o predicciones de cierta teora con datos del mundo real Para estimar la magnitud y significancia de una relacin emprica Para validar hiptesis o teoras rivales: ie, efecto de una poltica pblica

Breviario metodolgico

Investigacin cualitativa vs. cuantitativa? El mtodo idneo depende tanto de tu pregunta de investigacin como del tipo de respuesta que buscas obtener Una investigacin cuantitativa seria tiene al menos cuatro elementos (King et al., 1994): Inferencia descriptiva (exploracin de datos) e inferencia explicativa (exploracin de mecanismos causales). Replicabilidad: Procedimientos de recoleccin de datos, codificacin y anlisis explcitos, claros y generalizables. Conclusiones probabilsticas (con incertidumbre): de datos inciertos slo pueden seguirse conclusiones dem. The content is the method: La investigacin ser ms o menos cientfica si y slo si sigues un mtodo.

Small n vs. large n


Distintos tamaos de muestra imponen retos diferentes Muestras grandes permiten identificar patrones fcilmente generalizables a lo largo de casos ms o menos comparables, mientras que muestras pequeas permiten estudiar a profundidad la complejidad y/o peculiaridad de cada caso. Una observacin puede ser tan simple como un punto en un plano de k dimensiones--mismo que ponemos en perspectiva al compararlo con otras observaciones manteniendo constantes otras variables--o tan denso como el sinnmero de fenmenos que se entrecruzan en un episodio histrico. The curse of dimensionality A mayor N, mayor precisin tendrn los estimadores de una regresin, lo cual fortalece tus resultados... ...pero a mayor N, el nmero de posibles variables relevantes tambin aumenta, lo que puede debilitar tu teora o tus resultados iniciales.

Objetivos del Diseo de Investigacin Mejores Teoras

Mejorar tu pregunta de investigacin. Tu pregunta de investigacin debe:


Ser "importante" para el "mundo real (so what?). Hacer una contribucin especfica a la literatura existente.

Mejorar las teoras existentes

Busca teoras falsificables (a la Popper) o que podran estar equivocadas--qu evidencia te bastara para demostrarte que tu teora/creencia est equivocada?) Busca teoras con las mayores "implicaciones observables" posibles--cuntas hiptesis se desprenden de tu teora? Tu teora debe ser clara y concreta, quiz elegante, quiz parsimoniosa.

Objetivos del Diseo de Investigacin Mejor Evidencia

Mejorar la calidad de la evidencia existente


Registra todo el proceso de recabacin de datos replicabilidad. Recaba datos sobre el mayor nmero de "implicaciones observables" posibles robustez Puedes recabar ms datos? Puedes usar alguna otra variable dependiente? Maximiza la validez de tus observaciones: tus datos en verdad miden lo que quieres? Asegrate de que tu recoleccin de datos es confiable.

Mejorar el uso de la evidencia existente


Evita sesgos: usa tus datos para generar inferencias no sesgadas que en promedio sean correctas. Maximiza la eficiencia: explota la mayor cantidad posible de informacin contenida en tus datos minimiza la varianza de tus inferencias.

Datos: Corte transversal (cross-sectional)


Muestra aleatoria de una poblacin Observaciones a nivel individual, local, nacional, etc., en un momento dado en el tiempo Pro: permite explotar la varianza o heterogeneidad entre observaciones Contra:

son realmente comparables unos casos con otros? No observamos un mismo caso en el tiempo (no observamos el antes/despes).

Si la muestra no es aleatoria o representativa Problema de sesgo muestral / seleccin muestral


7

Datos: Panel / Longitudinales

Datos agrupados (pooled cross-section): acumular diferentes cortes de datos y tratarlos como una sola muestra, controlando por diferencias temporales, regionales, etc. Datos panel: permiten observar cierto individuo/regin a lo largo del tiempo. T > N: Time series/cross-section explotan la dinmica de los grupos (time-series asymptotics) T < N: Datos panel o longitudinales explotan la heterogeneidad de los grupos (cross-section asymptotics)
8

Datos: Series de Tiempo

Observaciones de una sola unidad a lo largo del tiempo: inflacin, tasas de inters, abstencionismo, nmero de denuncias. Una serie de tiempo difcilmente ser una muestra aleatoria (iid):

Inercia (path dependence) Correlacin temporal entre observaciones Tendencias de largo plazo Estacionalidad (seasonality) Cambios de corto vs. largo plazo

El Problema de la Causalidad

Afecta a estudios cuantitativos y cualitativos por igual. Hallar una correlacin entre dos o ms variables NO establece causalidad. De encontrar cierta correlacin o efecto, cmo podemos saber si en verdad X caus a Y? One can only hope: Estadsticamente, si controlamos por suficientes variables adicionales (covariates), es plausible que, ceteris paribus, el efecto hallado sea causal Theory to the rescue! La teora subyacente nos dice qu factores determinan qu variables. La evidencia emprica simplemente apoyar o rechazar las hiptesis derivadas de la teora.
10

Ejemplo: Rendimiento de la educacin


Teora: Un modelo de inversin en capital humano implica que a mayor educacin, mayores ingresos. En el modelo ms simple, esto implica una ecuacin a estimar del tipo:

Earnings 0 1education u
11

. reg EARNINGS SCHOOL Source | SS df MS -------------+-----------------------------Model | 19321.5589 1 19321.5589 Residual | 92688.6722 538 172.283777 -------------+-----------------------------Total | 112010.231 539 207.811189 Number of obs F( 1, 538) Prob > F R-squared Adj R-squared Root MSE = = = = = = 540 112.15 0.0000 0.1725 0.1710 13.126

-----------------------------------------------------------------------------EARNINGS | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------SCHOOL | 2.455321 .2318512 10.59 0.000 1.999876 2.910765 _cons | -13.93347 3.219851 -4.33 0.000 -20.25849 -7.608444 ------------------------------------------------------------------------------

12

120

EARNINGS 13.93 2.46S


100

Hourly earnings ($)

80 60 40 20 0 0 -20 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Years of schooling

13

Ejemplo

El estimador de 1 es el rendimiento de la educacin, pero ser este un efecto causal? El trmino de error o residual, u, incluye info sobre todos los dems factores que afectan las ganancias pero que no han sido incluidos en el modelo. Debemos controlar por tantos factores como nos sea posible (confounding factors, covariates, etc.) Ojo: al final siempre habr factores no observables que afectan las ganancias: son parte del residual. Endogeneidad: a) quiz las ganancias cuando joven te ayudan a estudiar un posgrado (X determina a Y, y viceversa). b) quiz tanto educacin como ganancias estn determinadas simultneamente por una variable omitida (IQ, por ejemplo).
14

Вам также может понравиться