You are on page 1of 30

METODOLOGIA DAS CIÊNCIAS SOCIAIS

CRITÉRIOS ESTRUTURAIS
John Gerring – Boston University

CAPÍTULO 9 – MÉTODOS
Um bom projeto de pesquisa, como argumentei, é caracterizado por plenitude, limites,
comparabilidade, independência, representatividade, variação, utilidade analítica,
replicabilidade, mecanismo e comparação causal. Na medida em que podemos tirar conclusões
precisas sobre as relações causais na esfera das ações humanas, o fazemos com estudos que
incorporam essas dez características. Essa é a maneira mais simples e parcimoniosa de resumir
a complexa tarefa do projeto de pesquisa na análise causal.
Como já observamos, esses critérios estão frequentemente em conflito uns com os
outros, de tal forma que não podemos cumprir todos os dez (pelo menos não em um grau igual).
Aqui é onde um projeto de pesquisa deve ir além das generalidades e em direção a escolhas
específicas e, muitas vezes, muito difíceis. Uma vez que cada escolha - de casos, de tratamentos
e de análise - implica um método um pouco diferente, há, em princípio, um número infinito de
métodos de ciências sociais. A maioria destes, no entanto, pode ser entendida como variantes
de nove abordagens básicas para seleção, tratamento e análise de casos: experimental,
estatística, QCA, mais similar (ou mais parecido), mais diferente, caso extremo, típico, caso
crucial e contra-factual, conforme resumido na Tabela 9.I.1
O capítulo começa com uma revisão desses nove métodos, a maioria dos quais será
familiar para o leitor. Uma segunda seção explora a relação de duas dimensões de análise -
sincrônica e diacrônica - implícita em cada um dos nove métodos. Uma terceira seção discute
a questão do tamanho da amostra no desenho da pesquisa. Uma seção final discute a utilidade
da ciência social orientada por métodos.

1 Os leitores podem se perguntar por que tem havido pouca menção de explicações narrativas, rastreamento de processos,
correspondência de padrões, etnografia, método histórico, estruturado, comparação focalizada (George 1979), grounded
theory (Glaser e Strauss 1967) e triangulação. Cada um destes (e muitos mais!) Pode ser considerado como método. No
entanto, nenhum é muito específico. Griffin (1992: 405), por exemplo, descreve a narrativa como "o retrato dos fenômenos
sociais como 'histórias' temporalmente ordenadas, sequenciais, reveladoras e abertas" repleta de conjunturas e
contingência ". Este não é um método no sentido de que estamos usando o termo aqui. Mais importante, a maior parte do
que é entendido como desejável nas abordagens anteriores é encapsulado nos dez critérios gerais relativos ao desenho da
pesquisa (Tabela 8.2) ou nos métodos delineados neste capítulo. De outras abordagens, tais como análise de estrutura de
eventos (Griffin 1993; Heise 1988, 1989) e modelagem de simulação (Johnson 1999), são específicas o suficiente, mas
ainda não demonstraram sua utilidade para a pesquisa em ciências sociais.
LARGE- N METHODS – MÉTODOS DE N- GRANDE
Relativo ao tamanho da amostra

Começamos com dois métodos que caracteristicamente empregam grandes amostras - o


método experimental e o método estatístico. Devemos observar que a noção de um tamanho de
amostra "grande" está aberta a interpretações consideráveis. Experimentos em ciências sociais
provavelmente gerarão menos casos do que experimentos nas ciências naturais; e muito menos
do que o ambiente de pesquisa não-experimental ("estatística") médio. No entanto, com
referência aos outros métodos analisados aqui, e tendo em mente uma noção plástica do
tamanho da amostra, podemos agrupar esses dois tipos de projetos de pesquisa em uma única
cesta.
Experimental

O método experimental é reverenciado como uma das marcas - talvez a marca registrada
- do método científico. Aqueles que olham para as ciências naturais para fornecer orientação
metodológica para as ciências sociais são susceptíveis de basear suas reivindicações sobre as
realizações formidáveis desta abordagem para a coleta de conhecimento. O que, então, torna o
método experimental tão especial?
Vamos começar com um exemplo. Um pesquisador deseja descobrir o efeito raciais na
avaliação de questões políticas entre membros do grupo racial majoritário. Para fazer isso, ela
organiza um experimento no qual os entrevistados amostrados aleatoriamente da raça
majoritária são divididos em dois grupos, um grupo de teste e um grupo de controle. O grupo
de teste lê uma série de passagens de notícias recentes sobre o envolvimento de minorias na
política. (Estas são notícias "positivas", mas destacam o envolvimento de minorias na política.)
Em seguida, eles são convidados a uma bateria de perguntas sobre questões políticas atuais. O
grupo de controle é solicitado o mesmo conjunto de perguntas, mas sem a leitura prévia de
notícias. Os resultados podem então ser comparados diretamente para determinar se o
enquadramento da questão tem efeitos demonstráveis sobre as posições dos respondentes.
Definitivamente, o método experimental envolve duas características essenciais: a
manipulação arbitrária do fator causal (ou fatores) de interesse e o controle - geralmente por
seleção aleatória - de todos os outros fatores que podem afetar plausivelmente a relação causal
de interesse.
Normalmente, este projeto de pesquisa produz as seguintes surpresas. Seus casos são
abundantes, ou podem ser multiplicados facilmente para se tornarem abundantes.2 Seus casos
são bem delimitados (desde que se é capaz de estudar o universo de casos possíveis, é bastante
fácil decidir o que constitui um caso relevante). Seus casos são comparáveis - um assunto é
semelhante o suficiente para o próximo assunto com relação à relação causal de interesse para
oferecer evidência útil. (Devemos observar que a comparabilidade de casos é alcançada
atribuindo aleatoriamente sujeitos aos grupos de controle e tratamento. É a randomização da
amostra, não as qualidades a priori desta amostra ou o tratamento em si, que alcançam altos

2 Métodos experimentais estão associados a amostras grandes, porque geralmente há pouco custo marginal para testar
casos adicionais. Podemos testar novamente a mesma unidade, ou podemos encontrar outras unidades que são
virtualmente idênticas. Ocasionalmente encontramos circunstâncias em que o reteste é dispendioso, ou mesmo proibitivo,
portanto não há conexão necessária entre o estudo experimental e as grandes amostras.
níveis de comparabilidade de casos em pesquisa experimental.3) Seus casos são independentes
um do outro, de tal forma que cada teste é considerado como oferecendo evidências
independentes sobre a questão de interesse do pesquisador. Seus casos demonstram variação
suficiente para comprovar a relação de interesse. O tratamento dos casos permite ao pesquisador
isolar o mecanismo no trabalho na relação causal. O experimento é replicável. E, finalmente,
alterações do experimento permitem testar uma ampla gama de hipóteses alternativas.
Claramente, há muito a ser dito sobre um projeto experimental. Nas memoráveis
palavras de Mario Bunge, "a melhor compreensão da realidade não é obtida respeitando o fato
e evitando a ficção, mas aborrecendo o fato e controlando a ficção ". De fato, a única
característica problemática do método experimental é a sua estreiteza de aplicação - daí a sua
baixa pontuação na representatividade é utilidade analítica. Nas ciências sociais, os métodos
experimentais são geralmente limitados a questões sobre as atitudes e o comportamento do
público em massa, uma vez que os membros do público podem ser entrevistados
individualmente ou observados em experimentos em grupo. Temos consideravelmente menos
acesso às elites. Mais importante, é difícil replicar as circunstâncias do comportamento das
elites de maneiras que respondam a perguntas significativas. Por exemplo, suponha que alguém
esteja interessado em descobrir a influência das contribuições de campanha na tomada de
decisão dos legisladores. Mesmo se o acesso a essas elites políticas pudesse ser organizado, em
um cenário experimental provavelmente seria inadequado para testar esta hipótese.
Não podemos testar hipóteses sobre muitos eventos em um cenário experimental porque
não podemos construir um fac-símile razoável desse evento para nossos participantes
experimentarem. Revoluções, para tomar um caso extremo, são difíceis de serem simuladas.
Além disso, nós não temos o direito, por razões de ética e lei, de manipular o comportamento
de nossos sujeitos de maneiras que possam elucidar questões que gostaríamos de saber sobre.
(Também não devo acrescentar que somos financiados suficientemente para este propósito). É
difícil ver, preocupações humanitárias e financeiras à parte, como alguém pode testar uma
sociedade.
Finalmente, muitos dos fenômenos que tentamos explicar estão enraizados firmemente
no passado. Se pudéssemos viajar no tempo para reproduzir a Revolução Francesa 10 vezes,
cada um sob condições ligeiramente diferentes, nós poderíamos descobrir - com um nível de
certeza comparável ao encontrado nas ciências naturais - se o Iluminismo, julgamentos errados

3 Outra maneira de expressar essa virtude é dizer que a randomização permite o controle de todas, exceto uma (ou
várias) variáveis de interesse, mantendo a comparabilidade em todas as outras dimensões.
reais, corrupção, guerras estrangeiras ou qualquer outro fator era o necessário ou suficiente
causa desse evento. Mas não podemos.
Um vislumbre das complicações inerentes à ao design da pesquisa experimental é
oferecido por um filme bem conhecido, o Groundhog Day (Dia da Marmota), que oferece uma
ilustração maravilhosa do método experimental como poderia ser aplicada a seres humanos.
Neste filme, um único dia é repetido e de novo sob circunstâncias iniciais idênticas. Cada dia
funciona como um caso e cada caso é totalmente independente do próximo. Apenas o
protagonista (Bill Murray) - ou, como poderíamos dizer, o experimentador - tem conhecimento
dos eventos do dia anterior. Assim, ele é capaz de sistematicamente testar várias hipóteses
relacionadas ao seu objetivo (conquistar o coração da heroína, Andie MacDowell), enquanto
controla outros fatores. Apropriadamente, o método é bem-sucedido; seus projetos de política
são realizados.
Pode ser que os métodos experimentais sejam subutilizados nas ciências sociais de hoje.
No futuro, podemos descobrir maneiras de simular vários contextos sociais, políticos e
econômicos, de modo que possamos testar, em um estudo experimental. as respostas individuais
e grupais. Mesmo assim, suspeito que a maioria das nossas preocupações atuais não pode ser
testada experimentalmente, ou pelo menos levantar sérias questões de representatividade.
Consequentemente, os métodos não-experimentais provavelmente continuarão a dominar a
pesquisa em ciências sociais. O restante deste capítulo se preocupa, portanto, com projetos de
pesquisa natural - em que os casos são tomados mais ou menos à medida que se apresentam (ou
seja, sem manipulação experimental).4

Estatísticos

Onde quer que os casos sejam não-experimentais e se deseja integrar um grande número
deles em uma análise, um é mais ou menos forçado a alcançar conclusões causais com métodos
estatísticos. Estritamente falando, "estatística" refere-se apenas a um método de análise; não
nos diz nada sobre seleção de casos, exceto que a amostra será relativamente grande.
Resultados experimentais, é claro, podem ser analisados estatisticamente - e geralmente são.
Nós vamos empregar o termo aqui para se referir a qualquer projeto de pesquisa N-grande que

4 Mill estava bem ciente das limitações do método experimental no estudo dos fenômenos sociais (ver Mill
1843/1872: 298). Vale a pena notar que nem todas as ciências naturais são baseadas em pesquisas experimentais.
Estudiosos de física teórica e astronomia, por exemplo, raramente se encontram em situações de laboratório.
usa métodos estatísticos, em vez de experimentais, para diferenciar entre ("controle para") faz
com que.
Mesmo assim, "estatística" é um termo embaraçosamente grande, abrangendo uma
ampla gama de métodos analíticos - de simples correlação a regressão múltipla, análise de
caminho, modelagem de equações estruturais, e assim por diante (o menu continua a crescer).
O que se pode fazer com este pacote de métodos em um determinado contexto de pesquisa é
determinado pelo tipo de variáveis, o número de variáveis, o número de casos e o tipo de
questões causais que se tem em mãos. O elemento crítico, para nossos propósitos, é que se está
usando métodos estatísticos, em vez de experimentais, para controlar os fatores de confusão.5
Como descrito por Vaughn McKim, os recursos empregados com mais frequência de
análise estatística seguem este padrão:
A observação (e medição) de valores de duas ou mais propriedades distribuídas
variavelmente dentro de uma população é a matéria-prima ... Para aplicar técnicas
padrão para revelar as relações que mantêm entre propriedades cujos valores podem
variar, um procedimento para medir a distribuição dos valores de cada variável deve
ser selecionado. Isto envolverá tipicamente uma representação da tendência central,
por exemplo, um valor médio da variável, e uma medida da dispersão dos seus valores,
comummente representada pelo desvio médio dos valores individuais da média, isto
é, a sua variância McKim (1997: 5-6).

Como observa McKim, esta associação entre variáveis pode ser estabelecida
visualmente - por exemplo, através de gráficos de dispersão. Se a associação é forte, existem
apenas duas variáveis de interesse, e uma não busca grande precisão, isso pode ser suficiente.
No entanto, "o avanço crítico feito pelos estatísticos no final do século XIX envolveu capitalizar
a ideia de que o grau de associação entre as variáveis representadas em um diagrama de
dispersão poderia ser representado algebricamente" - classicamente, desenhando uma linha
"melhor ajustada" que minimiza a distância entre cada ponto de dados (real) e a linha
(projetada). A inclinação da linha em um relacionamento linear simples funciona como uma
medida do "grau de associação" entre os dois fatores (X e Y), e as distâncias totais de todos os
pontos de dados da linha como uma medida da bondade de ajuste - isto é, a extensão em que a
variação de Y é "explicada" por X (se é verdadeiramente um relacionamento causal).

5
O termo "método estatístico" é utilizado noutro local (por exemplo, Lijphart 1971). É semelhante, embora não
idêntica, ao que Mill descreveu como o método de variação concomitante (veja Mill 1843/1872; De Felice 1986;
Mahoney 2000). Introduções ao a um tópico geral de estatística pode ser encontrado em praticamente todos os
livros de métodos. Achen (1982), Freedman et al. (1991), Hamilton (1992) e Kennedy (1998) são bons pontos de
partida.
Esta é uma descrição breve e esquemática de uma das mais comuns formas de análise
estatística, regressão de mínimos quadrados ordinários (OLS). Aqui, simplesmente medimos a
associação de duas variáveis. Geralmente, A análise estatística é solicitada a separar as
implicações causais de múltiplas variáveis de uma só vez. Em um projeto experimental, é claro,
teríamos foi capaz de controlar para todos, mas uma ou duas dessas variáveis, portanto,
vastamente simplificando a tarefa de comparação causal. Inferir causas de correlações é algo
complicado, mas não é categoricamente distinto do que continua em projetos experimentais,
com N-pequenos ou estudos de caso. Porque não se pode observar uma causa - causalidade é
uma inferência, não uma observação - todas as conclusões causais baseiam-se em evidências
co-variárias.

MÉTODOS PARA N-PEQUENO E MÉDIO

Uma segunda classe de métodos é frequentemente chamada de "Millean" (já que eles
derivam do Sistema de Lógica de J. S. Mill) ou simplesmente como "o método "(porque são
comumente empregados por comparativistas em ciência política e sociologia). Estes métodos
empregam pequeno ou amostras de tamanho médio e geralmente o foco se concentra na
variação primária de unidades de análises. Existem três tipos principais: comparativos
qualitativos análise (QCA), mais semelhante e mais diferente.

QCA

Análise comparativa qualitativa (QCA), iniciada por Charles Ragin, oferece uma estação
intermediária entre a análise de grandes e pequenos. N ideal está em algum lugar entre um
punhado e 50. Além de 50, o método começa a perder sua distinção e se funde com os métodos
estatísticos; abaixo de 10, ele se funde com os métodos de N pequeno discutidos abaixo. A
QCA não tem nada a dizer sobre a seleção de casos advertências, conforme especificado no
Capítulo 8, mas muito a dizer sobre como os fatores causais devem ser codificados e analisados.
A marca do QCA pode ser encontrada em três características. Primeiro, causas e os
resultados devem ser codificados dicotomicamente (presente / ausente, forte / fraco, etc.) para
que possam ser representados como o ou 1 em uma tabela de verdade. Ragin oferece o exemplo
imaginário de falha de regime - representado por 1 em a coluna sob Y na Tabela 9.2 (o indica
que um regime resistiu). Os fatores causais na tabela são (1) conflito entre idosos e jovens
oficiais militares, (2) morte de um ditador poderoso e (3) insatisfação da CIA com o regime.
Em segundo lugar, os casos são combinados em sequências comuns (combinações de
variáveis), observando o número de casos em cada sequência na coluna inicial (N). Existem
nove exemplos da primeira sequência, dois do segundo e assim por diante. Assim, um conjunto
complexo de causas e consequências pode ser reduzido a uma tabela parcimoniosa. Finalmente,
chega-se a conclusões causais através da lógica booleana. Enquanto a lógica estatística
geralmente aborda relações causais de uma forma aditiva - Xx é correlacionada com Y,
mantendo a outra constante Xs - a lógica booleana nos permite examinar a possibilidade de XT
ter um efeito diferente em Y quando combinado com a presença ou ausência de outras variáveis.
Cada sequência causal, conforme especificado pela presença ou ausência de Xs relevantes e o
Y, é considerado como uma relação causal única.

A tabela indica que todas as três causas, são causas suficientes (mas não necessárias) de
Y. Os regimes fracassarão se houver conflito entre oficiais militares mais velhos e mais jovens,
a morte de um poderoso ditador ou a insatisfação da CIA com o regime. Com mais casos e
interações mais complexas (por exemplo, múltiplos caminhos causais), um procedimento mais
formalizado é necessário para discernir essa conclusão. Mas a lógica da análise continua a
mesma.
Devemos ter em mente, contudo, que chegar a essa conclusão envolve várias suposições.
Mais importante, devemos supor que as causas e os resultados em questão são adequadamente
tratados com procedimentos de codificação dicotômicos. Isso pode envolver perda significativa
de informações. E se houver um conflito moderado entre oficiais militares mais velhos e mais
jovens? Como vamos codificar esse estado intermediário? Se as diferenças de graus são
suficientemente extremas, podemos ter alguma perda de exatidão (isto é, não precisamos
registrar as medidas exatas exigidas por maioria das análises estatísticas). Mas muitos fatores
em contextos sociais e políticos ocupar este reino intermediário. De maneira mais geral,
podemos notar que a QCA pressupõe a causação determinista. Em casa com necessidade e
suficiência, a QCA se esforça para analisar relações probabilísticas (mas veja discussão na nota
de rodapé # 15).
A utilidade do QCA em discernir caminhos causais - seja causalidade conjuntural ou
causação múltipla (ver Capítulo 7) - é um ponto de vista primário, necessitando a introdução de
um exemplo mais complexo. Um estudo recente de programas de segurança de renda em quinze
nações industrializadas emprega a QCA para chegar à seguinte conclusão. Extensas políticas
de seguridade social aparecem nessas nações em 1920, quando "(1) estatismo patriarcal e
mobilização da classe trabalhadora estão presentes e governo católico e democracia unitária
estão ausentes..., (2) governo liberal, mobilização da classe trabalhadora e democracia unitária
estão presentes enquanto o governo católico não está..., ou (3) o governo católico e a democracia
unitária e o estatismo patriarcal estão presentes, mas o governo liberal está ausente."
Assim, concluem os autores, havia três caminhos distintos para a seguridade social na
era da Primeira Guerra Mundial. Onde os caminhos causais são bem definidos (ou seja,
determinísticos), o QCA é bem construído para explorar essas relações - uma grande vantagem
sobre os pequenos métodos-N (como usualmente empregados) e análise estatística (como
usualmente empregado). No entanto, quando os caminhos causais são probabilísticos - outro
tipo de complexidade - o QCA falha. Se houvesse exceções para qualquer um dos caminhos
anteriores, por exemplo, a lógica booleana da QCA teria eliminado esse caminho como uma
hipótese causal.6
Em relação às abordagens de N pequeno, as amostras maiores tornaram possível QCA
provavelmente incluirão maior variação e, portanto, são mais propensos a ser adequadamente
delimitado e corretamente representativo de uma população maior. Existem poucas restrições
sobre o tipo de casos e variáveis que pode ser incluído (como é o caso na maioria das estratégias

6
Em trabalhos posteriores, Ragin (2000) incorpora elementos probabilísticos no procedimento de QCA. Estes
pertencem a (a) o grau de pertinência de um caso em uma categoria (que pode ser pontuada e correspondentemente
ponderada) e (b) a frequência com que um caminho causal designado é encontrado (uma ou duas exceções, onde
o N é razoavelmente alto, pode não ser suficiente para eliminar uma hipótese). Essas revisões aproximam a QCA
de um estilo de raciocínio probabilístico que está mais em sincronia com os métodos estatísticos explorados
anteriormente. À medida que o N aumenta, técnicas probabilísticas se tornam possíveis; mas QCA então perde sua
distinção como um método e a lógica booleana falha.
de pequeno porte), o QCA é consideravelmente mais flexível e pode interrogar um número
maior de possíveis hipóteses causais em um único desenho de pesquisa (uma vantagem
compartilhada com grandes métodos-N). Em relação aos grandes métodos de N (experimental
ou estatística), o contraste é invertido, aqui, o método é deficiente em plenitude, limitação,
variação e representatividade, e mais limitada no teste de hipóteses alternativas.
Consequentemente, QCA não recebe nenhuma pontuação na Tabela 9.1, significando seu status
em nossa gama de métodos. Deve-se notar que os pressupostos determinísticos da QCA ecoam
os pressupostos dos métodos de pequeno N, mas não de estudos de caso e grandes estudos de
N, que são susceptíveis de ter uma visão probabilística da causalidade.
QCA é uma adição significativa ao nosso arsenal de métodos de ciências sociais
(indiscutivelmente, o primeiro desde 1843), apesar de sua gama de aplicações ser
provavelmente permanecer limitada. A maioria das situações de pesquisa cairá mais
naturalmente em um pequeno N, estudo de caso ou grandes projetos de pesquisa em N.

Most- Similar –
Mais semelhantes- mais presentes/mais constantes

Preeminente entre os pequenos métodos de N é o método mais semelhante descoberto


por J. S. Mill (que ele chamou de "método da diferença"). Resumidamente, o desenho de
pesquisa mais semelhante procura alguns casos que são tão semelhantes quanto possível em
todos os aspectos, exceto o resultado de interesse, onde espera-se que eles variem. Isso ficará
mais claro se olharmos para um exemplo. Suponha que estamos interessados em explicar a
Revolução Francesa. Existem muitos possíveis casos comparativos, que podemos optar por
estudar. No entanto, o país mais próximo - culturalmente, economicamente, politicamente -
para a França, e aquele com o resultado mais diferente (ou seja, o patrimônio mais
revolucionário) é provavelmente a Inglaterra.
Assim, construímos uma comparação de dois países. Em seguida, analisamos todas as
possíveis causas do resultado em questão (revolução) - a existência de uma monarquia
repressiva, a vontade do regime de exercer repressão violenta para reprimir a dissensão interna,
a existência de um proletariado agrário, não há guerras e assim por diante. Com cada hipótese,
digamos, encontramos uma equivalência entre a França e a Inglaterra durante o século XVIII.
Cada uma dessas hipóteses pode então, pela lógica da análise mais semelhante, ser descartada.
Se a presença desse fator não levou à revolta na Inglaterra, raciocinamos, que provavelmente
não pode ser considerada uma causa de revolta na França (ver X 2-5 na Tabela 9.3). No entanto,
um possível fator é diferente entre os dois casos – X¹. Está claro que pode ser nossa causa
provável, por nós eliminamos todas as outras.

Diversas dificuldades possíveis devem ser notadas neste momento. Primeiro,


estipulamos um projeto de pesquisa perfeito e mais similar. Coisas no real o mundo raramente
é tão legal. Suponha que nossos dois casos sejam tão semelhantes que, embora o resultado seja
diferente, não podemos especificar nenhuma causa óbvia (não há Xl5 nos termos da Tabela
9.3). Nesta situação, devemos ou olhar para outros países, ou em diferenças mais sutis de grau
no Comparação Inglaterra / França.
Notar-se-á que tratamos cada hipótese, bem como o próprio resultado, como uma
variável dicotômica: Xs estão presentes (y) ou ausentes (n). Como a maioria das hipóteses das
ciências sociais são questões de grau, podemos tentar incorporar essas distinções mais sutis em
nossa análise. Assim, podemos substituir por nossas categorias dicotômicas um esquema
tripartido (alto, médio, baixo), ou ainda mais sutilmente calibração graduada. Talvez possamos
encontrar adjetivos não quantitativos (violento / pacífico) como mais útil. Naturalmente, essa
sutileza impõe um custo. Quanto mais complexas forem nossas operacionalizações, mais difícil
será incorporar casos adicionais, ou mesmo comparar Inglaterra e França.
A única restrição à nossa operacionalização de variáveis e resultados é que a variação
medida por tais operacionalizações deve ser bastante significativa. Em uma tricotomia de alta,
média e baixa, por exemplo, a diferença entre os casos que exemplificam "alta" e "médios" em
um fator causal particular podem não ser significativos o suficiente para sugerir conclusões
causais firmes. Esse problema foi discutido anteriormente, em conexão com o QCA.
Se nenhuma causa isolada sair da análise (como na Tabela 9.3), nós também podemos
considerar a possibilidade de que os fatores causais que atuam na produção da revolução sejam
múltiplos e trabalhem em conjunto uns com os outros. Mas este tipo de complexidade é
improvável que venha à luz em um projeto de pesquisa de pequeno-N. Tudo o que podemos
fazer é observar a variação individual variáveis; nós não temos casos suficientes para analisar
sequências - a menos que, naturalmente, casos de países também sejam observados
diacronicamente, como sugerido pela tradição histórico-comparativa de Barrington Moore e
Theda Skocpol. (A análise diacrônica é discutida mais tarde).
É importante ressaltar, finalmente, que quaisquer conclusões que alcançar tenha base na
análise de um N pequeno pode não ser muito útil para iluminar o fenômeno da revolução, como
aplicado a outros casos (não estudados). Se o desenho de pesquisa mais similar funcionar
perfeitamente, podemos argumentar que a XT é necessária para a ocorrência de revolução na
França e ponto no tempo. Mais geralmente, a proposição é assim: se um país é como a Inglaterra
ou a França no século XVIII, não vai experimentar revolução a menos que Xz esteja presente.
Não sabemos, no entanto, se X1 é suficiente, em si mesmo, para causar revolução.

Também não podemos especular sabiamente sobre as causas da revolução em outros


países. Na melhor das hipóteses, conseguimos para explicar apenas dois casos, com alguma
especulação sobre como o argumento causal pode se aplicar a uma população mais ampla.
Nossa perspectiva sobre a utilidade do método mais semelhante provavelmente
dependerá de como interpretamos esse método. Estreitamente interpretado - como um caso de
comparação de dois, com apenas uma variável diferindo entre os dois casos (como ilustrado na
Tabela 9.3) - o método tem um alcance limitado, de aplicabilidade, sua capacidade de decifrar
causas complexas e probabilísticas é praticamente nula, e provavelmente terá que
operacionalizar variáveis dicotomicamente (resultando em uma considerável perda de precisão
em muitos contextos).
Sob esta luz, as críticas de Stanley Lieberson e outros parecem justificadas. Se
adotarmos uma atitude mais permissiva em relação aos parâmetros desse método - estendendo
o número de casos (espacialmente e / ou temporalmente) -, descobriremos que ele tem uma
chance maior de superar algumas dificuldades. Por outro lado, está prestação permissiva coloca
em risco distinção como método de seleção e análise de casos.

* El método de semejanza de Mill: Consiste en comparar varios casos similares que solo
difieren en la variable dependiente, asumiendo que esto hará más fácil encontrar
aquellas variables independientes que explican la presencia o ausencia de la variable
dependiente.

Método de Diferença
Análise de diferença (na terminologia de Mill, o "método de concordância") é a imagem
inversa da análise mais semelhante: variação nos valores de X é valorizada e a variação de Y
evitada. Idealmente, descobre-se um único X que permanece constante nos dois casos,
sinalizando uma relação causal (ver Tabela 9.4). Assim, para continuar com o nosso exemplo
anterior, poderíamos decidir comparar a França com a China, outro país com um resultado
revolucionário. Diferenças de período de tempo (aproximadamente dois séculos) não são, em
princípio, um problema para as pesquisas mais desenhar; na verdade, são melhorias, porque
constituem outra diferença que pode ser analisada com referência ao resultado comum. Quanto
mais essas diferenças, podemos identificar com maior facilidade esses casos ajustar os
requisitos do método mais diferente.
Existem dificuldades formidáveis com este método, no entanto, a contabilidade por sua
escassez geral nas ciências sociais. Primeiro, como Mill reconheceu, os projetos de pesquisa
mais diferentes são mais úteis na eliminação de possíveis causas do que em fornecer uma prova
positiva de um argumento causal. Assim, na comparação França / China, poderíamos eliminar
a religião como uma causa necessária da revolução, já que nossos dois casos tinham religiões
muito variadas. Poderíamos também ser capazes de eliminar a burguesia como causa de
revolução, já que eles não desempenharam papel importante na revolução chinesa. No entanto,
sem variação em Y, quaisquer conclusões positivas sobre a causação são particularmente
vulneráveis ao problema da comparação causal "viés de variável omitida". Embora possamos
ser capazes de eliminar ou menos lançar dúvidas, possíveis fatores causais será difícil com base
desta lógica para concluir que a variável constante restante é a causa única de X, simplesmente
porque é a única hipótese que restou os outros foram descartados). É sempre possível, por
exemplo, que algum outro fator foi ignorado - ou porque não é aparente pesquisador ou porque
é muito difícil de medir - e que isso variável omitida contém a chave para nossa investigação.
Em segundo lugar, é uma característica geral dos projetos de pesquisa Most-diferent (ou
método de diferença) que ninguém será capaz de eliminar tudo, mas uma causa possível. Isto é
porque os casos que demonstram o mesmo resultado são provavelmente semelhantes em outros
aspectos também. Assim, tanto a França quanto a China experimentaram drenar
financeiramente as guerras estrangeiras; ambos desacreditaram as elites com sérias divisões
internas; ambos tinham um campesinato grande e sem-terra; e assim por diante. Nenhuma
dessas possíveis causas pode ser eliminada com segurança. Assim, o desenho de pesquisa Most-
diferent pode indicar quais de vários argumentos estão errados (insuficientes), mas
provavelmente não nos dirão muito sobre qual argumento está correto.
Caso contrário, é muito improvável que encontremos situações em que os casos valores
semelhantes em Y, mas valores altamente divergentes em Xs relevantes. Outro exemplo pode
esclarecer esse ponto. Suponha que estamos analisando gastos de governos. Será notado que
grandes gastadores tendem a ser parecidos; eles tendem a ter movimentos trabalhistas fortes,
partidos de esquerda fortes, governos centralizados, programas de bem-estar estabelecidos há
muito tempo, e assim por diante. Se, digamos, a Suíça, tivesse um grande governo (medido
monetariamente por receitas do governo ou gastos do governo), então poderíamos eliminar
muitas causas prováveis. Claro, a Suíça tem um muito frugal Estado (central). Se tivermos
muita sorte, podemos encontrar um ou dois casos que exemplificam o design de caso mais
diferente. Mas é pedir muito descansar uma teoria em dois casos.
Isso leva a um terceiro ponto crítico: embora possamos eliminar causas, não podemos
chegar a conclusões sólidas sobre as relações de uma natureza probabilística. Suponha que os
altos gastos do governo são geralmente (mesmo que um dos nossos casos de altos gastos tenha
um movimento trabalhista) correlacionado com um forte movimento trabalhista, e esta é uma
causa plausível. Nós estaríamos errados em eliminar essa variável como uma explicação do
crescimento do governo, embora a relação X: Y seja imperfeito. Como a maioria das relações
causais nas sociedades humanas é de natureza probabilística (as relações não são perfeitas),
devemos resultados da análise do método de diferença.
Esta dúvida é reforçada pela seguinte consideração. Quando um caso que é radicalmente
diferente do nosso outro caso, ou casos, mostra um resultado, há motivos primários para rejeitar
este caso como desviante. Precisamente porque os Xs variam muito, este projeto de pesquisa
enfatiza a hipótese de comparabilidade subjacente a toda análise comparativa. Casos que são
tão diferentes em suas características X (sociais, econômicas, político, histórico) podem não
responder da mesma forma a estímulos semelhantes. Eles podem ser "outliers".
Finalmente, devemos supor - se a lógica da análise mais diferente for diga-nos qualquer
coisa - que Y é o produto de uma e apenas uma causa. Se, digamos, altos gastos com previdência
social podem ser produzidos por mais de uma causa, ou por uma combinação de causas, esse
método de análise não nos ajuda a resolver o enigma. De fato, pode ser fundamentalmente
enganoso na medida em que nos encoraja a descartar fatores causais que não são constantes nos
dois casos.
Por todas estas razões, penso que é justo concluir (juntamente com a maioria outros
escritores que examinaram esta questão), que no Most-diferent comparações são raramente
encontradas no mundo empírico da ciência social e, quando encontrados, são de utilidade
limitada.22 As únicas circunstâncias que posso conceber em que a análise do método de
diferença pode ser útil é quando (a) interessa-se eliminar as causas supostamente "necessárias",
ou (b)não há variação alguma na variável dependente. Então, de fato, um é jogado de volta em
expedientes mais primitivos. Mas em todas as outras circunstâncias - o que quer dizer, na grande
maioria dos cenários de pesquisa - é melhor escolhermos casos para alcançar a variação no
fenômeno desejamos explicar.7

El método de la diferencia de Mill: Consiste en comparar varios casos diferentes, todos los
cuales tienen en común la misma variable dependiente, por lo que cualquier otra circunstancia
que esté presente en todos los casos pueden ser considerada como la variable independiente.

Case-Study Methods – Método de estudo de caso

Voltamo-nos agora para os métodos em que a amostra é, de alguma forma formal (mas
talvez enganosa) sentido, igual a 1. Existem quatro formas comuns de escolha de um estudo de
caso: caso extremo, caso típico, caso crucial e contrafactual. Os termos são um pouco confusos,
já que eles designam um tipo de caso (por exemplo, "extremo"), bem como um método de
análise (por exemplo, análise). Nenhum dano é feito enquanto mantivermos essa ambiguidade
terminológica em mente.
Como um projeto de pesquisa, estudos de caso oferecem uma virtude genérica e um
vício genérico. Sua virtude é a capacidade de elucidar mecanismos de conexão um X particular
com um Y particular. Observando o progresso de uma única unidade (um país, uma cidade,
uma pessoa) ao longo do tempo e prestando atenção à variação dentro desse caso, podemos
frequentemente observar, ou pelo menos intuir um relacionamento causal complexo no
trabalho.

7
A evidência mais forte contra o método mais diferente é que escritores que afirmam estar seguindo isso
normalmente contrabando na variação da variável dependente. Karl (1997), por exemplo, em seu excelente estudo
de petro-estados, frequentemente compara esses estados a outros estados (não petro). Na medida em que ela faz
isso, seu design mais diferente é comprometido. (Somos gratos por esses compromissos.)
O vicio correspondente são aqueles estudos de caso enfocam em um único caso; eles
não têm plenitude. A extensão desse vício muitas vezes não é clara. Na verdade, muitas vezes
não está claro se os chamados estudos de caso merecem está denominação. Formalmente (ou
seja, definicionalmente), estudos de caso baseiam-se na variação dentro do caso para analisar
relações causais maiores.
No entanto, devemos notar que três desses métodos (caso extremo, caso típico e caso
crucial) são definidos por suas características transversais (suas características em relação a um
conjunto maior de casos). De fato, enquanto a análise formal pode ser limitada a evidência
(casos dentro do caso), a maioria dos estudos de caso dedica alguma atenção comparações entre
casos também - geralmente por referência ao secundário literatura, ou para características bem
estabelecidas dos outros casos. Assim existe um caso formal (dentro de um caso) e outro
informal (caso a caso) elementos para a maioria dos estudos de caso.
Argumentos sobre a adequação dos estudos de caso muitas vezes dependem do
esclarecimento esta distinção. Lamentavelmente, o trabalho no gênero de estudo de caso nem
sempre é claro sobre que tipo de variação está sendo analisado. Nós podemos entender isso
problema como decorrente de uma ambiguidade de propósitos.
Formalmente, um caso estudo do Quênia enfoca o Quênia; é aí que o escritor conduziu
sua pesquisa de campo (ou qualquer tipo de pesquisa é necessária). Ainda o caso do Quênia não
é susceptível de fazer muito sentido, a menos que haja alguma consideração de outros países -
países que, à luz do argumento causal do autor, constituem bons casos (ver capítulo anterior).
Normalmente, estes incluirão países vizinhos.
O mesmo problema é encontrado no trabalho histórico focado em uma era particular:
enquanto o Um tópico ostensivo poderia ser o Quênia na década de 1930, será difícil (e com
toda a probabilidade impossível) explorar este tópico sem alguma consideração das décadas de
1920 e 1940.
Os escritores de estudo de caso sentem um desconforto compreensível quando forçados
a teorizar além dos limites de sua própria pesquisa primária. No entanto, eles não podem evitar,
e não devem evitar, alguma consideração de casos adicionais (não estudados) adicionais; caso
contrário, o estudo é mal delimitado.
Os escritores de estudo de caso sentem um desconforto compreensível quando forçados
a teorizar além dos limites de sua própria pesquisa primária. No entanto, eles não podem evitar,
e não devem evitar, alguma consideração de casos adicionais (não estudados) adicionais; caso
contrário, o estudo é mal delimitado. Se o N é único ou múltiplo, depende desse problema. Pelo
mesmo símbolo, quando outros casos são levados em consideração, é improvável para suportar
o mesmo peso que o caso que foi extensivamente estudado. Eles não são "casos" no mesmo
sentido.
A primeira questão é, portanto, a extensão em que um estudo de caso emprega análise
cruzada. A segunda questão é igualmente problemática e igualmente difícil de explicar. Nós
dissemos que o trabalho de estudo de caso (por definição) depende principalmente da variação
dentro do caso (ou seja, a variação dentro do caso). Nós também notamos que a variação dentro
do caso frequentemente emprega uma multiplicidade de casos (o N é alto). Aqui está um
segundo sentido, então, em que o N de um estudo de caso não é claro, para a definição de "caso"
(e daí o N de um estudo) só pode ser entendido por referência a um determinado proposição
causal, e um único estudo contém múltiplas proposições.
Uma proposição sobre o Quênia (at-large) define o país como a unidade de análise.
Aqui, o N é 1 (exceto na medida em que os casos informais são trazidos para reforçar a análise).
Uma proposição causal sobre a variação dentro Quênia (por exemplo, por que a rebelião Mau-
Mau emanou de Nairóbi e nas províncias Central e Rift Valley) define as unidades subnacionais
como unidade de análise. Aqui, o N pode ser igual ao número de regiões do Quênia. Se, para
escolher uma terceira opção, a proposição causal preocupações por que algumas pessoas no
Quênia (e não outras) participaram da rebelião, então a unidade de análise se torna indivíduos.
O N deste o estudo pode chegar aos milhares.
Já notamos esses pontos (no Capítulo 8), mas é importante enfatizar que o N de um
estudo - e particularmente de um estudo de caso – é muitas vezes indeterminado. Um autor é
susceptível de avançar proposições diferentes no decurso de tal estudo, cada um dos quais
define um primário diferente unidade de análise, e é provável que ela explore ambos os casos e
os casos evidencie para demonstrar essas proposições. Consequentemente, o N pergunta não é
facilmente resolvida. Quaisquer que sejam as complexidades, o ponto geral permanece.
Comparações que devem ser escrutinadas devem ser expostas de maneira explícita. O status
problemático do N nos estudos de caso não deve ser considerado como um convite à
ambiguidade, ou aos métodos "intuitivos". De fato, isso impõe uma especial (embora muitas
vezes negligenciada) carga sobre os pesquisadores do estudo de caso. Caso as questões devem
ser examinadas da maneira mais completa e explícita possível. Deveria ser claro para os leitores,
em particular, que tipo de variação está sendo por que tipo de reivindicações causais. Com esses
assuntos gerais, agora podemos nos voltar para a variedade de métodos de estudo de caso.
Extreme-cases/ casos extremos

Enquanto o método de diferença procura minimizar a variação no resultado de interesse,


o método de casos extremos procura maximizar tais variação. De fato, exalta o critério de
variação ao ponto de ser a principal característica do design de pesquisa. Assim, a França ou a
Suíça pode ser escolhido para um estudo da força do estado; Suécia ou Japão para um estudo
de gastos do governo; Coreia do Norte para um estudo do totalitarismo; e assim por diante.
Além de grande variação (cujas virtudes são discutidas no Capítulo 8), é provável que
um caso extremo ofereça vantagens na elucidação do mecanismo de trabalho em uma relação
causal. Momentos de extremidade como observou William James, muitas vezes revela a
essência de uma situação.
Considere os casos A, B, C, D, E, F e G, que variam ao longo da dimensão X. Digamos
que A, B, C, D, E e F variem minimamente, enquanto G exemplifica um valor extremo
("positivo" ou "negativo"). Ceteris Paribus, G será o caso mais útil para uma análise
aprofundada. Naturalmente, vamos querer manter os outros casos em mente enquanto
conduzimos nossa análise, já que esses casos fornecem a variação que estamos buscando. Mas
nós podemos justifique focalizar nossa atenção nesta unidade particular como um exemplar.
Casos extremos são particularmente úteis quando um fenômeno é difícil para
operacionalizar. Se não podemos medir o X com exatidão e precisão, estamos em terreno
particularmente instável na análise dos casos A, B, C, D, E, e F. Com G, no entanto, podemos
afirmar com alguma garantia de que algo aconteceu. É um claro "sim" ou "não" e, portanto,
vale a pena contemplando para relações causais subjacentes. Casos extremos oferecem um
método informal para dicotomizar uma variável contínua. Como não podemos medir com
precisão do "grau de fascismo", olhamos para os casos mais extremos desse fenômeno -
Alemanha e Itália - para nos falar sobre o que o fascismo significava, ou teria significado, em
outros lugares. Como não podemos medir com precisão o "grau de regulamentação de
negócios", olhamos para os países socialistas, de um lado, e Hong Kong, de outro, como casos
revelatórios (de alta regulação e baixa regulação, respectivamente). Essas são as virtudes do
método de casos extremos.
Pode haver algum sacrifício na representatividade, é claro. Um caso exemplificando um
resultado extremo é menos provável que seja representativo de uma população mais ampla de
casos do que um caso de médio porte. É, por definição, extremo, e o que é verdade em um
extremo pode não ser verdade no meio, ou no outro extremo.
Mas isso não é necessariamente assim. Lembre-se, nós somos interessados em relações
X: Y. Se essas relações exibem no caso relacionamentos internos, um caso extremo é tão
representativo quanto qualquer outro. Digamos que estamos investigando a relação entre
organização do trabalho e gastos do governo e nós decidimos focar apenas num caso de gastos
elevados (por exemplo, Suécia). Nossas trilhas de análise dentro de um caso a mudança de força
e consolidação do movimento trabalhista sueco e sua relação com os gastos do estado de bem-
estar social. (Existem, é claro, outros tipos de evidências dentro de um caso que alguém possa
querer investigar.) A relação entre a força dos trabalhistas e os gastos do governo atua muito da
mesma maneira em todos os outros casos de preocupação para nós, então nossa amostra (N =
i) pode ser considerado representativo da população. Se, no entanto, a relação não é uniforme -
se, por exemplo, a força de trabalho e relações de gastos do governo funciona de forma diferente
em parlamentarismos e sistemas políticos presidenciais - então teremos atingido um conjunto
de achados que não são generalizáveis para uma população maior.

Typical-case/ Método de caso típico

O método de caso típico é bastante semelhante ao seu primo, o método de caso extremo,
exceto que aqui a representatividade, em vez da variação, é maximizada. Uma abordagem de
caso típico procura encontrar o caso mais comum em uma determinada população - ou seja,
aquele caso que provavelmente será mais representativo em qualquer dimensão causal de
interesse.
Isso envolve a escolha de um caso que exemplifique a mediana, a média ou o modo
(espera-se que não estejam muito distantes) em dimensões causais relevantes. Assim, ao
investigar a opinião pública americana, Robert e Helen Lynd procurou por uma comunidade
que estava mais próxima de sua concepção da América (Muncie, IN). Ao investigar a ideologia
na América várias décadas depois, Robert Lane se voltou para homens que, ele pensou,
exemplificavam o homem comum urbano. "3 ° Assim como o método de caso extremo pode
ser ajustado de modo a escolher casos de ambos os extremos, então o método de caso típico
pode ser ajustado para escolher casos típicos de diferentes subgrupos de uma população em
geral para melhor representar essa população. É uma questão de amostragem estratificada (para
usar o jargão de estatísticas), mas em uma pequena escala de N e com mais métodos informais.3
* Numa população que se assume que varia consideravelmente de subgrupo para subgrupo um,
naturalmente, se esforça para encontrar casos típicos de cada um dos subgrupos, que podem
então ser adicionados para formar uma imagem composta da população.
Crucial-cases/ Casos Cruciais

Os casos são justamente escolhidos por razões de utilidade analítica, que argumentei no
Capítulo 8. Quando isso governa a seleção de caso em um N pequeno estamos identificando
casos cruciais - casos que são, por um motivo ou por outro, para um conceito ou para um corpo
mais amplo de teorias. Existem duas versões básicas de um caso crucial. No primeiro, escolhe-
se um caso ao qual ele veio a definir, ou pelo menos exemplificar, um conceito ou resultado
teórico. A França é um caso crucial nos estudos sobre revolução; A Suécia um caso crucial no
estudo do grande governo (Estados de Bem-Estar-Social); a União Soviética é um caso crucial
no estudo do comunismo; A Suíça é um caso crucial no estudo da longevidade democrática e
assim por diante. Esses são "paradigmas", pode-se dizer. Por causa de sua importância
(teoricamente, conceitualmente), o que sabemos sobre eles importa mais do que sabemos sobre
outros casos. Como alguém poderia estudar a revolução sem estudar a França?
Um segundo tipo de caso crucial revela um resultado inesperado luz da inferência causal
sob investigação - ou menos provável caso é positivo (em relação ao resultado previsto) ou um
caso mais provável é mostrado como negativo. Ambos são casos "desviantes", com respeito a
alguma teoria.
Tomemos a lei de Duverger como um exemplo. Duverger supôs que um sistema de voto
simples de maioria simples favorece sistema bipartidário. Negar casos cruciais seria, portanto,
de o seguinte tipo: um país com distritos de um único membro e primeiro-passado postar regras
(um cenário "mais provável") que não tem um ou um país com muitos distritos (um cenário
"menos provável") que tem um sistema de dois partidos. Confirmando casos seria de o seguinte
tipo: um país com distritos de um único membro e primeiro-passado postar regras que, em
outros aspectos, parece um candidato improvável para um sistema bipartidário (por exemplo, é
heterogêneo, dividido por conflito interno, quase democrático, com estruturas partidárias fracas
e assim por diante). São características não eleitorais que tornam este caso “menos provável”
evidenciar o resultado previsto pela teoria de Duverger. Pode-se também escolher estudar um
país com um sistema eleitoral proporcional que, ao longo de outras dimensões, parece maduro
para o controle bipartidário, mas cuja o resultado é multipartidário. O método do caso crucial
pode ser usado confirmar ou não uma teoria existente ou sugerir modificações nessa teoria.
A análise estatística é frequentemente útil para identificar quais casos ser crucial para
uma dada teoria. Se um caso está longe de ser previsto valor, parece (com base no modelo
estatístico) que esta o caso não se encaixa muito bem na teoria. Isso representa uma anomalia.
Ou a teoria está errada, a medição está errada, ou algum fator adicional (até agora não
explicado) está fazendo com que o caso caia fora da linha de regressão. Deve-se notar que casos
com altos resíduos são bem diferente dos casos com valores extremos. Um caso extremo pode
explicar a teoria perfeita. Um caso alto residual, ao qual nos referimos como desviante não.
As fraquezas deste método de outra forma esplêndida são talvez óbvias do nosso
exemplo escolhido: pode não haver um caso crucial, e mesmo quando pode ser possível explicar
sua existência sem comprometer a principal premissa teórica. Assim, pode-se dizer com
referência a um único caso desconfiante de que isso é, afinal, apenas um único caso em um
grande universo de casos. De fato, mesmo quando operamos no modo de desconfirmação,
estudos de casos cruciais geralmente acabam por reformular as teorias sob investigação, de
modo a ter em conta as anomalias recentemente descobertas, rejeitando essas teorias fora de
mão. Modificar, não falseando, é o propósito usual de estudos focados em um caso crucial.

Contrafactual
Até este ponto discutimos métodos que analisam casos "reais" - casos que realmente
existem ou existiram. Igualmente importante para muito social trabalho científico, e
particularmente para o trabalho de natureza histórica, é contrafactual análise - a exploração de
coisas que não aconteceram, mas (concebivelmente) poderia ter. Os contrafactuais são
experimentos de pensamento. Realizado em nossas cabeças, eles nos permitem testar várias
hipóteses contra as evidências disponíveis.34 A análise contrafactual está implícita,
observamos, em todo raciocínio causal. Para ter certeza, alguns contrafactuais são mais úteis
para testar argumentos causais do que outros. A regra geral, estabelecida no Capítulo 7, é que
contrafactuais que causam o menor dano ao registro histórico como nós o conhecemos - o curso
normal dos eventos - são os mais úteis. Se argumentarmos que os Estados Unidos venceram a
Segunda Guerra Mundial por causa de sua decisiva invasão da Europa em 1944, este argumento
é reforçado por um contrafactual: se tivéssemos esperado, dando à Alemanha tempo para
desenvolver seu próprio dispositivo nuclear, o resultado poderia ter sido diferente. Este é um
argumento razoável, dado o que sabemos dos esforços da Alemanha nessa direção. Não é
necessariamente conclusivo (são poucos contrafactuais), mas é útil em analisando a verdade da
nossa proposta inicial. A análise contrafactual construída de forma adequada está de acordo
lógica da análise mais semelhante.
Um olhar para descobrir que o contrafactual que cria dois casos que são tão semelhantes
quanto possível em todos os aspectos exceto pelo resultado e a causa presumida (que, é claro,
varia). De fato, a noção de um "contrafactual" é talvez um pouco errôneo. Porque os argumentos
causais são eles próprios questões de interpretação (eles não são fatos, no sentido usual deste
termo), um contrafactual simplesmente joga fora a lógica da hipótese inicial. Cada "factual"
hipótese sugere uma hipótese contrafactual.

Alguns culpam o fato da Revolução Americana por políticas imprudentes adotadas pelos
britânicos na esteira da Guerra Franco-Indígena. Os colonos teriam se revoltado na ausência de
impostos ("assediantes"), billeting de soldados britânicos, as declarações inflexíveis e
desdenhosas emanando da coroa e do gabinete? Esta parece ser uma linha frutífera de inquérito,
um conjunto útil de perguntas para representar o registro histórico.

Um útil contrafactual é um experimento mental que nos permite repetir a história de


uma maneira um pouco diferente do que o curso real dos eventos. Não é mais contra os fatos
do que o argumento que se pretende testar - neste caso, que a política britânica foi responsável
pela revolução. A técnica do raciocínio contrafactual nos permite criar casos (ainda que
hipotéticos) onde os casos são escassos. Não é claro que existem outros casos em tudo o que se
pode interrogar para evidência sobre as duas proposições discutidas aqui (o efeito do Iniciativa
americana para acabar com a Segunda Guerra Mundial e o papel da política britânica na
Revolução Americana). Certamente, essas situações seriam difíceis para replicar em um projeto
de pesquisa experimental. Não há nada não científica sobre um contrafactual, portanto. Onde
quer que os casos reais sejam escassos e um único resultado (ao invés de um resultado geral) é
de interesse, um pode ser obrigado a calcular cenários hipotéticos para formar, e teste, hipóteses
causais.

TWO DIMENSIONS OF ANALYSIS/ DUAS DIMENÇÕES DA ANÁLISE

Comparações que observamos, podem ser através do espaço ou através do tempo.


referem-se ao primeiro como sincrônico (ou transversal), e o último como diacrônico (também
conhecido como temporal, longitudinal ou histórico). Enfatizei os elementos sincrónicos dos
nove métodos básicos introduzidos neste capítulo porque comparações através do espaço são
mais fáceis de entender sobre um nível conceitual. No entanto, deve ficar claro para o leitor que
todos os estes métodos também podem ser empregados diacronicamente.
Eles podem, é claro, produzir muito mais casos diacrônicos, como quando um
experimento é conduzido por um longo período ou quando observações frequentes (cada uma
constituindo um caso separado) são tomadas durante um período limitado. Pesquisas de painel
(onde os mesmos assuntos são pesquisados em vários momentos) servem como experimentos
longitudinais. Os métodos contrafactuais também são inerentemente diacrônicos, uma vez que
se analisa uma determinada unidade ao longo do tempo sob várias condições hipotéticas.

Qualquer estudo que analise uma única unidade ao longo do tempo - e onde alguma
variação em Y e / ou X é observado durante esse período de tempo - pode ser entendido
empregando um método de análise "mais similar" (isso inclui o método contrafactual). Assim,
ao invés de comparar a França e Inglaterra, como na Tabela 9.3, pode-se comparar a França
consigo mesmo ao longo do tempo - criando dois casos, a França em Tx (antes da Revolução)
e a França em T2 (depois da Revolução). Esta é a abordagem normal ao estudo de caso pesquisa
e pesquisa histórica em geral.
O historiador da Revolução Francesa tipicamente analisa cuidadosamente as
mudanças na sociedade francesa durante e antes do evento de interesse. Idealmente, todos, com
exceção de alguns fatores, são mantidos constantes neste projeto de pesquisa diacrônica e,
eliminados como causas prováveis (Eles não mudam; portanto, eles não podem causaram a
revolução.) O foco do historiador é atraído para aquele ou vários fatores que mudaram de forma
antes do evento, e isso os tornam o principal suspeito causal.
É isso que torna o experimento natural tão atraente. Aqui a manipulação deliberada de
insumos é simulada pela ocorrência natural de eventos, criando um desenho de pesquisa quase-
mais semelhante (observado através do tempo). Por exemplo, quando os Países Baixos aboliram
a obrigatoriedade do voto, pouco antes da eleição de 1970, os analistas puderam observar
mudanças no comparecimento antes e depois da inovação. Porque estas mudanças foram
dramáticas, e porque nenhuma outra explicação poderia explicá-las (fatores causais alternativos
foram controlados), está quase-experiência ofereceu uma forte corroboração para o argumento
de que os regulamentos de votação afetarem os níveis de participação. O que se pode dizer,
então, sobre a utilidade do diacrônico e sincrônico análises? Quais são as vantagens e
desvantagens características de comparação longitudinal em diferentes situações de pesquisa?

Uma vantagem da análise diacrônica é que ela geralmente consegue estabelecer pelo
menos dois casos que satisfaçam o requisito de comparabilidade. Um único país, partido,
instituição ou indivíduo no Tx é susceptível de ser bastante semelhante a essa entidade em T2,
desde que os dois períodos de tempo razoavelmente próximos. Assim, a análise diacrônica é
particularmente útil quando desejamos manter os fatores culturais constantes em um projeto de
pesquisa. Fatores culturais envolvem problemas de comparabilidade, notamos, porque é difícil
reduzir as diferenças entre unidades para um padrão métrica. Projetos de pesquisa diacrônica
têm um tempo um pouco mais fácil de lidar com diferenças culturais, já que o país A no TT
provavelmente será culturalmente falando, bastante semelhante ao país A em T2 - mantendo
assim a cultura constante nos dois casos.
Para ter certeza, quanto mais separamos nossos casos no tempo, mais tênue torna-se a
comparatibilidade. Os historiadores suspeitam legitimamente de tentativas de comparem a
Inglaterra contemporânea com a Inglaterra elisabetana. Tudo depende, é claro, sobre a
proposição que se está tentando sustentar. Se alguém está discutindo que a força da festa é
determinada pela força e independência do parlamento, então uma comparação entre o partido
fraco / parlamento fraco Inglaterra elisabetana e forte-partido / forte parlamento contemporâneo
Inglaterra poderia ser bastante útil. Se alguém está argumentando que o crescimento no governo
é o produto de uma guerra de licitação entre partidos políticos, é provavelmente não é sensato
usar a Inglaterra elisabetana como um caso. Os partidos eram tão diferentes naquela época (mais
parecido com o que nós nos referiríamos hoje como facções) que eles não nos dizem nada útil
sobre as fontes de impostos e gastos do governo.
Uma situação recíproca é encontrada no problema da independência de casos. Quanto
mais próximos dois casos diacrônicos estão no tempo, menos provável é que esses dois casos
são totalmente independentes um do outro. Se não, eles não podem ser considerados como
fontes independentes de evidência (casos) para qualquer proposição que esteja sendo avançada.
Embora a análise sincrônica também enfrente problemas de independência de caso, tais
problemas raramente são tão severos quanto os experimentados na análise diacrônica: Mais
importante, eles geralmente são mais aparentes e, portanto, mais fáceis de controlar. Como o
problema da independência de caso foi discutido com alguma extensão no Capítulo 8, não vou
me debruçar sobre o assunto aqui.
A vantagem mais importante dos projetos de pesquisa diacrônica vem em jogo sempre
que os supostos X e Y são considerados próximos ligados, ou pelo menos regularmente ligados,
a tempo. Nestas circunstâncias, nós precisamos apenas traçar o resultado para ver quando,
precisamente, ocorreu (ou quando algum aumento ou diminuição do precipitado ocorreu), e
depois qual das possíveis causas também estava mudando naquele ponto (ou somente o
interior).
Se, por outro lado, temos razões para acreditar que o relacionamento X: Y é mais complicado,
ou se quisermos encontrar causas que remover do resultado real de interesse, então uma
pesquisa diacrônica projeto é provável que seja inconclusivo. As questões de tempo serão
menos críticas, e talvez até mesmo irrelevante, já que imaginamos longo e talvez irregular
períodos que separam causa e efeito. Mudanças nos arranjos de posse da terra, por exemplo, é
improvável que tenham uma relação temporal próxima revoltas revolucionárias, embora
possam ser bastante importantes preparando o palco para tais eventos.
Alternativamente, as variáveis X ou Y podem ser de tal natureza que não pode ser
rastreado com precisão no tempo. Podemos ter observações em somente intervalos de vinte
anos, uma lacuna que talvez seja grande demais para evidência útil no relacionamento X: Y.
Porque os eventos são mais fáceis de mais do que processos - eles acontecem em momentos
bem definidos em tempo - os resultados que tomam a forma de eventos são mais acessíveis a
um projeto de pesquisa diacrônica.
A análise diacrônica pode significar muitas coisas, portanto, dependendo o tipo de
método empregado, o tipo de evidência encontrado e as os tipos de inferência causal que se está
tentando provar. Na maioria das situações de pesquisa, a análise diacrônica oferece uma chance
de observar conexões - em quem fez o quê a quem - que eu referi como o mecanismo causal.
Sua desvantagem é igualmente evidente: existe uma única unidade de estudo (país, partido,
indivíduo). A menos que essa unidade ofereça uma grande variação ao longo do tempo, o N
será limitado. Mesmo se houver grande variação ao longo do tempo, pode-se questionar a
representatividade deste informante vis-à-vis uma população mais ampla (de países, partidos
ou indivíduos). Em suma, a amplitude de uma proposição baseada em um estudo diacrônico
provavelmente será menor do que a amplitude de uma proposição baseada em casos
considerado sincronicamente.

THE N DEBATE: SMALL VERSUS LARGE

Ao longo deste capítulo e no capítulo anterior, é executado um debate recorrente e


muitas vezes dogmático sobre o desenho da pesquisa: quantos casos devemos estudar?
Especificamente, devemos dividir nossa atenção entre muitos exemplos de um fenômeno, ou
enfocamos alguns? Podemos especular sobre as razões da intransigência dos dois campos em
este debate de longa data, que tem contrariado a ciência social desde o começando. Certamente,
está relacionado com os hábitos, inclinações e capacidades de praticantes nesses campos.
Aqueles não familiarizados com métodos estatísticos são forçosamente restritos a
amostras relativamente pequenas. Aqueles desconfortáveis com um formato narrativo
geralmente preferem abordagens N grandes, onde tabelas e gráficos ocupam o centro do palco.
Conveniência e temperamento devem não nos interessa aqui. Com o que devemos nos
preocupar são metodologicamente razões fundamentadas para preferir uma abordagem sobre a
outra.
Casos são bons e mais casos são melhores; nós falamos muito disso no no Capítulo 8.
Vale a pena notar que não existe argumento paralelo para N projetos de pesquisa: pequenez por
si só não é uma virtude. Mas a plenitude é apenas um critério entre dez projetos de pesquisa
que governam (ver Tabela 8.1).
Embora a plenitude possa aumentar a limitação, representatividade, variação e
comparação causal de uma amostra, muitas vezes tem efeitos deletérios efeitos sobre a
comparabilidade de casos. Porque a comparabilidade é talvez a mais característica importante
de uma amostra, e porque muitas vezes não há maneira óbvia de superar as incomparabilidades
de caso (por "controlar" fatores), devemos ter muito cuidado na defesa da pesquisa de grande
porte desenhos. Uma grande amostra com casos heterogêneos provavelmente provará algo
sobre nada, ou nada sobre alguma coisa.

Devemos notar também que, para muitos critérios proposicionais (Tabela 5.1) não há
vantagem clara para amostras pequenas ou grandes. Considere a precisão. Se alguém está
examinando a precisão de uma inferência em relação a um dado amostra de casos (casos
realmente estudados pelo investigador), parece claro essa pequena análise de N tem a vantagem.
A precisão relativa de um estudo muitas vezes sofre quando casos adicionais são adicionados.
Questões de medição são agravadas sempre que fatores altamente contextuais devem
ser operacionalizados em um grande número de casos. E se julgamentos qualitativos (por
exemplo, fraco, médio, forte) deve ser convertido em forma quantitativa, é provável essa
precisão foi sacrificada com o propósito de alcançar maior largura. Um assunto que leva várias
páginas de prosa para explicar não pode ser capturado em um único indicador sem alguma perda
de precisão.
Contudo, se estamos interessados na precisão de uma inferência em relação a uma
maior população - uma questão de representatividade -, então é claro que grande-N análise será
favorecida. Uma pesquisa aleatória com mais respondentes alcançará um nível mais alto de
precisão (medido pela margem menor de erro), indicando que estamos mais certos de que os
resultados entre nossa amostra são, de fato, reflexo dos verdadeiros resultados em nossa
população de interesse. Isso é axiomático. Eu levanto o ponto apenas para ilustrar que quando
os pequenos e grandes partidários de N discutem o problema da precisão eles estão
frequentemente discutindo sobre diferentes questões - precisão dentro de uma amostra versus
precisão em relação a uma população.
Podemos notar também que os métodos de análise de pequeno e grande porte não são
tudo de uma peça; assim, os termos desse contraste usual podem ser altamente enganosos. Por
exemplo, enquanto a maioria dos métodos de análise de N pequeno emprega uma visão
determinística da causação (causas são necessárias e / ou suficientes, e todas as variáveis
compreensíveis em termos inequívocos, categóricos), ambos os métodos de estudo (onde N =
1) e grandes N tendem a ter uma visão probabilística das relações causais.39 Assim, é difícil
generalizar sobre a questão N. A ambiguidade mais importante diz respeito à definição de caso
e portanto, do tamanho da amostra.
Pesquisadores de pequeno porte provavelmente procurarão variação, grandes
pesquisadores de N para variação entre casos. Assumindo que se reconhece a legitimidade da
análise dentro do caso, ela será realizada essa pesquisa de estudo de caso pode não ser um único
caso. De fato, a análise dentro do caso geralmente oferece uma análise muito maior do que a
análise de caso como já notamos. Embora possa haver problemas de representatividade quando
se procura generalizar a partir deste caso para os outros (não estudado), por vezes, evidências
mais fortes estão disponíveis análise do que da análise de casos. Em suma, o perene debate N /
large-N não admite resolução simples, pois o tamanho de uma amostra é apenas uma das muitas
características que caracteriza bons projetos de pesquisa.

IS THERE A BEST METHOD? EXISTE O MELHOR MÉTODO? / EXISTEM UM


MÉTODO MELHOR?

Indiscutivelmente, existe um melhor método para análise de ciências sociais, e é o


método experimental. De fato, o método experimental imita a definição de causação em termos
de condicionais contrafactuais. É definicionalmente verdade, pode-se dizer. Como também
notamos, o experimento puro raramente é aplicável a problemas de ciências sociais - ou, se
perifericamente aplicável, raramente iluminando. Situações experimentais, vira raramente são
representativos dos fenômenos sociais com os quais nos preocupamos (guerras, depressões,
eleições, chamadas legislativas, etc.). Consequentemente, é provável que tenham utilidade
analítica e relevância limitadas. Eles são seja trivialmente verdadeiro ou trivialmente duvidoso.
Infelizmente, o caráter não experimental da ciência social levou certos membros da
academia para declarar sua emancipação da ciência. A lógica parece ser "Se não podemos
realizar experimentos, não pode fazer ciência. "Esta lógica dicotômica não é muito útil. Dewey
observa: "A ideia de que, porque os fenômenos sociais não permitem a variação controlada de
conjuntos de condições em uma série de operações um-por-um, portanto, o método
experimental não tem nenhuma aplicação, fica no caminho de aproveitar o método experimental
para a medida que seja praticável. "* ° Se a ciência social não é uma ciência experimental é
pelo menos uma quase- ciência experimental, uma vez que imita os objetivos e os métodos de
análise experimental. De fato, muitas vezes ouve-se as virtudes do experimento "natural" - um
experimento que testa uma hipótese da mesma forma que um pesquisador faria se pudesse
manipular as entradas de uma sociedade. Estatística, mais semelhante, mais diferente, métodos
de caso extremo, caso típico, caso crucial e contrafactual todos podem ser vistos como quase-
experimental.
A lição razoável e útil a ser tirada dessa discussão não é que devemos nos divertir em
nosso status não-experimental, mas sim que nós devemos tentar reter tantas das virtudes do
experimental método que razoavelmente podemos, dadas as nossas agendas de pesquisa. Se
devemos tomar a evidência como se apresenta (ao invés de criá-la para nossos próprios
propósitos), isso não significa que o ideal científico esteja morto. O que significa é que os
cientistas sociais têm que trabalhar mais e pensar mais, sobre projeto de pesquisa do que o
cientista natural médio. Raramente é fácil responder à pergunta de qual projeto de pesquisa é o
melhor. No entanto, raramente um o design é tão bom quanto o outro. Dada uma situação
particular de pesquisa e uma hipótese particular de interesse, provavelmente haverá um ou dois
"melhor" (mais apropriado, mais esclarecedor) métodos de análise.
Se esses métodos são bons em comparação com métodos que podem ser, ou foram
aplicadas a outras situações de pesquisa é irrelevante. O que importa é que tomamos o cuidado
de selecionar o método mais apropriado para a questão de interesse. Algumas questões são mais
facilmente provadas do que outras. Mais uma vez, vemos a importância de padrões relativos de
adequação (ver Capítulo 2).
Temos que resistir à tentação de estudar apenas as perguntas fáceis por exemplo, que
podem ser respondidas com métodos experimentais). A ciência social orientada por métodos
frequentemente acaba provando conclusivamente nós já sabíamos antes de começarmos, ou
com o que nos importamos pouco. Questões de design de pesquisa e nossa consideração
cuidadosa de vários métodos e os casos importam ainda mais porque as respostas são
complicadas e não é facilmente resumido em uma frase ou equação concisa. Finalmente,
devemos notar que a maioria dos projetos de pesquisa combina vários elementos dos nove
métodos e duas dimensões apresentadas neste capítulo.
Desenhos experimentais nas ciências sociais são provavelmente mais com precisão
rotulado quase-experimental (eles são muitas vezes bastante diferentes a partir de experiências
nas ciências naturais), fundindo-se assim com os vícios e virtudes dos outros oito métodos.
Métodos mais semelhantes costumam favorecer casos com valores extremos no X ou Y de
interesse, fundindo assim com a abordagem de casos extremos. Onde quer que o N seja
pequeno, os escritores parecem incorporar casos "cruciais", mesmo que o escritor não esteja
seguindo explicitamente um projeto de pesquisa de caso crucial. A maioria dos métodos de
todos os tipos, como nós temos disse, incluir elementos sincrônicos e diacrônicos e – confundir.
Além disso, eles podem compor projetos de pesquisa separados (por exemplo, a análise
pode ser muito diferente e a análise diacrônica mais similar). A análise contrafactual, como
também notamos, é uma espécie da análise mais semelhante - como, aliás, é a narrativa mais
tradicional história. Mesmo dentro de cada método estipulado há enorme variação. O método
estatístico, em particular, abriga uma enorme variedade de abordagens. De fato, quanto mais
próximo se examina a tipologia estabelecida na Tabela 9.1, o menos adequado aparece. É uma
boa primeira aproximação, mas um somatório muito pobre do desenho da pesquisa como é
realizado no Ciências Sociais.