Вы находитесь на странице: 1из 394

Universidade de So Paulo

Faculdade de Filosofia, Letras e Cincias Humanas


Departamento de Lingustica
Programa de Ps-Graduao em Semitica e Lingustica Geral

Identidade na Pluralidade

Avaliao, produo e percepo lingustica


na cidade de So Paulo

Livia Oushiro

Verso Revisada

So Paulo
2015
Universidade de So Paulo
Faculdade de Filosofia, Letras e Cincias Humanas
Departamento de Lingustica
Programa de Ps-Graduao em Semitica e Lingustica Geral

Identidade na Pluralidade

Avaliao, produo e percepo lingustica


na cidade de So Paulo

Livia Oushiro

Tese apresentada ao Programa de Ps-


Graduao em Semitica e Lingustica Geral
do Departamento de Lingustica da Faculdade
de Filosofia, Letras e Cincias Humanas da
Universidade de So Paulo, para obteno do
ttulo de Doutor em Letras.

Orientador: Prof. Dr. Ronald Beline Mendes

Verso Revisada

So Paulo
2015
Banca Examinadora

Prof. Dr. Ronald Beline Mendes (FFLCH-USP)


Presidente

Prof. Dr. Jos Luiz Fiorin (FFLCH-USP)


Membro titular

Prof. Dr. Gregory R. Guy (NYU)


Membro titular

Profa Dra Maria Marta Pereira Scherre (UFES)


Membro titular

Prof. Dr. Sebastio Carlos Leite Gonalves (UNESP)


Membro titular
Para os paulistanos
e para o Pedro,
meu paulistano preferido.
Agradecimentos

Esta tese resulta de uma longa trajetria de amadurecimento e do apoio de


inmeras pessoas. Devo agradecer, primeiramente, aos meus pais, Kengo e
Iuri, e minha irm, Luciana, que sempre me apoiaram em todos os projetos;
ao Pedro, meu companheiro de todos os momentos, pelo carinho cotidiano e
por ser minha grande fonte de fora e de equilbrio emocional; e Jlia,
Ana, ao Rubens, ao Jlio e ao Caio, por terem me acolhido em sua famlia.
Agradeo Camila Zanon, ao Tiago Attorre, ao Uiran Gebara, Lana
Lim, ao Luciano Ferreira, ao Tiago Pessoa, Veruska Mazzoni, ao Bernardo
Goldberger e Cludia Maluhy pelas muitas noites de sbado h mais de
uma dcada. Em especial, os paulistanos dentre vocs, involuntariamente,
forneceram-me algumas boas ideias para este trabalho.
Ao Ronald Beline Mendes, que vem me acompanhando zelosamente no
percurso acadmico dos ltimos oito anos, agradeo pelas valiosas oportu-
nidades de crescimento que me propiciou, por ter me conduzido para alm
de limites que eu jamais poderia me imaginar capaz de ultrapassar, pela
orientao firme e pela amizade sincera.
Agradeo aos professores de Lingustica da USP, especialmente Evani
Viotti, ao Leland McCleary, Esmeralda Vailati Negro, ao Marcos Lo-
pes e Margarida Taddoni Petter, que contriburam continuamente com
minha formao; aos professores Waldir Beividas e Olga Ferreira Coelho,
enquanto coordenadores da ps-graduao, pelo apoio constante aos alunos
de Lingustica.

v
Aos professores Erez Levon e Evani Viotti, agradeo pelos muitos aponta-
mentos que fizeram para o encaminhamento desta pesquisa, por ocasio do
Exame de Qualificao. Aos professores Ronald Beline Mendes, Jos Luiz
Fiorin, Sebastio Carlos Leite Gonalves, Maria Marta Pereira Scherre e
Gregory Guy, pela leitura crtica desta tese, pelos inmeros comentrios e
sugestes de encaminhamentos futuros, e pelo alto patamar das discusses
que levantaram durante a Defesa. Aos professores Roberto Camacho, Silvia
Brando, Elisa Battisti, Esmeralda Vailati Negro e Marcos Lopes, por tam-
bm terem aceitado o convite para a banca. Aos vrios professores e colegas
presentes no dia 20 de fevereiro de 2015 na Sala 122, pelo inestimvel apoio
nesse momento da trajetria acadmica.
Tambm sou grata aos professores que, em encontros cientficos, em
reunies particulares ou em conversas informais ao longo de meu doutorado,
enriqueceram este trabalho atravs de seus questionamentos e sugestes:
Anna Christina Bentes, Carol Klee, Christina Gomes, Cludia Brescancini,
Danny Erker, Elisa Battisti, Greg Guy, James Walker, John Singler, Josane
Oliveira, Jos Luiz Fiorin, Kathryn Campbell-Kibler, Lilian Yacovenco, Lisa
Davidson, Luiz Carlos Schwindt, Marta Scherre, Meredith Tamminga, Philipp
Angermeyer, Raquel Meister Ko. Freitag, Rene Blake, Robin Dodsworth,
Scott Schwenter, Sebastio Carlos Leite Gonalves, Silvia Brando, Silvia
Vieira e Tony Naro.
A experincia da ps-graduao seria muito menos interessante sem a
companhia dos muitos colegas, sobretudo os amigos do Grupo de Pesquisa
em Sociolingustica: Day Almeida, Marlia Vieira, Rafael Rocha, Mari Bi-
eler, Wendel Santos, Larissa Soriano, Fernando Gomes da Silva, Amanda
Santana, Rafael Ciancio e Jlia Frana. A Eneida Leal, Ftima Baia, Indai
Bassani, Marcus Lunguinho, Rafael Minussi, Julio Barbosa, Carol Lemos,
meus veteranos, agradeo pelas muitas dicas de como sobreviver na ps; a
Carol Tomasi, pela divertida companhia durante a representao discente; a
Fernanda Canever e ao Vitor Nobrega, pelas conversas deliciosas, que nunca
tm hora para acabar.
O estgio sanduche na NYU contribuiu enormemente para meu amadu-
recimento acadmico e para os rumos desta pesquisa. Ao Greg Guy, devo

vi
os mais sinceros agradecimentos no apenas por ter aceitado a proposta do
estgio, mas tambm por sempre se mostrar disposto a discutir meus dados
e a me integrar plenamente na vida acadmica da NYU. Ao John Singler e
Rene Blake, agradeo igualmente pela carinhosa acolhida entre os socio-
linguistas do departamento e pelo interesse constante nos desenvolvimentos
deste projeto. Agradeo a Allison Shapp, Carina Bauman, Nicole Holliday
e Nate LaFave pela amizade e, de modo muito especial, a Emily Nguyen, a
Marie-Eve Bouchard, a Luiza Newlin-Lukowicz e Sang-Im Lee-Kim, por me
fazerem me sentir em casa, mesmo longe do Brasil.
Agradeo rica Flvia de Lima e ao Robson Dantas, pelo auxlio nos
trmites da universidade e por fazer a experincia acadmica parecer um tanto
menos burocrtica. Pelo financiamento da pesquisa, agradeo ao CNPq (pelos
seis primeiros meses) e FAPESP, pela Bolsa de Doutorado e pela Bolsa
Estgio de Pesquisa no Exterior (Processos 2011/09122-6 e 2012/01930-9).

vii
Resumo

Esta pesquisa apresenta anlises sobre avaliao, produo e percepo lin-


gustica no portugus paulistano, por meio do exame de quatro variveis
sociolingusticas: a realizao de /e/ nasal como monotongo [e] ou ditongo
[ej] (como em fazenda); a pronncia de /r/ em coda silbica como tepe [R] ou
retroflexo [] (como em porta); a concordncia nominal de nmero (como em
as casas/as casa); e a concordncia verbal de primeira e de terceira pessoa do
plural (como em ns fomos/ns foi, eles foram/eles foi). O objetivo central
analisar, em uma comunidade amplamente heterognea de um ponto de vista
sociodemogrfico, as inter-relaes entre a expresso de identidades sociais
atravs de usos lingusticos e a possvel influncia dos significados sociais
desses usos em processos de variao e mudana lingustica.
Para tanto, analisou-se qualitativa e quantitativamente uma amostra
contempornea do portugus paulistano, composta de 118 entrevistas sociolin-
gusticas com falantes nativos, luz dos pressupostos terico-metodolgicos
da Sociolingustica Variacionista (Labov, 2006 [1966], 2008 [1972]). Tais an-
lises compreendem o encaixamento lingustico e social de cada varivel, bem
como seu encaixamento simultneo na fala de cada indivduo. Alm disso,
examinaram-se percepes sobre as variantes de (-r), com base na tcnica de
estmulos pareados (Lambert et al., 1960), a fim de melhor compreender os
mecanismos subjacentes associao de certos significados sociais ao emprego
de diferentes formas lingusticas.

viii
Os resultados mostram que, embora as correlaes entre as quatro variveis
sociolingusticas e variveis sociais sejam bastante semelhantes entre si (todas
se correlacionam com o Sexo/Gnero, a Classe Social e o Nvel de Escolaridade
dos falantes), h diferentes tendncias dentro da comunidade por exemplo,
mudana em direo variante ditongada [ej]; padres divergentes quanto
ao emprego de (-r) por parte de jovens de diferentes classes sociais; variao
estvel das concordncias nominal e verbal em regies perifricas e mudana
em direo variante padro em regies centrais. Para compreend-los, o
exame de seus significados sociais fundamental. Argumenta-se que [ej]
tem se difundido rpida e unidirecionalmente pelo fato de se constituir um
marcador (Labov, 2008 [1972]) para paulistanos, que no revelam ter cons-
cincia da varivel, tampouco apresentam um discurso metalingustico sobre
suas variantes. O forte favorecimento do retroflexo entre jovens de classes
baixas foi desencadeado por uma reinterpretao de seu significado social
como uma variante local e de prestgio, devido presena macia de migrantes
do Norte/Nordeste, cuja variante fricativa relativamente mais estigmatizada
na comunidade. Ao mesmo tempo, ainda que o encaixamento social das
concordncias nominal e verbal seja bastante semelhante, a marca zero de
concordncia nominal (as casa) goza de maior vitalidade por indexicalizar
significados como masculinidade, paulistanidade e morador da Mooca.
No obstante as diferentes tendncias que se verificam na comunidade, os
padres de encaixamento das variveis lingusticas se reproduzem sistemati-
camente na fala de cada indivduo, o que permite caracterizar os paulistanos
como uma nica comunidade de fala (Labov, 2006 [1966]), que compartilha
normas de produo e de avaliao lingustica. De acordo com o teste de
percepes, os moradores da cidade tambm so consistentes em suas reaes
subjetivas a variantes de (-r). Demonstra-se adicionalmente que a coeso
dialetal promovida no por amplas categorias sociais como Sexo/Gnero
ou Faixas Etrias, mas pelo princpio mais fundamental de densidade de
comunicao (Gumperz, 1971b,a).
Palavras-chave: Portugus paulistano. Variao e mudana lingustica.
Identidades sociais. /e/ nasal. /r/ em coda. Concordncia nominal. Concor-
dncia verbal. Covariveis. Percepo.

ix
Abstract

This study examines linguistic evaluation, production, and perception in


So Paulo Portuguese, through analyses of four sociolinguistic variables: the
realization of nasal /e/ as a monophthong [e] or as a diphthong [ej] (as in
fazenda farm); the realization of coda /r/ as a tap [R] or as a retroflex []
(as in porta door); nominal number agreement (as in as casas/as casa the
houses); and first person plural and third person plural verb agreement (as in
ns fomos/ns foi we went, eles foram/eles foi they went). The main goal
is to investigate the inter-relation between the expression of social identities
through language uses and the possible impact of social meanings on processes
of language variation and change, in a highly diverse and heterogeneous
community.
Based on the theory and methods of Variationist Sociolinguistics (Labov,
2006 [1966], 2008 [1972]), each variables linguistic and social embedding, as
well as their simultaneous embedding in individual speakers speech, were
analyzed both qualitatively and quantitatively in 118 sociolinguistic interviews
with native Paulistano speakers. In addition, perceptions on the variants of
(-r) were examined through an experiment using the Matched Guise Technique
(Lambert et al., 1960), aimed at describing the mechanisms underlying the
association of certain social meanings with different language forms.
The results show that, in spite of the similarity between the social embed-
ding of the four variables (all of them are correlated with speakers sex/gender,

x
social class, and level of education), there are different trends within the
community for instance, change towards (e) diphthongization; divergent
patterns regarding (-r) in the speech of younger speakers of different social
classes; stable variation in nominal and verbal agreement in peripheral areas
but change towards the prestige variant in central areas. The explanation for
these patterns is related to the variants social meanings. It is argued that
[ej] has spread rapidly and unidirectionally because it is a marker (Labov,
2008 [1972]) for Paulistanos, who are not aware of the variable and do not
present an elaborate metalinguistic discourse on its variants. The fact that
retroflex /r/ is strongly favored by working class youth may be attributed
to a reinterpretation of its social meaning, due to the extensive presence of
migrants from the Northern and Northeastern regions of the country, whose
/r/ realization as a fricative is relatively more stigmatized in the community.
At the same time, although nominal and verbal agreement are very similarly
stratified, the nonstandard variant of the former (as casa the houses) exhibits
greater vitality as it indexes masculinities and local identities with the city
and with Mooca, one of its most traditional neighborhoods.
Despite different trends by different social groups in the community, the
embedding of the linguistic variables is systematically reproduced in each
speakers speech, which allows for the characterization of So Paulo as a single
speech community (Labov, 2006 [1966]) in that its native speakers share norms
of use and evaluation of the variants. According to the perception test, the
city inhabitants are also consistent in their subjective reactions to the variants
of (-r). It is shown that such social cohesion is promoted not by census social
categories such as sex/gender or age, but by the more fundamental principle
of density of communication (Gumperz, 1971b,a).
Keywords: So Paulo Portuguese. Language variation and change. Social
identities. Nasal /e/. Coda /r/. Nominal agreement. Verb agreement.
Covariables. Perception.

xi
Sumrio

Resumo viii

Abstract x

Lista de Tabelas xvii

Lista de Quadros xviii

Lista de Figuras xxii

I Para um estudo da variao lingustica em


So Paulo 1

1 Introduo 2

2 Pressupostos tericos 16
2.1 Modelos de agrupamentos sociais e de comunidades lingusticas 16
2.2 Identidades e significados sociais . . . . . . . . . . . . . . . . . 23
2.3 O paradigma quantitativo . . . . . . . . . . . . . . . . . . . . 32

3 Materiais e mtodos 35
3.1 Corpus e roteiro da entrevista . . . . . . . . . . . . . . . . . . 35
3.2 Variveis sociais . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.3 Anlises quantitativas . . . . . . . . . . . . . . . . . . . . . . 52

xii
Sumrio

II Identidades urbanas e padres de variao 60

4 A varivel (
e) 61
4.1 Avaliaes sobre [ej] entre paulistanos e no paulistanos . . . . 63
4.2 Anlise multivariada . . . . . . . . . . . . . . . . . . . . . . . 73
4.3 O encaixamento social de uma mudana de baixo . . . . . . . 81
4.4 Sntese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

5 A varivel (-r) 89
5.1 A variabilidade de (-r) e a hiptese da posteriorizao . . . . . 89
5.2 Avaliaes sobre o tepe e o retroflexo . . . . . . . . . . . . . . 94
5.3 Anlise multivariada . . . . . . . . . . . . . . . . . . . . . . . 103
5.4 Mudana ou variao estvel? Estigma ou prestgio? . . . . . . 113
5.5 Sntese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121

6 A varivel (CN) 123


6.1 A concordncia nominal no portugus brasileiro . . . . . . . . 123
6.2 Avaliaes sobre a marca zero de (CN) . . . . . . . . . . . . . 126
6.3 Anlise multivariada . . . . . . . . . . . . . . . . . . . . . . . 135
6.4 Identidades locais . . . . . . . . . . . . . . . . . . . . . . . . . 156
6.5 Sntese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159

7 A varivel (CV) 161


7.1 A concordncia verbal no portugus brasileiro e no portugus
paulistano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
7.2 Anlise multivariada . . . . . . . . . . . . . . . . . . . . . . . 169
7.3 O status de CV- em 1PP e 3PP: anlise conjunta de dados . 188
7.4 Sntese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195

III So Paulo: uma comunidade de fala 198

8 O indivduo e a comunidade 199


8.1 O indivduo na perspectiva sociolingustica . . . . . . . . . . . 202
8.2 Mtodo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207

xiii
Sumrio

8.3 Anlises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211


8.4 Sntese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227

9 A coeso dialetal 229


9.1 O estudo de covariveis . . . . . . . . . . . . . . . . . . . . . . 232
9.2 Mtodos e hipteses . . . . . . . . . . . . . . . . . . . . . . . 237
9.3 Anlises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241
9.4 Sntese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 261

10 Percepes sociolingusticas e significados sociais 263


10.1 O estudo de percepes sociolingusticas . . . . . . . . . . . . 266
10.2 Mtodos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 274
10.3 Anlises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 288
10.4 Rumo a um modelo do significado social de variveis . . . . . 307
10.5 Sntese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 319

11 Concluso 322

Referncias 328

Anexos 354
Anexo A: Roteiro de entrevista . . . . . . . . . . . . . . . . . . . . 354
Anexo B: Informantes do corpus de entrevistas sociolingusticas . . 361
Anexo C: Distribuio geogrfica dos informantes . . . . . . . . . . 366
Anexo D: Formulrio da anlise de percepo . . . . . . . . . . . . 367

xiv
Lista de Tabelas

4.1 Distribuio geral das ocorrncias de (e) . . . . . . . . . . . . 74


4.2 Variveis lingusticas no correlacionadas com (e) . . . . . . . 76
4.3 Tendncias de emprego de ej de acordo com Classe Morfolgica 77
4.4 Tendncias de emprego de ej de acordo com Raiz-Afixo . . . . 78
4.5 Variveis sociais no correlacionadas com (e) . . . . . . . . . . 78
4.6 Tendncias de emprego de ej de acordo com variveis sociais . 80
4.7 Tendncias de emprego de ej no cruzamento entre Faixa Etria
e outras variveis sociais . . . . . . . . . . . . . . . . . . . . . 82

5.1 Taxas das variantes de (-r) entre paulistanos cultos na dcada


de 1970, de acordo com Posio da Slaba no vocbulo . . . . 93
5.2 Distribuio geral das ocorrncias de (-r) na amostra . . . . . 103
5.3 Distribuio geral de tepes e retroflexos nos dados analisados . 104
5.4 Variveis lingusticas no correlacionadas com (-r) . . . . . . . 106
5.5 Tendncias de emprego de de acordo com variveis lingusticas
(1) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
5.6 Tendncias de emprego de de acordo com variveis lingusticas
(2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
5.7 Tendncias de emprego de de acordo com Estilo . . . . . . . 108
5.8 Varivel social no correlacionada com (-r) . . . . . . . . . . . 109
5.9 Tendncias de emprego de de acordo com variveis sociais (1) 110
5.10 Tendncias de emprego de de acordo com variveis sociais (2) 112

6.1 Distribuio de ocorrncias de CN- das perspectivas atomstica


e de SNs, de acordo com Estilo . . . . . . . . . . . . . . . . . 136

xv
Lista de Tabelas

6.2 Tendncias de emprego de CN- de acordo com Posio Linear


(anlise atomstica) . . . . . . . . . . . . . . . . . . . . . . . . 138
6.3 Tendncias de emprego de CN- de acordo com Posio Linear
e Nvel de Escolaridade/Classe Social . . . . . . . . . . . . . . 140
6.4 Varivel lingustica no correlacionada com (CN) (anlise ato-
mstica) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
6.5 Tendncias de emprego de CN- de acordo com variveis lin-
gusticas (anlise atomstica) . . . . . . . . . . . . . . . . . . . 143
6.6 Tendncias de emprego de CN- de acordo com Paralelismo
Intrassintagmtico (anlise atomstica) . . . . . . . . . . . . . 144
6.7 Tendncias de emprego de CN- de acordo com Classe Morfo-
lgica (anlise atomstica) . . . . . . . . . . . . . . . . . . . . 145
6.8 Tendncias de emprego de CN- em cruzamento entre Classe
Morfolgica e Posio Relativa . . . . . . . . . . . . . . . . . . 146
6.9 Varivel lingustica no correlacionada com (CN) (anlise de
SNs) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
6.10 Tendncias de emprego de CN- de acordo com variveis lin-
gusticas (anlise de SNs) . . . . . . . . . . . . . . . . . . . . . 149
6.11 Variveis sociais no correlacionadas com (CN) . . . . . . . . 151
6.12 Tendncias de emprego de CN- de acordo com Nvel de Esco-
laridade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
6.13 Tendncias de emprego de CN- de acordo com variveis sociais154
6.14 Tendncias de emprego de CN- em cruzamento entre Regio
e Zona de Residncia . . . . . . . . . . . . . . . . . . . . . . . 155

7.1 Distribuio de ocorrncias de CV- de acordo com Estilo . . . 172


7.2 Tendncias de emprego de CV- de acordo com variveis lin-
gusticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177
7.3 Variveis sociais no correlacionadas com (CV) . . . . . . . . 181
7.4 Tendncias de emprego de CV- de acordo com variveis sociais
(1) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182
7.5 Tendncias de emprego de CV- de acordo com variveis sociais
(2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183

xvi
Lista de Tabelas

7.6 Tendncias de emprego de CV-1PP- em dados de informantes


no categricos (1) . . . . . . . . . . . . . . . . . . . . . . . . 184
7.7 Tendncias de emprego de CV-1PP- em dados de informantes
no categricos (2) . . . . . . . . . . . . . . . . . . . . . . . . 185
7.8 Anlise de correlao entre Concordncia Verbal e Pessoa
Gramatical . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188
7.9 Tendncias de emprego de CV- em cruzamento entre Regio
de Residncia, Pessoa Gramatical e Faixa Etria . . . . . . . . 194

8.1 Frequncias e tendncias de emprego de CV-E para seis infor-


mantes, de acordo com Salincia Fnica . . . . . . . . . . . . . 204

9.1 Padres de uso mais frequentes das seis variantes em foco . . . 242
9.2 Comparao entre coeficientes de Pearson para formas menos
e mais salientes de CN, em correlao com outras variveis
sociolingusticas . . . . . . . . . . . . . . . . . . . . . . . . . . 250
9.3 Comparao entre coeficientes de Pearson para formas menos e
mais salientes de CV-3PP, em correlao com outras variveis
sociolingusticas . . . . . . . . . . . . . . . . . . . . . . . . . . 251
9.4 Comparao entre coeficientes de Pearson para formas menos e
mais salientes de CV-1PP, em correlao com outras variveis
sociolingusticas . . . . . . . . . . . . . . . . . . . . . . . . . . 252
9.5 Comparao entre coeficientes de Pearson para sujeitos prxi-
mos e distantes de CV-1PP, em correlao com outras variveis
sociolingusticas . . . . . . . . . . . . . . . . . . . . . . . . . . 254
9.6 Comparao entre coeficientes de Pearson para sujeitos [+hu-
mano] e [-humano] de CV-3PP, em correlao com outras
variveis sociolingusticas . . . . . . . . . . . . . . . . . . . . . 255
9.7 Correlaes de Pearson por fatores sociais . . . . . . . . . . . 257

10.1 Distribuio dos perfis sociais dos sujeitos ouvintes (1) . . . . 287
10.2 Distribuio dos perfis sociais dos sujeitos ouvintes (2) . . . . 288
10.3 Caractersticas correlacionadas com (-r) . . . . . . . . . . . . . 304

1 Caractersticas sociais dos informantes . . . . . . . . . . . . . 362

xvii
Lista de Quadros

3.1 Dados de (-r) e (e) na Lista de Palavras . . . . . . . . . . . . 37


3.2 Dados de (CN) e (CV) nas leituras de notcia de jornal e
depoimento . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.3 Estratificao social dos informantes da amostra . . . . . . . . 46
3.4 ndices para nvel de escolaridade e ocupao . . . . . . . . . . 49
3.5 Classificao dos falantes em classes sociais . . . . . . . . . . . 51
3.6 Variveis sociais . . . . . . . . . . . . . . . . . . . . . . . . . . 59

4.1 Variveis lingusticas da anlise de (e) . . . . . . . . . . . . . . 75

5.1 Variveis lingusticas da anlise de (-r) . . . . . . . . . . . . . 105


5.2 Trabalhos e resultados divergentes sobre a pronncia do (-r)
em So Paulo . . . . . . . . . . . . . . . . . . . . . . . . . . . 114

6.1 Variveis lingusticas da anlise de (CN-atomstica) . . . . . . 141


6.2 Variveis lingusticas da anlise de (CN-SNs) . . . . . . . . . . 147

7.1 Variveis lingusticas da anlise de (CV-1PP) . . . . . . . . . 173


7.2 Variveis lingusticas da anlise de (CV-3PP) . . . . . . . . . 174

9.1 Quadro resumo de fatores sociais favorecedores das variantes


[ej], [], R-0, CN-, CV-3PP- e CV-1PP- . . . . . . . . . . . 239
9.2 Resumo de resultados sobre covariveis . . . . . . . . . . . . . 247

10.1 Distribuio dos estmulos de (-r) em dois grupos . . . . . . . 276


10.2 Classificao das variveis quanto a tipos de significado social 282
10.3 Caractersticas correlacionadas com (-r) por perfil dos ouvintes 305

xviii
Lista de Figuras

1.1 Crescimento populacional na cidade de So Paulo 18722010 . 5


1.2 Estado de origem da populao economicamente ativa (3060
anos) na Regio Metropolitana de So Paulo . . . . . . . . . . 6
1.3 ndice de Desenvolvimento Humano no municpio de So Paulo
(2000) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2.1 Respostas pergunta: Quando voc estava em X, as pessoas


te reconheciam como paulistano? Como? . . . . . . . . . . . 26

3.1 Diviso da cidade de So Paulo entre regies mais centrais e


mais perifricas . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.2 Interface do Rbrul . . . . . . . . . . . . . . . . . . . . . . . . 55

4.1 Nuvem de palavras associadas sentena meu, (vo)c (es)t


entendendo o que eu (es)tou dizendo?, realizada com [ej] . . . 63
4.2 Pesos relativos referentes ao emprego de [ej] no cruzamento
entre Faixa Etria e (a) Sexo/Gnero; (b) Nvel de Escolaridade;
(c) Regio de Residncia; e (d) Classe Social . . . . . . . . . . 83
4.3 Valores de fronteamento de (aw) por dcada e Sexo/Gnero no
Philadelphia Neighborhood Study . . . . . . . . . . . . . . . . 84
4.4 Taxas de ej de acordo com dcada de nascimento e Sexo/Gnero
dos falantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

5.1 Palavras mais frequentemente mencionadas pelos informantes


para diferenciao entre o portugus paulistano e o portugus
de cariocas/interioranos . . . . . . . . . . . . . . . . . . . . . 95

xix
Lista de Figuras

5.2 Nuvem de palavras associadas sentena a porta t aberta,


realizada com /r/ retroflexo . . . . . . . . . . . . . . . . . . . 98
5.3 Nuvem de palavras associadas sentena a porta t aberta,
realizada com /r/ tepe . . . . . . . . . . . . . . . . . . . . . . 101
5.4 Pesos relativos referentes ao emprego de retroflexo no cruza-
mento entre Faixa Etria e (a) Regio de Residncia; (b) Nvel
de Escolaridade; e (c) Classe Social . . . . . . . . . . . . . . . 115
5.5 Pesos relativos referentes ao emprego de retroflexo no cruza-
mento entre Faixa Etria e Classe Social, em dados de Lista
de Palavras . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118

6.1 Notcia do jornal O Globo online (28 abr./2010) . . . . . . . . 127


6.2 Nuvem de palavras associadas sentena-alvo me v dois
pastel e um chopes . . . . . . . . . . . . . . . . . . . . . . . . 129
6.3 Pesos relativos referentes ao emprego de CN- no cruzamento
entre Regio de Residncia e Faixa Etria . . . . . . . . . . . 157
6.4 Taxas de emprego de CN- no cruzamento entre Regio/Zona
e Nvel de Escolaridade/Classe Social . . . . . . . . . . . . . . 158

7.1 Tendncias de emprego de CV- (1PP) em cruzamento entre


Sexo/Gnero e Nvel de Escolaridade para 29 falantes com
variao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186
7.2 Tendncias de emprego de CV- em cruzamentos entre Pessoa
Gramatical e (a) Nvel de Escolaridade; (b) Classe Social; e (c)
Mobilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189
7.3 Tendncias de emprego de CV- em cruzamento entre Pessoa
Gramatical e Salincia Fnica . . . . . . . . . . . . . . . . . . 190
7.4 Tendncias de emprego de CV- em cruzamentos entre Salincia
Fnica e (a) Nvel de Escolaridade; (b) Classe Social; e (c)
Mobilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192
7.5 Tendncias de emprego de CV- em cruzamento entre Regio
de Residncia, Pessoa Gramatical e Faixa Etria . . . . . . . . 194

xx
Lista de Figuras

8.1 Taxas de emprego das variantes ej, , CN- e CV- por nmero
de informantes . . . . . . . . . . . . . . . . . . . . . . . . . . 212
8.2 Diferenas entre pesos relativos de pares de fatores por menor
nmero de dados para a varivel (e) . . . . . . . . . . . . . . . 214
8.3 Diferenas entre pares de fatores por menor nmero de dados
para a varivel (-r) . . . . . . . . . . . . . . . . . . . . . . . . 216
8.4 Diferenas entre pares de fatores por menor nmero de dados
para a varivel (CN) . . . . . . . . . . . . . . . . . . . . . . . 218
8.5 Diferenas entre pares de fatores por menor nmero de dados
para a varivel (CN) Contexto Fnico Seguinte . . . . . . . 219
8.6 Diferenas entre pares de fatores por menor nmero de dados
para a varivel (CV) . . . . . . . . . . . . . . . . . . . . . . . 224
8.7 Diferenas entre pares de fatores por menor nmero de dados
para as variveis (e), (-r), (CN) e (CV), de acordo com Estilo . 226

9.1 Covariao entre (E) e (O) no ingls de Nova Iorque . . . . . . 232


9.2 Covariao entre apagamento de -s e concordncia nominal;
desnasalizao e concordncia verbal; e concordncia nominal
e concordncia verbal no Rio de Janeiro . . . . . . . . . . . . 234
9.3 Matriz de correlaes entre seis variveis . . . . . . . . . . . . 244
9.4 Correlaes entre 1PP- e CN-/3PP- . . . . . . . . . . . . . 246

10.1 Variveis quantitativas significativas para percepo de (-r) . . 290


10.2 Variveis quantitativas no significativas para percepo de (-r) 293
10.3 Diferena entre mdias de julgamento para Paulistanidade (R
- T) de acordo com Regio de Residncia e Origem do Ouvinte 296
10.4 Diferena entre mdias de julgamento para Sotaque (R - T) de
acordo com Regio de Residncia e Origem do Ouvinte . . . . 298
10.5 Atribuio de Zona, Faixa Etria, Escolaridade e Classe Social
de acordo com variante ouvida . . . . . . . . . . . . . . . . . . 299
10.6 Atribuio de Classe Social de acordo com variante escutada e
caractersticas dos ouvintes . . . . . . . . . . . . . . . . . . . . 302
10.7 Frequncia de seleo de caractersticas em estmulos com
Retroflexo e com Tepe . . . . . . . . . . . . . . . . . . . . . . 306

xxi
Lista de Figuras

10.8 Campo indexical de (ING) . . . . . . . . . . . . . . . . . . . . 310


10.9 Campo indexical de (t) . . . . . . . . . . . . . . . . . . . . . . 311
10.10Campo indexical de (-r) em So Paulo . . . . . . . . . . . . . 313
10.11Campos indexicais de (-r) de acordo com Sexo/Gnero dos
ouvintes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 315
10.12Campos indexicais de (-r) de acordo com Regio de Residncia
dos ouvintes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 316
10.13Campos indexicais de (-r) de acordo com Origem dos ouvintes 317

1 Distribuio geogrfica dos informantes da amostra . . . . . . 366


2 Formulrio de percepes da coleta presencial . . . . . . . . . 367
3 Formulrio de percepes da coleta online . . . . . . . . . . . 369

xxii
Parte I

Para um estudo
da variao lingustica
em So Paulo
1
Introduo

Esta pesquisa a primeira investigao abrangente sobre o portugus pau-


listano. Nela, apresentam-se anlises sobre avaliao, produo e percepo
lingustica, atravs do exame de quatro variveis sociolingusticas (Labov,
1969, 2006 [1966]) cujas variantes parecem ser particularmente salientes como
ndices de certas identidades urbanas: a realizao de /e/ nasal como mono-
tongo [e] ou ditongo [ej], em palavras como querendo e fazenda; a realizao
de /r/ em coda silbica como tepe [R] ou retroflexo [], em palavras como
porta e mulher; a concordncia nominal de nmero, como em as casas vs.
as casa; e a concordncia verbal de primeira e de terceira pessoa do plural,
como em ns fomos vs. ns foi e eles foram vs. eles foi. O objetivo central
analisar a expresso de identidades sociais atravs de usos lingusticos e o
possvel impacto de significados sociais de certas variantes em processos de
variao e mudana lingustica.
Ainda que o portugus paulistano j tenha sido documentado e analisado
por meio de importantes e amplos projetos de pesquisa, como o Projeto
Norma Urbana Culta (Castilho & Preti, 1986, 1987; Preti & Urbano, 1988,
1990), o Projeto Gramtica do Portugus Falado (Castilho, 1990; Castilho
et al., 2006; Ilari, 2008) e, mais recentemente, o Projeto para a Histria do
Portugus Brasileiro (Castilho, 2009), pode-se afirmar que h um grande
nmero de trabalhos com base no portugus paulistano, mas pouqussimos
sobre o portugus paulistano. Muitos dos trabalhos desenvolvidos com corpora
de lngua oral e escrita paulistana se preocupam em descrever o portugus
brasileiro, ora em contraposio variedade europeia (p.ex., mudana na
Introduo

marcao de parmetros), ora em seus processos de mudana internos (p.ex.,


gramaticalizao). Embora muitos desses estudos tenham se debruado sobre
a lngua em uso, o falante do portugus paulistano rara vez tem sido concei-
tualizado como um ser social, membro de uma comunidade com caractersticas
especficas.
O trabalho de Tarallo (1983) um dos primeiros a analisar essa variedade,
levando em conta o encaixamento social de fenmenos variveis. Seu estudo
sobre estratgias de relativizao examinou trs estruturas (relativa padro,
como em tem aquelas que no esto nem a; relativa com pronome resump-
tivo, como em uma mulher que ela queria que a gente entrevistasse...; e
relativa cortadora, como em essas besteiras que a gente fica se preocupando)
na fala de 40 paulistas da Grande So Paulo, estratificados em sexo, duas
faixas etrias (abaixo ou acima de 35 anos) e quatro classes socioeconmicas
(baixa, trabalhadora, mdia e alta). Especificamente quanto a correlaes
sociais, seus resultados mostram que a relativa com pronome resumptivo
favorecida entre os falantes dos dois estratos mais baixos e em estilos menos
formais, e que no h correlao com Sexo ou Faixa Etria. O prprio autor,
no entanto, apesar de chamar a ateno para a lacuna de estudos sociolin-
gusticos em So Paulo, ressalta que a varivel sob anlise no especfica da
comunidade:

[...] h todos os motivos para supor que os residentes de So Paulo


compartilham o mesmo sistema sinttico com brasileiros de todas as
partes do pas; [...] as diferenas dialetais se encontram com frequncia
muito maior nos nveis lexicais e fonolgicos do que na sintaxe. (Tarallo
1983 : 54)1

Com efeito, variveis sintticas, em geral, parecem se associar muito mais


raramente com variedades regionais ou grupos especficos de falantes. Dois
outros estudos que tambm se basearam em amostras de fala paulistana
exemplificam essa tendncia. Mendes (2005), ao analisar a alternncia entre
as perfrases estar + gerndio e ter + particpio com verbo auxiliar
no presente (como T chovendo muito vs. Tem chovido muito), em 21
1
Traduo prpria. Texto original: there is every reason to suppose that residents of So Paulo share
the same syntactic system with Brazilians in all parts of the country; [...] dialect differences are much
more often located at the lexical and phonological levels than in syntax.

3
Introduo

entrevistas do Projeto NURC-SP e 30 do PEUL-RJ,2 observou uma possvel


mudana em progresso (em tempo aparente) em favor da primeira estrutura
em ambas as amostras, mas nenhuma correlao com Sexo/Gnero ou Tipo
de Gravao (Elocues Formais, Dilogos entre Dois Informantes, Dilogos
entre Informante e Documentador, na amostra do NURC-SP). Oushiro (2011)
investigou a variao em interrogativas de constituinte (interrogativa-qu:
Onde voc mora?; qu-que: Onde que voc mora?; qu--que: Onde que
voc mora?; e qu-in-situ: Voc mora onde?) na fala de 53 paulistanos e,
de modo semelhante a Mendes (2005), constatou uma possvel mudana em
curso em favor da variante qu-que, e nenhuma correlao com Sexo/Gnero
e Nvel de Escolaridade. Nesses dois estudos, verifica-se preponderncia de
fatores lingusticos sobre os sociais para explicar a variao.
Pode-se dizer que os trabalhos de Tarallo (1983), Mendes (2005) e Oushiro
(2011), ainda que ancorados em uma viso de lngua que entende a variao
como parte do sistema lingustico e da competncia comunicativa dos falantes,
so pouco informativos quanto estratificao social do portugus paulistano
pela prpria natureza das variveis investigadas.
Nesse sentido, ganham destaque as pesquisas de Rodrigues (1987) e
de Coelho (2006). Ambos os autores investigaram o portugus falado em
favelas da Zona Norte da capital (respectivamente, Caromb e Brasilndia).
Rodrigues (1987) estudou a variao na concordncia verbal em uma amostra
de 40 paulistanos e migrantes, analfabetos ou semialfabetizados (um a quatro
anos de escolarizao), de ambos os sexos e de trs faixas etrias. Entre
vrias observaes de interesse sociolingustico, Rodrigues (1987) conclui que
a ausncia de concordncia verbal para a 1a pessoa do plural (P4, em sua
terminologia) tem significado social diferente da ausncia de concordncia
para a 3a pessoa do plural (P6) pois, apesar de ambas serem proscritas na
norma culta, o erro em P4 identifica o falante de origem rural.
Coelho (2006), por sua vez, investigou a variao no emprego dos pronomes
de 1a pessoa do plural (ns vs. a gente), bem como na concordncia verbal
(Nis V-zero vs. Nis V-mos). Com base em uma observao etnogrfica, o
2
Projeto da Norma Urbana Oral Culta e Programa de Estudos sobre o Uso da Lngua, respectivamente.
Ver Castilho & Preti (1986) e Paiva & Scherre (1999).

4
Introduo

autor construiu uma amostra de 24 entrevistas sociolingusticas com falantes


paulistanos e migrantes de outras regies, que faziam parte de diferentes
grupos relevantes dentro da comunidade: membros da associao de moradores,
frequentadores do grupo para jovens, os mano do gol a gol. Diferentemente
de Rodrigues (1987) e quase 20 anos mais tarde, Coelho (2006) avalia que
variantes estigmatizadas (como Nis vai, nis), ainda que sejam evitadas
por falantes que tenham experimentado ascenso social, recebem uma nova
significao entre certos jovens da periferia paulistana, presumivelmente filhos
dos migrantes das dcadas de 1970 e 1980: a marca zero de concordncia na
1a pessoa do plural no mais representa o dialeto rural, mas uma identidade
social de morador de periferia urbana.
Os trabalhos de Rodrigues (1987) e de Coelho (2006), que se preocuparam
mais propriamente com a investigao dos usos lingusticos em seu contexto
social, concentram-se no portugus falado em comunidades especficas da
capital paulista. Esses trabalhos trouxeram contribuies valiosas sobre as
correlaes entre usos lingusticos e identidades sociais, mas no se pode
consider-los representativos da grande complexidade sociodemogrfica da
cidade de So Paulo.


10


Populao (em milhes)


8
6

1880 1900 1920 1940 1960 1980 2000

Ano

Figura 1.1 Crescimento populacional na cidade de So Paulo 18722010.


(Fonte: IBGE 2010).

5
Introduo

Analisar a lngua falada em uma cidade com 11 milhes de habitantes


apresenta um srio desafio. So Paulo cresceu exponencialmente desde fins do
sculo XIX (ver Figura 1.1) para se tornar a stima cidade mais populosa do
mundo em 2010 (IBGE, 2010): de menos de 100 mil habitantes em fins dos
anos 1800, a populao cresceu para cerca de 2 milhes em meados do sculo
XX e para mais de 10 milhes no incio dos 2000. Tal crescimento ocorreu
principalmente em razo da vinda de (i)migrantes, sendo a populao da
cidade, ainda hoje, bastante heterognea quanto origem de seus moradores.
De acordo com um recente levantamento do Instituto de Pesquisa Econmica
Aplicada (IPEA, 2011), 46% da populao adulta economicamente ativa (entre
30 e 60 anos) residente na regio metropolitana3 no nasceu no estado de So
Paulo (ver Figura 1.2). Embora o levantamento no se refira exclusivamente
ao municpio, por meio dele possvel ter uma ideia da intensa presena de
migrantes que ali habitam. Pode-se supor que o ndice de habitantes no
nativos na capital seja ainda maior, visto que o levantamento se baseou na
origem por estados, de modo que os 54% de paulistas incluem tanto aqueles
nascidos na capital quanto no interior.

Baianos (11%)

Pernambucanos (7%)
Paulistas (54%)

Mineiros (8%)

Paranaenses (4%)

Cearenses (3%)

Norte/Nordeste (MA, PI, RN, PB, AL, SE) (9%)


Centro Oeste, SC, RS, ES, RJ (3%) Estrangeiros (1%)

Figura 1.2 Estado de origem da populao economicamente ativa (3060 anos)


na Regio Metropolitana de So Paulo. (Fonte: IPEA 2011)
3
A Regio Metropolitana de So Paulo ou Grande So Paulo abrange 39 cidades com uma populao
total de cerca de 19,5 milhes de habitantes, dos quais mais da metade (11,3 milhes) vive na cidade
de So Paulo.

6
Introduo

A cidade de So Paulo tambm extremamente heterognea quanto


aos indicadores sociais. A Figura 1.3 mapeia o ndice de Desenvolvimento
Humano em diferentes reas da cidade que, nesse levantamento da Prefeitura
Municipal no ano 2000, leva em conta o rendimento do chefe da famlia, a
taxa de mortalidade infantil e a taxa de alfabetizao combinada com a mdia
de anos de estudo.4

Figura 1.3 ndice de Desenvolvimento Humano no municpio de So Paulo (2000)


(Fonte: PMSP/ Secretaria Municipal do Desenvolvimento, Trabalho e
Solidariedade)

O IDH vai de 0,245 no extremo sul da cidade, ndice comparvel aos de


pases mais subdesenvolvidos, at 0,884 em regies mais centrais, comparvel
aos de pases com melhor qualidade de vida e menores desigualdades.5 As
4
Disponvel em http://www9.prefeitura.sp.gov.br/sempla/mm/index.php?texto=corpo&tema_cod=2.
ltimo acesso em 20 set./2014.
5
O IDH oficialmente calculado com base na expectativa de vida, PIB per capita, alfabetizao e
anos de escolaridade; como os parmetros utilizados pela Prefeitura Municipal no foram exatamente
os mesmos, problemtica a comparao direta dos presentes ndices com dados oficiais de pases
especficos. No entanto, a disparidade entre diferentes reas da cidade ntida.

7
Introduo

manchas mais escuras indicam bolses de desenvolvimento em certas partes da


cidade; fica clara, no entanto, uma radical diviso entre as regies mais centrais,
em que se encontram os mais altos IDHs, e as regies mais perifricas, cujos
indicadores diminuem paulatinamente. So Paulo abarca em si os extremos
da riqueza e da pobreza.
Nas entrevistas sociolingusticas aqui analisadas, comum a caracterizao
de So Paulo como um local de mistura e diversidade, em que se encontra
de tudo, conforme exemplificam as seguintes respostas a perguntas sobre o
que caracteriza a cidade (1)(3), o paulistano (3)(4) e o seu falar (5)(6):6,7

(1) D1: [risos] e o que voc acha que caracteriza (aqui)?


S1: olha... as pessoas dizem que que / aqui o centro financeiro n... mas
eu acho que a principal caracterstica de So Paulo o povo de So Paulo...
D1: que que voc acha que...?
S1: essa mistura de povos que tem em So Paulo... n nordestino
sulista... japons francs italiano espanhol... essa mistura de raas... n...
faz com que a cidade ela ela... ela no tem uma/ uma nica caracterstica...
n voc pode encontrar o que voc quiser aqui em So Paulo... n eu acho
que essa/ eu no consigo achar um nome pra definir isso... entendeu? mas
ao meu ver o que/ o o grande lance de So Paulo... essa mistura de de
culturas... no ?... que faz essa dive/ essa diversificao... torna a cidade
nica... (William A., M2SP)

(2) D1: quais so os pontos fortes de So Paulo?


S1: cultura... diversidade de gente... voc vai pra Campinas todo mundo
igual
D1: tudo igual como?
S1: tudo igual... padro... voc no v tribos... eu ia muito pra Campinas
D1: t
S1: a voc j bate o olho todo mundo igual... todas as mulher de salto
6
Nas citaes do corpus, o informante identificado por seu pseudnimo e perfil social: sexo (F
feminino; M masculino); faixa etria (1 20 a 34 anos; 2 35 a 59 anos; 3 60 anos ou mais);
nvel de escolaridade (M at Ensino Mdio; S Ensino Superior); e regio de residncia (C bairro
mais central; P bairro mais perifrico). As reticncias indicam pausas curtas, / indica truncamento
e (xxx) indica trechos ininteligveis. Ver Normas de Transcrio estipuladas pelo Projeto SP2010
(Mendes & Oushiro, 2013).
7
Os excertos de entrevistas sociolingusticas analisadas nesta pesquisa podem ser ouvidos clicando-se,
na verso em formato .pdf desta tese, sobre o cone . Para tanto, necessrio baixar o arquivo
Oushiro2014audio.zip no endereo http://projetosp2010.fflch.usp.br/oushiro-2014, que contm
os arquivos de udio, e descompactar essa pasta no mesmo local em que se encontra o arquivo .pdf no
computador. Por exemplo, se o arquivo da tese estiver no diretrio C:/Documentos, os arquivos de
udio devem estar em C:/Documentos/Oushiro2014audio. A senha para descompactao SP2014.
Nas transcries, trechos indicados por [...] foram retirados para maior conciso do texto, mas podem
ser escutados nos respectivos excertos de udio.

8
Introduo

alto (xxx) arrumado... ah no sei talvez no centro tenha uma diversidade


maior no centro de Campinas mas nos lugares que eu fui... tudo igual...
no tem tribo!... que nem aqui voc vai numa esquina tem os gticos na
outra tem uns punk na outra tem uns grupo de japons... (Clara C., F2SC)

(3) D1: e o que voc acha que caracteriza a cidade de So Paulo? tanto
caractersticas boas quanto ruins assim (se voc puder) definir
S1: ah a primeira coisa a caracterstica cosmopolita n
D1: ahn
S1: porque rene assim pases n So Paulo no s regies do Brasil So
Paulo rene pases culturas... n acho que o mundo est em So Paulo
[...] eu acho que So Paulo o que mais simboliza pra mim isso essa
diversidade... e outra a cidade das opes voc tem opo pra tudo... voc
no tem s uma coisa voc tem opo pra tudo... [...]
D1: e o paulistano? que que voc acha que caracteriza o paulistano?... pode
ser coisa boa ruim (xxx)
S1: ah depende ento mas a cai numa questo... que depende assim
porque... por exemplo eu sou filha de nordestina... e de um... de um cara
que do interior de So Paulo... ento eu tenho certas cul/ eu tenho
certas coisas que veio... que vieram perdo... das culturas deles n ento
assim isso complicado... agora assim diferente de pegar um filho... de
paulistanos n ento acho que a cai... n
D1: entendi
S1: n eu acho que o paulistano na verdade por mais que exista um cara
paulistano... eu no sei se d pra definir um cara paulistano/ por exemplo
eu me acho muito paulistana porque eu amo So Paulo em tudo [...] (Tatiana
M., F1SP)

(4) D1: e assim voc falou da cidade de So Paulo assim voc acha que tem
alguma coisa assim que caracteriza assim o paulistano?
S1: que caracteriza?
D1:
S1: nossa mas So Paulo est to... misturada n?
D1: [risos]
S1: que voc j perdeu a caracterizao dela... [...] ah misturou muito
muita gente do norte do nordeste do sul sude/ do sul... dos outros estados
do sudeste... tem de outros esta/ outros pases porque que nem agora voc
v tanto boliviano uruguaio paraguaio... chins libans que/ antigamente
no... antig/ foi/ h alguns tempos atrs voc no tinha essa mistu/ que
nem aqui... aqui voc quase no via boliviano... agora voc v boliviano por
aqui... que nem l onde eu trabalha/ l onde eu trabalho l no centro j
um lugar que voc via com muita frequncia... coreano libans srio rabe
tudo essas coisa... ah l a gente sabia que tinha... agora no eles esto
vindo pros bairros tambm mais afastado.... entendeu? a est toda essa

9
Introduo

mistura e voc no sabe mais a caracterstica de So Paulo mais [risos-D1]


uma mistura toda eu no vejo mais que tem uma caracterstica s (Giovana
A., F1SP)

(5) porque isso aqui... draga as pessoas no tem como... e e eu acho que as
pessoas acabam/ tem um um amlgama a n um... sabe uma uma uma
juno de todos os sotaques veio junto que faz uma sopa... e e todo mundo
entra nessa sopa chega uma hora voc acaba tomando essa sopa... do so/
dos sotaques todos que um/ que vira o sotaque paulista entendeu... que
uma mistura que tem uma coisa bastante misturada n (Romulo S., M3MC)

(6) D1: voc acha que tem um jeito de falar paulistano assim?
S1: paulistano?... sabia que eu no sei te dizer por qu?... porque aqui em
So Paulo tem tem tem de tudo/ todo mundo... tantos tantos... voc teria
que... e tambm tem esse nvel essa parte que eu sempre fico fi/ frisando
nvel de... classe social... alm de nvel de classe social... tem os sotaques
que aqui em So Paulo voc... deu uma volta na esquina voc j escutou
uns dois trs sotaques diferente... como que a gente vai diferenciar o so/
o paulistano?... a que est... acho que o paulistano a mistura de todos
esses sotaques assim... [...] (Pedro S., M2SP)

A heterogeneidade de sua populao faz de So Paulo um cenrio particular-


mente rico para o estudo da variao e da mudana lingustica, ao lado de
outros centros urbanos como Rio de Janeiro, Toronto, Nova Iorque: trata-se
de uma metrpole marcada por um histrico de migraes e imigraes, por
diversidade cultural e por fortes contrastes sociais.
Dentro desse cenrio, a presente pesquisa se concentra na anlise da
avaliao, produo e percepo lingustica da fala de paulistanos nativos, a
fim de oferecer uma ampla descrio dessa variedade lingustica.8 As quatro
variveis focalizadas neste estudo foram escolhidas por seu potencial para
iluminar a relao entre variao lingustica e identidades sociais.
A realizao de (e)9 j havia sido analisada atravs de perspectivas fonti-
cas e fonolgicas (Bisol, 1998; Demasi, 2009), mas no de uma perspectiva
8
O estudo do portugus falado por migrantes e imigrantes que residem em So Paulo faz parte da agenda
do Grupo de Estudos e Pesquisa em Sociolingustica (GESOL-USP) (ver Mendes & Oushiro 2012), a
comear pelo trabalho de Mendes (2011) sobre a realizao varivel de (-r) na fala de paraibanos, e a
pesquisa de mestrado de Gomes da Silva (2014) sobre a variao na concordncia nominal na fala de
alagoanos na cidade.
9
Seguindo conveno em estudos sociolingusticos (Labov, 1969), adotam-se parnteses ( ) para fazer
referncia varivel, em contraste com a notao fontica entre colchetes [ ] e fonolgica entre barras
/ /.

10
Introduo

sociolingustica. Curiosamente, a variante ditongada [ej] parece ser um ndice


saliente para a identificao de paulistanos fora da cidade, mas no to saliente
para os prprios paulistanos, que no apresentam um discurso metalingustico
sobre as variantes. Desse modo, a anlise investiga como se d o encaixamento
social de uma varivel que est abaixo do nvel da conscincia (Labov, 2001b)
dos falantes.
A varivel (-r), diferentemente de (e), um dos ndices mais salientes de
diferenciao dialetal no Brasil (Callou et al., 1996) e j foi extensivamente
estudada no portugus brasileiro. Tradicionalmente, aponta-se o tepe como
variante paulistana, em contraste com a realizao aproximante retroflexa
dos paulistas do interior [], a fricativa velar de cariocas [x G], ou a fricativa
glotal de belo-horizontinos [h H] (Cristfaro Silva, 2007). No entanto, an-
lises preliminares de (-r) em So Paulo mostram que o retroflexo no to
infrequente no falar de seus nativos (Mendes, 2010; Oushiro & Mendes, 2013).
Interessa examinar se os falantes da cidade reconhecem esta ltima variante
como parte de seu repertrio lingustico, suas avaliaes sobre ela, e se h
indcios de mudana em favor de uma das variantes.
As concordncias nominal (CN) e verbal (CV), de modo semelhante a
(-r), referem-se a fenmenos que j foram amplamente descritos em outras
comunidades brasileiras (ver Scherre 2008 para uma lista abrangente de
trabalhos), mas no to extensivamente em So Paulo. Por outro lado,
diferentemente de (-r), as variantes no padro dessas variveis so altamente
estigmatizadas de um ponto de vista normativo e constituem o exemplo, por
excelncia, de no saber falar portugus.
A marca zero de nmero em sintagmas nominais (SNs) nacionalmente as-
sociada a paulistanos, em frases estereotpicas como dois pastel. Consideran-
do-se que estudos prvios apontaram a diviso rural-urbano como umas das
mais relevantes para a marcao de nmero e que a varivel ubqua em todo
o territrio brasileiro, a associao da marca zero com uma cidade altamente
urbanizada investigada no sentido de localizar grupos que adotam a variante
como ndice de identidade local, seja no discurso metalingustico, seja nos
usos lingusticos factuais.
A marca zero de concordncia verbal, por outro lado, no parece se

11
Introduo

associar especificamente a falantes paulistanos; pelo contrrio, de acordo com


as observaes de Rodrigues (1987), parece identificar os migrantes cidade,
ou, de acordo com Coelho (2006), o jovem de periferia urbana. Desse modo, o
interesse nessa varivel est em verificar se h indcios de mudana em favor
da variante no padro entre jovens de periferia, sobretudo para a primeira
pessoa do plural.
Trata-se, portanto, de duas variveis fonticas e duas morfossintticas,
sobre as quais os falantes tm diferentes avaliaes e graus de conscincia.
A comparao entre os padres de encaixamento social dessas variveis per-
mite, neste trabalho, descrever processos mais amplos de variao e mudana
lingustica em relao s identidades e aos valores sociais associados s vari-
antes. Mais especificamente, esta pesquisa se prope a responder as seguintes
questes:
(i) Quais identidades urbanas se associam ao uso dessas variantes?
(ii) Como funcionam os mecanismos que regulam a adeso ou a resistncia
a certas normas lingusticas por parte de diferentes grupos sociais?
(iii) A cidade de So Paulo, no obstante sua ampla diversidade sociodemo-
grfica, pode ser considerada uma nica comunidade de fala?
O prximo captulo apresenta alguns conceitos fundamentais para o es-
tudo do portugus paulistano do modo como aqui se delineia. Discutem-se
inicialmente diferentes concepes de agrupamentos sociais, dentre as quais
se adota o modelo laboviano de comunidade de fala (Labov, 2006 [1966],
2008 [1972]). Em seguida, define-se o conceito de identidade em sua relao
com o significado social de variantes lingusticas e processos de mudana o
que constitui o eixo central deste trabalho. O captulo apresenta tambm os
preceitos do paradigma quantitativo que guiam as anlises desenvolvidas.
O captulo 3 descreve os materiais e os mtodos de anlise: a coleta e
a organizao de um corpus de 118 entrevistas; as variveis sociais e suas
respectivas hipteses; e os mtodos de tratamento e de anlises de dados no
programa R (R Core Team, 2013).
Os captulos 4 a 7, que compem a Parte II, apresentam respectivamente
os resultados de anlises sobre as variveis (e), (-r), (CN) e (CV). Demonstra-
se que a varivel (e) est em vigoroso processo de mudana, liderado pelas

12
Introduo

mulheres, em direo variante ditongada, e argumenta-se que tal movimento


se deve ao fato de que a alternncia tem ocorrido abaixo da conscincia dos
falantes.
O captulo sobre (-r) mostra que esta uma varivel aparentemente
estvel em So Paulo quando se considera a comunidade como um todo,
mas que os jovens de regies perifricas e de classes mais baixas, por um
lado, e aqueles de regies mais centrais e de classes mais altas, por outro,
exibem tendncias em direes contrrias: enquanto os primeiros favorecem
fortemente a variante retroflexa, os segundos a evitam radicalmente. Defende-
se que a forte presena de migrantes do Norte/Nordeste na comunidade
conduziu a uma reinterpretao do valor social do retroflexo, por parte dos
falantes de classes mais baixas, como uma variante local e de relativo prestgio
em relao s variantes fricativas, o que tem motivado o movimento de certos
grupos de falantes em sua direo.
A anlise sobre (CN) evidencia que a marca zero se associa, tanto no
discurso metalingustico dos paulistanos quanto nos usos propriamente, fala
de moradores da Zona Leste Central, onde se localiza o bairro da Mooca,
normalmente destacado como uma rea com dialeto prprio o mooqus
e como esteretipo do falar paulistano. Tal associao, no entanto, parece
estar em vias de desaparecimento entre os mais jovens. Alm disso, a variante
parece funcionar como ndice de masculinidade em So Paulo, diferentemente
de outros centros urbanos. Novamente se verificam tendncias distintas a
depender do grupo de falantes: variao estvel entre os habitantes de periferia
e mudana na direo da variante padro entre os moradores de regies mais
centrais. O aumento dos nveis gerais de escolaridade e o enfraquecimento da
associao da marca zero com identidades locais entre os mais jovens podem
ser apontados como os desencadeadores do movimento em direo forma
padro nas regies centrais.
No captulo sobre (CV), investiga-se inicialmente se a primeira pessoa do
plural (1PP) e a terceira pessoa do plural (3PP), tradicionalmente analisadas
separadamente nos estudos sociolingusticos, podem ser consideradas uma
nica varivel. Aps demonstrar que ambas se correlacionam com o mesmo
conjunto de variveis sociais e lingusticas, que por sua vez se organizam na

13
Introduo

mesma hierarquia de importncia, contrasta-se seu encaixamento social em


diferentes grupos da comunidade. De modo bastante semelhante a (CN), 1PP
e 3PP se encontram em mudana na direo da variante padro nas regies
mais centrais; nas regies perifricas, por outro lado, 3PP exibe padro de
variao estvel, ao passo que 1PP esboa um quadro de incio de mudana
em favor da forma no padro. Sugere-se que o maior estigma da marca
zero em 1PP do que em 3PP se deve a um maior grau de salincia fnica da
primeira (Naro 1981; Naro et al. 1999, p.ex. falou/falamos vs. come/comem)
e pelo fato de a variante no padro de 1PP ser favorecida, em relao de
3PP, entre pessoas menos escolarizadas, de classe social mais baixa e com
menor mobilidade, cuja fala tem maior probabilidade de ser estigmatizada
socialmente.
A Parte III se volta a questes mais amplas, que envolvem a codificao
lingustica de significados sociais atravs do encaixamento simultneo de
mltiplas variveis na fala de mltiplos indivduos. O captulo 8 demonstra que
os padres gerais de variao descritos nos captulos anteriores se reproduzem
sistematicamente na fala de cada indivduo, de modo que as regras variveis
no constituem apenas um construto abstrato, mas fazem parte integral da
competncia comunicativa dos falantes, membros de uma comunidade de fala.
No captulo 9, discute-se o emprego simultneo das quatro variveis so-
ciolingusticas. Os recorrentes padres de correlao com variveis como
Sexo/Gnero, Classe Social e Faixa Etria, em estudos sociolingusticos em
geral e nesta pesquisa especificamente, conduzem expectativa de que um
mesmo indivduo deva empregar conjuntos de variantes, como [ej] e [R] ou
a marca zero de (CN) e (CV) simultaneamente. As anlises mostram uma
realidade mais complexa, uma vez que, quando se consideram mltiplas va-
riveis, os falantes no se comportam exatamente do modo como as anlises
multivariadas em separado levariam a crer. Demonstra-se ento que a coeso
dialetal promovida no por amplas categorias sociais como Sexo ou Classe
Social dos falantes, mas pelo princpio mais fundamental de densidade de
comunicao (Gumperz, 1971b,a): as normas de usos lingusticos so apren-
didas diretamente no convvio social cotidiano, uma vez que grupos em que
indivduos tendem a interagir mais frequentemente entre si (como falantes

14
Introduo

que sempre moraram no mesmo bairro) exibem maior grau de consenso sobre
quais variantes andam juntas.
O captulo 10 reporta um experimento de percepo, baseado na tcnica
de estmulos pareados (Lambert et al., 1960),10 a respeito das variantes
tepe e retroflexa entre moradores da cidade de So Paulo (paulistanos ou
no). O objetivo foi o de analisar reaes subjetivas e inconscientes s
variantes, em contraste com seus padres de usos e o discurso metalingustico
sobre elas. Os resultados mostram que, a depender da variante ouvida, os
falantes so percebidos diferentemente quanto a graus de paulistanidade e
de sotaque, localizao do bairro, classe social e nvel de escolaridade, e que
tais percepes so mediadas por caractersticas sociais dos ouvintes. Com
base nesses resultados e no conceito de Eckert (2008) sobre campos indexicais,
apresenta-se um mtodo falsevel e replicvel para a constituio da rede de
significados sociais das variantes de uma varivel. Tal modelagem aponta
para os mecanismos de atribuio de significados sociais que regulam os usos
lingusticos cotidianos e os processos mais amplos de variao e mudana.
O captulo final sintetiza as concluses deste estudo: os milhes de falantes
paulistanos, no obstante sua ampla heterogeneidade, constituem uma nica
comunidade de fala, pois seus usos lingusticos se pautam pelo mesmo conjunto
de regras variveis e por percepes similares sobre o valor social das variantes.
A coeso dialetal guiada pela densidade de comunicao entre os membros
de uma comunidade. No entanto, tais usos, avaliaes e percepes se
encontram em relaes dinmicas e em constante movimento, em virtude
de mudanas na comunidade (como movimentos migratrios) e das inter-
relaes entre diferentes grupos; para compreend-los, faz-se necessrio o
exame dos significados sociais das variantes e dos mecanismos que conduzem
sua associao a determinados grupos sociais.
Os captulos que seguem se voltam, pois, demonstrao dessas teses.

10
Tambm chamada de tcnica de falsos pares.

15
2
Pressupostos tericos

A Sociolingustica parte da premissa de que os sistemas lingus-


ticos se constituem e se realizam pelos falantes no espao social.
Entretanto, ao se debruar sobre a lngua em uso por uma co-
munidade real, a primeira constatao do observador a grande
variabilidade de fatos lingusticos e no lingusticos que concorrem
para a heterogeneidade. Este captulo apresenta alguns conceitos
e premissas fundamentais para a anlise do portugus paulistano:
(i) diferentes tipos de comunidades; (ii) a inter-relao entre iden-
tidades, significados sociais e processos de variao e mudana
lingustica; e (iii) o paradigma quantitativo.

2.1 Modelos de agrupamentos sociais e de


comunidades lingusticas
Em geral, os estudos sociolingusticos se baseiam em um de trs conceitos de
agrupamentos sociais: comunidade de prticas, rede social e comunidade de
fala. Ainda que no se excluam mutuamente, a adoo de um deles, ou nfase
em um ou outro conceito, tem consequncias para a definio do objeto de
estudo, para os mtodos de coleta de dados, para as anlises que podem ser
desenvolvidas e para as concluses que podem ser traadas.
O conceito de comunidade de prticas relativamente recente nos estu-
dos de Sociolingustica; ele envolve tanto a experincia subjetiva quanto a
Modelos de agrupamentos sociais e de comunidades lingusticas

construo ativa, por parte dos membros da comunidade, das fronteiras que
a delimitam em relao s demais. Eckert & McConnell-Ginet (1992 : 464)
definem a comunidade de prticas como um agrupamento de pessoas que se
juntam em torno de uma iniciativa em funo de um compromisso mtuo.1
Wenger (1998, apud Meyerhoff & Strycharz 2013 [2002]) desenvolve a definio
acima, explicitando trs critrios que devem existir a fim de se falar sobre
uma comunidade de prticas: o compromisso mtuo, que pode tanto ser
harmonioso quanto conflituoso, mas pelo qual os membros necessariamente
se juntam em torno de prticas comuns; a iniciativa negociada em conjunto
(ainda que os prprios membros no sejam capazes de defini-la) a fim de se
atingir um mesmo propsito; e o repertrio compartilhado, resultado das
negociaes internas. No estudo de Coelho (2006) (ver Captulo 1, p. 4),
os mano do gol a gol e os membros da associao de moradores do bairro
podem ser considerados duas comunidades de prticas dentro da Brasilndia.
Diferentemente do que se observa em comunidades de fala ou redes sociais,
a participao em uma comunidade de prticas consciente. Dessa perspectiva,
lngua e variao lingustica so vistas como prticas sociais, e os falantes
como agentes da variao e da mudana lingustica. A proposta central
desse modelo distanciar-se de macrocategorias sociais como faixas etrias e
classes socioeconmicas, que podem no refletir as relaes de identidade com
agrupamentos menores com os quais os falantes operam em seu cotidiano.
Desse modo, pesquisas que se baseiam nesse conceito propem uma observao
etnogrfica da comunidade, a fim de identificar categorias relevantes para
seus membros, e enfatizam o papel do indivduo na construo ativa de sua
identidade social.
Os estudos que se desenvolveram a partir da anlise de redes sociais
diferem dos estudos focados em comunidades de prticas por ultrapassarem
os limites de um agrupamento de pessoas com um objetivo em comum. A
definio de uma rede social bastante simples: trata-se do conjunto de
relaes sociais de um indivduo (ego ou ncora) com outras pessoas (Milroy
& Llamas, 2013 [2002] : 409). De forma abrangente, uma rede pode ser vista
1
Traduo prpria. Texto original: an aggregate of people who come together around mutual engage-
ment in an endeavor.

17
Modelos de agrupamentos sociais e de comunidades lingusticas

como um conjunto de laos que ligam todos os membros da sociedade, por


mais remotas que sejam tais ligaes; assim, podem-se imaginar laos de
primeira, segunda ou quantas ordens forem possveis. Em geral, no entanto,
levam-se em conta laos de primeira ordem, ou seja, analisa-se a fala de
pessoas com quem um indivduo interage diretamente.
Essas relaes podem formar redes multiplexas quando so fortes e
densas, mantidas entre diversos membros dessa estrutura, ou podem ser
uniplexas, quando a ligao entre os indivduos existe primariamente por
intermdio do ncora. Ainda que essa tipologia se refira a um modelo ideali-
zado, a proposta pode ser til para a interpretao da variao lingustica
encontrada em diferentes comunidades; um corolrio do conceito de redes
sociais que um conjunto de pessoas que mantm laos fortes de interao em
uma rede multiplexa tende a manter normas lingusticas locais e a resistir a
presses de normas alternativas. Alm disso, sua aplicao pode ser vantajosa
a depender do tipo de agrupamento a ser estudado; tanto Rodrigues (1987)
quanto Coelho (2006) utilizaram-se de uma abordagem de rede social, por
intermdio de um ncora (um lder comunitrio), para se inserir nas comuni-
dades das favelas do Caromb e da Brasilndia. Bortoni-Ricardo (1985), em
seu estudo sobre a vocalizao de [L], reduo de ditongos e da concordncia
verbal na cidade satlite de Brazlndia (Braslia), baseou-se amplamente no
modelo de redes sociais para analisar a assimilao de padres urbanos na fala
de migrantes rurais. Battisti et al. (2007) o empregaram frutiferamente para
explicar a estabilizao do fenmeno de palatalizao de oclusivas alveolares
na comunidade de Antnio Prado-RS.
Por fim, a noo de comunidade de fala a mais ampla e abstrata, bem
como a mais antiga. H duas prerrogativas que sempre acompanharam sua
conceitualizao: a uniformidade de fala e a possibilidade de identificao de
um grupo de falantes que partilham uma mesma lngua (Patrick, 2002). At
o sculo XIX, a relao entre comunidade e forma lingustica era diretamente
equacionada (Hymes, 1974): cada povo possua a sua lngua, e esta, por
sua vez, refletia a histria e cultura de seu povo. No sculo XX, diversas
abordagens passaram a matizar essa equao, apesar de manterem a noo
de lngua como expresso de uma identidade histrico-cultural.

18
Modelos de agrupamentos sociais e de comunidades lingusticas

Bloomfield (1973 [1933] : 42) define a comunidade fala como um grupo de


pessoas que interagem por meio da fala.2 Essa definio prefigura uma srie
de problemticas que posteriormente seriam elaboradas por sociolinguistas.
Bloomfield assinala que a dificuldade ou talvez at a impossibilidade
de determinar quais pessoas pertencem a uma mesma comunidade de fala
advm do fato de no haver dois indivduos que falem exatamente da mesma
maneira de fato, nem um mesmo indivduo fala do mesmo modo a todo
momento. Sobre a questo da uniformidade lingustica, o autor aponta
a inteligibilidade como critrio de delimitao de comunidades de fala o
que, forosamente, tem apenas um valor relativo, visto que a inteligibilidade
entre falantes se organiza em um contnuo. Bloomfield tambm faz notar a
existncia de variao dentro de uma mesma comunidade devido a diferenas
de classe social, faixa etria e ocupao profissional. Tais diferenas, segundo
o autor, devem-se densidade de comunicao. Em um experimento mental,
Bloomfield (1973 [1933] : 4647) prope que se imagine um grande diagrama
em que cada falante de uma comunidade seja representado por um ponto; a
cada vez que um falante se dirigisse a outros, seria adicionada uma flecha
ligando o falante a seus ouvintes; ao fim de alguns anos ou dcadas, o diagrama
representaria a densidade de comunicao dentro de uma comunidade algo
que o modelo de redes sociais desenvolveria dcadas depois. Desse modo,
Bloomfield j atribua uma grande importncia ao papel da interao social
no estudo da mudana lingustica (Gumperz, 1972).
A partir da dcada de 1960, o conceito de comunidade de fala passou
a ser mais ativamente elaborado por Gumperz, Hymes e Labov. Gumperz
(1972 : 460) identifica uma das dificuldades centrais da conceitualizao: apesar
de se relacionar com trabalhos antropolgicos, o universo da anlise sociolin-
gustica no se refere a uma comunidade geograficamente especfica, mas sim
a uma lngua ou dialeto que abstrado da totalidade do comportamento
comunicativo. A equao entre lngua e comunidade, ainda presente em
Bloomfield (1973 [1933]), criticada; Gumperz considera que no h motivo
para se esperar que todos os membros de uma comunidade falem a mesma
2
Traduo prpria. Texto original: a speech community is a group of people who interact by means of
speech.

19
Modelos de agrupamentos sociais e de comunidades lingusticas

lngua ao contrrio, o bi- e o multilingualismo so antes a regra do que a


exceo em muitas sociedades. O autor tambm aproxima o bilingualismo
do bidialetismo, cuja diferena no significativa do ponto de vista de sua
funo social (Gumperz, 1972 : 463).
Ainda em dilogo com o trabalho de Bloomfield, Gumperz (1971b) impe
limites ao papel da densidade de comunicao na uniformidade lingustica ao
apontar que a estratificao social pode conduzir os falantes preservao
de suas variedades, ainda que interajam frequentemente com membros de
outros grupos, sobretudo em interaes no igualitrias (entre empregador
e empregado, por exemplo). Afirma o autor: Parece ser o caso de que a
comunicao conduz uniformidade apenas quando h tanto a possibilidade
quanto o desejo de assimilao social. Nas situaes em que as normas sociais
privilegiam a distino social, os smbolos lingusticos dessa distino tendem
a ser mantidos (Gumperz, 1967 : 227).3 nessa acepo que esta pesquisa
adota o conceito de densidade de comunicao.
Gumperz (1971b) introduz dois novos elementos que posteriormente so
adotados por Hymes e Labov: o compartilhamento de conhecimento lingustico
e de normas sociais. Hymes (1972), assim como Gumperz, muda a perspectiva
de estudo das variedades para a relao entre os falantes: a unidade de
anlise sociolingustica no a lngua, mas a comunidade de fala, definida
como uma comunidade que compartilha regras de conduta e interpretao
da fala, e regras para a interpretao de pelo menos uma variedade lingustica
(Hymes, 1972 : 54).4 O ponto de partida do estudo sociolingustico seria a
descrio do repertrio de modos de falar que inclui tanto regras de
gramtica quanto regras de uso , pois no possvel saber quais prticas so
essenciais para uma comunidade antes que se faa tal levantamento. Alm
desse repertrio verbal, sua abordagem etnogrfica considera a competncia
comunicativa (Hymes, 1991 [1979]) como elemento central para a definio
de uma comunidade de fala: ela composta pelo conjunto de falantes que
3
Traduo prpria. Texto original: It would seem that communication leads to uniformity only where
there is both the possibility and the desire for social assimilation. Where social norms put a premium
on social distinctness, linguistic symbols of such distinctness tend to be maintained.
4
Traduo prpria. Texto original: a community sharing rules for the conduct and interpretation of
speech, and rules for the interpretation of at least one linguistic variety.

20
Modelos de agrupamentos sociais e de comunidades lingusticas

exploram de forma apropriada os recursos identificados como pertencentes s


regras da prtica comunicativa.
Entretanto, dentre esses autores, Labov (2006 [1966], 2008 [1972]) aquele
cuja conceitualizao teve maior impacto nos estudos variacionistas. Para
Labov (2008 [1972] : 150),

a comunidade de fala no definida por nenhuma concordncia mar-


cada no uso de elementos lingusticos, mas sim pela participao num
conjunto de normas compartilhadas; essas normas podem ser observa-
das em tipos de comportamento avaliativo explcito e pela uniformidade
de padres abstratos de variao que so invariantes no tocante a nveis
particulares de uso.

De acordo com sua teorizao, os critrios para a delimitao de uma co-


munidade de fala so o compartilhamento de normas (ainda que inconscientes,
pois no se limitam a avaliaes por parte do indivduo) e a uniformidade
lingustica. importante notar que essa uniformidade no sinnimo de
uma suposta homogeneidade; ao contrrio, o prospecto a existncia de
heterogeneidade ordenada (Weinreich et al., 2006 [1968]) por meio do emprego
varivel e sistemtico de diferentes variantes lingusticas. O compartilhamento
e a uniformidade so entendidos como definidores de um padro, concebido
e descrito segundo um paradigma quantitativo (ver seo 2.3), em que o papel
de diferentes fatores pode ser testado e comparado.
Dessa forma, ainda que haja aparentes discrepncias de comportamentos
lingusticos de informantes isolados ou de subgrupos de pessoas, pode-se
verificar se a variao estruturada e, portanto, se h evidncias de normas
compartilhadas. Um indivduo ou um grupo de pessoas faz parte de uma
comunidade de fala caso os dois critrios acima sejam preenchidos. Dentro
desse quadro, a constatao de uma comunidade de fala resultado da pesquisa,
no seu ponto de partida (diferentemente de Hymes (1972)). Note-se, por
exemplo, que no estudo de Labov (2006 [1966]) no Lower East Side, em Nova
Iorque, a seleo de falantes no se pautou por interaes cotidianas, normas
compartilhadas, tampouco pelo requisito de fortes laos comunitrios; em
especial, no se empregaram critrios lingusticos o nico requisito foi a
residncia no bairro. A grande vantagem desse modelo evitar a circularidade

21
Modelos de agrupamentos sociais e de comunidades lingusticas

de definio de uma comunidade.


O presente estudo adota o conceito laboviano de comunidade de fala
como principal modelo de agrupamento lingustico. Parte-se de um critrio
sociodemogrfico o de ter nascido na cidade de So Paulo e ter ali vivido a
maior parte da vida para se examinar se os falantes paulistanos constituem,
alm de uma unidade poltica, geogrfica e sociocultural, uma comunidade de
fala.

2.1.1 Excursus: as trs ondas da Sociolingustica


Eckert (2012), em uma epistemologia informal, entrev que a empresa so-
ciolingustica, desde o estudo de Labov em Marthas Vineyard, pode ser
caracterizada por trs ondas de anlise. Grosso modo, elas se relacionam
com os trs tipos de agrupamentos sociais acima delineados.
A primeira teria se iniciado com o estudo de Labov (2006 [1966]) em
Nova Iorque. O principal foco dos trabalhos de primeira onda, segundo a
autora, o estabelecimento de padres regulares de variao lingustica de
acordo com macrocategorias sociais, sobretudo a estratificao socioeconmica
dos falantes. Nessa perspectiva, variveis como Sexo, Classe Social, Idade
e Estilo (esta ltima, entendida como grau de ateno fala), ainda que
tenham revelado a sistematicidade da variao lingustica, so tomadas pelo
pesquisador como instrumentos impostos de cima para baixo para descrever
processos de mudana mais amplos. No desenvolvimento desses estudos,
as macrocategorias por vezes passaram a se confundir com identidades dos
falantes, sem levar em conta sua relevncia para os prprios indivduos em
seu cotidiano.
A segunda onda se voltou para mtodos etnogrficos para examinar a
dinmica da variao lingustica mais localmente. Estudos como os de Mil-
roy (1980) em Belfast, Rickford (1986) na Guiana e de Eckert (1989) em
um colgio em Detroit (apud Eckert 2012) buscaram categorias locais para
compreender a relevncia de macrocategorias sociais na vida local. Esses
trabalhos questionam a viso harmoniosa de classe social como colocada
por Labov (2006 [1966]) em sua nfase no consenso da comunidade quanto

22
Identidades e significados sociais

s normas lingusticas. A anlise de usos lingusticos em relao com as


redes sociais dos falantes d destaque a prticas locais que funcionam como
resistncia a normas supralocais.
Por fim, a terceira onda conceitualiza a variao lingustica no como
reflexo de categorias sociais mas, ao contrrio, como prticas por meio das
quais os falantes se posicionam no mundo social. Denominada por Eckert
(2012) de perspectiva estilstica, a terceira onda enfatiza o papel agentivo
dos falantes na constituio de identidades e de significados sociais, em
contraposio a estudos com base em macrocategorias sociais. Em lugar disso,
d-se preferncia ao estudo de agrupamentos menores e de comunidades de
prticas, em que possvel mais bem observar significados e categorias locais.
Estilo, nessa perspectiva, entendido como o locus privilegiado da criao de
significados sociais, em que os falantes combinam e recombinam variantes em
um processo contnuo de bricolage (Cf. Eckert 2001, 2012 e Labov 2001a).
medida que os estudos de terceira onda iniciam sua incurso na
Sociolingustica brasileira (ver, p.ex., Camacho 2010; Freitag et al. 2012;
Mangabeira 2012; Salomo 2014), parece relevante situar esta pesquisa no
cenrio de estudos sociolingusticos. Da presente perspectiva, Eckert (2012)
renova os interesses no estudo do significado social da variao e levanta
crticas importantes sobre a interpretao do encaixamento social da variao
lingustica. Por outro lado, ainda que a autora assinale que as diferentes
ondas no se referem superao de modelos, sua demarcao parece
criar cises artificiais entre tpicos variados mas correlatos dentro do campo
de estudos: encaixamento lingustico; encaixamento social; processos de
mudana de mdio e longo prazo; criao contextualizada de identidades
sociais e individuais, ou estilos, mediante usos lingusticos. A prxima seo
representa um esforo em articular essas noes.

2.2 Identidades e significados sociais


Definies de identidade costumam ressaltar o carter relacional desse
conceito. Mendoza-Denton (2002 : 475) o define como a negociao ativa
da relao de um indivduo com construtos sociais mais amplos, na medida

23
Identidades e significados sociais

em que essa negociao sinalizada atravs de meios lingusticos e outros


meios semiticos;5 Kiesling (2013 : 450) como um estado ou processo de
relao entre o eu e o outro; a identidade como os indivduos definem,
criam, ou pensam sobre si em termos de sua relao com outros indivduos
e grupos, sejam eles reais ou imaginrios;6 e Battisti (2014 : 81), seguindo
Wenger (1998), afirma que a construo de identidade consiste em negociar
os significados de nossa experincia de pertena a diferentes grupos sociais.
A identidade, portanto, no um atributo pessoal tampouco uma posse,
mas um processo de criao de sentidos que deve ser ao mesmo tempo
individual e coletivo. A construo de sentidos se d sempre dentro de uma
matriz cultural e ideolgica, sobre a qual o indivduo no exerce controle.
Para pensar identidades em seu contexto social, deve-se levar em conta a
escala em que o conceito operacionalizado. Kiesling (2013) prope distines
em pelo menos trs grandes nveis: (i) amplos grupos censitrios, como
sexo, classe social, etnia; (ii) papis institucionais, como me, policial;
e (iii) tomadas de postura (stances) e posies durante a interao. O
presente estudo, que analisa uma amostra robusta da fala paulistana, baseia-
se principalmente na primeira dessas dimenses.
Como visto h pouco, uma das principais crticas levantadas por estudos de
terceira onda a ligao direta entre macrocategorias sociais e identidades
dos falantes. Com efeito, pode-se questionar se um novaiorquino categorizado
pelo pesquisador como pertencente classe baixa emprega a vocalizao ou
o apagamento de /-r/ (como em car carro e card carto) para indexar
uma identidade de classe baixa (Kiesling, 2013).7 De modo semelhante,
parece pouco plausvel (embora possvel em certos contextos) que um falante
categorizado como menos escolarizado empregue a marca zero de (CN) para
se identificar como algum de baixa escolaridade; seus objetivos, se os h,
podem ser outros.
5
Traduo prpria. Texto original: the active negotiation of an individuals relationship with larger
social constructs, in so far as this negotiation is signaled through language and other semiotic means.
6
Traduo prpria. Texto original: Identity is a state or process of relationship between self and other;
identity is how individuals define, create, or think of themselves in terms of their relationship with
other individuals and groups, whether these others are real or imagined.
7
Vale notar que Labov (2006 [1966]) no emprega o termo identidade social ou qualquer equivalente
em nenhum momento de seu trabalho sobre o ingls de Nova Iorque. O autor no desenvolve essa
questo.

24
Identidades e significados sociais

Desse modo, explicaes de cunho essencialista para o comportamento


lingustico de indivduos (p.ex. mulheres fazem mais concordncia nominal
porque so mais certinhas) e que reduzem o falante a uma nica dimenso
(ser mulher, ser nordestino, ser homossexual etc.) devem ser rechaadas.
Correlaes entre usos lingusticos e categorias sociais no necessariamente
implicam que x significa y por exemplo, o fato de o retroflexo ser favore-
cido por homens no necessariamente significa que a variante seja ndice de
masculinidades.
Ao mesmo tempo que no se deve reduzir os falantes a uma nica dimenso
social, no se deve superestimar o papel agentivo do indivduo na construo
de sua prpria identidade. Alm da improbabilidade de que um indivduo
possa monitorar e manipular conscientemente cada trao lingustico de sua
fala a todos os momentos, uma srie de construtos sociais que servem de
parmetros identitrios preexiste e ultrapassa o domnio da ao individual.
Gumperz (1971a : 152-153) sumariza essa questo do seguinte modo:

[...] em ltima instncia, o indivduo que toma a deciso, mas a


liberdade de escolher est sempre sujeita a restries tanto gramaticais
quanto sociais. As primeiras se relacionam com a inteligibilidade das
sentenas; as segundas com sua aceitabilidade. [...] O poder de seleo,
portanto, limitado por convenes que servem para categorizar formas
lingusticas como informais, tcnicas, vulgares, literrias, humorsticas
etc.8

Nesse sentido, o arcabouo terico-metodolgico da Sociolingustica Va-


riacionista, por intermdio de anlises quantitativas e multivariadas (ver
seo 2.3), oferece ferramentas particularmente teis para o desembarao da
complexa rede de influncias e de possvel interao entre vrios fatores sociais
e lingusticos na formao de identidades sociais (Mendoza-Denton, 2002).
Na presente pesquisa, o termo identidade sempre empregado para
fazer referncia a identidades sociais, nunca pessoais ou individuais. Com
efeito, a macroperspectiva impede qualquer tentativa de inferncia sobre como
8
Traduo prpria. Texto original: ultimately it is the individual who makes the decision, but his
freedom to select is always subject both to grammatical and social restraints. Grammatical restraints
relate to the intelligibility of sentences; social restraints relate to their acceptability. [...] The power
of selection is therefore limited by commonly agreed-on conventions which serve to categorize speech
forms as informal, technical, vulgar, literary, humorous etc.

25
Identidades e significados sociais

50
40
30
20
10
0

modo de falar atitudes aparncia fsica outros ser de fora no sabe

Figura 2.1 Respostas pergunta: Quando voc estava em X, as pessoas te


reconheciam como paulistano? Como? (Fonte: Oushiro 2012)

os informantes do corpus se identificam individualmente algo, alis, que


tampouco esttico, mas fluido, mutvel e finamente contextualizado.
O primeiro ponto de interesse sobre uma possvel identidade paulistana,
entendida de um ponto de vista sociolingustico. No obstante a caracterizao
de So Paulo como um lugar de mistura (ver Captulo 1, p. 8), os paulistanos
parecem ter uma identidade sociolingustica bem definida no territrio nacional
diferentemente, por exemplo, dos capixabas (Yacovenco et al., 2012 : 772).
Oushiro (2012) analisou as respostas de 72 informantes pergunta Quando
voc estava em (outra cidade j visitada pelo informante), as pessoas te
reconheciam como paulistano? (Se sim) Como? (ver pergunta 29 no Roteiro
de Entrevistas, Anexo A, p. 357). Deles, 66 (92%) responderam que sim,
e mencionaram mais frequentemente o modo de falar como ndice de sua
paulistanidade.
Os motivos apontados pelos informantes (muitas vezes, mais de um) foram
classificados nas categorias da Figura 2.1: modo de falar, modo de se portar,
aparncia fsica, no ser do local, outras respostas, ou no soube dizer por qu.
Junto a traos comportamentais e fsicos, como ser apressado, exibir poder
aquisitivo ou a brancura (ver exemplos (1)(3) abaixo), os paulistanos
frequentemente mencionam os modos de falar rpido (2), italianado
(4)(5), fanho (4).

26
Identidades e significados sociais

(1) D1: quando voc vai pra praia voc falou que vai pra Sorocaba as pessoas
percebem que voc no de l?...
S1: eu acho que percebe s de olhar a... a brancura nossa n? [risos] eu
acho que percebe sim
D1: por que... alm da brancura? quais outros motivos voc acha que faz
elas perceberem que voc no dali?
S1: eu acho que at uma questo eh financeira n? quem mora na praia
geralmente anda de bicicleta de havaianas
D1: uhum
S1: e a a gente est com carro e est... enfim a forma que a gente se veste
acho que tudo isso (Sonia L., F1SC)

(2) D1: mas j chegou a acontecer assim de perguntarem ah... voc de


So Paulo n?
S1: ah no todo mundo j sabia... pelo sotaque pelo jeito de falar e tambm
(ser) meio rpido... pelas perguntas tambm ento assim... (ento) a minha
irm vivia perguntando d tempo de fazer isso? d tempo de fazer aquilo?
S2: [risos] d tempo
S1: e o cara... d (i)magina tudo dava sabe e a gente assim n no
porque tem que saber tudo certo que no sei o qu no sei o qu... e o cara
nem a n? ele olhava pra minha irm e falava d d (xxx) e da chegou
uma hora que ela olhou pra ele e falou mas tudo d! no possvel vai
dar tudo errado! [risos] (Rebeca C., F1SC)

(3) D1: e quando voc estava no sul ou outras cidades que voc j foi... eles
percebiam que voc era de So Paulo?
S1: percebia... meio que... parece que est escrito assim paulista...
[risos-D1] mesmo/ mesmo sem falar nada por causa do sotaque assim o
pessoal voc de So Paulo n?... no sei se por causa da aparncia da
tatuagem ou coisa do tipo
D1: mas geralmente descobriam como assim? (alguma coisa que voc fazia)
que voc falava?
S1: quando eu comeava a falar... pelo sotaque... arroz... dez o pessoal
falava onde tem i no arroz onde tem i no dez... dente ... dente
com e no com i ... pelo sotaque mesmo (Jos L., M1MP)

(4) D1: e quando voc voc vai pra esses outros lugares as pessoas percebem
que voc de So Paulo?
S1: eu falo de um jeito muito paulistano todo mundo fala isso
D1: ?
S1: que eu falo muito meu eu falo muito... ficam at zoando que falo que
nem o Boa do Hermes e Renato o Boa uma cari/ uma caricatura do...
um paulistano superexagerado... ficam falando que eu falo que nem ele
D1: [risos] mas o que que assim que voc acha que o jeito do Boa assim

27
Identidades e significados sociais

me explica
S1: que fala p meu sabe esses... que na verdade um/... um jeito
meio italianado de se falar n italianizado... que sabe orra meu p meu
tudo meu... falam que a gente fala de um jeito meio... meio fanho assim
no sei... nunca percebi pra mim a gente de So Paulo no tem sotaque
eles que tm... a gente no tem no... e no eles percebe assim acho que
do jeito que eu falo (Marcelo B., M1MP)

(5) D1: [rudo] eh quando voc foi pra esses outros lugares pra Bahia pra
Recife pra... e mesmo pra Extrema 9 n... as pessoas reconheciam que voc
era/... paulistana?
S1: ah sim... reconhece... bom primeiro porque eu tenho um jeito de falar
meio italianado n? ento bem caracterstico cada vez que tem uma novela
da Globo sobre So Paulo os cara tudo falam com sotaque italianado
D1: aham
S1: ento tem isso... eh... em Extrema/ que em Extrema quando eu
chego l eu j sou conhecida porque eu sou irm do A. n?
D1: aham
S1: que o veterinrio ento diferente eu me relaciono mais com as
pessoas com quem eu j tenho contato... agora nesses outros lugares... o
nosso ritmo um pouco mais acelerado... n? (Iolanda P., F2SP)

Deve-se levar em conta que as prprias condies de entrevista realaram


essa dimenso identitria, independentemente do fato de os informantes se
identificarem ou no como paulistanos; eles foram recrutados para uma
pesquisa acadmica sobre So Paulo e os paulistanos e gravados justamente
por terem nascido na cidade; no roteiro de entrevista, muitas perguntas so
sobre seu bairro, a cidade e sua relao com ela. Sendo reais ou imaginados,
os traos levantados pelos informantes indicam que o paulistano se reconhece
como um ser sociolinguisticamente distinto de outros geogrficos dentro do
territrio nacional.
Por outro lado, tambm interessam a esta pesquisa identidades sociais
que diferenciem os paulistanos entre si. Os excertos em (6) muitos dos
quais reaparecero nas prximas pginas referem-se a categorias sociais
apontadas pelos prprios informantes como relevantes para a caracterizao
de grupos distintos na comunidade, para a diferenciao interdialetal e para
a associao de certas variantes a socioletos.
9
Cidade no interior de Minas Gerais.

28
Identidades e significados sociais

(6) a. os mais velhos que so bem de So Paulo falam mais assim


b. o cara sei l o adolescente... ele quer falar eh de outra maneira ele no
consegue...
c. a juventude fala bem assim... esses/ esses meninos que me entrevista-
ram falavam desse jeito aqui...
d. ento tem gente por exemplo que mora sei l Jardim Amrica (xxx)
com aquelas joias com aquelas coisa toda
e. as classes mais baixas falam diferente... do que as classes mais elitiza-
das que tiveram condies de estudo e tudo mais
f. assim meninas bem de classe mdia assim daquele tipo que... as pessoas
chamam de patricinha... ento ela fala assim
g. quando voc j vai indo mais pra periferia voc j vai vendo que as
pessoas j vo mudando
h. se voc for por exemplo no extremo da zona leste l na periferia...
favela do Elmo... vai ver que os caras falam assim
i. na Mooca d na hora para voc ver... tem a da Mooca porque se eu
falo meio cantado e falo meio italianado l isso ao cubo...
j. eh isso a um sotaque nosso caipira n?...
k. tem cada bairro de um jeito porque vai na zona leste tem muita
concentrao de nordestino ento tambm outro sotaque...

Os grupos destacados constituem identidades de gnero (patricinha), de


classe social (patricinha, classe mdia, classes mais baixas, classes
mais elitizadas), etrias (o adolescente, a juventude, os mais velhos),
de origem geogrfica (nordestino, caipira), de bairro (Mooca, Jar-
dins), de zona (zona leste) e de regio da cidade (periferia). Trata-se de
categorias que so relevantes para os membros da comunidade e que so em-
pregadas na definio de certas identidades sociais em situao de entrevista
sociolingustica, em que muitas vezes os interlocutores no so prximos entre
si. A questo de escala se torna relevante aqui: em outras situaes interati-
vas, outras categorias locais reconhecidas e ratificadas pelos interlocutores
poderiam surgir (a bicha po-com-ovo, o pereira, o coxinha); de uma
macroperspectiva, so preponderantes categorias amplamente reconhecidas
por todos.
Tambm interessa notar que, na grande maioria dos casos, a nomeao de
uma categoria social se refere ao outro, no ao ego; nos exemplos acima,
o adolescente, a patricinha, o cara da Mooca so categorias a que os
falantes no pertencem discursivamente. Isso significa que os informantes

29
Identidades e significados sociais

muitas vezes definem suas identidades sociolingusticas no atravs de eu sou,


mas sim atravs de eles so, ou seja, definem-se pela sinalizao discursiva
de que eles no pertencem a certas categorias sociais. Alguns dos estudos
sociolingusticos que se debruam sobre questes de identidades parecem
enfatizar a construo de personas dos prprios falantes, que agentivamente
selecionam traos lingusticos a fim de indexar pertena a certas categorias ou
tomadas de certas posturas ver, p.ex., Podesva (2007), Zhang (2005, apud
Eckert 2008); cabe aqui assinalar que a estratgia de afirmao por negao
pode ser to frutfera quanto: em seus usos lingusticos, os falantes podem
tambm indexar categorias com as quais no se identificam e das quais, ideal
ou factualmente, distanciam-se.
Desse modo, este estudo define identidades sociolingusticas como cate-
gorias sociais discursivamente elaboradas, s quais os indivduos podem ou
no pertencer e com as quais desejam ou no se filiar, e que so relevantes
para diferenciaes socioletais em suas avaliaes, produes ou percepes
lingusticas.
Os conceitos de indicadores, marcadores e esteretipos (Labov, 2008 [1972])
tambm so fundamentais para a discusso do valor e do significado social de
variantes lingusticas. Os primeiros se referem a variveis abaixo do nvel da
conscincia dos falantes, no disponveis para metacomentrios, ainda que
apresentem padres regulares nos usos lingusticos. Marcadores, por sua vez,
so reconhecidos pelos falantes de uma comunidade e revelam estratificao
socioeconmica e estilstica. Por fim, esteretipos dizem respeito a variveis
sujeitas a metacomentrios explcitos dos falantes e a extrema estigmatizao.
Na formulao laboviana, tais conceitos se relacionam com os estgios de
mudana lingustica:

As mudanas de baixo se iniciam como indicadores, estratificados por


faixa etria, regio e classe social. Nesse estgio, eles exibem grau
zero de conscincia social e so difceis de ser detectados tanto por
linguistas quanto por leigos. medida que procedem a seu trmino,
tais mudanas normalmente adquirem reconhecimento social como
marcadores lingusticos, normalmente na forma de estigma, que se
reflete em forte estratificao social na produo da fala, numa ngreme
curva de alternncia estilstica e em respostas negativas em testes de

30
Identidades e significados sociais

reao subjetiva. Por fim, as variveis podem se tornar esteretipos,


tpico de comentrios abertos, com um rtulo descritivo que pode ser
to distinto da factual produo que os falantes no percebem que eles
mesmos empregam a forma. (Labov 2001b : 196. Grifos no original)10

A questo a que se volta o sociolinguista interessado no significado social


da variao como tais valores passam a se associar com as variantes no
curso da mudana, e como informaes de identidades sociais so codificadas
linguisticamente.11
Conforme j se indicou, correlaes entre usos lingusticos e categorias
sociais no implicam relaes diretas entre variveis. No entanto, o exame
de como variveis sociolingusticas podem estar correlacionadas a outras de
natureza lingustica ou social aquilo que Weinreich et al. (2006 [1968])
denominaram o Problema do Encaixamento um primeiro passo para
levantar pistas sobre a associao entre variantes e identidades sociais. Sob a
premissa de que a lngua inerentemente varivel e heterognea, entende-se
que variveis sociolingusticas no ocorrem isoladamente, mas so influenciadas
por outros elementos internos lngua (como o contexto fonolgico, funes
gramaticais, relaes sintticas e paradigmticas etc.), uma vez que a mudana
no consiste na troca de um sistema inteiro por outro, mas sim em um processo
gradual. A estrutura lingustica, por sua vez, est encaixada no contexto
social de um conjunto de falantes, de modo que variveis sociais e geogrficas
so elementos intrnsecos da estrutura (Weinreich et al., 2006 [1968] : 123).
No entanto, a simples identificao de variveis (sociais ou lingusticas)
que se correlacionam com usos lingusticos no capaz de explicar processos
de variao e mudana. Dentre as cinco questes propostas por Weinreich
et al. (2006 [1968]) com vistas ao estabelecimento de princpios empricos
para o estudo lingustico, encontra-se, ao lado do Problema do Encaixamento,
10
Texto original: Changes from below begin as indicators, stratified by age group, region, and social class.
At this stage, they show zero degrees of social awareness, and are difficult to detect for both linguists
and naive speakers. As they proceed to completion, such changes usually acquire social recognition as
linguistic markers, usually in the form of social stigma, which is reflected in sharp social stratification
of speech production, a steep slope of style-shifting, and negative responses on subjective reaction tests.
Ultimately, they may become stereotypes, the subject of overt comment, with a descriptive tag that
may be distinct enough from actual production that speakers do not realize that they use the form
themselves.
11
Na formulao de Eckert (2008, 2012) e nos estudos de terceira onda, a questo do significado social se
dissocia do interesse na mudana lingustica e passa a enfocar exclusivamente a questo de identidades
dos falantes. A proposta de Eckert (2008) ser mais bem discutida no Captulo 10.

31
O paradigma quantitativo

o Problema da Avaliao.12 Tambm se devem determinar empiricamente


correlatos subjetivos ou o nvel de conscincia social que os falantes tm das
variveis, e suas relaes com o curso da mudana lingustica.
O presente estudo faz uma distino conceitual entre avaliao e percepo
lingustica: o primeiro empregado para fazer referncia ao discurso metalin-
gustico dos falantes sobre variantes, o que constitui um objeto de estudo em
si. O segundo diz respeito a inferncias feitas pelos usurios de uma lngua
ao ouvir outro falante, que podem ou no ser conscientes e que, portanto,
podem no ser objeto de comentrio metalingustico. Ambas, por outro lado,
diferenciam-se de produo lingustica, j que aquilo que as pessoas dizem ou
o modo como reagem a certas variantes podem no coincidir com seus usos
factuais.
Anlises de avaliao e de percepo parecem mais adequadas para in-
vestigar os tipos de associaes que os falantes estabelecem entre variveis
lingusticas e categorias sociais. Pessoas que empregam o retroflexo so
avaliadas ou percebidas como menos escolarizadas, mais masculinas, menos
paulistanas, menos patricinhas? Contudo, para interpretar tais avaliaes
e percepes, anlises de produo se fazem necessrias, uma vez que usos
lingusticos raramente so categricos; o emprego de retroflexo se d em taxas
bastante distintas entre os falantes (ver Captulo 8, p. 212) e, a depender
das experincias de certos grupos sociais, uma taxa de 20% pode j ser
muito frequente. Os trs tipos de anlises so necessrios para examinar
os mecanismos pelos quais certas variantes se associam a certos significados
sociais.

2.3 O paradigma quantitativo


O paradigma quantitativo se baseia no conceito de competncia comunicativa:
os membros de uma comunidade tm internalizadas no apenas as regras
da gramtica mas tambm as regras de seus usos apropriados, de forma
12
As outras trs questes so o Problema dos Fatores Condicionantes, o Problema da Transio e o Pro-
blema da Implementao, que no so abarcados neste trabalho; ver Weinreich et al. (2006 [1968] : 121
126).

32
O paradigma quantitativo

semelhante ao domnio de outras regras culturais (Sankoff, 1980).


A modelagem das restries gramaticais e sociais (Gumperz, 1971a),
ou seja, o olhar simultneo tanto para a estrutura lingustica quanto para a
estrutura social requer o exame de uma grande quantidade de dados (Guy,
1993): por um lado, raramente se pode falar em termos categricos acerca de
caractersticas dialetais, pois os dados observados quase nunca se organizam
perfeitamente isentos de variao interna; por outro lado, observaes qualita-
tivas conduzem estipulao de regras impressionsticas, em que se aplicam
termos como frequentemente, ocasionalmente ou s vezes a chamada
variao livre (Weinreich et al., 2006 [1968]). Com base na premissa de que
as flutuaes observadas na lngua em uso so ordenadas e formam padres,
o Paradigma Quantitativo busca modelar a competncia comunicativa dos
falantes por meio de uma srie de princpios.
O mais central deles o Princpio da Modelagem Quantitativa (Bayley,
2013 [2002]), que afirma (i) a necessidade de observar formas lingusticas
variveis em seu contexto de uso, seja o contexto lingustico ou no lingustico;
e (ii) contanto que haja dados suficientes, a possibilidade de derivar afirmaes
acerca da probabilidade de coocorrncia de uma forma lingustica varivel e
as caractersticas contextuais. Tais afirmaes expressam, em termos quanti-
tativos, a fora da associao entre a caracterstica contextual e a varivel
lingustica (Bayley, 2013 [2002] : 118).
Para tanto, necessrio examinar tanto as ocorrncias em que determinada
forma lingustica foi empregada quanto as instncias de no ocorrncia. O
Princpio de Contabilidade, tal como definido por Labov (1969 : 738), afirma
a importncia de se reportar o emprego de uma forma variante em relao ao
nmero total de casos em que ela poderia ter ocorrido no mesmo contexto,
mas no ocorreu. Assim, ainda que se tenha interesse na realizao ditongada
de [ej], por exemplo, devem-se analisar tanto os casos de [ej] quanto de [e]
em palavras como sete(i)nta. Esse princpio segue da observao de que
a lngua normalmente percebida como categrica, tanto por leigos quanto
por especialistas; observem-se comentrios comuns na forma de afirmaes
como paulistanos falam po[R]ta, pessoas do interior falam po[]ta caracte-
rizao que, como se apontar nos captulos 5 e 8, no corresponde aos fatos

33
O paradigma quantitativo

lingusticos, dado que a pronncia retroflexa de /r/ em coda relativamente


produtiva na fala de paulistanos nativos. Ao mesmo tempo, objetiva-se des-
crever padres gerais em vez de idiossincrasias; esses padres so mais bem
identificados atravs de uma anlise que no se baseie em instncias isoladas.
A regra varivel descreve padres de variao ao estabelecer probabilidades
de emprego de variantes em contextos vrios.
O Princpio de Mltiplas Causas (Bayley, 2013 [2002]) afirma a improba-
bilidade de que um nico fator contextual possa dar conta da variabilidade
que se observa nos dados. Uma vez que cada ocorrncia de uma determinada
varivel se d necessariamente dentro de um contexto enunciativo, social
e lingustico, h uma gama de fatores que pode influenciar o emprego de
formas lingusticas em alternncia. Por exemplo, na variao da concordncia
nominal, pode haver maior ou menor probabilidade de ocorrncia da marca
zero de acordo com o sexo/gnero do falante, sua classe social, os grupos
sociais com quem o falante convive, o estilo de fala etc., assim como de acordo
com a salincia fnica do morfema de plural ({s}, {es}, {is}, {es}), com o
contexto fnico seguinte (consoantes, vogais), com a animacidade do SN ([
animado], [ humano]) etc. A anlise multivariada modela as ocorrncias
de variveis como uma funo de vrias foras simultneas, intersecciona-
das e independentes, que podem agir em diferentes direes (Guy & Zilles,
2007 : 50).
O prximo captulo apresenta como esses conceitos so operacionalizados
no exame dos dados lingusticos.

34
3
Materiais e mtodos

Este captulo apresenta os materiais analisados nos captulos 4


a 9 e os mtodos empregados nos captulos 4 a 7. Descrevem-se
inicialmente a coleta e a organizao do corpus de 118 entrevis-
tas sociolingusticas; em seguida, discute-se a definio de sete
variveis sociais e suas respectivas hipteses, que so analisadas
em correlao com as variveis (e), (-r), (CN) e (CV); por fim,
apresentam-se os mtodos de tratamento e de anlise de dados no
programa R.

3.1 Corpus e roteiro da entrevista


Para atender as questes propostas nesta pesquisa (Captulo 1, p. 12),
organizou-se uma amostra robusta do portugus paulistano, composta de 118
entrevistas sociolingusticas provenientes do corpus do Projeto SP2010.1 Essas
gravaes, cada qual com cerca de uma hora de durao, foram coletadas por
diversos membros2 do GESOL-USP entre os anos de 2009 e 2013 e tiveram o
duplo objetivo de obter (i) amostras de fala semiespontnea de paulistanos
de variados perfis sociolingusticos; e (ii) mais informaes sobre as condies
1
O Projeto SP2010 conta atualmente com mais de 300 gravaes de falantes residentes nas cidades de
So Paulo, Itanhandu-MG, Campo Grande-MS e So Lus-MA. Sessenta entrevistas com paulistanos,
coletadas em 20122013, so disponibilizadas gratuitamente (udio e transcrio) no portal do Projeto
SP2010 (http://projetosp2010.fflch.usp.br/). Dessas 60, 18 fazem parte da amostra aqui analisada.
2
So eles: Alexandre Sobreiro, Ana Paula Piola Araujo, Camila Barbosa de Faria, Cau Rodrigues,
Dayane Celestino de Almeida, Ivanete Belm do Nascimento, Larissa Soriano, Livia Oushiro, Marclio
Melo Vieira, Mariane Esteves Bieler, Melissa Cruz, Rafael Ciancio, Rafael Stoppa Rocha e Talita
Vieira.
Corpus e roteiro da entrevista

de vida e avaliaes sociolingusticas desses falantes (Labov, 2006 [1966]).


So sobre essas entrevistas que se desenvolvem as anlises apresentadas nos
captulos 4 a 9.
O roteiro de entrevista se divide em duas partes (ver Anexo A, p. 354).
A primeira abrange tpicos como o bairro, a infncia, a famlia, a educao,
a ocupao, a rede social e as atividades de lazer do informante. Como
nota Labov (2006 [1966] : 59), malgrado o interesse do pesquisador no modo
como as pessoas falam cotidianamente, a prpria situao de entrevista e
de gravao necessria para a obteno de amostras comparveis de fala
provoca o distanciamento do modo mais espontneo com que as pessoas se
comunicam no dia a dia, sobretudo com familiares e amigos. Nesse sentido, a
incluso de tpicos como infncia e lazer tem o objetivo de tentar obter
amostras de fala relativamente menos monitoradas, ainda que se deva ter em
mente o efeito do Paradoxo do Observador durante toda a gravao.
A segunda parte contm perguntas mais especficas sobre a relao do
falante com a cidade e suas avaliaes sobre variantes lingusticas e sobre
identidades paulistanas. Na ltima parte da entrevista, pede-se ao informante
que leia uma lista de palavras, uma notcia de jornal e um texto com fortes
marcas de oralidade, aqui denominado depoimento.
A incluso de perguntas sobre avaliao lingustica e de leituras teve incio
em 2011. Na amostra aqui analisada, o roteiro atualizado foi aplicado
em 74 das 118 gravaes.3 A leitura de diferentes tipos de textos se baseia
na premissa laboviana (Labov, 2006 [1966], 2001a) de que tal tarefa deve
conduzir os falantes a um maior grau de monitoramento de sua prpria fala,
procedimento que revela as variantes consideradas como mais corretas ou
de maior prestgio pelos membros da comunidade. A hiptese aqui a de que
os falantes devam empregar estilos de fala gradualmente mais monitorados
de acordo com a seguinte hierarquia: (i) conversa na entrevista; (ii) leitura
do depoimento; (iii) leitura da notcia de jornal; e (iv) leitura da lista de
palavras.
Esta ltima foi elaborada especificamente para o estudo das variveis (-r)
3
Isso significa que 44 informantes no tm dados de leitura e respostas quanto s perguntas de avalia-
o lingustica; contudo, tal fato no prejudica as anlises desenvolvidas, j que esses informantes se
encontram bem distribudos nos perfis descritos adiante.

36
Corpus e roteiro da entrevista

e (e) (ver Quadro 3.1). De um total de 67 palavras/expresses, a lista contm


17 instncias de (e) em slabas tnicas e tonas, seguidas das consoantes [t,
d, , S], em posio medial e final.4 De modo semelhante, ela contm 30
ocorrncias de (-r), em slabas tnicas e tonas, precedidas das sete vogais
orais e seguida de consoantes diversas [t, d, k, g, b, m, n, Z, ], em posio
medial e final da palavra. No Quadro 3.1, as ocorrncias de interesse esto
em negrito (ver tambm Anexo A, p. 359).

slaba tnica slaba tona


(e) enchente defender
entretenimento enchente
fazenda entender
lento entretenimento
menta grmen
pertencimento ordem
presente penteado
urgente pertencimento
(-r) /a/ amargo, Marba argola, barqueiro, carteiro
/E/ grmen, Hrcules, perto N/Aa
/e/ cerca, defender, entender, erguer, pertencimento
erguer, soberba
/i/ circo, firme irm
/O/ orca, ordem, rgo N/Aa
/o/ gordo, porto, sabor fornalha, mortadela, orgnico
/u/ curto, turco furgo, urgente
a
Fonologicamente, no h palavras com vogais mdia-baixas em slabas tonas
no portugus.

Quadro 3.1 Dados de (-r) e (e) na Lista de Palavras

Aps a leitura da lista de palavras, pede-se que o informante demonstre


como um carioca e uma pessoa do interior falariam algumas delas. Como o
informante tem a possibilidade de escolher os itens lexicais, assume-se que
a prpria seleo por parte do falante revela os traos fontico-fonolgicos
mais salientes para a diferenciao dialetal. Nessa tarefa, as palavras mais
frequentemente escolhidas foram aquelas com /r/ em coda silbica para
4
Uma anlise qualitativa mais detalhada dessa varivel definiu o envelope de variao como as ocorrn-
cias de (
e) em slabas tnicas iniciais ou mediais. Ver discusso no Captulo 4, p. 73.

37
Corpus e roteiro da entrevista

diferenciar paulistanos de interioranos e cariocas, e palavras com /s/ em


coda silbica para diferenciar paulistanos de cariocas (ver Captulo 5, p. 95).
Embora alguns falantes tenham mencionado a varivel (e), isso foi bastante
menos frequente.
A leitura da notcia de jornal e do depoimento (p. 360) inclui 30
ocorrncias adicionais de (-r) e 20 de (e), assim como 16 SNs e 12 SVs plurais
(Quadro 3.2).

Jornal Depoimento
(CN) dois meses todos os armrios
relaes institucionais os colches
dos manifestantes os mveis
os integrantes meus filhos
das guas umas cadeiras novas
nos bairros os carros todos parados
os moradores os polticos
dos desalojados
escolas municipais
(CV) moradores cobram ns tivemos
[...] aguardam meus filhos compraram
moradores da regio do Jardim Pantanal protestaram os polticos falam
representantes dos manifestantes esperam [...] falam
os moradores cobram [...] tinham
[...] temem

Quadro 3.2 Dados de (CN) e (CV) nas leituras de notcia de jornal e depoimento

Os dados de (CN) abarcam SNs de 24 palavras, com diferentes morfemas


de plural (-s, como bairro-s; /-is/, como em morador-es, municipa-is;
/-js/, como em rela-es, colch-es.) Os dados de (CV) se concentram
em 3PP (h apenas uma ocorrncia de 1PP: ns tivemos) e nos tempos
presente e pretrito perfeito.
A entrevista se encerra com perguntas especficas sobre avaliaes dos
falantes acerca de trs das quatro variveis sociolingusticas desta pesquisa:
(e), (-r) e (CN). Pede-se que o informante comente sobre quatro modos de
falar: (i) meu, voc t entendendo o que eu t dizendo? em que (e) deve
ser pronunciado com a variante exageradamente ditongada [ej]; (ii/iii) a
porta (es)t aberta que o documentador deve pronunciar primeiramente

38
Corpus e roteiro da entrevista

com retroflexos e depois com tepes salientes; e (iv) me v dois pastel e um


chopes. Para cada uma dessas sentenas, o documentador primeiro pede
por uma opinio (o que voc acha desse modo de falar?); se o informante
manifesta uma atitude negativa, o documentador pergunta o que est er-
rado, estranho ou esquisito, e como o falante acha que deve ser a forma
correta;5 o documentador ento pergunta quem usa essas formas e, quando
a resposta paulistanos, se se trata de um fenmeno generalizado ou se
mais caracterstico de um grupo especfico de pessoas na cidade; por fim,
o documentador pergunta se o falante tambm emprega essas formas (ver
perguntas 3843 no Anexo A, p. 358).
As sentenas-veculo so deliberadamente indiretas quanto ao fenmeno
lingustico sob anlise; no se pergunta, em nenhum momento, o que o
informante acha de se pronunciar (e) de maneira ditongada, sobre o (-r)
retroflexo, caipira ou do interior, ou sobre a falta de concordncia.
Possveis comentrios sobre outros aspectos lingusticos que, como se ver,
de fato acabam ocorrendo podem ser indicativos da salincia social dessas e
de outras variantes na comunidade. Tais perguntas tambm tm o objetivo
de examinar se os paulistanos so consensuais em suas avaliaes sobre
[ej], [], [R] e a marca zero de (CN), ou se as variantes possuem diferentes
significados a depender do falante ou de grupos sociais; em qualquer dos
casos, o esforo o de se distanciar de impresses e avaliaes do prprio
pesquisador, e no assumir de antemo que os membros da comunidade as
avaliam homogeneamente.
As respostas a essas perguntas so analisadas detalhadamente nos captulos
4 a 6. O intuito inicial era o de classificar as respostas em certas categorias que
parecessem ser as mais pertinentes, de acordo com o discurso metalingustico
dos falantes. Contudo, como as entrevistas foram conduzidas por diferentes
documentadores, as perguntas nem sempre foram feitas exatamente da mesma
maneira, na mesma ordem ou no mesmo ponto do roteiro. Desse modo, uma
comparao direta das respostas seria problemtica.
5
Diferentes termos foram empregados pelos documentadores, a depender da reao do informante
sentena-alvo. claro que, de um ponto de vista lingustico, no h formas certas ou erradas. No
entanto, a acomodao do documentador ao informante permitia que os falantes elaborassem suas
colocaes, impresses e reaes, que tambm constituem objeto de interesse do sociolinguista.

39
Corpus e roteiro da entrevista

Entretanto, inegvel que certas noes so recorrentes e se reproduzem


sistematicamente no discurso dos informantes, como por exemplo a avaliao
de que falar dois pastel errado ou que a porta t aberta com realizao
retroflexa o modo como falam as pessoas do interior. Para avaliar noes
que surgem frequentemente, realizou-se uma anlise qualitativa do discurso
metalingustico dos informantes, da qual se extraram certas palavras-chave.
Por exemplo, do excerto em (1), extraram-se os termos cantado, italianado
e paulistano; para (2), atriburam-se errado, mais-velhos, paulistano,
menos-escolarizados.

(1) D1: o que voc acha desse jeito de falar... voc (es)t entendendo [ej] o
que eu (es)tou dizendo [ej]... o que voc acha desse jeito?
S1: meio cantado n meio italianado a
D1: voc acha?
S1: eu acho
D1: eh... mas quem voc acha que fala assim?... (vo)c (es)t entendendo
[ej] o que eu (es)to(u) dizendo [ej]
S1: eu falei assim? (vo)c (es)t entendendo [ej] o que eu (es)to(u) dizendo
[e] eu falei n? eu falei cantado
D1: voc acha que uma coisa dos paulistanos todos os paulistanos ou s
de um bairro?...
S1: eu acho que coisa de paulistano n?
D1: de uma maneira geral?
S1: ...
D1: entendi e... voc acha que voc fala desse jeito?
S1: eu falo eu falo meio cantado sim (Irene R., F3SC)

(2) D1: o que voc acha do... v dois pastel e um chopes?


S1: est tudo errado n?... gramaticalmente est errado n?... mas a
gente fala assim n isso uma... (xxx)
D1: voc fala assim?
S1: eu no... no eh no eu falo por favor... voc me v um pastel...
como que dois pastis e um chopes? [risos] (pastel... pastis)
D1: e tem algum grupo assim que fala mais assim?
S1: ah eu acho que quem mais velho daqui fala mais n? eh sei l eu acho
que/... eu acho que quem mais/ os mais velhos que so bem de So
Paulo falam mais assim... tambm acho que quem tem uma escolaridade
menor fala um pouco mais assim... mas acho que isso... (Rebeca C.,
F1SC)

Foram descartadas as respostas a perguntas que por vezes foram enviesadas

40
Variveis sociais

p.ex., o que voc acha desse modo bem paulistano de falar: voc t
entendendo o que eu t dizendo?. A partir do conjunto de palavras-chave para
cada sentena-alvo, criaram-se nuvens de palavras no site Wordle.net6 (ver,
p.ex., a Figura 4.1, p. 63). Trata-se de uma representao visual da frequncia
relativa com que certos termos ou noes surgiram em resposta s perguntas
sobre avaliaes lingusticas: termos mais frequentes so representados em
maior fonte, enquanto avaliaes infrequentes ou idiossincrticas recebem
menor destaque. Tais figuras permitem uma anlise qualitativa de noes
relevantes, sem perder de vista a diversidade de reaes dos informantes s
sentenas-alvo.

3.2 Variveis sociais


Todos os falantes dessa amostra nasceram em So Paulo ou se mudaram para
a cidade at os 10 anos de idade, tendo vivido na capital a maior parte de
suas vidas.7 Eles esto estratificados de acordo com quatro variveis sociais:
(i) Sexo/Gnero (masculino, feminino);
(ii) Faixa Etria (2034 anos, 3559 anos, 60 anos ou mais);
(iii) Nvel de Escolaridade (at Ensino Mdio, Ensino Superior);
(iv) Regio de Residncia (bairros mais centrais ou mais perifricos).
Sexo/Gnero e Faixa Etria so fatores externos amplamente analisados
em estudos sociolingusticos e frequentemente se mostram correlacionados a
variveis sociolingusticas cujas variantes se diferenciam em valor social: uma
srie de trabalhos observou que as formas de prestgio em uma comunidade
tendem a ser relativamente mais empregadas por mulheres (Chambers, 1995;
Labov, 2001b; Cheshire, 2002), e que formas desprestigiadas tendem a ser evi-
tadas por falantes da faixa etria intermediria, mais suscetvel a presses do
mercado lingustico (Bourdieu, 1991; Labov, 2001b). Alm disso, correlaes
com Faixa Etria podem apontar para possveis mudanas em progresso no
sistema lingustico mediante o construto mudana em tempo aparente (Labov,
6
Ver portal em http://www.wordle.net/.
7
No Anexo B, p. 361, inclui-se uma lista de todos os informantes, organizados em ordem alfabtica, com
ej], [], CN- e CV-.
suas respectivas caractersticas sociais e suas taxas de emprego das variantes [

41
Variveis sociais

2001b). Essas variveis sociais so includas nesta pesquisa a fim de verificar


se os mesmos padres se reproduzem em So Paulo e se h evidncia de
mudana em progresso em qualquer das quatro variveis dependentes.
O Nvel de Escolaridade tambm se relaciona com questes de estigma
e prestgio. A hiptese geral que falantes mais escolarizados tendem a
evitar formas estigmatizadas na comunidade ou, vista de outra perspectiva,
que as formas por eles empregadas so consideradas mais corretas. Nas
palavras de Votre (2004 : 51), a escola atua como preservadora de formas
de prestgio, face a tendncias de mudana em curso [...] incute gostos,
normas, padres estticos e morais em face da conformidade de dizer e de
escrever. Pode-se questionar, no entanto, se a escola responsvel direta por
padres de variao to comumente verificados em estudos sociolingusticos,
ou se a preferncia por certas formas lingusticas consequncia indireta de
estruturas sociais mais amplas, como a classe social a que pertencem, as redes
sociais de que participam ou os grupos a que tm acesso em decorrncia da
escolarizao. A anlise de Escolaridade juntamente da varivel Classe
Social, que se apresenta adiante, possibilita discutir o papel de ambas na
variao lingustica.
Alm disso, em uma grande metrpole como So Paulo, aventa-se a
hiptese de que os habitantes de diferentes partes da cidade apresentem
diferentes comportamentos sociolingusticos. No roteiro da entrevista, as
seguintes perguntas tinham o objetivo de identificar possveis ndices locais de
identidade(s) paulistana(s): Dentro da cidade de So Paulo, voc consegue
identificar se uma pessoa de alguma regio ou bairro especfico? (Se sim)
Voc poderia dar alguns exemplos? (ver pergunta 34 no Anexo A, p. 357).
A elas, algumas respostas foram semelhantes a (3):

(3) D1: e aqui dentro da cidade assim... voc consegue identificar se uma
pessoa de algum bairro especfico ou zona norte zona leste... zona oeste?
S1: ah no... quem disser que consegue mentira... na boa... esse papo
de/... tudo bem antigamente tinha a galera da Mooca n que voc tinha
uma galera com o sotaque... mais italiano mas meu isso mais velho
que meus pais n cara... n tipo... hoje impossvel n cara a cidade
completamente... miscigenada no tem mais nada n t ligado... e tambm
no existe uma cultura... distrital eu acho... sabe a cidade grande mas

42
Variveis sociais

no... eu acho que no ... no funciona assim... (Luis A., M1SP)

Nesse excerto de entrevista, apesar de sua ressalva ao bairro da Mooca de


antigamente, o falante Luis A. afirma no ser possvel identificar, nos dias
de hoje, de que parte da cidade de So Paulo uma pessoa . Essa afirmao
contrasta com outras cidades multiculturais no mundo, especialmente na
Amrica do Norte, como os etnolectos de Toronto (Hoffman & Walker,
2010).
Por outro lado, quando os falantes forneceram exemplos (ainda que in-
seguramente) de como identificar tipos de paulistanos de acordo com um
parmetro geogrfico, foi frequente a meno a certos bairros, acompanhada
muitas vezes de consideraes a respeito de classes sociais ou nvel de escola-
ridade:

(4) S1: [...] ento tem gente por exemplo... que mora sei l... Jardim
Amrica (xxx) com aquelas joia com aquelas coisa toda... ento pode ser/
aqueles cabelos super arrumado... aquela n?... ento pode ser que voc
seja... eu normalmente... acho que me visto de uma maneira simples
eu acho que no percebem... que sou de outro bairro... modo de falar as
expresses eu tenho impresso que no identificam no (Leila B., F3SC)

(5) D1: voc saberia por exemplo identificar uma eh/... voc consegue
perceber por exemplo se a pessoa da zona norte ou zona sul ou zona leste...
pela maneira de falar?
S1: ento mais pela classe social que voc percebe... e claro p se voc for
na Mooca voc vai ver que ele canta mais do que ningum... se (ele) for no
Brs tambm... eh Jardins Morumbi Moema... o pessoal fala igual mas por
exemplo as classes mais baixas falam diferente... do que as classes mais
elitizadas... que tiveram condies de estudo e tudo mais
D1: esse falar diferente voc saberia... mais ou menos... caracteriz-lo?
S1: se voc for no/ no extremo da zona leste l na periferia
D1: uhm
S1: favela do Elmo... vai ver que os cara falam assim a Joo... tem essa
no t ligado? o bagulho nosso... (a)cabo(u) eles falam dessa maneira...
muitas grias e tudo mais... eh diferente... de uma pessoa com uma
condio social melhor... (Paulo P., M1SC)

(6) D1: quando voc conhece alguma pessoa aqui em So Paulo voc consegue
re/ reconhecer se ela ... se desse bairro ou dessa zona?
S1: s vezes... [risos] s vezes depende n... s vezes a gente v alguma

43
Variveis sociais

pessoa assim andando na rua... a d pra falar... no assim de bairro/


eh especificar bairro... mas a gente consegue falar se uma pessoa mais
bem vestida... a j mora/ deve morar... Vila Madalena Moema nnn...
se ela mais ou menos n... ah deve morar... Itaquera [risos] no um
preconceito mas que... o que entendeu que nem l em Perus... onde
eu moro ainda d um pessoalzinho mais bonitinho... (mas) tem lugar l
embaixo que feio a coisa (Tais P., F1MP)

(7) S1: ou ento mesmo no/ (indo no) Ibirapuera voc j v pessoas dife-
rente... que nem voc vai aqui no Parque do Carmo... j v o pessoal...
mais pobrezinho
D1: aham
S1: a voc vai l no Ibirapuera voc j v um pessoal diferente... uma pele
diferente... que nem shopping... voc vai no/ naqui no Aricanduva voc j
v um tipo de pessoa... voc vai no shopping... Anlia Franco... zona
leste... mas voc j v outro tipo de pblico
D1: engraado que mesmo dentro da zona leste tem essa n?
S1: tem as diferenas
D1: n acho que Tatuap/ voc acha que tem uma diferena Tatuap Mo-
oca...?
S1: muita... porque j so bairros mais/ considerados nobres aqui na zona
leste
D1: aham
S1: ento quando voc j vai indo mais pra periferia voc j vai vendo que
as pessoas j vo mudando
D1: uhum
S1: j vai ficando uma pessoa mais simples... n? e muitas vezes as pessoas
simples no tm aquela mesma/... uma conversa mais culta ou ento no
tm noo de que tem que falar/ est num transporte pblico tem que falar...
baixo numa/ num tom mais/ no gritando aquela zoeira (Giovana A.,
F1SP)

Leila B. (4) menciona o Jardim Amrica (subdiviso dos Jardins) como um


bairro de pessoas mais ricas (com aquelas joia [...] aqueles cabelos super
arrumado). Paulo P. (5), de modo semelhante a Luis A., chega a destacar os
bairros da Mooca e do Brs por seu falar mais cantado, ao mesmo tempo
que enfatiza o contraste entre Jardins, Morumbi, Moema, por um lado,
e bairros de classes mais baixas, por outro, no extremo da zona leste, na
periferia. Tais P. (6) menciona o modo de se vestir da Vila Madalena e de
Moema em oposio a Itaquera e Perus. Giovana A. (7) descreve diferenas
de classe social entre o pblico do Parque do Ibirapuera e do Parque do

44
Variveis sociais

Carmo, dos shoppings Anlia Franco e Aricanduva (ambos na Zona Leste),


e ressalta diferenas dentro dessa zona da cidade, entre Tatuap/Mooca e
locais mais perifricos. Esses contrastes apontam mais para uma diviso
entre bairros de classes mdias/altas (Jardins, Morumbi, Moema, Ibirapuera,
Vila Madalena, Tatuap, Mooca) e de classes mais baixas (Parque do Carmo,
Itaquera, Perus), organizados de modo geral em reas mais centrais e mais
perifricas, e no para a diviso poltico-administrativa da cidade entre as
zonas Norte, Sul, Leste, Oeste e Central.
No corpus do Projeto SP2010, os
critrios para a classificao de bair-
ros como mais centrais ou mais
perifricos se baseiam na histria
de ocupao dos bairros e no grau
de desenvolvimento urbano em ter-
mos de verticalizao, servios e IDH.
De modo geral, bairros mais perifri-
cos so historicamente mais recentes,
bem como seu processo de verticaliza-
o (nos ltimos 20 anos), e possuem
uma infraestrutura urbana relativa-
mente menos desenvolvida (acesso a
transporte pblico, hospitais, esco-
las, centros culturais etc.). Por outro
Figura 3.1 Diviso da cidade de So
Paulo entre regies mais centrais e mais lado, bairros mais centrais so mais
perifricas antigos, so fortemente verticalizados
(o que implica alta densidade demo-
grfica) e possuem melhor infraestrutura urbana. Como consequncia dessas
caractersticas, bairros mais centrais tm, em geral, um custo de vida bastante
superior quele de bairros mais perifricos, algo que se verifica em preos
mdios de habitao e de servios; desse modo, assim como o Nvel de Es-
colaridade, a Regio de Residncia tambm um ndice indireto de status
socioeconmico do falante. Essa diviso ilustrada pela Figura 3.1.8
8
A distribuio geogrfica dos informantes da amostra pode ser visualizada no Anexo C, p. 366.

45
Variveis sociais

A combinao dos fatores dessas quatro variveis sociais Sexo/Gnero,


Faixa Etria, Nvel de Escolaridade e Regio de Residncia resulta em
24 perfis sociolingusticos, para cada um dos quais o corpus conta com 5
informantes, conforme o Quadro 3.3. O nico perfil com 3 informantes
F1MC; de fato, cada vez mais difcil, na cidade de So Paulo, encontrar
paulistanas com menos de 34 anos residentes da Regio Central que no
tenham ao menos iniciado o Ensino Superior.

Feminino (58) Masculino (60)


Centro (28) Periferia (30) Centro (30) Periferia (30)
2034 Mdio CarolinaA TaisP FernandoB MarceloB
anos (18) DaianeM AnaS FelipeL DanielC
(38) MilenaF IvanaB NicolauS EvandroO
PamelaR LucasR JairS
SamantaV LucasS JoseL
Superior AdrianaP TatianaM CristianoS MarcoP
(20) FernandaT ThaissaB RicardoT FabioS
PatriciaT GiovanaA WagnerL JonasM
RebecaC EloisaD AdolfoF LuisA
SoniaL AmandaA PauloP RodrigoC
3559 Mdio MauraC MarianaB FabioR GilsonS
anos (20) EdnaS InesC NiltonG LucioA
(40) JandiraF JasminM MarioM MauricioC
MeireC KarolinaM RodrigoS MiguelR
RenataC ReginaS MauricioB WaldemarN
Superior ClaudiaH AndreaC EduardoG RobertoM
(20) ClaraC MadalenaM PietroC ClaudomiroS
IaraS CelinaA CesarP JosN
CamilaA SabrinaD MauroB PedroS
PriscilaA IolandaP OsvaldoR WilliamA
60+ Mdio CleliaE AngelicaL RomuloS PlinioC
anos (20) CarmenC InaeA EduardoK AmaralM
(40) LucianaM HeloisaS SergioP AnisioC
SoraiaS VeraD HugoF DecioA
CicaN RosineideA RobertoC WaldemarS
Superior LeilaB AnaM HelderX HaroldoL
(20) IreneR EthelM ReinaldoS AnselmoN
MartaL IaraM RogrioA CarlosE
JulianaW NeideE JoseM LeoM
NairC DercyF SeverinoN MarceloH

Quadro 3.3 Estratificao social dos informantes da amostra em Sexo/Gnero,


Regio de Residncia, Faixa Etria e Nvel de Escolaridade

46
Variveis sociais

Alm dessas variveis, a ficha social dos informantes dispe de outras


informaes, como sua profisso, os locais em que j morou, a origem dos
pais e suas respectivas ocupaes e nveis de escolaridade. Desses dados,
organizaram-se trs outras variveis sociais que, mesmo que no estratifiquem
a amostra, exibem variabilidade e permitem o teste de hipteses adicionais:
Origem dos Pais, Mobilidade e Classe Social.
A varivel Origem dos Pais foi codificada em cinco fatores: (i) So Paulo
capital; (ii) interior de So Paulo, Minas Gerais ou Paran; (iii) Norte ou
Nordeste; (iv) estrangeira (italianos, espanhis, rabes, portugueses, japoneses,
coreanos); e (v) mista (pai e me de diferentes origens). Considerando-
se que a cidade de So Paulo frequentemente caracterizada como um
lugar de mistura e que metade de sua populao no nativa da cidade
(ver Captulo 1), essa varivel investiga, indiretamente, a possvel influncia
do intenso contato dialetal na comunidade falantes cujos pais no so
paulistanos apresentariam tendncias diferentes em seus usos lingusticos?
A varivel tambm avalia se falantes cujas famlias so mais enraizadas na
cidade apresentam maior tendncia de emprego das variantes, em princpio,
prototipicamente paulistanas: [ej], [R] e CN-. Assim organizada, essa varivel
no perfeitamente ortogonal com relao a Faixa Etria, j que na amostra
no h falantes com mais de 60 anos cujos pais so nordestinos. Desse modo,
Faixa Etria e Origem dos Pais foram analisadas separadamente quando se
incluiu uma, excluiu-se a outra do modelo estatstico.
A Mobilidade Geogrfica classifica os falantes de acordo com os lugares
em que j viveram: (i) sempre no mesmo bairro; (ii) sempre na mesma zona;
ou (iii) em diferentes zonas (ou cidades). A hiptese que falantes cuja
mobilidade menor tendem a se orientar por normas locais, ao passo que
aqueles com maior mobilidade, menos enraizados, adotam valores externos
e das classes mais altas (Milroy, 1987 [1980]). Em termos lingusticos, a
expectativa que os falantes com maior mobilidade tenham maior tendncia
a empregar as variantes consideradas padro.
Assim como Origem dos Pais e Mobilidade, a varivel Classe Social raras
vezes analisada na Sociolingustica brasileira. Com efeito, em muitos estudos,
o nvel de escolaridade dos falantes tomado como ndice direto ou indireto

47
Variveis sociais

de sua classe socioeconmica (Rodrigues, 1987, 2009; Mendes & Oushiro,


2012). Tal tradio remonta aos primeiros grandes projetos de amostragem
da fala brasileira, como o projeto de Mrio de Andrade Pronncias Regionais
do Brasil, na dcada de 1920 (Rodrigues, 1987), em que, junto a Antenor
Nascentes e Manuel Bandeira, objetivava gravar dois falantes de sete zonas
fonticas, um culto e um inculto, a fim de analisar a variao lingustica
no pas. Na dcada de 1970, o Projeto NURC registrou falantes cultos em
cinco capitais (Porto Alegre, So Paulo, Rio de Janeiro, Salvador e Recife),
e o projeto Competncias Bsicas do Portugus (Lemle & Naro 1977; apud
Guy 1981; Scherre & Naro 1998, inter alia) se voltou aos falantes analfabetos
e semialfabetizados que cursavam o MOBRAL (Movimento Brasileiro de
Alfabetizao).
Sem dvida, as grandes disparidades sociais no Brasil perpassam por nveis
ainda bastante baixos de escolaridade mdia da populao 8,8 anos em
2012 (IPEA, 2013 : 1415). Contudo, diversas polticas pblicas nas ltimas
dcadas, como a Progresso Continuada no estado de So Paulo e a ampliao
do acesso a cursos universitrios por intermdio de programas como o ProUni,
no mbito federal, tm aumentado os nveis mdios de escolaridade, ainda
que nominalmente. Como se viu mais acima, hoje em dia cada vez mais
difcil encontrar jovens paulistanos que no tenham ao menos concludo o
Ensino Mdio e mulheres que no tenham dado incio a um curso superior,
sobretudo se residentes de bairros centrais. O nvel de escolaridade, por si s,
parece no mais refletir a forte estratificao social que ainda se verifica na
sociedade.
Em estudos que examinaram Classe Social sociolinguisticamente, con-
senso que a varivel no se refere apenas renda familiar ou do informante;9
ela costuma ser operacionalizada como um ndice composto que normalmente
abarca nvel de escolaridade, ocupao e renda (p.ex., Labov 2006 [1966]
em Nova Iorque; Wolfram 1969, apud Dodsworth 2011 em Detroit; Tarallo
1983 em So Paulo), e, alm desses, valor do imvel e sua manuteno geral,
mobilidade em relao aos pais (p.ex., Labov 1984 na Filadlfia) e bairro de
9
O Projeto ALIP Amostra Lingustica do Interior Paulista um dos poucos no Brasil a coletar
informaes sobre a renda dos falantes. Os autores se referem varivel efetivamente como Renda
Familiar (Gonalves, s/d).

48
Variveis sociais

residncia (p.ex., Oliveira 1983 em Belo Horizonte).


certo que estudos em diferentes cenrios devem se basear em parmetros
relevantes para a comunidade local.10 Aqui, prope-se uma classificao
socioeconmica dos falantes com base em quatro parmetros: (i) seu nvel
de escolaridade; (ii) sua ocupao; (iii) a renda mdia familiar do bairro de
residncia; e (iv) a mdia dos ndices de escolaridade e ocupao tanto para o
pai quanto para a me do informante. Para o primeiro (ver Quadro 3.4), criou-
se uma escala de 1 a 5, em graus de meio ponto, que se incrementa quanto maior
o grau mximo de escolaridade obtido pelo falante at o momento da entrevista.
Para o segundo, elaborou-se uma escala semelhante de 1 a 5, com base em
faixas salariais mdias e presses do mercado lingustico (Sankoff & Laberge
1978, apud Dodsworth 2011): 1 desempregados e sem fonte de renda prpria;
2 trabalhadores braais sem treinamento, como empregadas domsticas,
porteiros, motoristas; 3 trabalhadores braais com treinamento tcnico, como
pilotos, mecnicos, tcnicos de som; 3.5 funes administrativas tcnicas
e de atendimento ao pblico, como vendedores, auxiliares administrativos;
4 profissionais de educao; 4.5 profissionais liberais, como contadores,
advogados, engenheiros, psiclogos; e 5 macroempresrios e cargos de
gerncia de alto escalo.

Nvel de Escolaridade Ocupao


5.0 Ps-graduao macroempresrios/gerncia de alto escalo
4.5 Superior completo profissionais liberais
4.0 Superior incompleto profissionais de educao
3.5 Mdio completo funes administrativas/atendimento ao pblico
3.0 Mdio incompleto trabalhador braal com treinamento
2.5 Fundamental II completo
2.0 Fundamental II incompleto trabalhador braal sem treinamento
1.5 Fundamental I completo
1.0 Fundamental I incompleto desempregado e sem renda

Quadro 3.4 ndices para nvel de escolaridade e ocupao


10
Para revises crticas sobre o conceito e a operacionalizao de Classe Social na Sociolingustica, ver
Rickford (1986); Ash (2013 [2002]); Dodsworth (2011).

49
Variveis sociais

Em seu estudo sobre a pronncia de (-r) em Belo Horizonte, na dcada de


1980, Oliveira (1983 : 40) ressalta a importncia do bairro de residncia do
informante para a composio do ndice socioeconmico:

[...] onde uma pessoa reside , em Belo Horizonte, a informao


fundamental para situar algum na sociedade. Muitas pessoas se
preocupam constantemente sobre a possibilidade de continuar morando
em um bom bairro, ou de se mudar para um.11

Preocupao semelhante se verifica em So Paulo; os falantes da amostra


facilmente identificam bairros em que gostariam de residir (ver pergunta 5
no Roteiro de Entrevista, p. 354), se neles j no residem: Mooca e Tatuap
na Zona Leste, Pinheiros na Zona Oeste, Jardim Frana na Zona Norte,
Chcara Santo Antnio na Zona Sul, para citar alguns. No presente estudo,
as diferenas socioeconmicas entre bairros so medidas por sua renda familiar
mdia, conforme levantamento da agncia Ibope Inteligncia em 2010.12 As
rendas mdias dos bairros de So Paulo vo de R$ 1.689,00 (MBoi Mirim)
at R$ 12.238,00 (Moema e Ibirapuera). Tais valores foram normalizados
em uma escala contnua de 2.0 a 5.0. Decidiu-se excluir, desse parmetro, os
valores de 1.0 a 1.9, j que a renda mais baixa de R$ 1.689,00 correspondia,
em 2010, a valor de mais de trs salrios mnimos.
O quarto parmetro, referente aos pais, calculado pela mdia dos ndices
das mesmas escalas do Quadro 3.4. Trata-se, portanto, de uma mdia de
quatro valores. Quando no se dispunha de certa informao (p.ex., o grau
de escolaridade do pai), a mdia foi calculada com base nos dados dispon-
veis, dividindo-se a soma dos ndices pelo nmero de dados considerados. A
incluso desse critrio pressupe que, ainda que o informante tenha experi-
mentado declnio ou (mais comumente) ascenso social, o status social dos
pais influencia os modos de falar do informante, tanto pelo contato direto na
infncia/adolescncia, quanto pela formao de primeiras redes sociais das
quais participa o informante.
11
Traduo prpria. Texto original: [...] where a person lives is, in Belo Horizonte, the critical informa-
tion for situating someone in society. Many people are constantly worried about being able to continue
to live in, or move to, a good neighborhood [...].
12
Disponvel em http://exame.abril.com.br/seu-dinheiro/imoveis/infograficos/pesquisa-de-imoveis-do-
ibope-2010/. ltimo acesso em 18 mar./ 2013.

50
Variveis sociais

O ndice socioeconmico foi calculado a partir da mdia dos valores de (i),


(ii), (iii) e (iv), conforme a frmula em (8), o que gerou uma escala contnua
de 1.0 a 5.0. Os informantes foram ento classificados nas classes sociais do
Quadro 3.5.

(8)

EscP ai+OcupP ai+EscM e+OcupM e


Escolaridade + Ocupao + Renda + 4
4

Classe Social ndice Socioeconmico Nmero de Falantes


A Alta 4.1 a 5.0 4
B1 Mdia alta 3.6 a 4.0 23
B2 Mdia mdia 3.1 a 3.5 34
C1 Mdia baixa 2.6 a 3.0 31
C2 Baixa alta 2.1 a 2.5 19
D Baixa mdia 1.6 a 2.0 7
E Baixa baixa 1.0 a 1.5 0

Quadro 3.5 Classificao dos falantes em classes sociais

O quadro mostra que a grande maioria dos falantes se concentra nas


classes mdias (B1, B2 e C1), e que a amostra no contm muitos falantes dos
estratos mais altos e mais baixos da populao residente na cidade. De fato,
no se esperava uma distribuio balanceada; no se trata de uma varivel
estratificadora da amostra, tampouco so as classes sociais bem divididas
na cidade. Assim organizada, a varivel Classe Social no ortogonal com
as demais variveis sociais, sobretudo com Nvel de Escolaridade: no h
falantes da classe A que tenham estudado apenas at o Ensino Mdio, e
no h falantes da classe D que tenham cursado o Ensino Superior. Para
a realizao de anlises estatsticas, decidiu-se amalgamar, por um lado, as
classes A e B1 (4 + 23 falantes), que correspondem s classes alta e mdia
alta, e, por outro, as classes C2 e D (19 + 7 falantes), dois nveis de classes
baixas. Reconfigurada em quatro fatores, Classe Social passa a ser ortogonal
com todas as demais variveis sociais.

51
Anlises quantitativas

Tal diviso no se pretende uma representao fiel ou a mais adequada das


classes sociais em So Paulo, mas permite entrever nuanas mais sutis para
alm de divises binrias em Nvel de Escolaridade e Regio de Residncia
dos falantes. As anlises dos captulos 4 a 7 mostram que se trata de uma
varivel social que se correlaciona sistematicamente com as quatro variveis
aqui analisadas.13
A prxima seo explicita como foram analisados quantitativamente os
materiais e as variveis que se descreveram acima.

3.3 Anlises quantitativas


Os dados foram analisados de acordo com as premissas do Paradigma Quan-
titativo (Guy, 1993; Bayley, 2013 [2002]; Sankoff, 1980), conforme descreveu
o Captulo 2. Na manipulao do corpus de 118 entrevistas sociolingusti-
cas, esta pesquisa empregou o programa R (R Core Team, 2013) tanto na
preparao e tratamento de dados quanto nas anlises estatsticas em si.
O R uma linguagem de programao que pode ser utilizada para realizar
computaes grficas e estatsticas, compilar e anotar corpora, produzir listas
de frequncias, entre diversas outras tarefas (Gries, 2009b; Tagliamonte, 2011).
O programa funciona atravs de uma interface textual em que se digitam e se
executam linhas de comando, que podem ser salvas, adaptadas e reutilizadas
posteriormente. Algumas de suas principais vantagens so o fato de ser
gratuito, estar disponvel para uma variedade de plataformas (Linux, MacOS,
Windows) e permitir a customizao de tarefas, sobretudo aquelas de carter
mecnico, repetitivo e previsvel, em scripts/cdigos criados previamente pelo
prprio usurio ou por outros.
Nesta pesquisa, a preparao dos arquivos de dados foi organizada em
scripts, que foram aplicados s quatro variveis e que podem ser adaptados
13
Um estudo futuro que se dedique discusso da relevncia e da operacionalizao dessa varivel para
fins de pesquisas sociolingusticas, em So Paulo ou em outras localidades, pode se propor a testar
a contribuio de diversos fatores que potencialmente so relevantes para composio de um ndice
socioeconmico: renda individual, renda familiar, nvel de escolaridade, tipo de escola em que estudou,
ocupao, valor e propriedade do imvel em que reside, condies dos pais, acesso a bens de cultura etc.
Labov (1984, 2001b) realizou uma tal anlise no corpus do Project on Language Change and Variation
da Filadlfia.

52
Anlises quantitativas

a outros estudos sociolingusticos. Tais cdigos so ora disponibilizados


gratuitamente para a comunidade de linguistas por meio do pacote dmsocio14
e descritos detalhadamente em Oushiro (2014). O pacote contm trs funes
que respectivamente realizam (i) a identificao automtica de ocorrncias
de uma varivel em um corpus transcrito fontica ou ortograficamente; (ii) a
extrao de tais ocorrncias, com contexto textual precedente e seguinte, para
uma planilha pr-codificada com as caractersticas sociais dos informantes
(seu sexo, faixa etria, idade, escolaridade etc.); e (iii) a amostragem aleatria
de um nmero de dados (definido pelo usurio), que pode ser empregada em
anlises de variveis com dezenas de milhares de ocorrncias. A automatizao
dessas tarefas naturalmente no exime o pesquisador de uma anlise cuidadosa
de seu corpus; ao reduzir drasticamente o tempo empregado em tarefas
mecnicas e repetitivas por exemplo, copiar e colar centenas ou milhares de
dados para uma planilha de codificao , o pesquisador dispe de mais tempo
para se dedicar a suas verdadeiras tarefas de descrio, anlise e interpretao
de resultados.
O corpus de 118 entrevistas contm mais de 25 mil ocorrncias de (e)
e mais de 60 mil de (-r); quantidades copiosas de dados costumam ser o
caso de variveis fonticas. Analisar todas elas seria uma tarefa no s
dispendiosa como desnecessria, uma vez que padres tendem a se revelar j
com um menor nmero de dados e a se manter constantes a partir de certo
ponto. Seguindo mtodo convencional em estudos sociolingusticos de variveis
fonticas (Wolfram, 1993; Tagliamonte, 2006), extraram-se aleatoriamente,
por meio da funo de amostragem do pacote dmsocio, 50 ocorrncias da
parte de Conversao para cada um dos 118 informantes e para cada uma
dessas duas variveis, totalizando 5.900 dados para (e) e 5.900 para (-r). A
esses, somaram-se todos os dados de leituras no arquivo final de dados.15
Oushiro & Mendes (2013 : 756), em anlise prvia de (-r) na fala de 102
informantes, mostram que tal procedimento mantm a proporo geral entre
14
Ver http://projetosp2010.fflch.usp.br/dmsocio.
15
Essa metodologia foi aplicada somente aos dados das variveis fonticas, mas no queles das variveis
morfossintticas (CN) e (CV), cujos totais foram relativamente menores (19.041 sintagmas nominais
plurais, 1.150 sintagmas verbais de 1PP e 10.224 sintagmas verbais de 3PP). Para a 1PP, em especial,
alguns falantes produziram menos de 50 dados, de modo que no era desejvel descartar ocorrncias.

53
Anlises quantitativas

variantes na comunidade, bem como nas subamostras individuais, de cada


informante.
As anlises estatsticas foram realizadas no programa R com auxlio do
pacote Rbrul (Johnson, 2009), que uma interface interativa para emprego
das funes glm (para modelo linear generalizado, do ingls generalized linear
model) e glmer (para modelos de efeitos mistos lineares generalizados, do
ingls generalized linear mixed-effects models) (Bates & Sarkar 2008, apud
Johnson 2009).
A Figura 3.2, extrada de Tagliamonte (2011 : 140), mostra a interface
do Rbrul. A partir de um menu de comandos (p.ex., no topo da figura,
MODELING MENU: 1 choose variables 2 one-level 3 step-up...),
o usurio digita o nmero correspondente quele que deseja executar (no
exemplo, selecionou-se 1, ou seja, choose variables), e o Rbrul ento
apresenta novas opes (Choose response; Type of response etc.), at que
se customize a anlise multivariada que se intenciona realizar.16
Como se trata de uma ferramenta ainda pouco empregada em estudos
sociolingusticos no Brasil, relativamente s anlises usualmente desenvolvidas
com o programa Varbrul (Cedergren & Sankoff, 1974; Guy, 2007 [1988];
Sankoff, 1988; Robinson et al., 2001), tambm convm descrever as vantagens
de se utilizar o programa. A primeira, j mencionada anteriormente, a
possibilidade de criar scripts ou rotinas automatizadas para a realizao de
certas tarefas. Para as anlises estatsticas no Rbrul, sabendo-se das opes
numeradas que conduzem criao dos modelos a ser testados, possvel
planejar uma srie de comandos na forma de um script que, ao ser executado,
realizar diversas anlises consecutivas.17 No Captulo 8, que descreve anlises
multivariadas para cada um dos 118 indivduos da amostra, a utilidade desse
recurso se tornar clara.
O programa R uma ferramenta bastante mais flexvel do que o Varbrul
16
Para um novo usurio do programa R, a interface do Rbrul relativamente mais simples do que a
alternativa de digitar as linhas de comando diretamente no Console; a seleo de opes numeradas 1,
2, 3... nada mais do que a insero de cdigos para execuo de certas funes.
17
claro que certas anlises s podem ser definidas com base em resultados prvios, ou seja, o pesquisador
deve examinar os resultados de cada modelo testado antes de decidir qual ser o prximo passo de
sua anlise. No entanto, s vezes o analista sabe, de antemo, que desejar realizar duas anlises
alternativas por exemplo, nos presentes dados, uma anlise em que se inclui Faixa Etria e se exclui
Origem dos Pais, e outra em que se faz o contrrio.

54
Anlises quantitativas

Figura 3.2 Interface do Rbrul (Fonte: Tagliamonte 2011 : 140)

55
Anlises quantitativas

para a realizao de anlises estatsticas, para alm da regresso logstica.


Para a presente pesquisa, so de especial interesse os modelos de efeitos
mistos (Baayen, 2008; Johnson, 2009). Nesses modelos, possvel incluir
dois tipos de variveis independentes no modelo estatstico, para anlises de
correlao com uma varivel dependente: efeitos fixos e efeitos aleatrios.
Os primeiros so variveis cujos exemplares da amostra so representativos
da populao amostrada,18 como o sexo ou a classe social do informante,
ou a classe morfolgica da palavra. Tais variveis e seus respectivos fatores
podem ser replicados em outros estudos. J os efeitos aleatrios se referem a
variveis especficas da amostra analisada, como, por exemplo, os indivduos
que foram aleatoriamente selecionados, ou os itens lexicais que fazem parte
dos dados coletados. Uma nova amostragem aleatria de dados provavelmente
acabaria contendo ocorrncias provenientes de homens e mulheres de classes
sociais comparveis ao de outras amostras coletadas com os mesmos critrios,
bem como das mesmas classes de palavras, mas dificilmente selecionaria
o mesmo conjunto de falantes ou de itens lexicais. A incluso de efeitos
aleatrios no modelo estatstico permite verificar se as correlaes observadas
se devem aos efeitos fixos ou se possivelmente se devem contribuio casual
de certos indivduos ou itens lexicais que eventualmente se comportam de
modo distinto da populao em geral. Em outras palavras, as variveis no
Rbrul so selecionadas como estatisticamente significativas apenas quando
as correlaes so fortes o suficiente para superar a variao inter-falantes
(Johnson, 2009 : 365).19 Como resultado prtico, anlises realizadas no Varbrul
podem por vezes selecionar certas variveis como relevantes para a variao,
quando de fato no o so, e anlises realizadas no Rbrul podem deixar de
reportar certas variveis como relevantes, quando de fato o so (Johnson,
2009).20 O Rbrul, desse modo, tende a ser mais conservador na avaliao de
18
O termo populao aqui empregado em sentido tcnico, e se refere ao universo do qual se extraram
os dados. Nesse caso, refere-se no s aos indivduos informantes, mas tambm ao conjunto de variantes
de uma varivel, em seus respectivos vocbulos.
19
Traduo prpria. Texto original: [...] when they are strong enough to rise above the inter-speaker
variation.
20
Essas diferenas geralmente ocorrem em relao a variveis independentes que apresentam pouca rele-
vncia na anlise no Varbrul, seja por uma pequena diferena no range (diferena entre maior e menor
pesos relativos dentro de um grupo de fatores Guy & Zilles 2007), seja na ordem de seleo no step-up
(em geral, um dos ltimos ou o ltimo grupo de fatores a ser selecionado). Tal foi o caso, por exemplo,
da varivel Regio de Residncia na anlise de (e): esta a ltima varivel a ser selecionada em anlises

56
Anlises quantitativas

probabilidades o que, de modo geral, prefervel em relao chance de


reportar uma varivel como relevante quando factualmente no o .
Uma terceira vantagem da utilizao do programa R a possibilidade de
se inclurem variveis contnuas na anlise (como idade, ndice socioeconmico,
frequncia da palavra, frequncia (Hz) de formantes, durao de segmentos
em ms etc.). Tome-se como exemplo a anlise do grupo de fatores Faixa
Etria, comum em estudos sociolingusticos. Embora tratada como uma
varivel discreta21 no Varbrul, a interpretao de resultados normalmente
feita como se fosse contnua, em termos de possveis mudanas em progresso
ao longo do tempo, de gradao etria ou de estabilidade no fenmeno em
questo. Tratando-se efetivamente de uma varivel contnua, prefervel ter
a possibilidade de analis-la como tal.
Nesta pesquisa, Classe Social e Faixa Etria foram analisadas tanto como
variveis discretas (na forma de fatores, p.ex. classe B2, 2a faixa etria)
quanto como variveis contnuas (p.ex., ndice socioeconmico 3.4, 3.5, 3.6
etc., 20, 21, 22 anos etc.). Esse outro modo de tratamento dos dados tem o
objetivo de complementar a descrio das correlaes verificadas nos modelos
propostos para o encaixamento social e lingustico das variveis (e), (-r), (CN)
e (CV) na comunidade paulistana. Para diferenciar as variveis discretas das
contnuas, utilizam-se os nomes ndice Socioeconmico e Idade.
No Rbrul, o resultado para variveis contnuas fornecido apenas em
logodds, que o logaritmo da probabilidade de um evento ocorrer dividido
pela probabilidade de no ocorrer (ln[p/(1 - p)]) (Johnson, 2009). A medida
indica em quanto aumenta (valores positivos) ou diminui (valores negativos)
a probabilidade de ocorrer uma variante a cada acrscimo de unidade da
varivel contnua para Idade, medida em anos neste estudo, e para ndice
Socioeconmico, de acordo com o ndice de 1 a 5.
importante ressaltar que a comparao de resultados com os de outras
pesquisas que se utilizam do Varbrul, de modo geral, no comprometida:
tanto o Varbrul quanto o Rbrul se utilizam de modelos estatsticos semelhantes
com o Varbrul, com range de apenas 6, e no selecionada na anlise com o Rbrul o que parece
indicar que a sua seleo no Varbrul se deve a flutuaes aleatrias entre os falantes da amostra.
21
Da advm o termo grupo de fatores, j que as variveis analisadas no Varbrul devem ser sempre na
forma de variveis qualitativas, no contnuas.

57
Anlises quantitativas

e geram resultados das mesmas medidas, como pesos relativos, logaritmo de


verossimilhana e valor de p ou de significncia.22 Quando se testam modelos
idnticos nos programas (a incluso das mesmas variveis com os mesmos
fatores, sem incluso de efeitos aleatrios no Rbrul), os resultados gerados so
virtualmente os mesmos, podendo os pesos relativos diferir em 0,01 (Johnson,
2009).
Cabe aqui uma nota terminolgica: nos estudos sociolingusticos que
se utilizam do Rbrul, tem-se convencionado empregar os termos predictor
variables ou predictors para as variveis independentes (Sexo/Gnero,
Idade, Classe Morfolgica etc.), que possivelmente se correlacionam com
variveis dependentes (em geral, o fenmeno lingustico sob anlise, como a
pronncia de (-r) ou a concordncia nominal). Tais termos no coincidem
com o que se chama de grupos de fatores nas anlises com o Varbrul. Por
um lado, grupos de fatores se referem somente a variveis discretas, no
numricas, e portanto no se referem a variveis contnuas como Idade ou
ndice Socioeconmico. Por outro, o termo predictor pode se referir tanto
s variveis quanto s variantes de um modelo linear p.ex., Sexo/Gnero
uma varivel previsora e Sexo Feminino tambm um previsor. Como as
anlises dos captulos 4 a 7 se baseiam nos resultados gerados pelo pacote
Rbrul (e no diretamente no programa R), desenvolvido especificamente
para ser comparvel ao Varbrul, sero utilizados os termos varivel, va-
rivel independente, ou ainda variveis internas/lingusticas e variveis
externas/sociais para fazer referncia s hipteses levantadas quanto aos
condicionamentos das variveis dependentes.
O Quadro 3.6 resume as sete variveis sociais descritas neste captulo
22
Esses termos so empregados extensivamente ao longo desta tese. Peso relativo se refere medida
mais empregada em estudos sociolingusticos; consiste em um valor entre 0 e 1 que, quando prximo
de 0.50, indica uma tendncia neutra de se empregar determinada variante; acima de 0.50 indica
favorecimento; e abaixo de 0.50 indica desfavorecimento da variante utilizada como valor de aplicao
(p.ex., o /r/ retroflexo []). O logaritmo de verossimilhana mede a proximidade entre o modelo testado
e os dados observados, e varia de acordo com a quantidade de dados (Guy & Zilles, 2007 : 238). Trata-se
de uma medida relevante quando se comparam dois modelos estatsticos alternativos em um mesmo
conjunto de dados quanto menos distante de zero, maior a verossimilhana entre os dados e o modelo
testado. O valor de p ou de significncia mede a probabilidade de se obter determinada distribuio
observada nos dados em caso de a hiptese nula ser verdadeira; quanto menor o valor, menor tal
probabilidade. Hiptese nula H0 , por sua vez, o oposto lgico da hiptese alternativa H1 ; se H1
afirma que h correlao entre a pronncia varivel de (-r) e o contexto fnico precedente, H0 afirma
que no h correlao entre a pronncia varivel de (-r) e o contexto fnico precedente.

58
Anlises quantitativas

Sexo/Gnero, Faixa Etria/Idade, Nvel de Escolaridade, Regio de Residn-


cia, Origem dos Pais, Mobilidade e Classe Social/ndice Socioeconmico ,
alm de Estilo e Falante, que foram includas nas anlises de cada varivel
sociolingustica deste estudo. As variveis lingusticas sero discriminadas
nos captulos pertinentes, uma vez que diferem para (e), (-r), (CN) e (CV).
Nos captulos 8, 9 e 10 sero descritos outros mtodos mais especfi-
cos para as anlises da fala dos indivduos, de covariveis e de percepes
sociolingusticas.

Sexo/Gnero feminino
masculino
Faixa Etria 1a faixa etria: 20 a 34 anos
2a faixa etria: 35 a 59 anos
3a faixa etria: 60 anos ou mais
Idade (varivel contnua: 20 a 83)
Nvel de Escolaridade at Ensino Mdio
Ensino Superior
Regio de Residncia bairro mais central
bairro mais perifrico
Classe Social A/B1: classe alta/mdia alta
B2: classe mdia mdia
C1: classe mdia baixa
C2/D: classe baixa alta e baixa mdia
ndice Socioeconmico (varivel contnua: 1 a 5)
Origem dos Pais So Paulo
interior (SP/MG/PR)
Norte/Nordeste
estrangeira
mista
Mobilidade Geogrfica baixa: sempre morou no mesmo bairro
mdia: sempre morou na mesma zona
alta: morou em diferentes zonas
Estilo Conversao
Leitura de depoimento
Leitura de jornal
Leitura de lista de palavras
Falante (efeito aleatrio)

Quadro 3.6 Variveis sociais

59
Parte II

Identidades urbanas
e padres de variao
4
A varivel (
e)

Este captulo analisa a realizao varivel de /e/ nasal como mo-


notongo [e] ou ditongo [ej], em palavras como fazenda e querendo.
Demonstra-se que o uso de [ej] se encontra em rpida expanso na
comunidade paulistana, com forte favorecimento pelos falantes do
sexo feminino. No entanto, as diferenas observadas em relao
ao Sexo/Gnero, Classe Social e outras caractersticas dos falantes
no se aplicam uniformemente na comunidade, uma vez que as
variantes se distribuem diferentemente ao longo das faixas etrias
e as diferenciaes se neutralizam entre os mais jovens. Nesse
sentido, o captulo tem como principal objetivo discutir o encaixa-
mento social da mudana, que tem ocorrido abaixo da conscincia
dos falantes (Labov, 2001b).

Embora existam diversos estudos sobre vogais nasais no portugus bra-


sileiro (p.ex., Bisol 1998; Medeiros 2007; Abaurre & Pagotto 2013; Moraes
2013), incluindo-se os ditongos nasais (p.ex., Bisol 1998; Demasi 2009), sua
grande maioria opera sob um ponto de vista fonolgico em que a nasalidade
tem funo contrastiva, como nos pares mnimos sem/sei [sej]/[sej] e po/pau
[pw]/[paw]
ou do ponto de vista da assimilao regressiva, como em cena
["se.n5]/["se.n5] , visando a descries aerodinmicas, acsticas, articulatrias,
perceptuais e fonolgicas.
A alternncia entre monotongao e ditongao de /e/ nasal foi ainda
pouco explorada, tanto da perspectiva fontica quanto de seus correlatos
)
A varivel (e

sociais. Colley (2011), ao realizar a descrio acstica de vogais nasais (como


em sendo) ou nasalizadas (como em pena) na fala de quatro informantes
cariocas, notou a frequente presena de um glide em /e/: em contextos em
meio de vocbulo, F2 pode abaixar na direo de [e@]. Trata-se, portanto, de
uma variante distinta daquelas encontradas no portugus paulistano e aqui
analisadas. Silva (2013), por sua vez, analisou na fala carioca a ditongao
de /e/ em relao vogal da slaba seguinte, em palavras como pense [I],
penso [U] e pensa [5], com a hiptese confirmada de que a vogal coronal
[I] favorece a realizao de /e/ nasal como [ej].
Um nico estudo que menciona en passant a ditongao de (e) no portugus
paulistano o de Vieira (2010), que se dedica s influncias fonolgicas do
italiano no portugus da cidade de So Paulo. Ao comparar as leituras de
uma lista de palavras entre falantes da Bahia, Minas Gerais, Distrito Federal,
Cear, Rio de Janeiro, Rio Grande do Sul e So Paulo, o autor atestou a
variante [ej] nos vocbulos tempo, fermento e entendendo apenas na fala do
informante paulistano. Vieira (2010 : 50) sugere que a variante teria surgido
pela inexistncia de vogais nasais no italiano e consequente dificuldade dos
imigrantes em realizar o segmento, mas no se volta ao teste dessa hiptese.
Neste estudo, analisa-se primeiramente o status atual da ditongao de (e)
na comunidade paulistana em comparao a outras comunidades. A variante
parece ser um esteretipo (Labov, 2008 [1972]) do linguajar paulistano fora
de So Paulo (em frases como T choveindo!), mas os nativos da cidade, em
geral, no desenvolvem um discurso metalingustico sobre [ej]. Em seguida,
apresentam-se os resultados das anlises multivariadas de correlao com
as sete variveis sociais, seis variveis lingusticas e Estilo, e examina-se
mais detalhadamente o encaixamento social de [ej] por meio de cruzamentos
com a varivel Faixa Etria; por fim, discute-se a progresso da variante na
comunidade, em contraste com fenmenos sujeitos a estigmatizao.

62
j] entre paulistanos e no paulistanos
Avaliaes sobre [e

4.1 ej] entre paulistanos e


Avaliaes sobre [
no paulistanos
Em se tratando de uma varivel pouco estudada, esta pesquisa buscou avalia-
es a respeito da variante [ej] atravs da pergunta: O que voc acha desse
modo de falar: Meu, voc t entendendo o que eu t dizendo?, com realiza-
o exageradamente ditongada de (e), conforme se descreveu no Captulo 3 (p.
38). Com base nas respostas dos informantes e na seleo de palavras-chave,
criou-se a nuvem de palavras da Figura 4.1, que representa visualmente a
frequncia relativa de noes associadas sentena.

Figura 4.1 Nuvem de palavras associadas sentena meu, (vo)c (es)t


entendendo o que eu (es)tou dizendo?, realizada com [ej]

Entre os significados sociais apontados pelos informantes gravados, verifica-


se que a noo mais recorrente a de paulistano. No entanto, deve-se
suspeitar de que tal impresso se deva necessariamente ditongao de (e).
Em muitas dessas avaliaes, o foco dos comentrios metalingusticos foi sobre
o vocbulo meu, como nos trechos (1) a (3).

63
j] entre paulistanos e no paulistanos
Avaliaes sobre [e

(1) D1: [risos] o que voc acha desse jeito de falar assim meu (vo)c (es)t
entendendo [ej] o que eu (es)tou dizendo? [ej]
S1: ... ns n
D1: [risos]
S1: no tem jeito n cara...
D1: voc acha que paulistano fala assim?
S1: fala!... com certeza... o sotaque paulista muito caracterstico n meu...
meu! no d pra/ p... meu... cara... n... (Luis A., M1SP)

(2) D1: e desse jeito de falar... eh meu voc (es)t entendendo [ej] o que
eu (es)tou dizendo? [ej]
S1: eh...
D1: quem que voc acha que fala assim?
S1: eh... no sei eu acho meio... uhn... acho que um jeito meio paulista 1
at de se falar
D1: ?... voc acha que voc fala assim?
S1: meu meu... eu acho muito paulista isso... paulistano (Marcelo B.,
M1MP)

(3) D1: o que voc acha desse jeito de falar... meu (vo)c (es)t entendendo
[ej] o que eu (es)tou dizendo? [ej]
S1: tipicamente... paulistano isso n? meu
D1: entendi
S1: o meu [...]
D1: todos falam assim?
S1: ... eu acho que at os... no sei se na periferia tanto assim n?...
eu acho que mais... nas regies mais centrais/ o povo mais... mais velho
assim sabe? (Felipe L., M1MC)

Comentrios que tambm parecem advir da presena de meu na sentena


se referem expresso como gria e, por extenso, a um falar no correto
(mas no necessariamente errado), coloquial, e fala de adolescentes
ou mais jovens:

(4) D1: e que que voc acha da da pessoa que fala meu voc (es)t entendendo
[ej] o que eu (es)tou dizendo? [ej] [...]

S1: eu acho que assim ... falta de assunto... falta de contedo eu acho
sinceramente... n... lgico que tem todo um contexto social de gria... no
1
A distino entre os termos paulista e paulistano, como pessoas nascidas no estado e na cidade
de So Paulo respectivamente, raramente feita pelos informantes da amostra. O termo paulista
frequentemente empregado para se referir s pessoas nascidas na cidade de So Paulo. No exemplo em
(2), observe-se que o informante Marcelo B. alterna entre esses termos. Ver tambm os exemplos (10)
e (12) abaixo.

64
j] entre paulistanos e no paulistanos
Avaliaes sobre [e

... mas quando/ acho que quando o aluno... o cara sei l o adolescente...
ele quer falar eh de outra maneira ele no consegue... porque ele no tem
contedo... ele no tem ele no sabe/ sabe por qu? o cara no l... o cara
no se interessa... (William A., M2SP)

Muitos dos falantes discorreram apenas sobre o contedo explcito da sentena,


descrevendo-a como um modo de se fazer claro ou de chamar a ateno. Em
sua maioria, esses foram casos em que o documentador deixou de mencionar
o vocbulo meu:

(5) D2: o que voc assim de eh... quem fala meu (vo)c (es)t entendendo
[ej] o que eu (es)tou te dizendo? [ej]

S1: ah o que/ o que... o que uma pessoa (xxx) o que ela se refere assim?
D1:
D2: ... que que voc acha assim de algum que fala assim?
S1: eu acho que eu est falando demais e... [risos] e algum me/ sabe falou
tanto que ele acha que... que deixou alguma coisa despercebida e a voc
fala voc est entendendo o que eu estou te dizendo? (Eloisa D., F1SP)

(6) D1: voc viu (que tem bastante trecho) sabe... voc (es)t entendendo
[ej] o que eu (es)tou dizendo? [ej] voc... que que voc acha dessa dessa
frase?
S1: eh o tal negcio a pessoa quer que voc... mostra muito pra voc n...
ela quer/ eh voc est vendo que voc est ali falando com ela voc est
ali por aquele motivo... mas (ela) sempre quer reafirmar... est sempre
afirmando pra voc... voc est vendo olha s... aqui ... (Karolina M.,
F2MC)

(7) D1: que que voc acha desse jeito de falar ah voc est entendendo [ej]
o que eu estou dizendo? [ej] [...]
S1: dizendo [ej]
D1: [risos]
S1: ah pra ver se a pessoa est entendendo o seu problema n?... que
que eu acho?... ah sei l eu acho certo... n?... principalmente se for
da... da classe social... esse tipo de pessoa uma classe social baixa n?
(xxx) porque eu acho que o... classe social... (assim)... mais alta assim de
diferente... eles tm as palavras diferentes pra dizer... n... at no modo
que ela quer te... falar [...] pra mim se estou assim/ se a pessoa falar pra
mim normal... mas se est no meio de pessoas j estudadas vai se ofender
porque fala assim est acha/ achando que eu sou burro? (Pedro S.,
M2SP)

65
j] entre paulistanos e no paulistanos
Avaliaes sobre [e

Outros comentrios frequentes dizem respeito prosdia e caracterizam esse


modo de falar como italianado, cantado.

(8) D1: o que voc acha desse jeito de falar... voc (es)t entendendo [ej] o
que eu (es)tou dizendo [ej]... o que voc acha desse jeito?
S1: meio cantado n meio italianado a
D1: voc acha?
S1: eu acho
D1: eh... mas quem voc acha que fala assim?... (vo)c (es)t entendendo
[ej] o que eu (es)to(u) dizendo [ej]
S1: eu falei assim? (vo)c (es)t entendendo [ej] o que eu (es)to(u) dizendo
[e] eu falei n? eu falei cantado...
D1: voc acha que uma coisa dos paulistanos todos os paulistanos ou s
de um bairro?...
S1: eu acho que coisa de paulistano n?
D1: de uma maneira geral?
S1: ...
D1: entendi e... voc acha que voc fala desse jeito?
S1: eu falo eu falo meio cantado sim (Irene R., F3SC)

(9) D1: que que voc acha desse jeito de falar assim... voc (es)t enten-
dendo [ej] o que (es)tou dizendo? [ej]
S1: peculiar n prprio da gente... e isso eu acho que tem... tem um
cantar italiano... eu sinto que tem um... uma msica... italiana nesse...
nessa frase
D1: quem que voc acha que fala mais assim?... tem algum na cidade
algum grupo...?
S1: no o pessoal do Jardins... eu acho que no ... eu acho que dos
bairros... mas no os bairros muito perifricos no... eh prximos do centro
da cidade... que pode ser Perdizes que pode ser... eh a prpria Mooca...
pode ser Aclimao... (Iara S., F2SC)

associao com italianos parece estar relacionada a meno mais frequente


do bairro da Mooca (de ocupao originalmente italiana), mas tambm
bairros mais centrais (como Perdizes e Aclimao), em detrimento daqueles
de regies perifricas. Ainda que bem menos frequente, outra identidade
social mencionada por dois informantes a de patricinhas, pessoas do sexo
feminino e, em geral, mais jovens e pertencentes a classes sociais mais altas:

(10) D1: e essa frase aqui ... se eu dissesse assim... voc (es)t enten-
dendo? [ej] voc acha esquisito ou normal?

66
j] entre paulistanos e no paulistanos
Avaliaes sobre [e

S1: entendendo [ej] meio forado n


D1: forado? mas voc acha que algum fala assim?
S1: acho
D1: quem?
S1: ah mina principalmente n
D1: mulher?
S1: [risos] principalmente n
D1: mas mas... mulher daqui?
S1: daqui paulista bem paulista... patizinha paulista total (vo)c (es)t
entendendo? [ej] n... (Fernando B., M1MC)

(11) D1: voc entende algumas pessoas que voc... percebe pessoas falando...
desse jeito assim aqui em So Paulo?
S1: um pouco... um pouco um pouco sim no to carregado assim
D1: ? quem que voc acha que fala (assim)?
S1: mais carregado assim?
D1:
S1: ah mais paty assim... mais assim que... eu acho que puxa um pouco
mais assim... acho que o pessoal da periferia no puxa... tanto nesse
sentido vai falar mais... meu (vo)c (es)t entendendo [enU] o que eu
(es)tou dizendo? [enU]
D1: [risos]
S1: mais... mais... no sei mais fechado mais curto no sei
D1: [risos]
S1: acho que o tom que voc deu foi diferente (Thaissa B., F1SP)

De todos esses exemplos at aqui, chama a ateno o fato de a maioria


dos falantes no mencionar especificamente o segmento (e), tampouco sua
ditongao. Alguns dos poucos informantes que fazem meno explcita
varivel, ou pelo menos a repetem nas palavras-alvo entendendo ou
dizendo, comentam sobre experincias de viagens a outras cidades do Brasil
ou situaes de contato com falantes de outras regies, em que foram
informados de que falam desse modo:

(12) D1: e que que voc acha do jeito de falar voc est entendendo [ej] o
que eu estou dizendo? [ej] ... ou fazenda [ej]
S1: isso! isso! entendendo [ej] ah voc est entendendo? [ej]
isso mesmo que eles [pessoas do interior de So Paulo] falavam/ falam que
a gente fala muito... ento voc est entendendo? [ej] ... meio que
uma forma meio cantada de falar mas uma caracterstica eu acho do
paulista n (Lucas S., M1MC)

67
j] entre paulistanos e no paulistanos
Avaliaes sobre [e

(13) S1: pra mim... no meu ponto de vista todos os outros tm sotaque/
sotaque menos ns
D1: [risos]
S1: ento eu no vejo isso como um sotaque sabe?... mas pelo que dizem...
o paulistano fala o e/ o entendendo... [ej] fazendo... [ej] eu acho que
o jeito correto de falar nessas fazendo... [e] entendendo... [e] e j
o paulistano no ah voc est entendendo? [ej] voc est fazendo [ej]
isso?
[...]
D1: voc comentou at... eh mas eu vou falar de novo... o que que
voc acha desse modo de falar voc est entendendo [ej] o que eu estou
dizendo?? [ej]
S1: [risos] eu acho normal... eu acho completamente normal
D1: normal?... voc acha que coisa de paulistano falar assim?
S1: ah depois que as pessoas me falaram eu acho assim mas eu eu/
D1: mas quem te falou assim?
S1: ah o pessoal que trabalhava comigo de Curitiba todo mundo falava ai
essa coisa de So Paulo... eh (es)t entendendo [ej] [...] eh e fala coisa
muito en en en en meio o ene talvez pegue desse jeito n? (Carolina A.,
F1MC)

Em (13), Carolina A. chega a contrastar as realizaes de (e) como monotongo


e ditongo espontaneamente, antes mesmo que a documentadora lhe houvesse
apresentado a sentena-alvo; adiante, ela afirma que a variante ditongada era
mencionada por seus colegas curitibanos como algo tpico dos paulistanos. De
fato, a ditongao de /e/ nasal parece ser um trao lingustico que identifica
paulistanos fora da cidade de So Paulo. Em entrevistas sociolingusticas
realizadas por membros do GESOL-USP em outras comunidades, a variante
frequentemente associada ao falar paulistano e/ou paulista, e muitas vezes
avaliada como um modo feio, forado, engraado ou diferente de se
falar. Os excertos abaixo so de entrevistas realizadas em Itanhandu-MG
(14), Campo Grande-MS (15) e So Lus-MA (16):

(14) ItanhanduMG (Bieler da Silva, 2013)


a. D1: voc lembra que a gente estava falando de sotaque? como que
voc acha que um paulistano falaria alguma dessas palavras? [da lista
de palavras] ... tem diferena?
S1: ah tem diferena... eh... deixa eu ver uma aqui [risos]... eles
falam perten... [ej] (entendeu?) o en fica mais puxadinho...

68
j] entre paulistanos e no paulistanos
Avaliaes sobre [e

(F2A-Clarice)

b. D1: e o paulistano?... voc que morou l... pequena mas morou l


S1: ento
D1: como que ele falaria diferente?
S1: defender porque a minha irm paulista [...] ela falaria bem
bonitinho mesmo
D1: [risos]
S1: entretenimento [ej] n
D1: [risos]
S1: bem diferente (F2A-Luiza)

c. D1: a gente estava falando de sotaque agora h pouco voc acha


que um paulista falaria diferente essas palavras do que voc falou?...
S1: puxando o ene n
D1: aham
S1: entretenimento [ej] [risos] (M2A-Marcos)

(15) Campo-GrandeMS (Vieira, 2013)


a. D1: que que voc acha desse modo de falar... voc (es)t enten-
dendo [ej] o que eu (es)tou dizendo? [ej]
S1: entendendo [ej] o que eu (es)tou dizendo [ej] isso de paulista
D1: do interior ou da capital?
S1: da capital
D1: uhum
S1: paulista fala entendendo [ej] ... ele fala entra [ej] [...]
D1: aham que que voc acha desse modo de falar?
S1: [pausa longa] no sei no costume meu eu acho feio n...
aquilo que eu falei para voc tudo regional... uma questo de
de de de cultura... (isso) no a nossa cultura a gente acha feio
(F53C-Olga)

b. D1: que que voc acha desse modo de falar aqui ... voc (es)t
entendendo [ej] o que eu (es)tou dizendo? [ej]
S1: voc (es)t entendendo [ej] ... quem fala assim ... o pau-
lista... que puxa mais entendendo [ej] ... vendo [ej] eles falam
muito assim
D1: uhum... voc ouve isso aqui em Campo Grande? voc acha que
o campo grandense fala assim?
S1: no o campo grandense no...
D1: uhum
S1: mas o paulista fala agora eu lembrei ele fala (vo)c (es)t en-
tendendo [ej]

69
j] entre paulistanos e no paulistanos
Avaliaes sobre [e

D1: o paulistano?
S1: eles falam/ o pau- paulistano
D1: paulistano? uhum legal... e... que que voc acha desse modo de
falar?
S1: [risos] diferente n... diferente (F47C-Regina)

c. D1: e o paulistano?
S1: o paulistano eu no sei imitar no s sei quando ele fala os
cara/ o tsc eh mano... essas coisa assim
D1: aham
S1: no (es)tou entendendo [ej] assim... tem entendendo aqui?...
entender [ej]
D1: [risos]
S1: assim que ele fala
[...]
D1: certo... bom voc j falou mas eu vou perguntar de novo... que
que voc acha desse modo de falar aqui ... voc (es)t entendendo
[ej] o que eu (es)tou dizendo? [ej]
S1: caracterstico... pra pra pra reconhecer de de onde que esse
palavreado isso paulistano
D1: uhum
S1: paulistano
D1: que que voc acha desse modo de falar?
S1: ah... se eu tivesse morando l eu achava normal agora que eu
moro aqui eu/ eu acho interessante eu rio (M55S-Pedro)

(16) So LusMA (Santos, 2012)


a. D1: o que que tu acha desse modo de falar aqui... eh... voc
(es)t entendendo [ej] o que eu (es)tou dizendo [ej]
S1: [risos]
D1: que que tu acha?
S1: [risos] cara parece caricato aquilo que eu te falei dos paulistas
parece caricato [risos]
D1: parece com eles?
S1: parece
D1: ?
S1: forado
D1: tu acha que forado
S1: eu acho (vo)c est entendendo [e@] eu acho forado
D1: como que tu acha que deveria ser?
S1: voc est entendendo... [e] esse entendendo [e@] assim meio
esquisito
D1: tu fala assim?

70
j] entre paulistanos e no paulistanos
Avaliaes sobre [e

S1: como?
D1: assim como eu fiz?
S1: no! [risos] no...
D1: tu acha que o ludovicense fala assim?
S1: no (M2B-Jos M.)

b. D1: o que que tu acha desse modo de falar aqui ... voc (es)t
entendendo [ej] o que eu (es)tou dizendo [ej]
S1: ah isso chato
D1: chato?... como que tu acha que deveria ser?
S1: normal... (vo)c (es)t entendendo [e] o que estou falando
D1: ah certo... e tu acha que tem algum lugar no Brasil especfico
que fale assim como eu fiz?
S1: tem
D1: qual esse lugar?
S1: eu acho que so os paulistas
D1: os paulistas falam desse jeito?
S1: acho que
D1: ?
S1: paulista
D1: e... o ludovicense fala assim como eu fiz?
S1: no
D1: no? tu fala assim?
S1: no (F1B-Patrcia L.)

c. D1: e o que que tu acha desse modo de falar aqui... voc (es)t
entendendo [ej] o que eu (es)tou dizendo [ej]
S1: acho diferente da gente n
D1: ?
S1: sim
D1: e se diferente da gente... ser que poderia ser assim de algum
lugar especfico?
S1: ahn parece... parece de So Paulo Rio... mas eu acho que parece
mais de So Paulo pode ser... pode ser que a pessoa queira dar uma
certeza maior pro que que ela esteja dizendo
D1: aham... e tem alguma coisa de errada a?
S1: s esse... esse esse endo [e::] endo [e::] n
D1: uhn
S1: (es)t/ (es)t assim muito forte e a fica feio
D1: ah... certo... e tu fala assim como eu fiz?
S1: eu no
D1: no?
S1: no!

71
j] entre paulistanos e no paulistanos
Avaliaes sobre [e

D1: e tu acha que o ludovicense fala assim como eu fiz?


S1: no isso est l pra baixo (F2B-Wilma B.)

As entrevistas realizadas em Itanhandu-MG no continham uma pergunta


especfica com a sentena-alvo, mas comentrios sobre a ditongao de (e)
associada aos paulistanos por vezes surgem quando a documentadora pergunta
como o informante acha que um paulistano pronunciaria alguns dos itens
lexicais da lista de palavras. Em Campo Grande-MS, capital que recebeu
muitos migrantes da cidade e do estado de So Paulo (Vieira, 2013), a
associao de [ej] com paulistanos e paulistas frequente. Em So Lus-
MA, os ludovicenses tambm relacionam a ditongao com cariocas, embora
menos frequentemente do que com So Paulo; nesse sentido, o comentrio
de Wilma B. (16-c) bastante representativo de uma avaliao da variante
como no nativa: isso est l pra baixo. Note-se que essa informante
aponta especificamente o segmento /e/ como errado, feio, embora com
realizao apenas alongada (mas no ditongada) [e::], e Jos M. (16-a) repete
as palavras-alvo com o ditongo [e@], que parece mais caracterstico de cariocas.
De todo modo, esses informantes, ainda que pudessem comentar outros traos
lingusticos p.ex., o uso do pronome voc em vez de tu quase sempre
mencionam ou contrastam especificamente o segmento (e), o que indicativo
da salincia social da varivel naquela localidade.
Em conjunto, esses trechos de entrevistas permitem considerar que [ej]
funciona como trao lingustico para identificao de paulistanos, mas os
prprios nativos da cidade, por sua vez, ainda que nela reconheam uma
prosdia paulistana, em geral no se identificam como usurios da variante,
no apresentam um discurso metalingustico que explicitamente associe grupos
sociais variante ditongada de (e), ou ainda uma avaliao positiva ou negativa
sobre as variantes dessa varivel. Nos termos de Labov (2008 [1972]), em sua
classificao de variveis como indicadores, marcadores ou esteretipos, que se
distinguem por graus de conscincia social e de diferenciao estilstica (ver
Captulo 2, p. 30), a varivel (e) pode ser caracterizada como um marcador
para os paulistanos e como um esteretipo para no paulistanos: enquanto
esses dois tipos de variveis apresentam variao estilstica (diferentemente

72
Anlise multivariada

de indicadores), [ej] est disponvel para comentrios metadiscursivos para


os no nativos da cidade, o que de modo geral no ocorre para os prprios
paulistanos.

4.2 Anlise multivariada


O segmento /e/ ocorre em uma srie de contextos que fazem parte de fenme-
nos variveis distintos, mas que se sobrepem parcialmente. Isso significa que
nem todas as ocorrncias de /e/ podem ser variavelmente realizadas como
monotongo ou ditongo; em alguns casos, h ainda uma terceira variante,
constituindo-se outra varivel.
Slabas tonas, sobretudo em posio inicial de vocbulo, como a preposi-
o em (p.ex. em cima) e o prefixo en- (p.ex. engarrafar, engravidar), so
quase categoricamente realizadas como [i]. Esses dados podem ser considera-
dos parte de um processo varivel diferente, o alamento de vogais pr-tnicas
(Viegas 2003; Battisti 1993; Tenani & Silveira 2008, inter alia), que tambm
ocorre com vogais orais (Cf. [pe."di.dU] vs. [pi."di.dU]).2 Em slabas tonas
finais, em palavras como homem, virgem, comem, /e/ passvel no s de
alamento mas tambm de desnasalizao (Cf. ["O.mej, "viR.gej, "kO.mej] vs.
["O.mi, "viR.gi, "kO.mi]), algo que tambm ocorre com vogais nasais posteriores
(Cf. [fa."la.Rw]
vs. [fa."la.Ru]) (Votre 1978; Guy 1981; Battisti 2002; Schwindt
& Silva 2009). Em monosslabos tnicos como bem, tem/tm, sem, e em
slabas tnicas finais em palavras como tambm, porm, ningum (Colley,
2011), /e/ categoricamente realizado como ditongo [ej]. Desse modo, no
foram includos os casos de /e/ em slabas tonas (pr ou ps-tnicas), tam-
pouco em slabas tnicas em fim de vocbulo. Alm disso, quando seguido de
/d/, especialmente em verbos no gerndio (fazendo, comendo), /e/ tambm
est sujeito assimilao de nd (Cf. [fa."ze.nU], [ko."me.nU]) (Mollica 1989;
Martins 2004; Ferreira & Tenani 2009; Vieira 2011, inter alia), um processo
que parece bloquear a ditongao (*[fa."zej.nU, ko."mej.nU]). As ocorrncias
2
De fato, o contexto VN (vogal mdia seguida de segmento nasal subespecificado, sem consoante no
ataque silbico) apresenta alamento voclico praticamente categrico em diversas comunidades (ver
p.ex. Battisti 1993, para comunidades gachas, e Celia 2004, para Nova Vencia-ES).

73
Anlise multivariada

de end foram includas apenas quando /d/ foi de fato realizado.


Portanto, o envelope de variao desta anlise inclui ocorrncias de /e/
em slabas tnicas iniciais ou mediais, como em nfase, fazenda e a segunda
slaba de entendo.
Do modo como se define o envelope de variao, h um total de 25.703
ocorrncias da varivel na amostra. Dessas, selecionaram-se aleatoriamente
50 por falante dentre os dados de conversao (118 informantes x 50 dados =
5.900), aos quais se somaram todos os dados de leituras (1.335), constituindo-
se um arquivo com 7.235 ocorrncias da varivel (ver Captulo 3, p. 53). As
variantes se distribuem conforme mostra a Tabela 4.1.
Tabela 4.1 Distribuio geral das ocorrncias de (e) (N = 7.235)

Codificao N ocorrncias %
Monotongo [e] 4.276 59,1
Ditongo [ej] 2.959 40,9
N Total 7.235

Embora se constitua como um esteretipo do falar paulistano, a realizao


ditongada de (e) no predominante, mas relativamente frequente: corres-
ponde a cerca de 41% do total das ocorrncias. Os dados foram codificados
de acordo com as sete variveis sociais descritas no Captulo 3 (Sexo/Gnero,
Faixa Etria/Idade, Nvel de Escolaridade, Regio de Residncia, Classe
Social/ndice Socioeconmico, Mobilidade e Origem dos Pais), Estilo, Falante
(varivel aleatria) e seis variveis lingusticas especificadas no Quadro 4.1.
As variveis lingusticas abordam aspectos fonolgicos e morfolgicos que
possivelmente se correlacionam com a realizao varivel de (e). Contexto
Fonolgico Precedente e Contexto Fonolgico Seguinte foram codificadas de
acordo com cada segmento fontico, e posteriormente reorganizadas, cada
qual, em Sonoridade [ sonora] e Ponto de C coronal, dorsal, labial (ou
pausa) (Clements & Hume, 1995). A varivel Vogal da Slaba Seguinte testa
se h, na fala paulistana, favorecimento da ditongao de (e) quando a slaba
seguinte contm uma vogal coronal [I], de modo semelhante ao que Silva
(2013) constatou em seus dados da fala carioca. A influncia da morfologia

74
Anlise multivariada

Contexto Fnico Precedente [a, e, E, i, o, O, u, b, d, f, g, h, k, l, m, n, p, S,


s, t, v, x, z] ou pausa
Contexto Fnico Seguinte [b, d, , f, g, h, k, p, s, , t, Z, S, z]
Vogal da Slaba Seguinte [I]: gente, pacincia
[U]: tempo
[5]: setenta
Classe Morfolgica substantivo: centro, ambiente
adjetivo: contente, lento
verbo: pretendo, pensa
advrbio: felizmente, sempre
numeral: setenta, duzentos
preposio: em frente de, dentro
pronome: a gente
Raiz-Afixo raiz: lembr-o, depend-e
afixo: antiga-mente, faz-endo
Item Lexical (efeito aleatrio)

Quadro 4.1 Variveis lingusticas da anlise de (e)

analisada atravs da localizao do segmento (e) em diferentes classes


de palavras (substantivo, adjetivo, verbo etc.), bem como se est na raiz
da palavra ou no. A incluso de Item Lexical (efeito aleatrio) permite
verificar se os efeitos observados se devem s demais variveis lingusticas
ou a possveis itens lexicais especficos que eventualmente se comportem de
modo idiossincrtico.3
Dentre as seis variveis lingusticas analisadas, apenas duas so sele-
cionadas como significativamente correlacionadas ao uso varivel de (e) no
portugus paulistano: Classe Morfolgica e Raiz-Afixo. A Tabela 4.2 mostra
a distribuio dos dados das variveis no selecionadas como significativas:
Contexto Fnico Precedente e Contexto Fnico Seguinte (reorganizados tanto
como Ponto de C quanto por sonoridade do segmento), e a Vogal da Slaba
Seguinte. Para todas essas variveis, observe-se que os pesos relativos, oriundos
de anlises one-level (univariadas) no primeiro passo da rotina step-up, so
3
Nas prximas pginas, embora se apresentem os resultados para variveis lingusticas e sociais em
tabelas distintas, as anlises multivariadas incluram sempre ambas. A separao tem apenas o objetivo
de prestar maior clareza exposio. A mesma organizao adotada nos captulos dedicados s
anlises de (-r), (CN) e (CV).

75
Anlise multivariada

Tabela 4.2 Variveis lingusticas no correlacionadas com (e)


(N [ej] = 2.959 (40,9%); N Total = 7.235)

P.R. % [ej] N Total


Contexto Fnico Precedente Ponto de Ca
coronal [.52] 42,5 3.736
labial [.51] 40,4 1.585
dorsal + pausa [.49] 38,1 1.914
Contexto Fnico Precedente Sonoridadeb
sonora [.50] 39,2 5.371
surda [.52] 45,7 1.864
Contexto Fnico Seguinte Ponto de Cc
coronal [.51] 42,0 6.030
labial + dorsal [.47] 35,6 1.205
Contexto Fnico Seguinte Sonoridaded
sonora [.53] 45,8 849
surda [.50] 40,2 6.386
Vogal da Slaba Seguintee
[5] [.56] 47,2 652
[U] [.43] 41,1 2.229
[I] [.53] 39,8 4.354
a Input: 0,409; b Input: 0,394; c Input: 0,411; d Input: 0,391; e Input: 0,392;
[ ] indicam a no seleo da varivel como significativa.

prximos do ponto neutro (0.50), o que indica a alta probabilidade de que as


diferenas entre os fatores no sejam factualmente significativas.
Desses resultados, interessante notar que variveis fontico-fonolgicas
no se correlacionam com (e), cuja natureza fontica. Isso indica que a
ditongao de (e) no se deve a processos fonolgicos comuns como assimila-
o, dissimilao ou harmonizao voclica em relao ao contexto fnico.4
Diferentemente, os condicionamentos estruturais da varivel dizem respeito a
caractersticas relativas morfologia.
Classe Morfolgica e Raiz-Afixo foram analisadas separadamente pelo fato
de no serem ortogonais entre si: o segmento /e/, quando em pronome (a
gente) e em preposies (dentro, em frente de), sempre ocorre na raiz, nunca
4
Isso, claro, no descarta a possibilidade de outros condicionamentos acstico-articulatrios, no anali-
sados aqui.

76
Anlise multivariada

em afixos. Os fatores da varivel Classe Morfolgica foram reagrupados em trs


categorias, uma vez que as diferenas entre cada um dos sete fatores originais
no eram estatisticamente relevantes (2 = 3,36(4), p > 0,50).5 A Tabela 4.3
mostra que substantivos, adjetivos e verbos favorecem a ditongao de (e) (P.R.
0.56); advrbios e numerais a desfavorecem (P.R. 0.45), assim como as palavras
mais gramaticais, o pronome a gente e preposies (P.R. 0.41). Esse resultado
pode ser explicado pelo fato de que palavras gramaticais como o pronome a
gente (Zilles, 2005) ou a preposio dentro se encontram em estgio avanado
de gramaticalizao e, portanto, so mais propensas reduo fontica. Isso
torna mais provvel a pronncia de (e) como monotongo do que a realizao
mais longa como ditongo. Por outro lado, palavras menos gramaticais como
substantivos (ambiente), adjetivos (lento) e verbos (pretendo) favorecem a
variante ditongada, j que costumam ter proeminncia prosdica na sentena.

Tabela 4.3 Tendncias de emprego de [ej] de acordo com Classe Morfolgica


(N [ej] = 2.959 (40,9%); N Total = 7.235)

P.R. ej]
% [ N Total
Classe Morfolgica
substantivo + adjetivo + verbo 0.56 47,2 3.918
advrbio + numeral 0.45 37,3 1.689
preposio + pronome 0.41 29,4 1.628
Range 14
Input: 0,388. 2 = 3,36(4), p > 0,50.

O resultado para a varivel Raiz-Afixo (Tabela 4.4) mostra que maior a


tendncia ditongao quando (e) se encontra na raiz da palavra (P.R. 0.55),
e menor quando se encontra no afixo (P.R. 0.42). Considerando-se que os
sufixos (-mente, -mento, -ncia etc.) so mais gramaticalizados que a raiz das
palavras, observa-se aqui tendncia semelhante quela verificada em Classe
Morfolgica: quanto menor a carga semntica do morfema em que se encontra
5
L-se qui-quadrado igual a 3,36, com quatro graus de liberdade e valor de p maior do que 0,50. A
notao indica que a anlise original com sete fatores tem grande probabilidade maior do que 50%
de chance de no ser significativamente diferente da anlise mais sinttica com trs fatores (7 - 3
fatores = 4 graus de liberdade). Pelo princpio da Navalha de Occam, a anlise que explica o mesmo
fenmeno com um menor nmero de elementos (3 fatores em vez de 7) prefervel. Ver Guy & Zilles
(2007 : 188197) sobre testes de qui-quadrado para amalgamao de fatores de uma varivel.

77
Anlise multivariada

Tabela 4.4 Tendncias de emprego de [ej] de acordo com Raiz-Afixo


(N [ej] = 2.959 (40,9%); N Total = 7.235)

P.R. ej]
% [ N Total
Raiz-Afixo
raiz 0.55 42,0 4.353
afixo 0.42 39,3 2.882
Range 13
Input: 0,442.

o segmento, menor a tendncia de ocorrer a pronncia [ej].


As variveis no lingusticas, por sua vez, apresentam-se como as mais
relevantes para o emprego varivel de (e), em termos tanto da ordem de
seleo de variveis quanto de range (a diferena entre o maior e o menor
pesos relativos). Das oito variveis, apenas duas no so selecionadas: Regio
da Cidade e Origem dos Pais (Tabela 4.5).

Tabela 4.5 Variveis sociais no correlacionadas com (e)


(N [ej] = 2.959 (40,9%); N Total = 7.235)

P.R. ej]
% [ N Total
Regio da Cidadea
bairro mais central [.51] 41,6 3.404
bairro mais perifrico [.49] 40,3 3.831
Origem dos Paisb
pais paulistanos [.51] 40,8 3.003
pais no paulistanos [.50] 41,0 4.232
a Input: 0,409. b Input: 0,409. [ ] indicam a no seleo da varivel.

Diferentemente da hiptese aventada (ver Captulo 3, p. 47), paulistanos


filhos de paulistanos, cujas famlias esto enraizadas h mais tempo na cidade,
no apresentam maior tendncia de emprego da variante estereotipicamente
paulistana. Isso possivelmente se deve rpida expanso da variante na co-
munidade (ver discusso adiante). Ao mesmo tempo, a despeito da associao
feita pelos falantes entre a sentena meu, voc t entendendo o que eu t
dizendo? e bairros mais centrais (como Mooca, Aclimao e Perdizes; exem-

78
Anlise multivariada

plos (3), (9) e (11) acima), a diviso geogrfica entre bairros mais centrais e
mais perifricos no tem relevncia para a estratificao de (e) em So Paulo.
As demais variveis sociais so selecionadas e, em geral, com range mais
alto do que para as variveis lingusticas. Ainda que estigmatizada em outras
comunidades como um modo feio ou engraado de falar (vejam-se os
exemplos (14)(16) acima), a ditongao de (e) parece gozar de certo prestgio
social na comunidade paulistana, mesmo que abaixo da conscincia (Labov,
2001b) (ver Tabela 4.6). A variante favorecida por membros de classes
sociais mais altas (Cf. P.R.s 0.60 e 0.58 para as classes A/B1 e B2 vs. 0.43 e
0.37 para as classes C1 e C2/D); pelos falantes com maior nvel de escolaridade
(P.R. 0.56) em relao aos menos escolarizados (P.R. 0.44); e nos estilos de fala
mais monitorados da leitura de lista de palavras (P.R. 0.66), do depoimento
e da notcia de jornal (P.R. 0.62), em relao fala mais espontnea da
conversao (P.R. 0.47).6 Como varivel contnua, ndice socioeconmico (p
< 0,001) revela um aumento da probabilidade de ocorrncia da ditongao
em 0.52 unidades de logodds para cada unidade na escala socioeconmica
(de 1 a 5). Essas variveis revelam uma gradao sistemtica no emprego
de [ej] quanto s hierarquias esperadas de correlao com variantes no
estigmatizadas: favorecimento por membros de classes mais altas, por mais
escolarizados e em estilos mais monitorados de fala.
Por outro lado, a varivel Mobilidade Geogrfica mostra que a ditongao
mais tpica entre falantes com menor mobilidade, presumivelmente mais
enraizados em seus bairros ou regies de residncia. Nesse caso, a correlao
indica que a variante pode funcionar como ndice de identidade local, seja
com o bairro, seja com a prpria cidade.
Dentre todas as variveis lingusticas e sociais, a que se correlaciona mais
fortemente com a pronncia de (e) o Sexo/Gnero dos falantes, com o
maior range a diferena entre o maior e o menor pesos relativos de 28. A
ditongao fortemente favorecida pelas mulheres (P.R. 0.64) e, inversamente,
bastante desfavorecida pelos homens (P.R. 0.36). A varivel Faixa Etria
6
A diferena entre a leitura de lista de palavras e a de notcia de jornal e depoimento, com efeito, no
significativa (2 = 0,59(1), p > 0,30), de modo que se poderiam apresentar os resultados para essa
varivel na forma binria leituras vs. conversao. A distino mantida na Tabela 4.6 apenas
para ilustrar a gradao paralela aos nveis esperados de monitoramento da fala.

79
Anlise multivariada

Tabela 4.6 Tendncias de emprego de [ej] de acordo com variveis sociais


(N [ej] = 2.959 (40,9%); N Total = 7.235)

P.R. ej]
% [ N Total
Sexo/Gnero
feminino 0.64 50,1 3.592
masculino 0.36 31,8 3.643
Range 28
Faixa Etria
2034 anos 0.63 49,5 2.340
3559 anos 0.50 42,3 2.534
60+ anos 0.37 30,9 2.361
Range 26
Classe Social
A/B1 0.60 48,3 1.714
B2 0.58 42,5 2.140
C1 0.43 37,4 1.856
C2/D 0.37 34,6 1.525
Range 23
Nvel de Escolaridade
Ensino Mdio 0.44 37,1 3.514
Ensino Superior 0.56 44,5 3.721
Range 12
Mobilidadea
baixa + mdia 0.55 44,7 3.856
alta 0.44 36,5 3.379
Range 11
Estilo b

conversao 0.47 37,6 5.900


depoimento + jornal 0.62 51,0 751
lista de palavras 0.66 61,3 584
Range 19
Input: 0,388. a 2 = 1,02(1), p > 0,30; b 2 = 0,41(1), p > 0,50.

80
O encaixamento social de uma mudana de baixo

revela um padro de desfavorecimento da ditongao entre os mais velhos


(P.R. 0.37), e gradual favorecimento entre os falantes da segunda (P.R. 0.50)
e da primeira (P.R. 0.63) faixas. Considerando-a como varivel contnua, a
probabilidade de emprego de [ej] decresce em 0,02 unidades de logodds para
cada unidade de idade (p < 0,001). Ainda que sejam pouco frequentes as
avaliaes como a de Fernando B. e a de Thaissa B. (excertos (10)(11)), que
remetem a um modo de falar de patricinhas, as correlaes observadas nos
dados caracterizam justamente essa identidade social: jovens mulheres de
classes mais altas.
Esses resultados para Sexo/Gnero e Faixa Etria, considerados paralela-
mente ao discurso metalingustico dos falantes da amostra que, como se viu
acima, no tm conscincia da alternncia em (e) , permitem caracterizar
esse processo varivel como uma possvel mudana de baixo (Labov, 2001b),
observada em tempo aparente.

4.3 O encaixamento social de uma mudana


de baixo
Considerando-se que os paulistanos em geral no parecem ter conscincia
dessa varivel, os resultados aqui se emparelham com os daqueles de uma
srie de outros estudos sociolingusticos que reportam o fato de as mulheres
estarem frente dos homens em casos de mudana de baixo por exemplo, o
alamento de (E) e (O) em Nova Iorque (Labov 2006 [1966]), a anteriorizao
de (E), (O) e (o) em Detroit (Fasold 1969), a anteriorizao de (aw) em Toronto
e em Vancouver (Chambers & Hardwick 1985), para citar alguns (apud Labov
2001b).
Interessa, ento, discutir como tem ocorrido o encaixamento social da
varivel em tempo aparente. Nesse sentido, realizaram-se cruzamentos entre
Faixa Etria e as demais variveis sociais. Os cruzamentos foram includos,
cada qual, em anlises multivariadas no Rbrul em modelos de efeitos mistos.7
7
Ou seja, os cruzamentos foram analisados em modelos que tambm incluram as demais variveis
independentes, sociais e lingusticas, bem como os efeitos aleatrios (Informante e Item Lexical).

81
O encaixamento social de uma mudana de baixo

Os resultados em pesos relativos se encontram na Tabela 4.7 e so representa-


dos graficamente na Figura 4.2. Nelas, comparem-se os valores de range para
cada grupo etrio.

Tabela 4.7 Tendncias de emprego de [ej] no cruzamento entre Faixa Etria e


outras variveis sociais

Faixa Etria
2034 anos 3559 anos 60+ anos
Sexo/Gneroa
feminino 0.64 0.70 0.55
masculino 0.61 0.32 0.21
Range 3 38 34
Nvel de Escolaridadeb
Ensino Mdio 0.62 0.41 0.29
Ensino Superior 0.63 0.58 0.46
Range 1 17 17
Regio de Residnciac
bairro mais central 0.60 0.52 0.44
bairro mais perifrico 0.65 0.48 0.31
Range 5 4 13
Classe Social d

A/B1 0.74 0.59 0.46


B2 0.64 0.56 0.53
C1 0.55 0.50 0.25
C2/D 0.58 0.31 0.23
Range 19 28 30
a Input: 0,371. b Input: 0,370. c Input: 0,369. d Input: 0,371.

A Tabela 4.7 mostra que o padro de estratificao social no emprego de


[ej] se mantm, na maior parte dos casos, nas trs faixas etrias. Todos os
grupos apresentam curvas ascendentes ininterruptas, exceto pelas mulheres
(ver Figura 4.2a), cuja tendncia a [ej] parece se retrair na primeira faixa
etria. Contudo, a maior tendncia de emprego da ditongao pelas mulheres
em relao aos homens observada nas trs subdivises etrias: entre os mais
jovens (0.64 vs. 0.61), os de idade intermediria (0.70 vs. 0.32) e os mais
velhos (0.55 vs. 0.21). De modo geral, os padres da comunidade na direo
da variante ditongada so bastante consistentes.

82
O encaixamento social de uma mudana de baixo

0.7

0.7
(a) Sexo/Gnero (b) Escolaridade
0.6

0.6
Pesos Relativos

Pesos Relativos
0.5

0.5
0.4

0.4
0.3

0.3
Feminino Ens. Mdio
Masculino Ens. Superior
0.2

0.2
60+ 3559 2034 60+ 3559 2034

Faixa Etria Faixa Etria


0.7

0.7
(c) Regio de Residncia (d) Classe Social
0.6

0.6
Pesos Relativos

Pesos Relativos
0.5

0.5
0.4

0.4

AB1
0.3

0.3

B2
Central C1
Perifrica C2D
0.2

0.2

60+ 3559 2034 60+ 3559 2034

Faixa Etria Faixa Etria

Figura 4.2 Pesos relativos referentes ao emprego de [ej] no cruzamento entre


Faixa Etria e (a) Sexo/Gnero; (b) Nvel de Escolaridade; (c) Regio de
Residncia; e (d) Classe Social

Por outro lado, tais diferenas se reduzem drasticamente entre os falantes


de primeira faixa etria. Na Figura 4.2, a semelhana de tendncias na fala
dos informantes mais jovens se visualiza pela aproximao das curvas no
canto superior direito de cada grfico (mulheres e homens (a), mais e menos
escolarizados (b), habitantes de regies mais centrais e mais perifricas (c) e
diferentes classes sociais (d)).
Anlises multivariadas que consideram apenas os dados dos falantes entre
20 e 34 anos (excluindo-se, evidentemente, a varivel Faixa Etria) deixam
de selecionar Regio de Residncia, Sexo/Gnero, Escolaridade e Classe
Social. As trs ltimas, como mostrou o subitem anterior, esto entre as
mais relevantes para a estratificao social de (e) em So Paulo quando se

83
O encaixamento social de uma mudana de baixo

considera o conjunto total de falantes. Entre os mais jovens, fatores estilsticos


e lingusticos se sobrepem a diferenciaes sociais.
Verifica-se, portanto, que as diferenas entre mulheres e homens, entre
mais e menos escolarizados, e entre indivduos de diferentes classes sociais se
neutralizam na primeira faixa etria deste estudo. Resultados semelhantes
so reportados por Labov (2001b) a respeito de variveis fonticas no ingls
da Filadlfia, como (eyC) (made feito, eight oito) e (aw) (house casa, out
fora), em mudanas de baixo lideradas por mulheres. A Figura 4.3 trans-
posta de Labov (2001b : 304) e mostra as taxas mdias para o fronteamento
de (aw) para diferentes grupos etrios, separados por Sexo/Gnero.

Figura 4.3 Valores de fronteamento de (aw) por dcada e Sexo/Gnero no


Philadelphia Neighborhood Study (Fonte: Labov 2001b : 304)

Observe-se que a taxa de mudana entre as mulheres mais regular do


que entre os homens, o que faz da linha de regresso das primeiras (a linha
pontilhada superior, r2 = 0,961) mais previsora do que a dos segundos (r2
= 0,788) quanto ao fronteamento de (aw). Em outras palavras, o modelo
de regresso linear se aplica mais adequadamente s mulheres, de modo que
os valores previstos pelo modelo correspondem mais aproximadamente aos

84
O encaixamento social de uma mudana de baixo

valores observados nos dados. Nas palavras de Labov (2001b : 303), para as
mulheres, h [ento] pouqussima diferena entre empregar Idade como uma
varivel quantitativa e a anlise por dcada.8 Para os homens, a progresso
no tempo mais complexa, j que passam por perodos de rpida expanso
da variante (p.ex., entre os falantes de 50-59 e 40-49 anos, ou entre 20-29 e
menos de 20) e outros perodos de relativa estagnao (entre 20-29, 30-39 e
49-49 anos). Alm disso, a inclinao da curva para as mulheres (-5.38)
menor do que para os homens (-6.60), o que revela o avano de fronteamento
de (aw) entre os homens mais jovens.
Na presente anlise de (e), a reorganizao dos dados de acordo com a
dcada de nascimento do falante permite uma observao mais detalhada da
progresso de [ej] ao longo do tempo (aparente) na cidade de So Paulo.9 Na
Figura 4.4, apresentam-se as taxas de emprego da variante ditongada, divididas
por Sexo/Gnero, para datas de nascimento desde 1927 (o informante mais
velho da amostra, Eduardo K.) at 1993 (a informante mais jovem, Milena
F.). Em geral, os informantes da terceira faixa etria correspondem queles
nascidos nas dcadas de 1920, 1930 e 1940; os de segunda faixa etria queles
nascidos nas dcadas de 1950 e 1960; e os de primeira faixa etria a partir da
dcada de 1970.
Observe-se que, de modo semelhante aos dados de (aw) na Filadlfia
(Figura 4.3 mais acima), a progresso de [ej] mais regular entre as mulheres,
exceto para a ltima dcada. Alm disso, note-se que as mulheres esto
aproximadamente uma gerao frente dos homens, j que apresentam taxas
de emprego de [ej] que s so equiparadas pelos homens cerca de 30 anos
depois: esses s atingem a taxa de aproximadamente 35% de ditongao na
dcada de 1960, enquanto as mulheres j empregam a variante nessa proporo
nas dcadas de 1920-30; a taxa de 40% entre homens em 1980-90 j havia
sido ultrapassada pelas mulheres nos anos 1960.
A aproximao de tendncias entre os falantes mais jovens, neste caso,
8
Traduo prpria. Texto original: there is [then], for womens use of (aw), very little difference
between using age as a single quantitative variable and the decade-by-decade analysis.
9
O reagrupamento dos falantes a partir de sua data de nascimento, em vez de simplesmente empregar
faixas etrias mais curtas, prefervel pelo fato de as entrevistas terem sido coletadas ao longo de
cinco anos (2009 a 2013). O ano de nascimento um parmetro que se aplica objetivamente a todas
as gravaes, independentemente do ano em que foram coletadas.

85
O encaixamento social de uma mudana de baixo


60
Taxa de ditongao de /eN/


50




40


30
20
10

Feminino
Masculino
0

192030 1940 1950 1960 1970 198090

Dcada de nascimento

Figura 4.4 Taxas de [ej] de acordo com dcada de nascimento


e Sexo/Gnero dos falantes

no se deve a uma acelerao do processo por parte dos homens, como se


verificou no estudo laboviano sobre (aw) na Filadlfia, mas por uma aparente
retrao por parte das mulheres. No se deve interpretar da que a direo da
mudana esteja em vias de reverso. Labov (2001b : 454) tambm observa a
existncia de um pico entre jovens adultos e uma queda entre os falantes com
menos de 20 anos (no presente estudo, o pico est entre 20 e 30 anos), e sugere
que a mudana pode ter chegado a um limite. Ser interessante observar, nos
prximos anos e dcadas, a progresso da mudana na comunidade paulistana,
analisando tambm o comportamento de falantes mais jovens no includos
na presente amostra (adolescentes e crianas). At o momento, a mudana
tem progredido vigorosamente.
possvel traar aqui uma comparao entre o encaixamento de (e) e outros
fenmenos variveis no portugus paulistano e brasileiro, que diferem quanto
ao grau de salincia social e de estabilidade/mudana. Os prximos captulos
mostraro que as variveis (-r), (CN) e (CV) se encontram aparentemente em
variao estvel na comunidade, mas que grupos sociais distintos caminham
em diferentes direes em tempo aparente. Enquanto se observa convergncia

86
O encaixamento social de uma mudana de baixo

para (e), para as demais variveis deste estudo se observa divergncia.


A questo de movimentos divergentes numa mesma comunidade explo-
rada no modelo de fluxos e contrafluxos de Naro e Scherre (ver Naro & Scherre
1991; Scherre & Naro 2006; Naro & Scherre 2013). Os autores questionam
a suposio de que a mudana lingustica sempre se d unidirecionalmente,
e apresentam exemplos de tendncias opostas, em amostras sincrnicas e
diacrnicas, quanto aos usos da variante padro das concordncias nominal e
verbal. Afirmam Scherre & Naro (2006 : 120):

[...] o melhor modelo para dar conta da concordncia de nmero no


portugus brasileiro o modelo de fluxos e contrafluxos, que apresenta
a configurao de grupos e de indivduos transitando por diversas vias
linguisticamente bem estruturadas. Este modelo certamente se aplica
a fenmenos sujeitos a estigma, mas solidamente estruturados. (Grifo
acrescido)

O contraste que interessa enfatizar aqui est no fato de que, para a varivel
(e) em So Paulo, a grande maioria dos falantes no revela uma atitude
negativa para com a variante ditongada e tampouco desenvolve um discurso
metalingustico elaborado quanto varivel diferentemente das avaliaes
correntes sobre as concordncias de nmero e sobre a realizao de (-r) em
coda silbica. Isto sugere, em complemento proposta de Naro e Scherre
sobre fenmenos sujeitos a estigma, que variveis abaixo da conscincia social
devem revelar maior tendncia a progredir unidirecionalmente, contanto que
no venham a se associar a valores negativos. Se se difundirem na comunidade
avaliaes como as dos no paulistanos, que consideram [ej] um modo feio
ou forado de se falar (excertos (14)(16), p. 6870), ou ainda as avaliaes
de Fernando B. e de Thaissa B. ainda raras , que associam a variante a
patricinhas (excertos (10)(11), p. 6667), possvel que se altere o curso da
mudana. A proposta aqui que se lance um olhar mais atento avaliao
social que os falantes fazem das variantes, para alm das impresses do prprio
pesquisador, a fim de melhor compreender casos de variao estvel ou de
mudana em progresso em diferentes comunidades.

87
Sntese

4.4 Sntese
O presente captulo descreve o encaixamento lingustico e social de uma vari-
ante que, na comunidade paulistana, no saliente a pronncia ditongada
de (e). No obstante sua baixa salincia, observa-se a preponderncia de
fatores de natureza social em relao aos de natureza lingustica e, entre
os primeiros, a importncia das variveis Sexo/Gnero e Faixa Etria. Os
resultados de anlises quantitativas, juntamente anlise do discurso meta-
lingustico dos informantes, permite caraterizar este como um tpico caso de
mudana de baixo, liderado pelas mulheres. No entanto, observa-se tambm
que as diferenas sociais se neutralizam entre os falantes mais jovens.
Com vistas a comparar fenmenos variveis cujos graus de salincia social e
padres de encaixamento se distinguem, e com vistas a formular generalizaes
que contribuam para um modelo mais amplo da Teoria da Variao e da
Mudana, sugere-se, em complemento ao modelo de fluxos e contrafluxos de
Naro e Scherre para fenmenos lingusticos estigmatizados, que processos
de variao e mudana abaixo da conscincia dos falantes tendem a uma
progresso mais vigorosa e unidirecional. A observao da evoluo dos
padres sociolingusticos de (e) nos prximos anos em So Paulo, bem como
a anlise comparada de outras variveis e comunidades, permitiro avanar
no teste da validade dessa hiptese.

88
5
A varivel (-r)

Verificou-se, no captulo anterior, que a pronncia de (e) se encon-


tra em um vigoroso processo de mudana, abaixo da conscincia
dos falantes, na direo da variante ditongada. O presente captulo
se volta pronncia de (-r) em So Paulo, em que predominam
as variantes tepe e retroflexa. Tomando a Hiptese da Posterio-
rizao (Callou et al., 2002) como ponto de partida, investiga-se
se a realizao de (-r) tambm estaria em processo de mudana.
Constata-se, diferentemente, um caso de variao estvel quando
se considera toda a amostra, mas cruzamentos entre Faixa Etria
e variveis sociais detectam tendncias divergentes entre grupos da
comunidade. Argumenta-se que as variantes de (-r) estabelecem
uma relao mais complexa entre si do que aquela que se descreve
com os binmios padro/no padro ou estigma/prestgio, e
que as diferentes tendncias so mais bem compreendidas quando
se leva em conta o status relativo de cada variante em diferentes
grupos sociais.

5.1 A variabilidade de (-r) e a hiptese da


posteriorizao
A pronncia varivel de (-r) em coda silbica, em palavras como porta
e mulher, um dos ndices mais salientes de diferenciao dialetal no

89
A variabilidade de (-r) e a hiptese da posteriorizao

portugus brasileiro (Callou et al., 1996; Mendes, 2010) e tem sido objeto de
diversos estudos sociolingusticos, em diferentes comunidades.1 Os rticos,
com efeito, formam uma classe de sons bastante diversos, que abrangem
vibrantes mltiplas e simples, fricativas, retroflexos e realizaes voclicas
(Ladefoged & Maddieson, 1996; Lindau, 1980; van Hout & Van de Velde,
2011).
Em um estudo fontico com dados de trs lnguas indo-europeias (ingls
norte-americano, sueco e espanhol) e sete lnguas do oeste africano (haus,
degema, edo, ghotuo, calabari, bumo e izon), Lindau (1980) se prope a buscar
um correlato acstico comum a todas as variantes de /R/. A autora conclui
que no h um trao fontico nico que possa ser nomeado a essncia da
classe dos rticos, e prope que sejam mais propriamente caracterizados pelo
conceito de Wittgenstein de semelhana de famlia. Ladefoged & Maddieson
(1996 : 245), em seu captulo sobre os rticos, concluem que a unidade
global do grupo parece residir principalmente nas relaes histricas entre
os subgrupos, e na escolha da letra r para represent-los.2 E van Hout
& Van de Velde (2011), em introduo a um volume que rene trabalhos
apresentados no primeiro encontro do r-atics (Nijmegen, Holanda, maio de
2000),3 explicam que o ttulo do livro e do encontro se refere natureza
camalenica de /R/, que tem mltiplas variantes e frequentemente se envolve
em padres de variao e mudana.
Desse modo, a principal caracterstica dos rticos que tendem a alternar
entre si. No causa surpresa, portanto, que a varivel j tenha sido objeto de
estudos sociolingusticos vrios, tanto no portugus quanto em outras lnguas.4
Muitos desses estudos apontam para uma tendncia de posteriorizao ou
enfraquecimento do /R/. Trudgill (1974, apud van Hout & Van de Velde
1
Ver, por exemplo, Brescancini & Monaretto (2008) para os estados do Sul do Brasil; Brando (2009)
e Callou et al. (1998) para o estado e a cidade do Rio de Janeiro; Leite (2004, 2010) e Guiotti (2002)
para o interior do estado de So Paulo; Oliveira (1983) para Belo Horizonte-MG; Oliveira (1999) para
Salvador-BA; Rezende (2013) para o estado de Gois; Dorneles & Cerqueira (2011) para Rio Branco-
AC; Skeete (1997) para Joo Pessoa-PB, inter alia.
2
Traduo prpria. Texto original: the overall unity of the group seems to rest mostly on the historical
connections between these subgroups, and on the choice of the letter /r/ to represent them all.
3
Em 2013, o encontro teve sua quarta edio em Grenoble, na Frana.
4
O volume organizado por van Hout & Van de Velde (2011) abriga trabalhos sobre lnguas escandinavas,
o holands, o ingls britnico, o alemo, o francs belga e o francs de Montreal. Nagy & Irwin (2010),
em seu estudo variacionista sobre o apagamento de /r/ em Boston e vizinhanas, listam estudos em
nove outras comunidades da Amrica do Norte.

90
A variabilidade de (-r) e a hiptese da posteriorizao

2011), por exemplo, mapeia a difuso do /R/ uvular na Europa Ocidental,


em contraste com a vibrante mltipla [r]. De modo semelhante, Sankoff &
Blondeau (2007) reportam a mudana, em tempo real, das variantes apicais [r,
R] para as realizaes com o trao [-anterior] (fricativa velar [x, G] ou vibrante
uvular [R]) no francs de Montreal.
No entanto, h contraexemplos no ingls norte-americano para uma su-
posta unidirecionalidade de enfraquecimento de /r/ at seu apagamento.
Labov (2006 [1966]), em seu estudo sobre o apagamento/vocalizao vs. a
realizao de (-r) em Nova Iorque (em sua terminologia, R-0 e R-1, respec-
tivamente), havia sinalizado uma lenta mudana na comunidade na direo
da forma de prestgio R-1, tendncia que tem se mantido segundo estudos
mais recentes (Labov, 1994; Becker, 2009). A restaurao do (-r) tambm
tem ocorrido em outras localidades do nordeste norte-americano (Nagy &
Irwin, 2010), e de forma bastante vigorosa nos estados do sul (Labov et al.,
2006 : 4647).
No portugus brasileiro, a hiptese de posteriorizao de /-r/ em coda
silbica defendida por Callou et al. (1996, 2002):

[...] a norma da pronncia do /r/ aponta para um processo de pos-


teriorizao, de enfraquecimento de anterior para posterior (velar ou
farngeo), com eventual mudana de modo de articulao de vibrante
para fricativa, em posio medial, chegando at a se cancelar, em
posio final. (Callou et al. 1996 : 487.)

Tal observao feita a partir de um levantamento das realizaes de


(-r) nas cinco capitais documentadas pelo Projeto NURC (Recife, Salvador,
Rio de Janeiro, So Paulo e Porto Alegre), em que os autores registram sete
variantes: vibrante apical mltipla [r], vibrante uvular [R], fricativa velar [x G],
fricativa larngea/aspirada [h H], vibrante apical simples/tepe [R], aproximante
retroflexa [] e zero fontico. Com base principalmente nas taxas de emprego
dessas variantes, Callou et al. (1996) identificam duas zonas dialetais no pas,
uma em que predominam as variantes com o trao [+anterior] [r R] (Porto
Alegre e So Paulo) e outra em que so mais frequentes as variantes [-anterior]
[R x G h H] e o apagamento (Rio de Janeiro, Salvador e Recife).

91
A variabilidade de (-r) e a hiptese da posteriorizao

Em vista de outros processos de posteriorizao e enfraquecimento de


segmentos consonantais em coda silbica no portugus brasileiro a saber, a
palatalizao e aspirao de /-s/ (S h) e a vocalizao de /-l/ ( w) ,
Callou et al. (2002 : 544) postulam a seguinte trajetria para a realizao de
(-r) no portugus brasileiro: r R x h . Note-se, contudo, que esse
percurso no contm a variante retroflexa. Rennicke (2011), alternativamente,
prope que h duas trajetrias paralelas no portugus: a primeira, idntica
de Callou et al. (2002), seria um processo de velarizao; a segunda, de
retroflexo (r R ). Em qualquer dos dois casos, o portugus
paulistano, se em processo de mudana, estaria em fases intermedirias.
Diversos estudos em diferentes comunidades brasileiras parecem ir ao
encontro da hiptese de posteriorizao/enfraquecimento de (-r). Para citar
apenas trs exemplos, comparem-se resultados obtidos em Joo Pessoa-PB,
em cidades do interior fluminense e nos estados do sul. Na primeira locali-
dade, Skeete (1997) contrastou as realizaes fricativas (velar e glotal) com as
variantes com o trao [+anterior] (tepe, retroflexo e vocalizao), e verificou
que as ltimas so favorecidas pelos homens, analfabetos e mais velhos. Em
comunidades do norte e do noroeste do estado do Rio de Janeiro, Brando
(2009) verificou que as variantes [+anterior] (vibrante alveolar, tepe e retro-
flexo), em contraste com as fricativas e o apagamento, so favorecidas pelos
falantes mais velhos, de segunda e terceira faixas etrias; em uma anlise
que contrape a pronncia retroflexa ao conjunto tepe/vibrante alveolar, o
retroflexo favorecido pelos falantes mais jovens. Com dados do VARSUL,
Monaretto (1997) tambm indica o favorecimento do retroflexo em relao
ao tepe pelos falantes mais jovens da amostra. Em cada um desses casos, os
mais jovens tendem a favorecer as variantes mais posteriores dentre aquelas
disponveis na respectiva comunidade.
Especificamente para So Paulo, o levantamento de Callou et al. (1996,
2002) nos dados do NURC revela o predomnio do tepe em contexto medial
(87%), e do tepe e do apagamento em contexto final (41% e 49%), conforme a
Tabela 5.1. As taxas observadas para a variante retroflexa na fala de falantes
cultos, na dcada de 1970, foram bastante baixas: 5% em meio de palavra
e 2% em contexto final. Em contexto medial, a anlise da perspectiva de

92
A variabilidade de (-r) e a hiptese da posteriorizao

Tabela 5.1 Taxas das variantes de (-r) entre paulistanos cultos na dcada de
1970, de acordo com Posio da Slaba no vocbulo
(Fonte: Callou et al. 1996 : 467468)

Medial Final
apagamento 2% 49%
aspirao 0% 0%
fricativa velar 2% 0%
vibrante uvular 1% 1%
retroflexo 5% 2%
tepe 87% 41%
vibrante alveolar 3% 7%

emprego do tepe (vs. todas as outras realizaes) indicou favorecimento da


variante pelos falantes do sexo masculino e de segunda faixa etria, em padro
de variao estvel.5
Anlises mais recentes sobre a realizao de (-r) como tepe ou retroflexo
em So Paulo (Mendes, 2010; Mendes & Oushiro, 2011b) apontaram para
o favorecimento da variante retroflexa por falantes do sexo masculino e
menos escolarizados. Contudo, tais anlises tambm apresentaram resultados
dspares quanto distribuio de (-r) e quanto a certos condicionamentos.
Em uma amostra com 24 falantes paulistanos prototpicos entenda-se,
falantes que residem em bairros mais centrais e que se identificam com noes
de paulistanidade e cosmopolitismo , estratificados de acordo com seu
sexo/gnero, trs faixas etrias e dois nveis de escolaridade, Mendes (2010)
observou uma taxa mdia de emprego de 12% de retroflexo e um indcio de
mudana em tempo aparente em favor do tepe. Mendes & Oushiro (2011b),
na anlise de uma amostra com 48 informantes, estratificados de modo
semelhante, constataram, diferentemente, uma taxa de 31% de retroflexo e
um indicativo de variao estvel na comunidade.
Desse modo, o objetivo aqui o de buscar maiores evidncias para a
estabilidade ou no da pronncia de (-r) em um corpus mais abrangente.
5
Para os dados de (-r) final, a anlise de Callou et al. (1996) foi realizada sob a perspectiva do apagamento
vs. realizao. Nessa anlise, tambm se observou um padro de variao estvel, e favorecimento do
apagamento entre as mulheres.

93
Avaliaes sobre o tepe e o retroflexo

Entretanto, a compreenso dos movimentos que se vislumbram na comunidade,


conforme se reportam nos itens 5.3 e 5.4 adiante, deve antes passar por um
exame das avaliaes dos paulistanos sobre as variantes.

5.2 Avaliaes sobre o tepe e o retroflexo


A salincia das variantes de (-r) constitui verdadeiro shiboleth 6 que identifica
a origem dos falantes no portugus brasileiro. A cidade de So Paulo, mais do
que qualquer outra no pas, aquela em que possivelmente todas as variantes
de (-r) esto em contato.
No roteiro de entrevista sociolingustica, aps a leitura da lista de palavras,
o documentador perguntava ao informante como um carioca e uma pessoa do
interior do estado falariam algumas delas (ver Anexo A, Roteiro, p. 358359).
Como o informante tem a possibilidade de escolher os itens lexicais, assume-se
que a prpria seleo por parte do falante revela os traos fontico-fonolgicos
mais salientes para a diferenciao dialetal. A pergunta sobre o portugus
carioca foi feita para 63 informantes, e a pergunta a respeito dos interioranos
foi feita para 61. A Figura 5.1 mostra os itens lexicais mencionados mais
frequentemente (por pelo menos cinco falantes diferentes) para ambas as
variedades.
certo que existe uma preferncia pelas primeiras palavras da lista,
organizada em ordem alfabtica: alma, amargo, argola, barqueiro, biscoito,
carteiro... No entanto, interessa tambm notar que algumas das palavras no
topo da lista no se encontram entre as mais frequentemente eleitas pelos
falantes: animao, atitude, cacique, chcara. No se trata, portanto, de
uma seleo que se baseia simplesmente na ordem em que as palavras foram
apresentadas; os falantes buscam, ativamente, aquelas que contm os traos
lingusticos mais salientes que os diferenciam de um outro geogrfico.
Em relao aos cariocas, as palavras mais frequentemente citadas so
aquelas que contm (-r) e/ou (-s) em coda silbica: biscoito (19), amargo (17),
argola (15), barqueiro (14). Dos 63 informantes, 22 mencionam explicitamente
6
Palavra hebraica que, segundo o Velho Testamento (Juzes 12: 115), era utilizada pelos soldados de
Jeft para identificar os efraimitas, que a articulavam como siboleth.

94
Avaliaes sobre o tepe e o retroflexo

Figura 5.1 Palavras mais frequentemente mencionadas pelos informantes para


diferenciao entre o portugus paulistano e o portugus de cariocas/interioranos

o (-r) aspirado, e 16 o (-s) chiante:7

(1) D1: e um carioca assim?... a senhora sabe?


S1: ah eh... eh... amargo [5maRgU] ... argola [axgOl5] ... barqueiro
[baxkejRU] ... biscoito [biSkojtU] ... eh erguer [exgex] ...
D1: ah entendi
S1: por a o erre forado n? (Ethel M., F3SP)

(2) D1: e um/ um carioca falaria como?


S1: [...] justia [ZuSis5] ... justia [ZuSi@ s5] (pode) colocar uns quinze
esses aqui n pra falar... n... amargo [5mahgU] ... amargo [5mahgU]
... argola [5hgOl5] ... barqueiro [bahkejRU] o erre e o esse so marcas
assim do carioca n... (William A., M2SP)

(3) D1: e... o carioca?... como que o carioca falaria a?


S1: ah o... a gente/ eh a gente o contrrio n? a gente gosta do do erre
e ignora o esse
D1:
S1: o carioca gosta do esse e ignora o erre n
D1: aham
S1: eu curto [R] ele fala (o paulista/) o carioca fala eu curto [ewkutU]
7
Outros comentrios metalingusticos incluem o alongamento de vogais, o falar arrastado e o vocbulo
mesmo, pronunciado com a aspirao de /-s/.

95
Avaliaes sobre o tepe e o retroflexo

... eu curto [ewku:tU]


D1: aham
S1: nem deu o erre n
D1: aham
S1: essa cerca a essa cerca [Es5"sekai Es5"sek5]
D1: aham [risos]
S1: [risos] vamos pro circo [vampU"si5 kU] [...] em compensao o esse n?
D1: o esse... como que... ficaria uma/ alguma palavra dessa a?
S1: deixa eu ver (vai) discoteca [iSkotEk5] cisne [SiSnI] ... cisne
[SiSnI] ... [risos] biscoito [biSkojtU] [risos] (Fabio S., M1SP)

Para identificar interioranos, as palavras com (-s) (biscoito, discoteca,


ostracismo, fusquinha etc.) no so mencionadas na mesma frequncia. Em
lugar delas, apresentam-se quase que invariavelmente aquelas com (-r): amargo
(18), argola (17), curto (13), mortadela marba (12), barqueiro (10).8

(4) D1: e algum do interior voc saberia me dar um exemplo? assim...


algum...
S1: ah tem (ixe) eu acho que em Ribeiro Preto no ?... Campinas
(falaria) gordo [godU] ... falaria gordo [godU] falaria... carteiro
[katejRU] ... curto [kutU] ... puxaria o erre eu acho n... (Fernanda T.,
F1SC)

(5) D1: e... e no interior de So Paulo como que falaria?


S1: no/ no interior [] ... ordem e progresso [OdipogREsU]
D1: [risos]
S1: perto [pEtU] ... olha o porto a [OLupotai] ... entretenimento
[etetenimetU] eh d/ d uns erre diferente a (Daniel C., M1MP)

Alm dessas, o vocbulo alma tambm mencionado em relao ao rota-


cismo:

(6) D1: voc acha que... eh como que voc acha que uma pessoa do interior...
falaria alguma dessas palavras a?
S1: alma fala arma [am5] ... arma [am5]
D1: arma [risos]
S1: tudo com erre...
D1: ahn
S1: ... bem assim... eles colocam muito erre no... na onde no sabe?
8
Tambm se mencionam, com menor frequncia, a marca zero de concordncia, o no alamento de /e/
ps-tnico, a simplificao de cluster consonantal (zeba para zebra), e os itens uai e oc.

96
Avaliaes sobre o tepe e o retroflexo

D1: uhum
S1: onde tem o ele assim... e assim acho que isso mesmo... (Samanta V.,
F1MP)

Em todas essas realizaes de (-r), empregou-se o retroflexo, chamado por


linguistas e leigos de r caipira (Amaral, 1920; Silva Neto, 1960; Head, 1987;
Leite, 2004; Brando, 2007; Rennicke, 2011). A maior parte dos trabalhos
sobre a variante faz referncia sua estigmatizao. Em um estudo sobre
atitudes lingusticas entre falantes oriundos de So Jos do Rio Preto (interior
de So Paulo), todos estudantes da Universidade Estadual de Campinas, Leite
(2004) mostra que h maior frequncia de emprego do retroflexo entre os alunos
ingressantes, e aumento relativo de realizaes voclicas e da aproximante
alveolar entre os concluintes. De acordo com a autora, os prprios informantes
mencionam ter sido alvos de provocaes por parte de colegas em razo da
pronncia retroflexa de (-r), avaliam-na negativamente como feia, puxada,
carregada, e sinalizam um desejo de alterar sua pronncia para se aproximar
de um padro campineiro que seria intermedirio e ideal. Em sua tese
de doutorado, contudo, Leite (2010) contraria a hiptese de que a pronncia
campineira seria menos retroflexa em comparao com a de outras cidades do
interior.
Vale lembrar as j conhecidas palavras de Amadeu Amaral sobre a in-
fluncia do dialeto caipira no falar da minoria culta da capital da provncia,
que, poca do Imprio, trouxe resistncias criao de cursos de Direito em
So Paulo por receio de contaminar o linguajar dos futuros bacharis: Foi
o que criou aos paulistas, h j bastante tempo, a fama de corromperem o
vernculo com muitos e feios vcios de linguagem (Amaral, 1920 : 1). Antes
de constituir uma inovao recente no portugus paulistano, a melhor leitura
a de permanncia: o retroflexo, nesse interldio de pouco mais de um sculo,
provavelmente nunca deixou de existir na cidade.
De fato, uma srie de estudos atesta a vitalidade da variante retroflexa e
sua ampla extenso territorial, que no se restringe ao interior de So Paulo e
arredores (Brando, 2007). A presente pesquisa tambm testemunha a forte
presena da variante na cidade de So Paulo, na fala de seus nativos. Alm
de seu encaixamento social e lingustico, discutido adiante, interessa saber

97
Avaliaes sobre o tepe e o retroflexo

qual a avaliao que os habitantes da cidade dela fazem.


A sentena-alvo a porta t aberta, em que os segmentos de (-r) deveriam
ser pronunciados como retroflexo, foi apresentada a 28 informantes da amostra.
Diferentemente do que ocorreu com [ej], foram poucos os paulistanos que
no comentaram especificamente a realizao de (-r). Com base em suas
avaliaes, criou-se a nuvem de palavras da Figura 5.2. Nela, claramente
salta aos olhos a principal noo associada ao retroflexo: interior. A mesma
associao geogrfica aparece em outras conceitualizaes mais especficas:
interior de So Paulo, So Bernardo, Campinas, Sorocaba, mineiro.

Figura 5.2 Nuvem de palavras associadas sentena a porta t aberta,


realizada com /r/ retroflexo

(7) D1: e o que que a senhora acha de a porta [] est aberta? []


S1: eh isso a um sotaque nosso caipira n?... que a gente... porque a/
aqui So Paulo a gente tem... muita mistura mais com o italiano n?... ah
a fora do italiano... ento a gente tem bastante... ahn... essa influncia...
agora esse a bem o o... o interior de So Paulo n?
D1: uhum e a senhora fala assim?
S1: no porque jus/ a gente no... no tinha... parentes... no interior (Iara
M., F3SP)

(8) D1: e quem fala assim... a porta [] (es)t aberta? []


S1: ento porta [] interior n mas a que est tem/ tem interior...
mais acho que interior de So Paulo e de Minas n mineirinho... que fala
tambm assim n (Jos N., M2SP)

98
Avaliaes sobre o tepe e o retroflexo

(9) D1: e a porta [] (es)t aberta? []


S1: ah no vejo problema nenhum
D1: ? e quem que fala assim?
S1: interior com certeza (Renata C., F2MC)

Os paulistanos, de modo geral, no se reconhecem na articulao retroflexa.


Isso talvez se deva ao modo como foi apresentada a sentena-alvo, de maneira
exagerada ou seja, pode ter sido decorrncia do prprio desenho do roteiro de
entrevistas. No entanto, dada a ampla presena de migrantes em So Paulo,
a eventual ocorrncia de retroflexos na cidade tambm frequentemente
atribuda a eles:

(10) D1: e... as pessoas que falam... ahn a porta [] est aberta? []
S1: isso parece um sotaque interiorano de gente que veio do interior...
como So Paulo um polo de atrao de gente de tudo quanto canto...
todos os sotaques voc capaz de ouvir aqui (Romulo S., M3MC)

(11) D1: e que que voc acha da porta [] (es)t aberta? []


S1: [risos] ah vem do interior
D1:
S1: leite quente faz mal pros dente
D1: [risos] e voc acha que em So Paulo algum fala assim?
S1: no t/ t/ tem poucas pessoas que que que vieram do interior que vieram
de determinada regio... que... tem talvez... que falam sim... claro...
que que So Paulo... tem muito.... eh uma... como que mesmo eh...
tsc... uma variedade de culturas de de de religies de... tudo se encontra
em So Paulo n voc encontra... gente de tudo que parte desse planeta
voc encontra aqui... (ento) um negcio bem misturado (Mauricio B.,
M2MC)

A caracterizao de So Paulo como um lugar de mistura (ver Captulo


1, p. 8) tambm permite o no reconhecimento do retroflexo como uma das
variantes de seus falantes nativos. Para muitos sobretudo residentes de
bairros mais centrais , quando se ouve o retroflexo em So Paulo, porque
se est diante de um migrante. H apenas alguns poucos paulistanos que no
diferenciam a variante drasticamente em relao ao tepe ou que reconhecem
empreg-la.

(12) D1: e a porta [] (es)t aberta? []

99
Avaliaes sobre o tepe e o retroflexo

S1: a eu acho que um paulistano com pezinho no interior assim


D1: com pezinho no interior
S1: ... que nem eu s vezes solto isso a porta [] (es)t aberta [] eu
falo muito (assim) (Tatiana M., F1SP)

(13) S1: eu puxo bastante... a porta [] (es)t aberta [vocalizado] [risos]


... a minha lngua at trava... mas depende da pessoa... tem pessoas que
falam direitinho e no puxa nada ento... acho que vai... de paulistano
pra paulistano n?
D1: ah entendi... voc fala de qual jeito?
S1: eu falo a porta [] est aberta [] [risos]
D1: mas voc acha que por exemplo a porta [] (es)t aberta [] tpico
de So Paulo?
S1: eu acho que... ... eu acho que sim... porque tem muitas raa
junto n?... o paulistano s tem vrios... ento acaba surgindo um sotaque
diferente do outro (Milena F., F1MC)

Em (14) abaixo, a documentadora apresenta a sentena-alvo com o tepe,


mas ela repetida pelo informante com uma aproximante alveolar; o (-r) do
interior, por sua vez, realizado com uma aproximante retroflexa. Segundo
Lucas S., a diferena entre o (-r) do interior e o da capital uma questo de
grau de retroflexo.

(14) D1: e do eh a porta [R] (es)t aberta [R]


S1: a porta [] (es)t aberta [] ... ento isso que aquela coisa como/
como em So Paulo tem muita/... muita gente de todo lugar vem pra
c... So Paulo mesmo eu acho que ele foi construdo a maior parte dos
interiores que vm ento essa coisa do interior de falar porta []
D1: uhum
S1: a gente tem s que diminuiu ento ficou porta [] (Lucas S., M1MC)

A sentena-alvo a porta t aberta foi apresentada com a articulao tepe


para 55 informantes. De seus comentrios metalingusticos, criou-se a nuvem
de palavras na Figura 5.3. Em contraste com a pronncia retroflexa, a
associao mais frequente, nesse caso, com paulistanos.

(15) D1: eh e a porta [R] (es)t aberta? [R]


S1: So Paulo
D1: voc fala assim?
S1: a porta [R] (es)t aberta [R] ... falo (Renata C., F2MC)

100
Avaliaes sobre o tepe e o retroflexo

Figura 5.3 Nuvem de palavras associadas sentena a porta t aberta,


realizada com /r/ tepe

Todavia, notem-se outros dois tipos de comentrios bastante frequentes


para essa sentena-alvo: aqueles sobre o verbo estar e os que a caracterizam
como um modo normal de se falar. Este ltimo pode ser entendido de
duas maneiras: como a norma local, portanto, forma prototpica paulistana,
ou como nada de diferente que valha comentrio. Essas acepes so
exemplificadas nos exemplos (16) e (17). No entanto, elas no so diferenciadas
na nuvem de palavras pois a distino nem sempre clara, e parecem decorrer
uma da outra.

(16) D1: e... o que voc acha desse jeito de falar a porta [r] (es)t aberta?
[r]
S1: a porta [R] (es)t aberta?... [R] o tpico paulistano falando... normal
(Sonia L., F1SC)

(17) D1: e quando falam assim a porta [R] (es)t aberta? [R]
S1: a porta [R] (es)t aberta? [r]
D1: o que voc acha desse modo de falar?
S1: a porta [R] (es)t aberta [R] o... o que que eu posso te dizer disso?
D1: voc no achou nada?
S1: no acho nada porque o/ acho que o normal... ou voc fala a
porta [R] (es)t aberta [R] ... um jeito de voc estar falando como que a
porta est ou voc podia falar essa porta estava fechada n? ento... que
mais? (Jandira F., F2MC)

101
Avaliaes sobre o tepe e o retroflexo

No caso de estar, trata-se de metacomentrios sobre a reduo do verbo:

(18) D1: e o que voc acha de... a porta [R] (es)t aberta [R]
S1: errado... ns falamos... ah a porta (es)t aberta mas errado
isso que eu te falo voc come palavra
D1: como seria o certo?
S1: eu acho que seria a porta est aberta [verbo estar pleno] ... certo?...
mas a gente eh eh/ acho que a pressa... n? (Angelica L., F3MP)

(19) D1: e a porta [R] (es)t aberta? [R]


S1: (es)t ok mas ainda (es)t bem popular n?... porque o certo seria a
porta est aberta [verbo estar pleno]
D1: uhum
S1: mas a gente fa/ popularmente falando pode (Madalena M., F2SP)

(20) D1: e falar a porta [R] (es)t aberta [R] que que voc acha?
S1: ah isso difcil voc ver falar a porta (es)t aberta no t t
... (es)t cheio n... o t e o n [...] agora tem uns que j (es)to
querendo mudar em vez de falar n fala no ... n ento pelo menos
deixar de fazer a contrao... n e (es)to verbalizando as duas palavras...
no mas (es)t acontecendo (William A., M2SP)

Neste ponto, importante lembrar que as sentenas foram deliberadamente


construdas de modo a no enfocar diretamente os fenmenos lingusticos sob
anlise, e que desvios desse foco tambm do pistas da salincia social das
variantes. Ora, os frequentes comentrios sobre o verbo estar, em vez do
tepe, indicam que no h o que se falar sobre o (-r) nesses casos. Assim como
na ausncia de comentrios metalingusticos sobre o [ej], o silncio de alguns
informantes sobre o tepe revelador.
O que da se depreende que a relao entre o retroflexo e o tepe e entre
pares de variantes sociolingusticas, em geral no simtrica e, portanto,
no necessariamente forma um par de oposio como padro/no padro,
prestgio/estigma. No se questiona aqui a validade desses conceitos,9 mas
sim se aponta para uma armadilha criada pelos prprios artifcios analticos
empregados pelos sociolinguistas nas anlises de correlao binomiais, que
por vezes mascaram relaes mais complexas. O presente estudo, de fato,
no se esquiva desse artifcio (tepe vs. retroflexo, [e] vs. [ej], marcao
9
Para uma crtica dos conceitos padro/no padro/prestgio/estigma, ver Coupland (2007 : 4247).

102
Anlise multivariada

zero ou explcita de nmero...).10 A questo aqui a relao entre teoria e


mtodo, que no deve ser invertida: a primeira deve guiar a segunda, e no o
contrrio. Em outras palavras, a anlise binominal no deve dar a iluso de
que o valor social das variantes se estabelece apenas entre si. Desse modo, na
interpretao dos resultados, parece mais til no pensar em termos binrios,
mas sim considerar uma determinada variante como default, no marcada, a
partir da qual mltiplas outras variantes estabelecem outros lingusticos.
No caso do (-r), com suas vrias realizaes, isso se torna patente.

5.3 Anlise multivariada


As ocorrncias de (-r) nesta amostra (N = 68.764) foram codificadas de
acordo com as variantes na Tabela 5.2, que tambm apresenta suas respectivas
propores.

Tabela 5.2 Distribuio geral das ocorrncias de (-r) na amostra (N = 68.764)

Codificao %
tepe/trill 29,2
aproximante retroflexa/alveolar 14,1
fricativa (velar ou glotal) 0,4
apagamento 56,3

Ocorrncias de palavras estrangeiras (p.ex., Big Brother, outdoor, over,


Museu dOrsay), em sua maioria inglesas, foram codificadas separadamente e
posteriormente descartadas, uma vez que difcil determinar se o eventual
emprego de retroflexo se deve a uma breve alternncia de cdigos. De modo
semelhante, foram retiradas do arquivo de dados ocorrncias metalingusticas,
em que o falante exemplifica diferentes modos de falar (p.ex., carioca fala
po[x]ta). Tambm foram excludos os casos de (-r) em final de palavra
seguidos de vogal (p.ex., por exemplo, por isso, contar uma estria etc.), j
10
Ao mesmo tempo, importante lembrar que nem todos os trabalhos variacionistas analisam variveis
binomiais. Labov (2008 [1963]), por exemplo, em seu estudo pioneiro em Marthas Vineyard, diferencia
inicialmente seis graus de centralizao de (ay) entre um ncleo mais aberto [a] e um mais centralizado
[@].

103
Anlise multivariada

que no mais se caracterizam como em contexto de coda silbica, mas sim de


/r/ pr-voclico.
O apagamento de (-r) representa a maior parte dos dados (56,3%) e se
refere principalmente a ocorrncias do morfema de infinitivo (p.ex., falar,
comer).11 Por sua vez, as variantes fricativas de (-r) (velar ou glotal, surda
ou sonora), embora presentes na fala de paulistanos nativos, so pouqussimo
expressivas (0,4%) e podem ser consideradas bastante marginais. Esta anlise
se debrua, ento, sobre os dados de tepe e de retroflexo em coda silbica, tanto
em contexto medial (p.ex., porta) quanto final (p.ex., mulher), que parecem ser
as variantes paulistanas mais salientes para indexao de identidades sociais.
Consideram-se tepe tanto a vibrante mltipla [r] quanto a vibrante simples
[R], e retroflexo tanto a aproximante alveolar [] quanto a aproximante
retroflexa [], indistintamente.
Da amostragem de 50 dados por falante (ver Captulo 3, p. 53), acrescida
dos dados de leituras (lista de palavras, notcia de jornal e depoimento),
obtm-se a seguinte distribuio dos dados:

Tabela 5.3 Distribuio geral de tepes e retroflexos nos dados analisados

Retroflexo % Tepe % Total


conversao 1.882 31,9 4.018 68,1 5.900
depoimento 217 29,0 532 71,0 749
jornal 238 40,2 354 59,8 592
lista de palavras 274 13,8 1.711 86,2 1.985
Total 2.611 28,3 6.615 71,7 9.226

Alm de Falante (efeito aleatrio), Estilo e as variveis sociais descritas no


Captulo 3, p. 59 (Sexo/Gnero, Faixa Etria/Idade, Nvel de Escolaridade,
Regio de Residncia, Classe Social/ndice Socioeconmico, Origem dos Pais
e Mobilidade), a anlise multivariada examinou correlaes com as variveis
lingusticas do Quadro 5.1.
11
O apagamento de (-r) no tratado aqui. Ver Oushiro & Mendes (2014) para uma anlise dessa varivel
em So Paulo. Enquanto o apagamento de (-r) em verbos no infinitivo parece ser uma pronncia
no marcada na comunidade, seu apagamento em substantivos (p.ex., aca(r), mulhe(r)) parece ser
socialmente estigmatizado. Ao mesmo tempo, a realizao do morfema (-r) em verbos no infinitivo,
embora infrequente, tambm portadora de significados sociais.

104
Anlise multivariada

Contexto Fnico Precedente [a, e, E, i, o, O, u]


Contexto Fnico Seguinte [b, d, g, p, t, k, , S, Z, , f, v, s, z,
l, m, n, h] ou pausa
Tonicidade da Slaba tnica: porta
tona: porto
Posio da Slaba medial: ergue
final: mulher
Classe Morfolgica substantivo: irmo, liberdade
adjetivo: perto, vermelha
advrbio: melhor, normalmente
verbo-raiz: conversar, perde
morfema de infinitivo: conversar
conjuno/preposio/marcador conversacio-
nal: porque, por causa, certo
Item lexical (efeito aleatrio)

Quadro 5.1 Variveis lingusticas da anlise de (-r)

De modo semelhante anlise de (e), Contexto Fnico Precedente e


Contexto Fnico Seguinte foram inicialmente codificadas de modo detalhado
e posteriormente analisadas em subclasses de segmentos: pelos traos [
alto] e [ anterior] para a vogal precedente, e por Ponto de C (Clements &
Hume, 1995), [ sonoro] e [ contnuo] para contexto seguinte. Essas variveis
analisam possveis processos de assimilao com a aproximante retroflexa, que,
em relao ao tepe, um segmento [-alto], [-anterior], [+sonoro] e [+contnuo].
Quanto a Ponto de C, ambas so [+coronal]. Tonicidade e Posio da Slaba
tambm investigam condicionamentos fonolgicos para a articulao de (-r),
e Classe da Palavra analisa a influncia da morfologia. Se se trata de um
processo de enfraquecimento (Callou et al., 1996, 2002), pode-se esperar que
o retroflexo seja favorecido em slabas tonas, em posio final e em palavras
mais gramaticais (conjunes, preposies e marcadores conversacionais).
Dentre essas variveis, no so selecionadas como relevantes para a variao
de (-r) o Contexto Fnico Precedente definido pelo trao [anterior] e o
Contexto Fnico Seguinte de acordo com o trao [contnuo] (Tabela 5.4).
A Tabela 5.5 apresenta os resultados das variveis lingusticas includas na

105
Anlise multivariada

Tabela 5.4 Variveis lingusticas no correlacionadas com (-r)


(N = 9.226; [] = 28,3%)

P.R. % [] N-Total
Contexto Fnico Precedente [ anterior]a
[+anterior] [0.51] 30,6 3.469
[anterior] [0.50] 26,9 5.757
Contexto Fnico Seguinte [ contnuo]b
[+contnuo] [0.49] 30,0 2.829
[contnuo] [0.51] 27,5 6.397
a Input: 0,222. b Input: 0,223. [ ] indicam a no seleo da varivel como significativa.

mesma anlise multivariada, de acordo com a ordem em que foram selecionadas


pelo Rbrul. Quanto ao Contexto Fnico, a pronncia retroflexa favorecida
quando o (-r) precedido por vogal [-alta] (P.R. 0.63) e seguido de consoante
[+coronal] (P.R. 0.55), o que aponta para uma forte tendncia assimilao
com a vogal que precede (-r) e, em menor medida, com a consoante seguinte.
interessante notar a correlao com consoantes [+coronal], no esperada,
visto que o tepe tambm compartilha esse trao. O trao de sonoridade
tambm relevante, com favorecimento do retroflexo quando seguido de
consoantes com o trao [+sonoro] (P.R. 0.56; ver Tabela 5.6 adiante).
A varivel Classe da Palavra foi reorganizada em trs fatores: verbo (raiz)
+ advrbios, substantivos + adjetivos, e conjuno/preposio + verbo (mor-
fema de infinitivo) (X2 = 5,84(3), p > 0,10). O retroflexo mais favorecido
em palavras menos gramaticais (verbos/advrbios: P.R. 0.66; substanti-
vos/adjetivos: P.R. 0.49) em relao a palavras mais gramaticais e o morfema
de infinitivo (P.R. 0.43), bem como em slabas tnicas (P.R. 0.55) em relao
a tonas (P.R. 0.46).
Esses resultados sinalizam que necessrio diferenciar os processos de
posteriorizao e de enfraquecimento. Como visto na seo 5.1, Callou et al.
(1996, 2002) entendem que a varivel (-r) no portugus brasileiro estaria
sofrendo ambos os processos simultaneamente. Contudo, ainda que [] seja
um segmento [-anterior] do que [R], o fato de ser favorecido em segmentos
que tendem a ter proeminncia prosdica na sentena (slabas tnicas e

106
Anlise multivariada

Tabela 5.5 Tendncias de emprego de [] de acordo com variveis lingusticas (1)


(N = 9.226; [] = 28,3%)

P.R. % [] N-Total
Contexto Fnico Precedente [ alto]
[-alto] 0.63 37,9 3.466
[+alto] 0.42 22,6 5.760
Range 21
Classe da Palavraa
verbo (raiz) + advrbio 0.66 39,5 1.119
substantivo + adjetivo 0.49 29,4 6.356
conjuno/preposio + morfema de infinitivo 0.43 17,2 1.751
Range 23
Tonicidade da Slaba
tnica 0.55 34,0 4.591
tona 0.46 22,6 4.635
Range 9
Contexto Fnico Seguinte (Ponto de C)
[+coronal] 0.55 34,6 4.832
[-coronal] 0.44 21,3 4.394
Range 11
Posio da slaba
final 0.60 36,5 1.843
medial 0.48 26,3 7.383
Range 12
Input: 0,203. a X2 = 5,84(3), p > 0,10

palavras menos gramaticais, sobretudo verbos) indica que se trata antes de


um processo de fortio do que de lenio ou seja, no portugus paulistano
no se verifica enfraquecimento, apenas posteriorizao. Desse modo, parece
ser mais adequada a proposta de Rennicke (2011) de diferenciao entre os
processos de velarizao e de retroflexo para caracterizar as alternncias de
(-r) nos dialetos do portugus. No portugus de So Paulo, ocorre o segundo,
e no o primeiro.
A variante tambm favorecida quando est na posio final da palavra
(P.R. 0.60), resultado previsto pela hiptese de enfraquecimento. Contudo,
nesse caso, (-r) se comporta de modo semelhante ao apagamento (ver Callou
et al. 1996; Oliveira 1999), de modo que tal tendncia pode ser explicada pela

107
Anlise multivariada

Tabela 5.6 Tendncias de emprego de [] de acordo com variveis lingusticas (2)


(N = 9.226; [] = 28,3%)

P.R. % [] N-Total
Contexto Fnico Seguinte (sonoridade)
[+sonoro] 0.56 30,7 4.148
[-sonoro] 0.45 26,3 5.078
Range 11
Input: 0,205.

trajetria de retroflexo [r R ].
Similarmente anlise de (e) do captulo anterior, as variveis externas
so aquelas que, em geral, apresentam correlaes mais fortes do que as
variveis lingusticas. Para as variveis sociais, realizaram-se amalgamaes
em Mobilidade (2 = 0,004(1), p > 0,99), Classe Social (2 = 0,32(1), p >
0,50), Origem dos Pais (2 = 0,41(1), p > 0,50) e Estilo (2 = 0,94(2), p
> 0,50). Esta ltima (Tabela 5.7) foi analisada em um modelo que incluiu
as variveis estratificadoras da amostra e todas as variveis lingusticas,
exceto Classe da Palavra, da qual no independente nesta amostra (no h
conjunes e preposies nas leituras).

Tabela 5.7 Tendncias de emprego de [] de acordo com Estilo


(N = 9.226; [] = 28,3%)

P.R. % [] N-Total
Estilo
conversao + jornal + depoimento 0.58 32,3 7.241
lista de palavras 0.24 13,8 1.985
Range 34
Input: 0,188. 2 = 0,94(2), p > 0,50.

Diferentemente da hiptese que se aventou no incio das anlises, no se


observam tendncias graduais de emprego de retroflexo de acordo com as
categorias Conversao > Depoimento > Notcia de Jornal > Leituras, uma
vez que a leitura da notcia de jornal e do depoimento favorecem o emprego

108
Anlise multivariada

de retroflexo tanto quanto a conversao na entrevista (P.R. 0.58). Por outro


lado, a leitura da lista de palavras se destaca pelo forte desfavorecimento
do retroflexo (P.R. 0.24). No estilo em que se espera o maior grau de
monitoramento, os falantes apresentam forte tendncia de evitar o retroflexo
e a favorecer o tepe, o que indicador de seus graus de prestgio relativos na
comunidade (maior para o tepe, menor para o retroflexo). Observem-se, pois,
as correlaes verificadas com as variveis sociais.
Nota-se, primeiramente, que Faixa Etria no selecionada como sig-
nificativa para a variao de (-r). A varivel contnua Idade tampouco o
. Na Tabela 5.8, os pesos relativos entre colchetes se referem aos valores
da primeira rodada do step-up. Embora paream indicar uma mudana em
progresso em favor do retroflexo (P.R. 0.57 para os mais jovens e gradual
decrscimo para falantes mais velhos), a no seleo da varivel no modelo
de efeitos mistos no Rbrul indica que a diferenciao entre os fatores no
maior do que aquela verificada entre os indivduos da amostra (ver Captulo
3, p. 56). De um modo geral, esse resultado aponta para um caso de variao
estvel, quando se considera a comunidade como um todo.

Tabela 5.8 Varivel social no correlacionada com (-r)

P.R. % [] N-Total
Faixa etriaa
2034 anos [.57] 36,7 3.051
3549 anos [.52] 26,0 3.256
60+ anos [.40] 22,1 2.919
a Input: 0,203. [ ] indicam a no seleo da varivel como significativa.

No entanto, os valores dessa anlise univariada no deixam de ser intrigan-


tes. Ainda que a varivel no seja selecionada, a diferena de 17 pontos entre
o maior e o menor valor de pesos relativos e de quase 15 pontos percentuais
no de se ignorar.12 Alm disso, a anlise de Mendes (2010) havia sinalizado
12
A ttulo de exemplificao, comparem-se esses pesos relativos com os de outras variveis no selecio-
nadas, cuja diferena bem menor. Para o trao [anterior] de Contexto Fnico Precedente, os pesos
relativos so 0.51 para [+anterior] e 0.50 para [-anterior]; para o trao [contnuo] de Contexto Fnico
Seguinte, 0.51 para [+contnuo] e 0.49 para [-contnuo].

109
Anlise multivariada

Tabela 5.9 Tendncias de emprego de [] de acordo com variveis sociais (1)


(N = 9.226; [] = 28,3%)

P.R. % [] N-Total
Classe Sociala
A/B1 0.27 11,2 2.194
B2 0.41 27,9 2.783
C1 + C2/D 0.68 37,4 4.249
Range 41
Regio de Residncia
bairro mais perifrico 0.67 36,6 4.881
bairro mais central 0.31 19,0 4.345
Range 36
Mobilidade Geogrficab
baixa 0.71 39,6 2.197
mdia + alta 0.43 24,8 7.029
Range 28
Nvel de Escolaridade
Ensino Mdio 0.61 35,0 4.497
Ensino Superior 0.40 21,9 4.729
Range 21
Sexo/Gnero
masculino 0.59 32,7 4.661
feminino 0.41 23,8 4.565
Range 18
Input: 0,203. a 2 = 0,32(1), p > 0,50. b 2 = 0,004(1), p > 0,99.

uma mudana em progresso em favor do tepe, contrariamente ao que se esboa


na Tabela 5.8. Guardadas as devidas diferenas entre as amostras desses
trabalhos, tal reverso nos resultados no esperada, considerando-se que
ambas so contemporneas. Desse modo, h indcios de um encaixamento so-
cial mais complexo na comunidade. A subseo 5.4 voltar a esses resultados,
atravs de cruzamentos entre Faixa Etria e outras variveis sociais.
Os resultados para a varivel Sexo/Gnero (Tabela 5.9) se coadunam com
aqueles j extensivamente constatados, em diversos estudos sociolingusticos:
a forma de menor prestgio na comunidade tende a ser evitada por falantes
do sexo feminino (P.R. 0.41) e a ser favorecida por falantes do sexo masculino

110
Anlise multivariada

(P.R. 0.59).13 Embora tal constatao seja recorrente (ver, p.ex., Chambers
1995; Labov 2001b; Cheshire 2002), a interpretao desse fenmeno no sem
controvrsia; enquanto alguns autores argumentam que mulheres tendem a
empregar a forma de prestgio como modo de superar sua posio desprivile-
giada na sociedade (p.ex., Fasold, 1990, apud Cheshire 2002), outros defendem
que no so as mulheres que favorecem as formas de prestgio, mas sim que so
as formas por elas empregadas que tendem a ser vistas como mais corretas
(p. ex. Milroy et al, 1994, apud Cheshire 2002).
Dentre as variveis estratificadoras da amostra, a Regio de Residncia a
primeira a ser selecionada, com 36 pontos de range, e se apresenta como uma
das mais importantes para a variao na pronncia de (-r) no falar paulistano:
moradores de bairros mais perifricos favorecem fortemente o emprego da
variante retroflexa (P.R. 0.67), enquanto moradores de bairros mais centrais
tendem a evit-la (P.R. 0.31). O retroflexo tambm fortemente favorecido
por falantes com menor mobilidade geogrfica (P.R. 0.71) e, inversamente,
desfavorecido por falantes com maior mobilidade (P.R. 0.43). possvel
inferir que quanto maior a mobilidade geogrfica, mais fluidas so as redes
sociais dos falantes (Milroy, 1987 [1980]; Milroy & Llamas, 2013 [2002]), que
entram em contato com maior variedade de grupos sociais; interessante
notar que so justamente esses falantes que tendem a evitar o emprego de
retroflexo. Quanto Escolaridade, os resultados mostram que o retroflexo
favorecido por falantes com menor nvel de escolarizao (P.R. 0.61). Em
conjunto, os resultados para Regio de Residncia, Mobilidade e Nvel de
Escolaridade sinalizam a importncia de Classe Social para a estratificao
sociolingustica de (-r) na cidade de So Paulo, visto que todos esses fatores
podem ser considerados ndices indiretos de status socioeconmico.
Os resultados para Classe Social, com efeito, mostram de forma ainda mais
marcante a estratificao social de (-r): o retroflexo bastante favorecido por
falantes das classes C1 e C2/D (P.R. 0.68), desfavorecido pela classe B2 (P.R.
0.41), e evitado ainda mais fortemente pelas classes A/B1 (P.R. 0.27). Como
13
Esse resultado o oposto daquele verificado por Callou et al. (1996), que haviam constatado o favore-
cimento do tepe pelos falantes do sexo masculino. A diferena provavelmente pode ser atribuda aos
diferentes envelopes de variao. Aquela anlise contrastou o tepe com todas as demais variantes, das
quais o apagamento era a mais frequente. Como os autores reportam o favorecimento do apagamento
pelas mulheres, deduz-se da o favorecimento do tepe pelos homens.

111
Anlise multivariada

varivel contnua, ndice Socioeconmico (p < 0,001) revela um decrscimo


de 0,90 logodds para cada unidade que se incrementa na escala social.

Tabela 5.10 Tendncias de emprego de [] de acordo com variveis sociais (2)


(N = 9.226; [] = 28,3%)

P.R. % [] N-Total
Origem dos Pais
N/NE 0.82 57,4 611
interior (SP/MG/PR) 0.60 31,0 2.562
So Paulo + mista 0.45 25,6 5.193
estrangeiros 0.27 16,3 860
Range 55
Input: 0,201. 2 = 0,41(1), p > 0,50.

Por fim, os resultados para a varivel Origem dos Pais (Tabela 5.10)
revelam que os falantes que menos favorecem o retroflexo so aqueles que tm
pais estrangeiros (0,27) e pais paulistanos ou de origem mista (P.R. 0.45).
Por outro lado, diferentemente do que se poderia esperar, no so os filhos
de migrantes do interior de SP/MG/PR que mais favorecem o r caipira,
embora tambm o favoream (P.R. 0.60). As maiores tendncias de emprego
se verificam entre aqueles cujos pais so do Norte/Nordeste (P.R. 0.82).
Ora, retome-se a baixssima frequncia de variantes fricativas entre falantes
paulistanos (0,4%; ver Tabela 5.2), que informa que filhos paulistanos de
migrantes nortistas e nordestinos no retm a aspirao de (-r). Tal proporo
contrasta fortemente com a intensa presena de migrantes dessas regies que
vivem atualmente em So Paulo (ver Figura 1.2 no Captulo 1, p. 6). Ao
mesmo tempo, os filhos de migrantes do Norte e do Nordeste no necessaria-
mente adotam a variante tradicionalmente considerada mais paulistana; em
vez disso, tendem a empregar, tanto em termos de frequncia (57,4%) quanto
em termos de tendncia (P.R. 0.82), a variante retroflexa, de modo ainda
mais expressivo do que filhos de migrantes do interior de SP/MG/PR.
possvel especular duas interpretaes sobre esses resultados, uma de
natureza lingustica e outra de natureza social. Linguisticamente, a variante
retroflexa se aproxima mais do /-r/ aspirado por ser um segmento [-anterior],

112
Mudana ou variao estvel? Estigma ou prestgio?

relativamente ao tepe; socialmente, possvel que o emprego da variante


retroflexa seja favorecido pela rede social estabelecida por migrantes e seus
filhos paulistanos diante de sua relativa situao socioeconmica na cidade.
De acordo com o levantamento do IPEA (2011), migrantes do Norte/Nordeste
atingem em mdia menores nveis de escolaridade, tm menos acesso Internet
e possuem as menores rendas mensais de todos os grupos pesquisados, fatos
que caracterizam pertencimento a classes sociais mais baixas. Conforme
mostra a Tabela 5.9, habitantes de bairros mais perifricos, com menor
mobilidade geogrfica, menor nvel de escolarizao e pertencentes a classes
mais baixas so aqueles que mais tendem a empregar o retroflexo; ainda que
os filhos paulistanos de migrantes do Norte/Nordeste venham a ascender
socialmente, as caractersticas menos privilegiadas dos pais devem contribuir
para o estabelecimento da rede social desses falantes.
O papel da presena de migrantes e de outras variantes de (-r) em So
Paulo tem ainda relevncia para a anlise de diferentes tendncias que se
observam atualmente na comunidade e que so descritos na prxima subseo.

5.4 Mudana ou variao estvel? Estigma


ou prestgio?
Conforme se mencionou anteriormente, anlises feitas com base em diferentes
amostras do portugus paulistano geraram resultados divergentes quanto s
taxas de emprego de retroflexo e quanto estabilidade ou no da variao de
(-r) em coda silbica. Esses resultados esto resumidos no Quadro 5.2.
Tais divergncias so indcios de que o processo de variao entre tepe e
retroflexo na cidade de So Paulo deve ser mais complexo do que as anlises
at aqui desenvolvidas levam a crer. Os motivos para as diferentes concluses
certamente residem nas amostras utilizadas que, apesar de semelhantes,
guardam certas propriedades: a amostra de Mendes (2010) se restringiu a
falantes mais prototpicos, residentes de bairros mais tradicionais em So Paulo
e que se identificam com a cidade; Mendes & Oushiro (2011b), ao aumentar a
amostra de informantes, no levaram em considerao tal critrio; a presente

113
Mudana ou variao estvel? Estigma ou prestgio?

Mendes 2010 Mendes & Esta anlise


Oushiro 2011
Tamanho e 24 falantes 48 falantes 118 falantes
estratificao Sexo/Gnero Sexo/Gnero Sexo/Gnero
da amostra Faixa Etria Faixa Etria Faixa Etria
Escolaridade Escolaridade Escolaridade
Regio
Taxa de retroflexo 12,0% 31,0% 28,3%
Anlise em Mudana em favor Variao estvel Variao estvel
tempo aparente do tepe

Quadro 5.2 Trabalhos e resultados divergentes sobre


a pronncia do (-r) em So Paulo

anlise, por sua vez, incluiu na estratificao dos falantes a varivel Regio de
Residncia, que se revelou como uma das mais importantes para a pronncia
de (-r). As taxas semelhantes (cerca de 30% de emprego de retroflexo) nas
duas amostras maiores permite concluir que essa deve ser a proporo atual
da variante no portugus paulistano de modo geral. Para avaliar em que
medida esse caso de variao estvel, realizaram-se cruzamentos entre a
varivel Faixa Etria com Sexo/Gnero, Nvel de Escolaridade, Regio de
Residncia e Classe Social, a fim de verificar se h tendncias divergentes
dentro da comunidade.
O cruzamento entre Faixa Etria e Sexo/Gnero no selecionado pelo
Rbrul como significativo para a variao de (-r) ou seja, os efeitos de cada
varivel so independentes entre si. J com as variveis Regio de Residncia,
Escolaridade e Classe Social, os cruzamentos com Faixa Etria revelam os
padres que se visualizam na Figura 5.4.
Os padres nessas figuras se assemelham. Por um lado, os fatores que j se
revelaram favorecedores do retroflexo apresentam, para todas as faixas etrias,
pesos relativos acima de 0.50, representados pelas linhas contnuas: habitantes
de bairros mais perifricos, menos escolarizados e das classes C1-C2/D. Essas
curvas, assim como aquela para os falantes da classe B2 na Figura 5.4c,
tambm apresentam pesos relativos gradualmente maiores quanto menor a

114
Mudana ou variao estvel? Estigma ou prestgio?

0.7 (a) Regio de Residncia (b) Escolaridade

0.7
Pesos Relativos

Pesos Relativos
0.5

0.5
0.3

0.3
Periferia Ens. Mdio
0.1

0.1
Centro Ens. Superior

60+ 3559 2034 60+ 3559 2034

Faixa Etria Faixa Etria

(c) Classe Social


0.7
Pesos Relativos

0.5
0.3

A/B1
B2
0.1

C1 C2/D

60+ 3559 2034

Faixa Etria

Figura 5.4 Pesos relativos referentes ao emprego de retroflexo no cruzamento


entre Faixa Etria e (a) Regio de Residncia; (b) Nvel de Escolaridade;
e (c) Classe Social

faixa etria. Os demais falantes habitantes de bairros mais centrais, mais


escolarizados e de classe social mais alta tambm esboam aumento na
tendncia ao retroflexo: o peso relativo para a terceira faixa etria sempre
menor do que para a segunda, nos trs cruzamentos. Tal tendncia, contudo,
rompida pelos falantes mais jovens desses grupos; em vez de seguir a tendncia
geral da comunidade em direo ao retroflexo, com gradual aumento do peso
relativo, os jovens de bairros mais centrais, com Ensino Superior e, sobretudo,
de classe social mais alta evitam radicalmente o emprego da variante o que
equivale a dizer que favorecem o tepe.
A deflagrao de movimentos divergentes na comunidade d conta do fato
de Faixa Etria no ser selecionada na anlise global do Rbrul, conforme
a Tabela 5.8 (p. 109). Embora os pesos relativos esbocem uma aparente

115
Mudana ou variao estvel? Estigma ou prestgio?

mudana em progresso, esse resultado no se sustenta, visto que h uma


poro significativa de falantes (os de primeira faixa etria) que no seguem
a mesma tendncia. Alm disso, o que se observa na Figura 5.4 d conta dos
resultados aparentemente contraditrios se comparados aos de Mendes (2010)
e Mendes & Oushiro (2011b). Ao utilizar uma pequena amostra de falantes
prototpicos, residentes de bairros mais centrais (e, presumivelmente, de
classe social mais alta), a anlise de Mendes (2010) ressalta a forte tendncia
entre falantes de primeira faixa etria em direo ao tepe. J a anlise de
Mendes & Oushiro (2011b), com uma amostra no estratificada por Regio de
Residncia ou Classe Social, apresenta resultados mais semelhantes curva
verificada para as tendncias de pronncia de (-r) por parte dos residentes de
bairros mais centrais da Figura 5.4a.
Mais importante, no entanto, so as consequncias desses fatos para a
compreenso do encaixamento social de (-r) em So Paulo. Se so amostrados
apenas residentes da periferia, ou apenas os menos escolarizados, ou apenas os
de classes mais baixas, est-se diante de uma mudana em tempo aparente, em
favor do retroflexo. De fato, em anlises alternativas com esses subconjuntos
de dados, Faixa Etria selecionada como significativamente correlacionada
pronncia de (-r). Se no se levam em conta a Regio de Residncia ou a
Classe Social dos falantes, est-se diante de um caso de variao estvel. Se
se consideram apenas os falantes de classe mais alta de So Paulo, est-se
diante do incio da mudana em direo ao tepe.
De modo semelhante restaurao do (-r) no ingls norte-americano
(Labov et al., 2006; Becker, 2009; Nagy & Irwin, 2010), esses resultados
mostram que possvel haver reverso de tendncias na comunidade e que a
mudana lingustica, pelo menos quando vista em curtos espaos de tempo,
nem sempre unidirecional. Nesse sentido, os movimentos de (-r) verificados
em So Paulo so tambm um novo exemplo do modelo de fluxos e contrafluxos
(Naro & Scherre, 2013) movimentos que possivelmente se estendem desde
os tempos dos bandeirantes, passando pelo dialeto caipira da poca do
Imprio, pela massiva imigrao europeia no incio do sculo XX, at a
chegada de migrantes internos desde meados do sculo passado. Entretanto,
a compreenso desses movimentos no possvel se no se analisam as

116
Mudana ou variao estvel? Estigma ou prestgio?

identidades sociais com as quais as variantes se associam.


O fato de o retroflexo ser favorecido por residentes de bairros mais pe-
rifricos, menos escolarizados, com menor mobilidade e do sexo masculino
apontaria, em princpio, para seu estigma na comunidade ou, ainda, para um
prestgio encoberto (Trudgill, 1974; Chambers, 1995). Esse conceito costuma
ser empregado em estudos sociolingusticos para explicar a produtividade ou
a persistncia de formas consideradas no padro. No entanto, tal conceito
parece no dar conta da forte tendncia de certos grupos de jovens a empregar
a variante.
As tendncias opostas entre os falantes de primeira faixa etria sinalizam
que tepe e retroflexo podem possuir significados sociais distintos para dife-
rentes grupos sociais. A se valer pelas figuras, trata-se verdadeiramente de
uma diviso socioeconmica, mais do que o local de residncia ou o nvel de
escolaridade.
Para melhor estimar o valor social das variantes, volte-se leitura da
lista de palavras, na qual se assume que os falantes tm o grau mximo de
ateno fala: uma anlise mais detalhada somente desses dados (N = 1.985)
revela, de modo ainda mais contundente, as tendncias divergentes entre
os paulistanos de diferentes classes sociais. Na Figura 5.5, os mais velhos
(P.R. 0.12) e sobretudo os mais novos (P.R. 0.04) da classe A/B1 evitam
radicalmente a variante retroflexa (Cf. Figura 5.4).
Quando apresentados sentena-alvo a porta t aberta com realizao
retroflexa, certo que a principal associao dos falantes foi com interior.
No entanto, certos residentes de bairros mais centrais chegam a associ-lo
diretamente com habitantes de periferia, consoante com os resultados da
anlise de correlaes:

(21) D1: e o que voc acha... de... da frase assim a porta [r] est aberta?
[r]
S1: [risos] nossa! voc tinha que ver meu sobrinho falando ele tem cinco
anos... nossa ele paulistano nato nato mesmo... tipicamente de
paulistano n?... [...]
D1: voc acha que pra/... todos os bairros de So Paulo eles falam assim?
S1: no
D1: no?

117
Mudana ou variao estvel? Estigma ou prestgio?

A/B1

0.8
B2
C1 C2/D

Pesos Relativos

0.6
0.4
0.2

60+ 3559 2034

Faixa Etria

Figura 5.5 Pesos relativos referentes ao emprego de retroflexo no cruzamento


entre Faixa Etria e Classe Social, em dados de Lista de Palavras

S1: no...
D1: que diferenas assim voc acha que existem?
S1: no erre principalmente... certo... [] (entendeu) certo [] entendeu?
D1: uhm voc acha que bairros eles falam assim?
S1: periferia
D1: periferia?
S1: periferia (Felipe L., M1MC)

(22) S1: porque o pessoal muito afastado... da periferia eles... o erre deles...
eh parece com o do interior... muitos falam o porque [] ... eu observo
em programa de televiso por exemplo que que voc v... pessoal de bairros
afastados...
D1: aham
S1: eles...
D1: periferia... aonde assim? (que bairro)
S1: So Miguel/ So Miguel Paulista 14 por exemplo (Iara S., F3SC)

A reao dos jovens de classe alta no sentido de evitar radicalmente o


retroflexo pode ter sido consequncia de uma percepo, consciente ou no,
de que seu emprego se associa periferia e s classes baixas.15
Por outro lado, para as classes B2 e C1-C2, as respectivas curvas na
Figura 5.5 mostram que continua havendo uma forte tendncia pronncia
14
Bairro da Zona Leste de So Paulo.
15
Essa questo ser retomada nos captulos 8 e 10.

118
Mudana ou variao estvel? Estigma ou prestgio?

retroflexa entre os mais jovens (P.R. 0.87 e 0.90), tanto quanto nos demais
momentos da entrevista. Isso indica que, para jovens de classes mais baixas,
o retroflexo no to estigmatizado quanto se poderia supor. As avaliaes
feitas pelos jovens Milena F. e Lucas S. (excertos (13)(14), p. 100), que
reconhecem a ampla variabilidade de (-r) em So Paulo e o retroflexo como
uma das variantes paulistanas, so iluminadoras nesse sentido. Ambos, alis,
pertencem a classes sociais mais baixas, de acordo com os critrios da amostra
(C1 e C2, respectivamente).
possvel que o relativo prestgio do retroflexo entre esses falantes seja
decorrncia da presena de outras variantes na comunidade. Embora sejam
praticamente inexistentes na fala dos paulistanos, as variantes fricativas se
fazem presentes na comunidade principalmente entre os migrantes do Norte
e do Nordeste. J se assinalou que seus filhos paulistanos tendem a adotar
o retroflexo; isso pode ter ocorrido no apenas pelas questes lingusticas
e sociais apontadas acima, mas tambm por uma reinterpretao do valor
social da variante: do ponto de vista das classes mais baixas, o retroflexo
valorizado por se diferenciar das variantes fricativas, essas sim rejeitadas pela
comunidade.
Por outro lado, a variante tepe pode se associar no apenas a caractersticas
como maior nvel de escolaridade e classe social mais alta, mas tambm com
esteretipos correlatos de alienao social e frivolidade. Observem-se, nesse
sentido, as descries da informante Thaissa B., residente de um bairro mais
perifrico:

(23) S1: eu tinha uma uma amiga que morava aqui na rua... e ela est
morando... um pouco mais pra frente no muito distante daqui... mas os
contatos dela so todas assim meninas bem de classe mdia assim daquele
tipo que... as pessoas chamam de patricinha... ento ela fala assim
mesmo sabe do tipo... meu... est ruim isso t ligado tipo... assim que
ela fala e... antes aqui ela no falava assim n uma coisa assim... que
parece que o meio formou ela totalmente... diferente mesmo (Thaissa
B., F1SP)

Em (23), Thaissa B. define patricinhas como meninas de classe mdia


e enxerga pejorativamente a mudana no modo de falar de uma amiga do

119
Mudana ou variao estvel? Estigma ou prestgio?

bairro que passou a conviver com pessoas de classe social mais alta. Adiante,
a mesma falante associa a categoria paty ao tepe, em contraposio ao
retroflexo como uma forma de identidade local:

(24) D1: e o a porta [r] (es)t aberta [r]?


S1: ah coisa de paty
D1: [risos]
S1: a porta [R] (es)t aberta [r] coisa de paty... a porta [] (es)t
aberta [] mais... o erre diferente
D1: [risos]
S1: [falando com voz mais grave:] que aqui o esquema outro... certo?
[] [risos] (Thaissa B., F1SP)

Thaissa B. faz uso das expresses esquema e certo para fazer aluso a duas
identidades sociais: uma da periferia, possivelmente associada aos manos
prototipicamente, jovens de periferia que se filiam ao movimento hip hop (ver,
p.ex., Bentes & Rios 2006) em contraposio s patys. Nesse trecho, as
identidades associadas s variantes retroflexa e tepe so novamente paralelas
aos resultados das anlises de correlao: h uma relao entre falantes do
sexo masculino residentes de bairros mais perifricos e o retroflexo, e falantes
do sexo feminino de bairros mais centrais e o tepe. Contudo, pode-se inferir
que o valor negativo, neste caso, atribudo ao tepe, visto que ele que se
associa ao outro.16
No se pretende dar a entender, aqui, que todos os jovens residentes de
periferia se identificam como manos e minas, tampouco que todos os jovens
de bairros mais centrais se identificam como patricinhas e mauricinhos.
Trata-se de esteretipos sociais que se associam a certos valores e que podem,
indiretamente, atuar na seleo (inconsciente) que grupos de falantes fazem
de variantes particularmente sujeitas a avaliao social. A informante Thaissa
B. (F1SP) apresenta uma taxa de 68% de emprego do retroflexo, bastante
acima da mdia das mulheres (23,8%), falantes mais jovens (36,7%) e com
nvel superior (21,9%), e mesmo de habitantes de bairros mais perifricos
(36,6%). Seu emprego da variante parece querer demarcar uma identidade de
16
Ver, no entanto, o Captulo 8, que se debrua sobre a fala de indivduos. Mesmo Thaissa B., que
discursivamente se alinha com a periferia e parece preferir o retroflexo ao tepe, tende a favorecer o
ltimo na leitura da lista de palavras.

120
Sntese

periferia, em contraposio de patricinhas de classe mdia.


Sugeriu-se acima que, em vez de pares de opostos como estigma/prestgio
ou variante padro/no padro, as variantes de (-r) em So Paulo fossem
vistas como formas default, no marcadas, a partir das quais se estabelecem
outras identidades sociais. Para os falantes de classes mais altas, a forma
default o tepe (vibrante mltipla e simples), e os demais erres identificam os
residentes de periferia, de classes mais baixas e os migrantes na cidade; para
os falantes de classes mais baixas, as formas default parecem ser o tepe e o
retroflexo indistintamente, e os demais erres se associam aos no paulistanos;
para outros, ainda como Thaissa B., que se identifica fortemente com a
periferia , a forma default o retroflexo, e o tepe identifica as patys e os
membros das classes mais altas.

5.5 Sntese
Este captulo apresenta anlises qualitativas e quantitativas da pronncia
varivel de (-r) como tepe ou retroflexo na cidade de So Paulo. Os resultados
mostram que a variante retroflexa relativamente produtiva entre paulistanos,
uma vez que ocorre em aproximadamente um tero (28,3%) dos casos nos con-
textos em que alterna com o tepe no portugus paulistano. Linguisticamente,
a variante retroflexa favorecida quando precedida de vogal [-alta], seguida
de consoante [+coronal], em palavras menos gramaticais, em slabas tnicas
e em final de palavra. Socialmente, a pronncia retroflexa favorecida por
falantes de classes sociais mais baixas, residentes de regies mais perifricas,
com menor mobilidade geogrfica, menos escolarizados, do sexo masculino e
pertencentes a famlias de migrantes do Norte e do Nordeste do pas.
No quadro geral, verifica-se um caso de aparente variao estvel. No
escopo sincrnico deste trabalho, a observao de tendncias contrrias dentro
da comunidade, por parte de diferentes grupos sociais, permite uma viso mais
detalhada do encaixamento social das variantes de (-r) e traz luz discusso
sobre o papel do valor social das variantes em processos de variao e mudana;
entre habitantes de periferia, classes mais baixas, filhos de nordestinos, o
retroflexo parece ter adquirido status de variante local, aproximando-se do tepe

121
Sntese

e afastando-se de variantes fricativas, o que pode explicar o movimento em sua


direo por parte desses grupos sociais. Sugere-se, por fim, que as mltiplas
variantes de (-r) em So Paulo estabelecem relaes para alm dos pares
estigma/prestgio e padro/no padro. Em lugar deles, a perspectiva de
formas default e formas marcadas, no necessariamente simtricas, permite
uma melhor compreenso de tendncias divergentes que se verificam na cidade.

122
6
A varivel (CN)

Este e o prximo captulo analisam as concordncias nominal


e verbal, duas das variveis mais estudadas na Sociolingustica
brasileira, ao lado de (-r). Muito j se sabe sobre seus condiciona-
mentos lingusticos e sociais, mas as explicaes sobre processos
de mudana ou estabilidade dessas variveis geralmente se pautam
por correlaes diretas com as categorias sociais dos falantes que
favorecem o emprego de uma ou outra variante. Este captulo
discute as identidades sociais que se associam marca zero de
concordncia nominal de nmero (como em os menino-) na co-
munidade paulistana, a fim de melhor compreender os mecanismos
que regulam a manuteno de usos lingusticos considerados no
padro. A anlise qualitativa e quantitativa dos dados sugere que
a marca zero de (CN) funciona como ndice de masculinidades na
fala de homens paulistanos e de identidade local com certos bairros
e com a cidade, embora a associao da variante com a noo de
paulistanidade parea estar em vias de desaparecimento.

6.1 A concordncia nominal no portugus


brasileiro
A variao na concordncia nominal de nmero (CN) dentro de sintagmas
nominais (SNs) e entre o SN e o predicado como em a-s casa-s vs. as
A concordncia nominal no portugus brasileiro

casa- e as casas so bonita-s vs. as casas so bonita- tem sido objeto de


numerosos estudos sociolingusticos no portugus brasileiro.1
Certos resultados tm sido recorrentes nas mais variadas comunidades
em que o fenmeno foi investigado. A posio linear do vocbulo dentro
do SN, sua posio relativa ao ncleo ou o cruzamento entre essas duas
variveis sempre se mostram correlacionados com a varivel: a primeira
posio e as posies pr-nucleares (p.ex, os meus em os meus meninos)
tendem a favorecer a ocorrncia da marca de plural (ver, p.ex., Scherre
1988; Brando & Vieira 2012). A salincia fnica (Scherre, 1988), analisada
atravs dos processos de formao do plural (-s, -is, -es etc.), tambm se
apresenta invariavelmente relevante; embora a hierarquia de fatores possa
diferir de comunidade para comunidade, ou mesmo entre subgrupos da mesma
comunidade (Scherre, 1988), o plural regular (com simples acrscimo de /-s/)
sempre favorece a marca zero; a salincia fnica quanto tonicidade da palavra
nem sempre analisada, mas tende a ser relevante quando includa no modelo
estatstico, com desfavorecimento das marcas de plural em monosslabos
tonos, paroxtonas e proparoxtonas (ver, p.ex., Salomo 2010). O efeito
serial do paralelismo (Scherre & Naro, 1992; Scherre, 1998, 2001), seja entre
as palavras dentro de um sintagma, seja entre sintagmas de uma sequncia
discursiva, costuma revelar forte tendncia ao emprego de formas semelhantes
(marcas levam a mais marcas, e zeros levam a mais zeros). O contexto
fonolgico seguinte, quando se mostra relevante, indica o favorecimento da
marca zero quando a palavra em foco seguida por consoantes em vez de
vogais (ver, p.ex., Guy 1981). Para animacidade do ncleo, sintagmas com o
trao [-humano] (os gato-s, as coisa-s) tendem a desfavorecer a marcao de
plural (ver, p.ex., Brando & Vieira 2012). Quanto a variveis sociais, o nvel
de escolaridade dos falantes frequentemente se apresenta como uma das mais
1
Ver, p.ex., Scherre 1978, 1988; Guy 1981, 2000; Naro & Scherre 1991; Fernandes 1996; Lopes 2001;
Antonino 2007; Salomo 2010; Brando & Vieira 2012; Yacovenco et al. 2012; Silva & Scherre 2013;
Mendes 2014, inter alia. O Projeto Concordncias (Estudo comparado dos padres de concordncias em
variedades africanas, brasileiras e europeias), coordenado por Silvia Rodrigues Vieira, Silvia Figueiredo
Brando e Maria Antnia da Mota, volta-se comparao dos padres de variao nas concordncias
nominal e verbal em diferentes variedades do portugus. Ver portal em http://www.concordancia.
letras.ufrj.br/. Para uma lista abrangente de trabalhos realizados at meados da dcada de 2000
sobre as concordncias (nominal e verbal), ver tambm Scherre & Naro (2006 : 123129) e Scherre
(2008 : 3136).

124
A concordncia nominal no portugus brasileiro

fortemente correlacionadas com a marcao de plural: quanto maior o nvel


de escolaridade, maiores as taxas de emprego da variante prescrita pela norma
culta, que normalmente se toma como a variante padro. A anlise em tempo
aparente tende a quadros de variao estvel, com o desfavorecimento da marca
zero por parte dos falantes da faixa etria intermediria, embora subgrupos
dentro de uma mesma comunidade possam apresentar movimentos divergentes
entre si (Naro & Scherre, 1991; Scherre & Naro, 2006); o sexo/gnero, por
fim, tende a revelar o favorecimento da marca zero pelos homens, embora a
varivel nem sempre seja selecionada como relevante pelo programa Varbrul
(ver, p.ex., Salomo 2010 para a regio de So Jos do Rio Preto e Brando
& Vieira 2012 para a Regio Metropolitana do Rio de Janeiro).
Na comunidade paulistana, a alternncia tem sido analisada da perspectiva
de identidades de gnero (Mendes, 2014, no prelo) e do contraste entre
diferentes subcomunidades da cidade, como paulistanos e alagoanos (Gomes da
Silva, 2014). No entanto, um levantamento abrangente a respeito dos padres
de variao entre paulistanos ainda no havia sido realizado. O presente
captulo tem o duplo objetivo de descrever padres gerais de variao quanto a
variveis sociais e lingusticas tradicionalmente analisadas, a fim de contribuir
para o mapeamento da concordncia nominal no portugus brasileiro, e,
principalmente, discutir as identidades sociais que se associam marca zero
de plural na cidade de So Paulo. Em uma comunidade altamente urbanizada,
em que cada vez mais raro encontrar pessoas que no tenham concludo
pelo menos o Ensino Mdio, quais fatores se correlacionam com a marca zero
de plural e quais grupos se associam ao emprego da variante?
A anlise qualitativa que examina o discurso metalingustico dos paulis-
tanos sobre a expresso dois pastel e um chopes sugere uma associao
estereotpica da marca zero com a cidade de So Paulo e, mais especificamente,
com o tradicional bairro da Mooca, embora os falantes mais jovens paream
no mais associar a variante no padro de (CN) com o portugus paulistano.
A anlise quantitativa, por sua vez, mostra que tambm para o portugus
paulistano se apresentam como relevantes certas variveis lingusticas tra-
dicionalmente investigadas em estudos sobre concordncia nominal, como
Salincia Fnica e Paralelismo; no entanto, um resultado que aqui difere

125
Avaliaes sobre a marca zero de (CN)

em relao a outras comunidades aquele para a varivel Animacidade, que


revela tendncia marca zero em SNs com o trao [+humano]. Quanto
a variveis sociais, destacam-se a discusso sobre o papel de Classe Social
(muitas vezes no analisada na sociolingustica brasileira), a forte correlao
com Sexo/Gnero (diferentemente de outros centros urbanos), e a hiptese de
que os moradores do bairro da Mooca tendem marca zero. Argumenta-se
que a variante funciona como ndice de masculinidades e de uma identidade
local, para alm de rtulos como forma padro ou no padro.

6.2 Avaliaes sobre a marca zero de (CN)


Nacionalmente, os paulistanos so estereotipados por frases como dois pastel
e um chopes, com marca zero de plural em pastel e um s adicional
em chopes. Essa associao pode ser vista na mdia, na cultura pop e no
discurso popular sobre o portugus paulistano. A Figura 6.1 apresenta o
ttulo de uma matria da sesso de turismo do jornal carioca O Globo, na qual
os jornalistas fazem uso dessa expresso popular: Um chopes, dois pastel:
aproveite nossa seleo dos melhores bares de So Paulo.2 O exemplo (1)
excerto de uma letra de msica da banda paulistana Velhas Virgens, que faz
mltiplas referncias a localidades e personagens da capital paulista: esquina
da Ipiranga com a So Joo, o bar Brahma, a Catedral da S, Adoniran
Barbosa.

(1) Um chopps e dois pastel (Velhas Virgens)


(Paulo de Carvalho e Alexandre Cavalo Dias)

Encontrei Caetano
Na esquina da Ipiranga com a So Joo
Sabe o que ele tinha na mo
Um chopp do Bar Brahma e um disco do Adoniran
Um chopp do Bar Brahma e um disco do Adoniran

Encontrei o professor Pasquale


Atrs da Catedral da S
2
Disponvel em http://oglobo.globo.com/boa-viagem/um-chopes-dois-pastel-aproveite-nossa-selecao-
dos-melhores-bares-de-sao-paulo-3017181. ltimo acesso em 24 abr./2014.

126
Avaliaes sobre a marca zero de (CN)

Figura 6.1 Notcia do jornal O Globo online (28 abr./2010)

Ele estava a p
Trazia dois pastel e um disco do Noel
Trazia dois pastel e um disco do Noel

Pasquale, vejam vocs


Deu pastel pro Caetano e acertou o portugus
Caetano, que baiano
Ps s no chopps e virou um paulistano
(...)

O excerto em (2) de uma notcia do jornal Folha de So Paulo online (05


jun./2011)3 sobre um projeto de lei para preservar o mooqus, suposto sota-
que do bairro da Mooca, na Zona Leste da cidade. Dessa notcia, destaca-se
o comentrio da presidente da associao dos moradores do bairro, Crescenza
Giannoccaro de Souza, que faz questo de ressalvar que os moradores sabem
fazer o plural corretamente. Embora negue a associao da marca zero de
concordncia com os mooquenses, seu comentrio refora a existncia de um
discurso corrente que afirma justamente o contrrio.

(2) Sotaque da Mooca pode virar patrimnio imaterial de SP

O cantado modo de falar da Mooca, bairro da zona leste de So Paulo,


que inclui tambm expresses nacionalmente famosas como orra meu e
3
Disponvel em http://www1.folha.uol.com.br/cotidiano/925287-sotaque-da-mooca-pode-virar-
patrimonio-imaterial-de-sp.shtml. ltimo acesso em 24 abr./2014.

127
Avaliaes sobre a marca zero de (CN)

belo, pode se tornar o primeiro bem imaterial protegido da cidade.

Est no Conpresp (Conselho Municipal do Patrimnio Histrico) um pedido


para transformar o mooqus em patrimnio de So Paulo. A ideia
registrar e preservar esse jeito peculiar de falar de parte dos paulistanos.

Fico maravilhada com a ideia, afirma Crescenza Giannoccaro de Souza


Neves, presidente da Associao Amo a Mooca. Ela faz, porm, uma res-
salva sobre uma caracterstica atribuda ao modo de falar dos moradores
do bairro: a falta de s nos plurais. Os imigrantes, quando chegaram,
tinham dificuldade de dizer os plurais, pois era diferente da lngua deles.
Ns, descendentes, tambm falamos cantado, mas usamos bem os plurais.
(...)

(Fonte: Folha de So Paulo online. 05 jun./2011)

Visto que se trata de uma varivel difundida por todo o territrio brasileiro,
curioso notar sua associao estereotpica especificamente com a cidade
de So Paulo. No roteiro das entrevistas sociolingusticas aqui utilizadas,
buscaram-se avaliaes sobre a marca zero de concordncia nominal mediante
a pergunta: O que voc acha desse modo de falar: me v dois pastel e um
chopes? (ver Captulo 3, p. 38). Diferentemente de (e) e da realizao de (-r)
como tepe, foram pouqussimos os informantes que no apresentaram algum
tipo de comentrio metalingustico sobre a concordncia nominal. Trata-se
de uma variante com alto grau de salincia social e que se apresenta como
sinnimo de no saber falar portugus.4
A Figura 6.2 representa as noes mais frequentemente associadas com
a variante no padro da concordncia nominal, a partir da sentena-alvo.
Nota-se a a alta frequncia de associao com o falar paulistano e, de modo
relativamente expressivo, com a imigrao italiana e o bairro da Mooca.
possvel que a preponderante associao da sentena com paulistanos
seja decorrncia da ordem em que foram feitas as perguntas sobre avaliao
lingustica, aps aquelas sobre a ditongao de (e) e as pronncias tepe e
retroflexa de (-r) em coda silbica. Ao perceber que o documentador sempre
4
Recorde-se da chamada polmica do livro didtico, em meados de 2011, quando diversos meios de
comunicao externaram grave preocupao com o fato de um livro recomendado pelo Ministrio da
Educao, Por uma vida melhor, afirmar no haver erro em frases como os menino pega o peixe. O
episdio ilustra o quanto ainda cabe aos linguistas divulgar seu campo de estudos.

128
Avaliaes sobre a marca zero de (CN)

busca descobrir se se trata de uma variante paulistana ou no e quais grupos


tendem a empreg-las, muitos dos informantes j afirmam que um modo
paulistano de falar. Os exemplos (3) e (6) ilustram a associao da variante
com a regio da Mooca/Tatuap, e (4)(6) exemplificam o discurso popular
que atribui a presena da variante na cidade vinda macia de imigrantes
italianos, em cuja lngua nativa o plural nominal no se realiza com o morfema
-s.

Figura 6.2 Nuvem de palavras associadas sentena-alvo


me v dois pastel e um chopes

(3) D1: [risos] e o que o senhor acha de por exemplo eh... me v dois pastel
e um chopes
S1: bem paulista isso a... isso bem paulista e tradicional daqui do Tatuap
do... da Mooca dessa regio (Lucio A., M2MP)

(4) D1: e quanto a... essa forma de falar... me v dois pastel e um chopes
que que que voc acha que...
S1: ento que tambm
D1: tambm tem a ver com/
S1: ... uma grande parte da populao fala assim
D1: uhum
S1: dois pastel e um chopes
D1: e a voc acha que... mais paulistano assim ou?
S1: mais paulistano
D1: paulistano... e...

129
Avaliaes sobre a marca zero de (CN)

S1: por causa da influncia italiana


D1: uhum
S1: que o italiano no tem plural
D1: uhum
S1: ento dois pastel
D1: ah sim
S1: [risos]
D1: e... e...
S1: quer dizer tem plural mas no plural com esse (Juliana W., F3SC)

(5) S1: ento assim a gente tem inclusive essa coisa do... de comer o esse
n no no do dos plural... n do ter tomado duas cerveja... eh dois chope
no/ um chopes e dois pastel... essa coisa de comer o esse eh vem/ acho
acredito eu que venha tambm do italiano porque no italiano o plural no
feito com esse feito com i n... e ento a gente acabou herdando isso da
convivncia com os italianos aqui ento [...]
D1: parece que voc sabia da prxima pergunta j
S1: ah ?
D1: que eu ia te perguntar o que voc acha sobre as pessoas que fala ah
me v dois pastel e um chopes
S1: ento acho que isso acho que / so/ eh eu imagino que seja por
conta da convivncia com os italianos onde o o... o plural feito de outra
forma que no com esse (Romulo S., M3MC)

(6) D1: e o que que voc acha de... me v dois pastel e um chopes?
S1: [risos] ah sei l... ah pessoal menos instrudo n que fala assim n...
dois pastel e um chopes... mais o povo n?
D1: voc conhece pessoas que falam assim?
S1: ahn... olha... na Mooca eu conheci muita gente assim... inclusive... eu
tenho um irmo... ele no/ quer dizer agora ele at est morando na Mooca
eu tinha me esquecido disso... fazem uns trs meses que ele... ele voltou
pra Mooca... mas ele corta muitos esses finais das palavras... apesar de
ser mdico... mas ficou assim os carro... no sei por que que fala assim...
acho esquisito no sei se ... se um pouquinho da origem italiana ou se
influncia do bairro n (Iara S., F2SC)

A informante Iara S. (6) associa a marca zero de plural primeiramente com


pessoas menos instrudas e de classes mais baixas; em seguida, no entanto, ela
lembra de muitas pessoas do bairro da Mooca, em que a informante vivera
at a adolescncia e no qual ainda possui parentes. L, mesmo os falantes
mais escolarizados, como seu irmo mdico, tendem a cortar os esses finais
das palavras algo que atribudo, pela informante, influncia italiana ou

130
Avaliaes sobre a marca zero de (CN)

do bairro.
Outros informantes, no entanto, afirmam se tratar mais de um esteretipo
criado pelos cariocas, ainda que admitam a possibilidade de haver algum fundo
emprico para a gozao (7). Outros ainda questionam a factual tendncia de
os paulistanos empregarem a variante atualmente, mesmo que isso possa ter
sido verdadeiro no passado (8).

(7) D1: ... e quanto a/ a esse modo de falar... me v dois pastel e um


chopes?
S1: uhn
D1: voc acha que caracterstico... de algum... de algum grupo
S1: sim... carioca tirando sarro de paulista
D1: [risos] voc acha que... que mais uma caricatura ento?
S1: n...
D1: assim... um esteretipo... no no reflete tanto a realidade
S1: dois pastel e um... pode refletir...
D1: uhum
S1: que eu nunca prestei ateno nisso
D1: mas voc acha que j est mais distante talvez tenha sido... a forma
S1: (xxx) no vou dizer que no acontea no (xxx)
D1: mas a voc acha que... que algo que caracteriza o paulistano ou...
S1: sim caracteriza
D1: como um todo assim?
S1: (todo) alguns voc escuta isso de (ir em feira)
D1: aham
S1: se voc ficar prestando ateno voc vai acabar escutando (Pietro C.,
M2SC)

(8) D1: e o que voc acha desse jeito de falar me v dois pastel e um
chopes?
S1: eu acho que mito... eu acho que...
D1: voc acha que mito?
S1: eu acho que as pessoas no falam [risos] assim talvez no passado
eu acho que... eu no sei eu j ouvi dizer que tem a ver com... com...
a imigrao ale/ ahn desculpa a italiana n? que no sei se os italianos
comem os esses assim mas eu acho que mito eu no... eu mesma... eu sei
que tem msica que fala dois pastel um chopes no sei... mas eu mesma
nunca presenciei nada parecido [risos]
D1: ento voc acha que dentro de So Paulo... no acontece esse modo?
S1: eu acho que no de repente at j se falou assim... no sei se entre os
italianos mas eu acho que no... eu eu acho que no fala [risos] (Claudia
H., F2SP)

131
Avaliaes sobre a marca zero de (CN)

Certos falantes, por outro lado, no s assumem o esteretipo como


defendem o emprego da variante como marca de identidade paulistana.

(9) D1: e o me v dois pastel e um chopes?


S1: ... coisa nossa n... e no deve mudar est bom?
D1:
S1: se est errado (xxx) falando se errado em portugus est errado (no
sei o qu) mas no tem que deixar/ isso uma coisa que tem que manter e
deixar os carioca porque o carioca pra comeo os carioca no sabe vestir...
(Plinio C., M3MP)

Alm da associao estereotpica com o falar paulistano, o segundo tipo


de comentrio mais recorrente acusa explicitamente o erro gramatical,
associado a falantes menos escolarizados ou de classes mais baixas, e seguido
geralmente de avaliaes negativas como feio, horrvel, brega, ignorante.
Andrea C. (10), professora de geografia do Ensino Fundamental e Mdio, no
disfara seu desgosto em ver seus alunos falando errado. Para ela, dizer
que paulistanos no fazem a concordncia nominal um esteretipo, assim
como todo brasileiro gosta de futebol. Claudomiro S., como Claudia H.
(8), acredita que a associao com paulistanos e imigrantes se refere a um
fenmeno do passado, mas que o emprego da variante com marca zero hoje
em dia se deve falta de conhecimento, no mais imigrao (11).

(10) D1: e o que que voc acha dessa daqui... me v dois pas/ dois pastel e
um chopes?
S1: isso a mostra uma ignorncia (crassa) tambm que uma coisa que
nunca/ dois pastel... quando os alunos falam tenho vontade de descer
um livro na cara deles... forma de falar e e passa como sendo uma
coisa que todo paulista fala... e de novo todo brasileiro gosta de futebol...
todo paulista fala errado me d dez pozinho... (Andrea C., F2SP)

(11) D1: t... e por exemplo essa daqui o que voc acha dessa?... me v
dois pastel e um chopes... me v dois pastel e um chopes
S1: essa da a clssica do falar errado n
D1: [risos] por qu?
S1: essa da era... pelo menos nas ane/ anedotas que corriam... era o
carioca tirando sarro de paulista
D1: n sei
S1: essa da... eu... como... eu procuro falar corretamente e fazer tudo
corretamente isso da... di no ouvido quando eu escuto... eu acho feio

132
Avaliaes sobre a marca zero de (CN)

D1: ento como que seria o jeito correto?


S1: um pastel... no/ dois pastis... dois pastis e um chope [...] isso
da antigamente era... ahn na poca que... voc tinha aquela coisa de...
ter os grupos de migrantes ou de imigrantes... que praticamente no saam
do bairro... ahn eles tiravam muito sarro dos italianos que os italianos que
falavam desse jeito ento a regio ali Bexiga Brs... Mooca... se falava
desse jeito... e a com o passar do tempo foi mudando um pouco mas...
virou anedota... hoje em dia possvel que se fale desse jeito mas... a
no porque um... imigrante... que que no sabe falar direito... a lngua
do lugar pra onde ele imigrou.... mas hoje em dia por causa realmente
da... falta... de conhecimento... que est que est se popularizando [...]
(Claudomiro S., M2SP)

De modo geral, as avaliaes que associam a expresso dois pastel e um


chopes com o falar paulistano, com a imigrao italiana e com certos bairros
da cidade parecem se restringir aos falantes mais velhos, a partir da segunda
faixa etria (falantes acima de 35 anos). Entre os mais jovens, sobretudo os de
classes mais altas e residentes de bairros mais centrais, so mais recorrentes
avaliaes negativas e a associao com baixa escolaridade (12)(14). Alguns
jovens chegam a reverter o esteretipo e atribuir a expresso aos cariocas
(15)(16).

(12) D1: t... e o que que voc acha desse jeito assim de falar?... me v
dois pastel e um chopes...
S1: eu acho horroroso nem chego perto... fico revoltada...
D1: [risos] por qu?...
S1: ah porque odeio quando erra portugus
D1: ah t...
S1: acho que/
D1: como que tinha que ser?
S1: no gosto... a frase?
D1: ...
S1: como que voc falou?...
D1: me v dois pastel e um chopes
S1: no sei se eu sou muita referncia... voc pode ver pra mim por favor
um pastel e um chope?
D1: [risos]
S1: [risos] eu no sei se eu estou muito assim... que eu sou me tambm
sabe... (xxx) tudo certinho a est vendo... de repente a minha fase...
mas no consigo... se a I. [filha da informante] pede alguma coisa (eu
digo) ... para... volta... vamos de novo...

133
Avaliaes sobre a marca zero de (CN)

D1: barato... voc acha que ... voc acha que paulistano fala assim? ou
alguns paulistanos falam assim?
S1: no... acho que gente mal educada que fala assim (Fernanda T., F1SC)

(13) D1: e o que que voc acha eh... da pessoa que fala assim... me v dois
pastel e um chopes?
S1: horrvel
D1: [risos]
S1: coisa mais ridcula do mundo... e to comum n a gente escuta no
s isso mas outros erros... que uma coisa assim surreal (Carolina A.,
F1MC)

(14) D1: e voc acha que tem bairros da cidade em que as pessoas falam
mais desse jeito dois pastel e outros que falam menos?
S1: acho acho
D1: por bairro?
S1: acho que sim acho que principalmente os da periferia n porque
D1: ahn
S1: infelizmente o nvel de instruo n de... escolaridade menor ento
acho que isso uma tendncia (Tatiana M., F1SP)

(15) D1: e o... dois pastel e um chopes?


S1: nossa a ... meio caiara meio carioca n... dois pastel e um chope/
dois pastel... [paStEw] da onde que ? eu no sei... [...] eu j ouvi muito
isso de os cara falando de zoeira n... por causa do lance do plural e tal...
coisa de feira n... [...] meu v zoava isso no sei da onde que
D1: mas por que que ele zoava voc sabe?
S1: no... no sei essas... no sei esse tipo de zoeira que voc faz meio
por fazer sabe... frase do tipo meio dito popular assim... (Fernando B.,
M1MC)

(16) D1: e... que que voc acha desse modo de falar eh me v dois pastel e
um chopes?
S1: bem carioca
D1: ah ? [risos]
S1: bem/ me d dois pastis e um chopes... bem carioca sem falar sem
falar que est errado n o portugus ali est... o Aurlio est se revirando
na tumba ali (xxx)
D1: voc acha feio esse modo de falar?
S1: com certeza!... no nada contra carioca mas meu... dois pas/ dois
pastel e um chopes... voc est pedindo pastel... voc est pedindo
pastis
D1: [risos]
S1: pastis plural voc est pedindo dois no um... e chope voc

134
Anlise multivariada

est pedindo um no / no so vrios (Jair S., M1MP)

Os excertos (12)(16), retirados de entrevistas com falantes mais jovens,


parecem indicar que a associao estereotpica da expresso dois pastel
e um chopes com paulistanos pode estar em vias de desaparecimento da
comunidade.
Na anlise quantitativa a seguir, a associao com paulistanos e com
falantes de certos bairros investigada por meio do mapeamento das ten-
dncias de emprego de acordo com a regio de residncia do falante. Alm
disso, investiga-se se haveria tendncia de mudana em direo variante
com concordncia plena em consequncia do aumento geral dos nveis de
escolarizao na comunidade e da forte avaliao negativa que os falantes
mais jovens fazem da variante no padro.

6.3 Anlise multivariada


Das 118 entrevistas, extraram-se todas as ocorrncias de sintagmas nominais
plurais com duas ou mais palavras em que pelo menos uma tenha sido flexio-
nada quanto ao nmero (ou seja, no se consideram dados invariveis como
mais nibus, dois culos, tampouco aqueles em que a noo de pluralidade
apenas semntica, como muita criana ou uma srie de coisa). Os mais de 19
mil SNs foram analisados sob duas perspectivas: a atomstica, em que cada
palavra considerada uma unidade de anlise (p.ex., o-s vs. o-; menino-s
vs. menino-), e a no atomstica, em que se analisa o SN como um todo
(p.ex., os meninos vs. os menino-/ o- menino-s) (Scherre, 1988, 1997). Em
ambas, excluram-se dados seguidos de [s, z, S, Z] (p.ex., os meninos so...,
os meninos j..., as - suas - chamadas...), que constituem um contexto de
neutralizao em que no possvel determinar se o morfema de plural foi de
fato realizado. Em sintagmas com trs ou mais palavras, em que h mltiplas
combinaes possveis quanto presena ou ausncia de morfema de plural,
a anlise de SNs contraps a concordncia explcita plena (p.ex., os meus
meninos SSS) concordncia parcial ou seja, a marca zero em pelo menos
uma das palavras flexionveis (p.ex., os meus menino (SS), os meu menino

135
Anlise multivariada

(S), o meus meninos (SS), o meus menino (S), o meu meninos (S).
Ressalta-se que as anlises atomstica e no atomstica so complementares
entre si (trata-se, com efeito, de um mesmo conjunto de dados); elas objetivam
iluminar diferentes processos que ocorrem seja no nvel da palavra (como a
posio do vocbulo em relao ao ncleo), seja no nvel do sintagma (como a
animacidade do SN). Os termos marca zero e CN- so empregados como
equivalentes para fazer referncia variante sem concordncia plena (ainda
que, em rigor, s possa haver concordncia em SNs, e no em vocbulos
avulsos). O termo CN-E empregado para se referir concordncia ou
marca de plural explcita. Para ambas as perspectivas, as anlises incluram
o mesmo conjunto de variveis sociais, descrito no Captulo 3.
A distribuio geral das ocorrncias de concordncia nominal revela que a
marcao de pluralidade semicategrica em contextos de leitura (Tabela 6.1)
e quando o vocbulo ocupa a primeira posio do SN (Tabela 6.2 adiante).

Tabela 6.1 Distribuio de ocorrncias de CN- das perspectivas atomstica


e de SNs, de acordo com Estilo

Atomstica Sintagmas Nominais


N CN- N Total % CN- N CN- N Total % CN-
Estilo
Conversao 2.829 34.130 8,3 2.709 17.866 15,2
Depoimento 19 1.335 1,4 17 516 3,3
Notcia de jornal 8 1.244 0,6 10 659 1,5
2.856 36.709 7,8 2.736 19.041 14,4

A Tabela 6.1 mostra que, tanto da perspectiva atomstica quanto de SNs,


o emprego de CN- pouqussimo frequente na leitura de notcia de jornal
(0,6% e 1,5% respectivamente), de acordo com a previso de que, nesse estilo,
os informantes monitoram mais sua prpria fala. Na leitura de depoimento,
h um aumento considervel das taxas de emprego da variante, uma vez que
mais do que dobram em frequncia (1,4% e 3,3%); esse aumento pode ser
atribudo tanto a um menor grau de monitoramento da fala em razo da
informalidade do texto, quanto ao fato de que alguns informantes o leram de
modo teatralizado, incorporando uma persona:

136
Anlise multivariada

(17) S1: t choven(d)o muito... choven(d)o tanto na semana passada que


ficou uma piscina na minha casa... pra voc ver... molharam todos os
armrio- a cama o colcho tudo! foi um sacrifcio!... o que a gente
fez?... ns tivemos que erguer os mveis pra limpar tudo o/ pra limpar
tudo... a geladeira o forno... minha irm at veio me ajudar sabe?...
meus irmos compraram umas cadeira- novas... mas aquela coisa
assim... quando chover de novo vai molhar tudo outra vez!... [risos]
palhaa n?... voc fica sem ter o que fazer... e tem um rio l perto que
alaga... quer dizer... gua dentro e fora de casa... da que acontece?...
fica aquele trnsito os carro- tudo parado-... a gente demora um
tempo pra chegar em casa... no aguento mais essa enchente nessa
cidade agora o que que eu vou fazer?... os polticos falam falam mas
eles tinha- que fazer alguma coisa urgente... voc t entenden(d)o o que
eu t dizen(d)o? [risos]
D1: [risos] voc leu de uma forma muito legal porque voc criou uma
personagem a n?... quem que voc imagina... falando uma coisa dessa?
S1: eu imagino que uma mulher sofrida coitada que j no tem nada...
e agora tem menos ainda... porque ela mora num lugar que vrzea que
a estria do Pantanal 5 na zona leste que margem de rio de novo...
(Daiane M., F1MC)

Daiane M. sinaliza claramente que est representando uma personagem


atravs da mudana de voz e pela quebra temporria no meio da leitura,
quando ri e diz: palhaa n?. A informante emprega uma srie de variantes
que podem ser consideradas no padro: a assimilao nasal do segmento /d/
em choven(d)o, entenden(d)o, dizen(d)o, a variante qu-que na interrogativa
de constituinte o que que eu vou fazer e a marca zero de concordncia
verbal em eles tinha, entre outras. No texto escrito, essas variveis foram
grafadas chovendo, entendendo, dizendo, que eu vou fazer? e eles
tinham (ver Roteiro de Entrevista no Anexo A, p. 360). De acordo com
Daiane M., sua representao se refere a uma mulher sofrida de classe baixa,
que j no tem nada e agora tem menos ainda em consequncia da enchente
em sua casa. Dentre os traos lingusticos selecionados para represent-la,
encontra-se a marca zero de plural em algumas ocorrncias de SNs plurais.
As taxas de emprego da variante nas duas leituras diferem ainda mais
daquelas observadas para o estilo mais espontneo da conversao (8,3%
e 15,2% na Tabela 6.1). Devido ao baixssimo nmero de ocorrncias de
5
Referncia ao Jardim Pantanal, bairro da Zona Leste de So Paulo.

137
Anlise multivariada

CN- nas leituras, as anlises que seguem se concentram sobre os dados


de conversao somente; deve-se assinalar, no entanto, o forte efeito de
monitoramento da fala, que se apresenta como um dos mais relevantes para a
variao na concordncia nominal.
Quanto Posio Linear do vocbulo dentro do SN, verifica-se tambm
uma distribuio extrema quando a palavra ocupa a primeira posio: a taxa
de marca zero nesse contexto de apenas 0,3% (Tabela 6.2), o que refora
a constatao de estudos prvios de que essa a posio privilegiada para
a marcao de nmero em SNs no portugus brasileiro (Guy, 1981; Scherre,
1988; Brando & Vieira, 2012). Em anlise multivariada de regresso logstica,
a disparidade entre a primeira posio e as demais fica clara nos pesos relativos
(de 0.08 a 0.86) e no amplo range de 78, o que torna essa varivel a mais
relevante para a variao na concordncia nominal.

Tabela 6.2 Tendncias de emprego de CN- de acordo com Posio Linear,


com e sem dados de 1a posio (anlise atomstica)

P.R. % CN- N Total


Posio Lineara
1a posio 0.08 0,3 14.246
2a posio 0.85 14,1 16.934
3a posio 0.85 13,5 2.725
a
4 posio 0.86 14,3 210
5a posio 0.85 13,3 15
Range 78 8,3 34.130
Posio Linear (sem 1a posio)b
2a posio [.50] 14,1 16.934
a
3 posio [.49] 13,5 2.725
4a posio [.51] 14,3 210
a
5 posio [.49] 13,3 15
14,0 19.884
a Input:0,022. b Input: 0,140. [ ] indicam a no seleo da varivel
como significativa.

As demais posies lineares (2a a 5a ) apresentam taxas de marca zero em


torno de 14% no portugus paulistano e pesos relativos bastante prximos
entre si. De fato, uma anlise que exclui os dados de primeira posio deixa de

138
Anlise multivariada

selecionar Posio Linear como uma varivel relevante. Com base nas taxas
de CN- bastante prximas entre si para as posies 2 a 5, no surpreende o
fato de a varivel no ser selecionada. Outros estudos, como o de Braga &
Scherre (1976, apud Scherre 1988), tambm obtiveram resultados semelhantes.
Em outros, no entanto, observou-se uma tendncia gradual de menos marcas
de plural quanto maior a distncia em relao primeira posio (p.ex., Ponte
1979, apud Scherre 1988; Nina 1980, apud Scherre 1988; Guy 1981). Scherre
(1978, 1988), todavia, indica haver tendncias distintas de acordo com o nvel
de escolaridade dos falantes (note-se que sua anlise, diferentemente da que
se apresenta aqui, estabeleceu a marca explcita e no a marca zero como
valor de aplicao):

[...] enquanto o grupo escolarizado apresenta a oposio bsica entre a


posio zero favorecendo a aplicao da regra [de marcao de plural]
e a posio no zero desfavorecendo-a, o grupo semiescolarizado
evidencia uma linha decrescente em termos de favorecimento, partindo
da posio 0 (zero) at a posio 4 (quatro) (Scherre, 1988 : 145146).

As amostras de Ponte (1979), Nina (1980) e Guy (1981), em que se


verificaram tendncias graduais, de fato se referem a informantes com pouco
ou nenhum grau de instruo formal; as amostras de Braga & Scherre (1976,
apud Scherre 1988) e Scherre (1978, 1988), em que se verificou tendncia
binria, abarcam falantes mais e menos escolarizados, assim como a presente
amostra paulistana.
Nos dados apresentados aqui, as diferentes tendncias de marcao de
plural quanto Posio Linear, em diferentes grupos de falantes, foram
testadas em relao ao Nvel de Escolaridade e Classe Social dos informantes.
A Tabela 6.3 compara os pesos relativos e valores de range de acordo com
trs nveis de escolaridade e trs classes sociais da amostra paulistana.
A tendncia gradual de menos marcas de plural em posies mais distantes
da primeira se encontra mais propriamente entre os falantes que estudaram
at o Ensino Fundamental (P.R. 0.72, 0.76 e 0.81, range 9). Entre falantes
com Ensino Mdio ou Superior, as diferenas entre as posies do vocbulo
so menores (ranges 4 e 2), no significativas e no graduais. O mesmo ocorre

139
Anlise multivariada

Tabela 6.3 Tendncias de emprego de CN- de acordo com Posio Linear e


Nvel de Escolaridadea /Classe Socialb
(N CN- = 2.786 (14,0%); N Total = 19.884)

Ens. Fundamental Ens. Mdio Ens. Superior


Posio linear
2a posio 0.72 0.62 0.38
3a posio 0.76 0.58 0.38
4a 5a posies 0.81 0.60 0.36
Range 9 4 2
Classes C-D Classe B2 Classes A-B1
2a posio 0.70 0.39 0.29
3a posio 0.70 0.42 0.25
4a 5a posies 0.72 0.43 0.29
Range 2 4 4
a Input: 0,120. b Input: 0,112.

quanto aos pesos relativos para todas as classes sociais, mesmo as mais baixas,
em que se observam ranges de 2 e 4.
Com base nessas observaes e nos resultados prvios supracitados, parece
possvel a generalizao de que h interferncia supravernacular da escolariza-
o, que sobrescreve a tendncia gradual de aplicao da regra de marcao
de plural para outra regra tambm varivel de oposio binria entre
primeira e demais posies. Nesse caso, trata-se de fato de um efeito da
escolaridade e no da classe social dos falantes.
Feitas essas consideraes sobre as distribuies dos dados quanto ao Estilo
de fala e Posio Linear da palavra, as anlises que seguem consideram somente
as ocorrncias em estilo de conversao (para a anlise atomstica e de SNs) e
em vocbulos a partir da segunda posio do SN (para a anlise atomstica).
Discutem-se inicialmente os resultados para as variveis lingusticas; aqueles
para as variveis sociais, que tambm foram includas nos dois conjuntos de
anlises, vm descritos na sequncia.

140
Anlise multivariada

6.3.1 Anlise atomstica


As variveis lingusticas da anlise atomstica so discriminadas no Quadro
6.1. Embora a codificao tenha sido bastante detalhada inicialmente, foram

Anlise atomstica
Processos vogal oral /s/: casa-casas
Morfofonolgicos de vogal nasal /s/: fim-fins, mo-mos
Formao do Plural -r /is/: professor-professores
(terminao da -l /is/: azul-azuis, pastel-pastis
palavra e morfema) -S /is/: ms-meses, capaz-capazes
-o /js/: profisso-profisses
-o /js/: po-pes
Metafnicos: ovo-[O]vos
Tonicidade do Item monosslabo tnico: vez-vezes
Singular monosslabo tono: o-os
polisslabo oxtono: morador-moradores
paroxtono: ano-anos
proparoxtono: quilmetro-quilmetros
Posio Relativa pr-nuclear: todas as pessoas mais velhas
nuclear: todas as pessoas mais velhas
ps-nuclear: todas as pessoas mais velhas
Classe Morfolgica substantivo: meus amigos, os parques
adjetivo: placas informativas, pases europeus
quantificador indefinido: essas vrias pessoas
demonstrativo: todas essas coisas
possessivo: amigos meus, os seus direitos
artigo definido: todos os dias
pronome: todos eles
Contexto Fnico consoante as meninas [f]oram
Seguinte vogal as meninas [e]nto
pausa as meninas... ento
Paralelismo precedida por CN-: nos ltimo- anos
Intrassintagmtico precedida por CN-E/invarivel: nos ltimos anos
(somente para 3a , 4a e
5a posies)
Item Lexical (efeito aleatrio)

Quadro 6.1 Variveis lingusticas da anlise de (CN-atomstica)

141
Anlise multivariada

realizadas amalgamaes de fatores em certos grupos no desenvolvimento das


anlises estatsticas, que sero oportunamente destacadas. Ao mesmo tempo,
certos pares de variveis lingusticas no so verdadeiramente independentes
entre si por exemplo, Posio Relativa e Classe Morfolgica , de modo que
foi necessrio realizar anlises separadas, ora com uma, ora com outra.
Dentre as variveis lingusticas, Processos Morfofonolgicos de Formao de
Plural e Tonicidade do Item Singular investigam, ambas, o papel da salincia
fnica (Scherre, 1988). A segunda varivel, no entanto, no selecionada
como significativa para a marcao varivel de plural em um modelo de efeitos
mistos, com a incluso do Item Lexical como efeito aleatrio (ver Tabela 6.4).
Embora j se tenha mostrado relevante em outros estudos (Scherre, 1988;
Dias & Fernandes, 2000; Salomo, 2010), possvel que o efeito de tonicidade
se deva a itens lexicais frequentes especficos, como os, coisas ou vezes.

Tabela 6.4 Varivel lingustica no correlacionada com (CN) (anlise atomstica)


(N CN- = 2.786 (14,0%); N Total = 19.884)

P.R. % CN- N Total


Tonicidade
monosslabos tnicos [.44] 4,0 2.167
polisslabos oxtonos [.69] 7,4 2.092
monosslabos tonos+paroxtonos+proparoxtonos [.72] 16,3 15.625
Input: 0,079. [ ] indicam a no seleo da varivel como significativa.

Processos Morfofonolgicos, por sua vez, uma das variveis mais rele-
vantes entre as selecionadas como significativas (Tabela 6.5). Nesta varivel,
foram amalgamados, por um lado, os plurais em -es (pes), -es (profisses),
-r /is/ (professores) e metafnicos (ovos) e, por outro, os plurais em -l /is/
(azuis) e -S /is/ (meses) (2 = 5,74(4), p > 0,20). Palavras terminadas em
vogal oral (casa-s) ou nasal (fin-s, mo-s) favorecem a marca zero de plural
(P.R. 0.80 e 0.71), e a diferena entre esses fatores que se refere nasalidade
da vogal significativa (2 = 18,5(1), p < 0,001), de modo que se manteve
sua separao. Em acordo com a hiptese da salincia, os plurais regulares,
menos salientes, apresentam alta tendncia marca zero, enquanto plurais

142
Anlise multivariada

Tabela 6.5 Tendncias de emprego de CN- de acordo com variveis lingusticas


(anlise atomstica)
(N CN- = 2.786 (14,0%); N Total = 19.884)

P.R. % CN- N Total


Processos Morfofonolgicos de Formao de Plurala
vogal oral /-s/ 0.80 16,0 16.066
vogal nasal /-s/ 0.71 10,7 394
-es + -es + -r /-is/ + metafnicos 0.66 8,1 1.386
-l /-is/ + -S /-is/ 0.43 2,9 2.038
Range 37
Posio Relativab
pr-nuclear 0.47 1,7 1.215
nuclear + ps-nuclear 0.87 14,8 18.669
Range 40
Contexto Fnico Seguinte c

consoante + pausa 0.54 14,9 14.824


vogal 0.49 11,3 5.060
Range 5
Input: 0,044. a 2 = 5,74(4), p > 0,20; b 2 = 1,21(1), p > 0,20; c 2 = 0,02(1), p > 0,80.

irregulares tm pesos relativos menores para a variante.


Para Posio Relativa da palavra, separaram-se inicialmente os itens
lexicais pr-nucleares, nucleares ou ps-nucleares, mas a diferena entre os
dois ltimos no se mostrou relevante (2 = 1,21(1), p > 0,20). Essa varivel
tambm se apresenta como uma das mais importantes para a marcao de
plural, com desfavorecimento da marca zero em posio pr-nuclear (P.R.
0.47), em contraste com a nuclear/ps-nuclear (P.R. 0.87) resultado que se
relaciona com Posio Linear da palavra, conforme se descreveu mais acima: a
posio da palavra dentro do SN relevante tanto em termos lineares quanto
em termos estruturais, relativos ao ncleo, j que posies mais direita
favorecem a marca zero.
O Contexto Fnico Seguinte, por sua vez, mostra uma diferena pequena
mas significativa entre palavras seguidas por consoante ou pausa (P.R. 0.54,
2 = 0,02(1), p > 0,80), que favorecem a marca zero de plural, e aquelas
seguidas de vogal (P.R. 0.49). Tal resultado, j verificado em outros estudos

143
Anlise multivariada

(Guy, 1981), pode ser atribudo tendncia de formao da slaba cannica


CV: quando seguido de vogal, o morfema -s de plural pode ser ressilabificado
[ka.za.za.ma.re.las], enquanto sua manuteno em palavras seguidas de conso-
ante ou pausa gera slabas CVC [ka.zaz.ver.dIs.]. A tendncia marca zero,
nesse contexto, pode ser entendida como uma tendncia fonolgica a evitar
slabas CVC, com coda silbica.
As demais variveis da anlise atomstica foram examinadas em modelos
que no incluem aquelas das tabelas 6.4 e 6.5, ou em modelos com um
subconjunto de dados, a fim de evitar a no ortogonalidade entre certas
variveis. Paralelismo Intrassintagmtico analisa a tendncia de marcao de
plural de acordo com a palavra imediatamente precedente dentro do sintagma.
Considerando-se que a marcao de plural praticamente categrica na 1a
posio, excluram-se dessa anlise os dados de 2a posio (p.ex., ltimo(s)
em nos ltimo(s) ano(s)). A Tabela 6.6 mostra que, quando a 3a , 4a ou 5a
palavra do SN precedida por uma palavra com marca de plural ou invarivel
(p.ex., os meus amigo(s), os dias mais feliz(es)), a tendncia marca
zero desfavorecida (P.R. 0.45); por outro lado, quando precedidas por uma
palavra sem marca de plural (os meu- amigo(s)), a tendncia de ocorrer CN-
bastante alta: 81,8% dessas ocorrncias, equivalente a um peso relativo de
0.98. Em outras palavras, uma vez que se emprega uma palavra com marca
zero, a probabilidade de que a(s) palavra(s) seguinte(s) no mesmo sintagma
apresente(m) o morfema de plural, embora possvel, muito pequena.

Tabela 6.6 Tendncias de emprego de CN- de acordo com Paralelismo


Intrassintagmtico (anlise atomstica)
(N CN- = 400 (13,6%); N Total = 2.950)

P.R. % CN- N Total


Paralelismo Intrassintagmtico
precedida por CN- 0.98 81,8 143
precedida por CN-E/invarivel 0.45 10,1 2.807
Range 53
Input: 0,057.

A varivel Classe Morfolgica no independente de Posio Relativa

144
Anlise multivariada

Tabela 6.7 Tendncias de emprego de CN- de acordo com Classe Morfolgica


(anlise atomstica)
(N CN- = 2.786 (14,0%); N Total = 19.884)

P.R. % CN- N Total


Classe Morfolgica (sem Posio Relativa)
substantivo 0.58 14,8 16.950
adjetivo 0.56 13,2 1.953
quantificador indefinido 0.49 11,5 61
demonstrativo + possessivo 0.16 2,2 554
artigo definido + pronome 0,0 366
Range 42
Input: 0,057.

ao Ncleo, j que substantivos sempre ocupam a posio nuclear (meus


dois irmo(s)) e artigos sempre ocupam posio pr-nuclear (todos o(s) lu-
gar(es)). Desse modo, essas duas variveis foram inicialmente analisadas em
separado. Os resultados na Tabela 6.7 indicam que substantivos e adjetivos
favorecem a marca zero de plural (P.R. 0.58 e 0.56); quantificadores indefinidos
(vrios, muitos) esto prximos do ponto neutro (PR. 0.49); demonstrativos
(esses, aquelas) e possessivos (meus, suas) desfavorecem a variante (P.R.
0.16); e no houve ocorrncias de marca zero em artigos definidos (os, as)
ou pronomes (eles) a partir da segunda posio. Tal hierarquia se assemelha
quela observada para a Posio Relativa, j que artigos definidos, demonstra-
tivos, possessivos e quantificadores indefinidos geralmente ocupam posies
pr-nucleares (desfavorecedoras da marca zero), e adjetivos e substantivos
costumam figurar em posies nucleares e ps-nucleares (favorecedoras da
marca zero) (Cf. Tabela 6.5).
A fim de separar o efeito de Classe Morfolgica e Posio Relativa, realizou-
se uma anlise alternativa com o cruzamento dessas variveis. Excluram-se
substantivos (pelo fato de sempre ocuparem a posio nuclear), e artigos
definidos e pronomes (por no apresentarem variao na presente amostra);
adjetivos e quantificadores definidos, por sua vez, foram amalgamados (2
= 0,05(2), p > 0,950). A Tabela 6.8 mostra que, embora prevalea a dife-

145
Anlise multivariada

rena na hierarquia de restries entre a posio pr-nuclear, por um lado,


e as posies nuclear/ps-nuclear, por outro, h uma diferena significativa
entre demonstrativos/possessivos e adjetivos/quantificadores indefinidos. Os
primeiros desfavorecem mais a marca zero relativamente aos segundos (Cf.
0.13 e 0.29; 0.35 e 0.69). Desse modo, tanto a Classe Morfolgica da palavra
quanto sua Posio Relativa ao ncleo tm um efeito sobre o emprego de
CN-.

Tabela 6.8 Tendncias de emprego de CN- em cruzamento entre Classe


Morfolgica e Posio Relativa (anlise atomstica)
(N CN- = 276 (10,7%); N Total = 2.568)

P.R. % CN- N Total


Classe Morfolgica + Posio Relativa
adjetivo + quant. indefinido nuclear/ps-nuclear 0.69 15,3 1.640
demonstrativo + possessivo nuclear/ps-nuclear 0.35 6,1 66
adjetivo + quant. indefinido pr-nuclear 0.29 3,5 374
demonstrativo + possessivo pr-nuclear 0.13 1,6 488
Range 56
Input: 0,036. 2 = 0,05(2), p > 0,95.

De modo geral, portanto, verifica-se que o portugus paulistano segue a


mesma tendncia de outras comunidades brasileiras quando se consideram os
itens lexicais isoladamente: favorecimento da marca zero em formas menos
salientes; em posio nuclear ou ps-nuclear; em substantivos, adjetivos e
quantificadores indefinidos; e quando a palavra seguida de consoante/pausa
ou precedida por outra com marca zero.

6.3.2 Anlise de SNs


A anlise da perspectiva no atomstica (SNs) incluiu as variveis lingusticas
discriminadas no Quadro 6.2. Dentre essas variveis, Nmero de Palavras
no SN no selecionada como significativa para a concordncia nominal. A
Tabela 6.9 mostra, alm de porcentagens e os respectivos pesos relativos
todos prximos ao ponto neutro , que a maior parte dos dados consiste em

146
Anlise multivariada

Nmero de Palavras duas: os meninos


trs: os meus filhos
quatro: umas coisas meio estranhas
cinco: as coisas muito mais intensificadas
Classe Morfolgica artigo indefinido: uns meninos
do Primeiro artigo definido: os meninos
Elemento Pr-nuclear demonstrativo: essas coisas todas
numeral: duas pessoas
possessivo: meus irmos
adjetivo: melhores condies
quantificador indefinido: alguns erros
todos/todas: todas essas pessoas
substantivo: pessoas bonitas
Configurao com posies ps-nucleares: as pessoas mais velhas
Sintagmtica Ps-Nuclear sem posies ps-nucleares: as pessoas
Animacidade do SN [+humano]: os professores
[-humano]: as coisas
Paralelismo Sinttico primeiro de uma srie
(5 oraes precedentes) precedido por SN com CN-
precedido por SN com CN-E
Sintagma Nominal (efeito aleatrio)

Quadro 6.2 Variveis lingusticas da anlise de (CN-SNs)

sintagmas de duas palavras (quase 15 mil dos 17.866), e que o total de dados
decresce drasticamente para SNs de 3 a 5 palavras.
A Configurao Sintagmtica (ou seja, a organizao das palavras dentro
do SN) analisada de modos diversos nos diferentes estudos sobre concordncia
nominal. Neste trabalho, separaram-se os contextos pr- e ps-nuclear: no
primeiro caso, analisou-se a classe morfolgica da primeira palavra do SN
(artigo definido, numeral, possessivo etc.);6 no segundo, considerou-se a
existncia ou no de palavras em posio ps-nuclear. O resultado dessas e
das demais variveis so apresentados na Tabela 6.10.
SNs encabeados por artigos indefinidos (uns, umas) e demonstrativos
(essas, aqueles) so aqueles que mais favorecem a marca zero (P.R. 0.72);
6
Inicialmente, codificaram-se a Classe Morfolgica do Primeiro e do ltimo Elemento Pr-nuclear. Essas
foram contrastadas, a fim de determinar qual delas exercia maior influncia no emprego de CN-. Um
teste de qui-quadrado entre essas anlises indica que mais relevante a Classe Morfolgica da Primeira
Palavra, com menor valor absoluto de logaritmo de verossimilhana (Cf. l.l. 2086,734 vs. 2091,516; ver
Guy & Zilles 2007 : 190-193); excluiu-se, portanto, a varivel Classe Morfolgica do ltimo Elemento
Pr-Nuclear e manteve-se apenas aquela que considera o primeiro elemento.

147
Anlise multivariada

Tabela 6.9 Varivel lingustica no correlacionada com (CN) (anlise de SNs)


(N CN- = 2.709 (15,2%); N Total = 17.866)

P.R. % CN- N Total


Nmero de palavras
Duas [.50] 15,1 14.98
Trs [.51] 15,4 2.663
Quatro [.56] 18,3 208
Cinco [.46] 13,3 15
Input: 0,152. [ ] indicam a no seleo da varivel como significativa.

artigos definidos (os, as), possessivos (meus, suas) e numerais (dois) revelam
tendncia neutra (P.R. 52); e adjetivos (belas; P.R. 33), quantificadores
indefinidos (alguns; P.R. 0.28) e substantivos (pessoas; P.R. 0.15) desfavorecem
a variante. H muitas das ocorrncias de demonstrativos que se referem no
a algo especfico, mas a categorias gerais de pessoas ou coisas:

(18) a. aquele pessoal que vai no funk tem aquelas calcinhas coladinha-...
tem uma roupa de funk baile funk (Clara C., F2SC)
b. d vontade de rir n? porque elas parece aquelas velha- que
reclama n? (Mariana B., F2MP)
c. puta j toquei meu... at em em... essas parada- de forr serta-
nejo de... (Luis A., M1SP)

Desse modo, possvel que o favorecimento de CN- em SNs iniciados por


artigos indefinidos e demonstrativos se deva a um trao semntico [-definido].
Quanto Configurao Sintagmtica Ps-nuclear, a presena de palavras
em posies ps-nucleares favorece a marca zero (P.R. 0.69), enquanto sua
ausncia a desfavorece (P.R. 0.48). Tal resultado est em consonncia com o
resultado verificado para a varivel Posio Relativa da anlise atomstica, que
mostrou que a posio ps-nuclear favorece a ausncia de marca de nmero.
O Paralelismo Sinttico (Scherre & Naro, 1992; Scherre, 1998, 2001),
investigado em diversos estudos prvios em mltiplas localidades do pas (ver
Seo 6.1), manifesta resultados similares em So Paulo: SNs precedidos por
outros SNs com marca zero favorecem CN- (P.R. 0.70), e SNs precedidos por
SNs com concordncia plena a desfavorecem (P.R. 0.45); quando se trata do

148
Anlise multivariada

Tabela 6.10 Tendncias de emprego de CN- de acordo com variveis lingusticas


(anlise de SNs)
(N CN- = 2.709 (15,2%); N Total = 17.866)

P.R. % CN- N Total


Classe Morfolgica do Primeiro Elemento Pr-nucleara
artigo indefinido + demonstrativo 0.72 28,4 2.424
artigo definido + numeral + possessivo 0.52 14,5 12.375
adjetivo 0.33 8,9 1.060
quantificador indefinido + todos 0.28 6,6 1.407
substantivo 0.15 6,3 600
Range 57
Paralelismo Sinttico
precedido por SN com CN- 0.70 48,4 1.393
primeiro de uma srie 0.52 16,1 7.806
precedido por SN com CN-E 0.45 9,0 8.667
Range 25
Configurao Sintagmtica Ps-nuclear
com posies ps-nucleares 0.69 16,6 1.456
sem posies ps-nucleares 0.48 15,0 16.410
Range 21
Animacidade
[+humano] 0.54 16,2 5.581
[humano] 0.48 14,7 12.285
Range 6
Input: 0,051. a 2 = 5,52(4), p > 0,20.

primeiro SN de uma srie (neste estudo, a ausncia de SNs plurais nas cinco
oraes precedentes), a tendncia prxima do ponto neutro (P.R. 0.52),
semelhante probabilidade geral da amostra. Em complemento anlise do
Paralelismo Intrassintagmtico da anlise atomstica, percebe-se que o efeito
serial do paralelismo atua tanto dentro do sintagma quanto na relao do SN
com outros SNs que o precedem.
Animacidade, por sua vez, revela tendncia oposta quela normalmente
verificada em outros estudos (ver, p.ex., Brando & Vieira 2012): so os SNs
com o trao [+humano] que favorecem CN- (P.R. 0.54) em relao queles
com o trao [-humano] (P.R. 0.48). De fato, alguns SNs recorrentes que
tendem a favorecer a marca zero so os cara e os moleque; no entanto, a

149
Anlise multivariada

incluso de Item Lexical como efeito aleatrio indica que no se trata de um


efeito superficial desses itens especficos.7 Resultados semelhantes quanto
Animacidade foram observados por McLaughin (2013), em seu estudo sobre
trs variveis do ingls de 88 afro-descendentes em Chapel Hill (NC, EUA): o
morfema -s de 3a pessoa do singular (ex. My momma make-s/ me clean up
minha me me faz limpar); o apagamento da cpula (ex.: shes/ older than
me ela mais velha do que eu); e contrao de is/has (ex.: Europe is/s nice
a Europa legal; Im sure it has/s been done Tenho certeza de que est
feito). Os trs casos (a variante zero de -s na 3PS, o apagamento da cpula
e a contrao de is/has) foram favorecidos por SNs com o trao [+humano].
Assim, diferentemente da anlise atomstica, que sinalizou forte concor-
dncia do portugus paulistano com os padres de outras comunidades, aqui
se verifica uma varivel cujo efeito se d na direo contrria. Esses resulta-
dos indicam que a correlao com Animacidade nem sempre segue a mesma
direo, e que o favorecimento de CN- por SNs [humano] ou [animado]
no generalizado no portugus brasileiro.

6.3.3 Variveis sociais


Os resultados para as variveis sociais so aqui apresentados paralelamente
para as anlises atomstica e no atomstica (SNs) que incluram, ambas,
as mesmas sete variveis (ver Captulo 3, p. 59) , ainda que tenham
sido realizadas separadamente. Os resultados so apresentados nas mesmas
tabelas apenas para que possam ser diretamente comparados: ambas exibem
resultados similares, quando no idnticos. Nelas, coincidem o conjunto de
variveis selecionadas, sua hierarquia de seleo e os valores de range algo
esperado, posto que se trata do mesmo conjunto de dados.
No so selecionadas como significativas para a concordncia nominal a
Origem dos Pais, a Regio de Residncia e a Faixa Etria (Tabela 6.11). A
Idade do falante (varivel contnua) tampouco selecionada, o que indica que
a concordncia nominal parece ser um caso de variao estvel em So Paulo.
7
possvel que haja a atuao do grau de formalidade do item lexical (Scherre, 1988), varivel no tes-
tada na presente pesquisa. Contudo, no deixa de ser digna de nota a seleo da varivel Animacidade
em direo contrria de outros estudos.

150
Anlise multivariada

Tabela 6.11 Variveis sociais no correlacionadas com (CN)

Atomsticaa SNsb
N CN- = 2.786 (14,0%) N CN- = 2.709 (15,2%)
N Total = 19.884 N Total = 17.866
P.R. % CN- N Total P.R. % CN- N Total
Origem dos Pais
N/NE [.57] 19,1 1.482 [.71] 19,9 1.340
estrangeira+interior+So Paulo [.49] 15,3 11.497 [.52] 16,6 10.365
mista [.29] 10,7 6.905 [.43] 11,6 6.161
Range (28) (28)
Regio de Residncia
bairro mais perifrico [.52] 14,1 11.079 [.51] 15,3 9.961
bairro mais central [.49] 13,9 8.805 [.49] 15,1 7.905
Range (3) (2)
Faixa Etria
2034 anos [.51] 13,5 6.233 [.48] 14,3 5.613
3559 anos [.42] 11,0 7.173 [.44] 12,2 6.405
60+ anos [.56] 17,9 6.478 [.58] 19,2 5.848
Range (14) (14)
a Input: 0,082. b Input: 0,061. [ ] indicam a no seleo da varivel como significativa.

A reconfigurao da varivel Origem dos Pais em trs fatores na Tabela


6.11 corresponde a amalgamaes realizadas em modelos de efeitos fixos; sem
a incluso de Falante como efeito aleatrio, os resultados haviam indicado o
favorecimento de CN- por filhos de migrantes do Norte e do Nordeste do
pas, e desfavorecimento por falantes cujos pais so provenientes de locais
distintos entre si. Os filhos de italianos, includos entre os estrangeiros, no
apresentaram tendncias significativamente diferentes de filhos de paulistanos
ou de migrantes do interior. Tal resultado, no entanto, no se mantm quando
se inclui o falante como efeito aleatrio (diferentemente do que ocorre na
anlise sobre (-r), ver Captulo 5), o que indica que os efeitos observados no
se devem s categorias da varivel, mas a tendncias de falantes individuais.
Desse modo, malgrado a constante associao da variante com um falar
italianado, no se pode afirmar, com base nessa amostra no estratificada
de acordo com a Origem dos Pais , que o emprego de CN- tenha alguma
influncia da imigrao italiana na cidade.
De modo semelhante, a despeito da avaliao de Tatiana M. que associa

151
Anlise multivariada

a marca zero com os moradores de periferia (excerto (14), p. 134), no h


correlao com Regio de Residncia diferentemente do que se observa
para (e) e (-r). A frequente associao da variante com o bairro da Mooca,
entretanto, investigada adiante por meio do cruzamento entre Regio e Zona
de Residncia.
Em estudos prvios sobre a concordncia nominal, o Nvel de Escolaridade,
quando considerado, frequentemente se mostra relevante para a variao.
Ainda que a presente amostra tenha sido estratificada entre falantes que
atingiram o Ensino Mdio e aqueles que prosseguiram para o Ensino Superior,
a anlise apresentada na Tabela 6.12 separa do primeiro grupo os falantes
com nvel de Ensino Fundamental. A categorizao em trs nveis permite
entrever que a correlao gradual e sistemtica: falantes que estudaram at
o Ensino Fundamental favorecem fortemente a marca zero (P.R. 0.85 e 0.81);
aqueles que estudaram at o Ensino Mdio a favorecem em menor grau (P.R.
0.67 e 0.64); e aqueles com nvel superior tendem a desfavorec-la (P.R. 0.32
e 0.35). Em outras palavras, quanto menor o nvel de escolaridade, maior a
tendncia de emprego das variantes proscritas pela norma culta.

Tabela 6.12 Tendncias de emprego de CN- de acordo com Nvel de


Escolaridade (anlise atomstica e de SNs)

Atomsticaa SNsb
N CN- = 2.786 (14,0%) N CN- = 2.709 (15,2%)
N Total = 19.884 N Total = 17.866
P.R. % CN- N Total P.R. % CN- N Total
Nvel de Escolaridade
At Ens. Fundamental 0.85 29,7 2.415 0.81 31,8 2.192
At Ens. Mdio 0.67 18,4 6.358 0.64 19,8 5.775
Ens. Superior 0.32 8,1 11.111 0.35 8,8 9.899
Range 53 46
a Input: 0,068. b Input: 0,074.

Pode-se questionar, no entanto, se esse resultado se deve interferncia


direta da escolarizao (tal qual se verificou para as tendncias de emprego de
marca zero quanto Posio Linear, na Tabela 6.3 acima) ou se se trata de um

152
Anlise multivariada

efeito colateral da classe socioeconmica dos falantes, uma vez que diferentes
nveis de escolaridade restringem as oportunidades de posicionamento no
mercado de trabalho, de ascenso social e de estabelecimento de redes sociais
dos falantes. O contraste com os resultados para a varivel Classe Social pode
iluminar essa questo.
A Classe Socioeconmica dos falantes se apresenta como a varivel social
que se correlaciona mais fortemente com CN-, com ranges de 64-65. Da
Tabela 6.13, depreende-se que quanto mais baixo o nvel socioeconmico,
mais alta a tendncia ao emprego da marca zero, desde as classes mais
altas A/B1 (P.R. 0.13 e 0.23) at as classes mais baixas C2/D (P.R. 0.77
e 0.88). Como varivel contnua, o ndice Socioeconmico exibe valor de
-1.23 logodds (p < 0,001) a cada unidade da escala social (de 1 a 5). Para
avaliar a preponderncia de Escolaridade ou Classe Social, computou-se o
valor de qui-quadrado que contrasta as anlises; tal comparao indica que a
segunda tem maior poder de previso do que a primeira para a ocorrncia
da marca zero (2 = 93,3(1), p < 0,001 para a anlise atomstica, 2 =
19,64(1), p < 0,001 para a anlise de SNs). Desse modo, parece mais razovel
interpretar que as tendncias de emprego observadas em diferentes nveis de
escolaridade so decorrncia do status social dos falantes e das redes sociais
que eles estabelecem com falantes da mesma classe social. Sugere-se aqui
que os consistentes resultados observados para Escolaridade, em diversas
comunidades, sejam interpretados no pela eficcia do sistema educacional,
mas pelas oportunidades de ascenso social que oferece ao indivduo que, por
sua vez, acomoda-se aos padres esperados de seu estrato socioeconmico.
O Sexo/Gnero dos falantes tambm se correlaciona a (CN), com favoreci-
mento de CN- por parte dos homens (P.R. 0.64 e 0.63) e desfavorecimento
pelas mulheres (P.R. 0.38 e 0.36). Tendo em vista as correlaes que geral-
mente se observam para variveis cujas variantes se diferenciam em graus de
estigma ou prestgio, os presentes resultados esto de acordo com a expec-
tativa de que a variante no padro seja favorecida pelos falantes de sexo
masculino. No entanto, os estudos sobre a concordncia nominal, sobretudo
em comunidades urbanas, nem sempre verificam a correlao com a varivel
Sexo/Gnero (ver, p.ex., Salomo 2010; Brando & Vieira 2012) ou correla-

153
Anlise multivariada

Tabela 6.13 Tendncias de emprego de CN- de acordo com variveis sociais


(anlise atomstica e de SNs)

Atomsticaa SNsb
N CN- = 2.786 (14,0%) N CN- = 2.709 (15,2%)
N Total = 19.884 N Total = 17.866
P.R. % CN- N Total P.R. % CN- N Total
Classe Social
A/B1 0.13 5,4 5.119 0.23 5,9 4.528
B2 0.38 8,9 5.981 0.35 9,7 5.343
C1 0.64 18,0 5.127 0.63 19,0 4.656
C2/D 0.77 28,9 3.657 0.88 31,1 3.339
Range 64 65
Sexo/Gnero
feminino 0.38 9,8 9.327 0.36 10,4 8.434
masculino 0.64 17,8 10.557 0.63 19,4 9.432
Range 26 27
Mobilidade c,d

baixa 0.54 21,9 4.122 0.65 23,8 3.727


mdia + alta 0.36 12,0 15.762 0.46 12,9 14.139
Range 18 19
a Input: 0,044. b Input: 0,051. c,d 2 = 1,46(1), p > 0,20.

es to fortes quanto a que se observa em So Paulo, com range de 26-27.


Mendes (no prelo), em seu estudo sobre a concordncia nominal e identidades
de gnero, constatou a mesma correlao em sua amostra de 36 entrevistas
sociolingusticas, e que homens gays efeminados tendem a desfavorecer a
marca zero ainda mais do que as mulheres. vista desse resultado, o autor
sugere que, na comunidade paulistana, homens tendem a empregar CN- de
modo a evidenciar sua masculinidade. Ainda que o presente estudo diferencie
os falantes mais propriamente quanto ao sexo, e no quanto ao gnero ou
quanto marcao, no discurso, de um modo mais ou menos masculino de
ser, uma explicao semelhante parece plausvel para dar conta no apenas da
direo observada para a correlao (favorecimento de CN- pelos homens),
mas para a grande diferena entre tendncias de homens e mulheres. Na
cidade de So Paulo, a marca zero parece funcionar no s como forte estrati-
ficador de classes sociais e nveis de escolaridade, mas tambm como ndice

154
Anlise multivariada

de masculinidades.
Quanto Mobilidade Geogrfica, os falantes com menor mobilidade (aque-
les que sempre viveram no mesmo bairro) tendem a empregar a marca zero
(P.R. 0.54 e 0.65), ao passo que os falantes com maior mobilidade (que j
se mudaram do bairro ou zona de origem) tendem a evit-la (P.R. 0.36 e
0.46). Isso sinaliza a importncia de uma identidade local para o emprego da
variante. Essa possvel influncia pode ser analisada pelo cruzamento entre
Regio de Residncia e Zona, que permite um mapeamento mais detalhado da
cidade. Os nove fatores da nova varivel (as zonas Norte, Sul, Leste e Oeste
subdivididas entre parte central e perifrica, mais a Zona Central) passaram
por amalgamaes at que se chegasse ao modelo mais sinttico da Tabela
6.14 (2 = 2,95(5), p > 0,70 para anlise atomstica e 2 = 3,29(5), p > 0,50
para anlise de SNs).
Tabela 6.14 Tendncias de emprego de CN- em cruzamento entre Regio e Zona
de Residncia (anlise atomstica e de SNs)

Atomsticaa SNsb
N CN- = 2.786 (14,0%) N CN- = 2.709 (15,2%)
N Total = 19.884 N Total = 17.866
P.R. % CN- N Total P.R. % CN- N Total
Regio + Zona de Residncia
ZL Central 0.85 35,1 934 0.85 37,7 851
ZL Perifrica 0.65 18,9 2.612 0.66 19,7 2.374
ZN Perifrica+Sul+Oeste 0.46 12,7 13.681 0.46 13,8 12.275
Zona Central + ZN Central 0.41 8,7 2.657 0.40 9,6 2.366
Range 44 45
a Input: 0,064. 2 = 2,95(5), p > 0,70. b Input: 0,053. 2 = 3,29(5), p > 0,50.

Os moradores da Zona Leste Central so aqueles que mais favorecem


a marca zero (P.R. 0.85 para a anlise atomstica e de SNs), seguidos dos
moradores da Zona Leste Perifrica (P.R. 0.65 e 0.66); os residentes das Zonas
Central e Norte Central so aqueles que mais desfavorecem essa variante
(P.R. 0.41 e 0.40), e os das demais regies exibem tendncia mais prxima ao
ponto neutro (P.R. 0.46). Ora, a Zona Leste Central justamente onde se
localiza o bairro da Mooca, frequentemente associado expresso dois pastel

155
Identidades locais

e um chopes pelos falantes paulistanos. Neste caso, a avaliao feita pela


comunidade CN- mais frequente entre os moradores da Mooca coincide
com aquilo que se observa empiricamente.
A prxima seo se volta mais detalhadamente para a questo das identi-
dades locais, seja com o bairro, seja com a cidade: como se d o encaixamento
social de CN- em diferentes partes da cidade? Em especial, a forte associao
no discurso popular entre a marca zero e o bairro da Mooca ocorreria apenas
pelo seu uso mais frequente, ou tambm por padres divergentes de variao
lingustica em relao comunidade? Recorde-se o comentrio de Iara S.
(6), que afirma que na Mooca a variante comumente empregada mesmo
na fala de pessoas mais escolarizadas, como seu irmo mdico. Poderia a
associao da marca zero com o bairro advir de uma maior semelhana nos
usos lingusticos por parte de pessoas com diferentes graus de escolaridade ou
pertencentes a classes sociais distintas?

6.4 Identidades locais


As anlises acima no indicaram correlaes entre (CN) e Regio de Residncia
ou Faixa Etria dos falantes. No entanto, um cruzamento entre essas variveis
revela diferentes tendncias nas regies central e perifrica.8
Na Figura 6.3, observa-se que os falantes com mais de 60 anos que residem
em bairros mais centrais favorecem mais a marca zero (P.R. 0.60) do que
aqueles de regies perifricas (P.R. 0.52), assim como os falantes entre 3559
anos das reas centrais desfavorecem CN- (P.R. 0.48) relativamente menos do
que os de reas perifricas (P.R. 0.37). Tais tendncias podem ser visualizadas
pelas curvas paralelas para as duas faixas etrias mais altas. Isso, no entanto,
inverte-se entre os falantes mais jovens: entre esses, so os habitantes das reas
perifricas que favorecem CN- (P.R. 0.56) em relao aos de reas centrais
(P.R. 0.44). Alm disso, enquanto para os residentes de bairros mais centrais
se esboa um quadro de mudana em favor da variante prescrita pela norma
culta (a tendncia de emprego de CN- gradativamente menor entre os mais
8
Os resultados reportados nesta subseo se referem ao arquivo de dados da anlise de SNs, que no
diferem significativamente das anlises atomsticas.

156
Identidades locais

0.8
0.6
Pesos Relativos

0.4
0.2

Bairro perifrico
0.0

Bairro central

60+ 3559 2034

Faixa Etria

Figura 6.3 Pesos relativos referentes ao emprego de CN- no cruzamento entre


Regio de Residncia e Faixa Etria

jovens, relativamente aos mais velhos), para os de regies mais perifricas


se configura o tpico quadro de variao estvel, com desfavorecimento da
variante proscrita por parte dos falantes da faixa etria intermediria.9 Esses
padres parecem estar de acordo com as avaliaes dos paulistanos da amostra:
entre os mais velhos, a partir da segunda faixa etria, o emprego da marca zero
associado aos falantes de bairros tradicionais de So Paulo, como a Mooca,
Brs e Bexiga, localizados nas regies mais centrais; entre os mais jovens,
tal avaliao tem se enfraquecido em favor da associao com residentes de
bairros de periferia.
Entretanto, de acordo com a subseo anterior, no so todos os falantes
da rea central que favorecem a marca zero; dentre eles, os habitantes da Zona
Leste Central se destacam por sua forte tendncia de emprego da variante.
Com base nas porcentagens, realizaram-se ento outros cruzamentos: um entre
o mapeamento mais detalhado da cidade (de acordo com as quatro categorias
da Tabela 6.14) e a Escolaridade, e outro entre o mesmo mapeamento e a
Classe Social dos falantes.
A Figura 6.4 (topo) mostra que as taxas de emprego de CN- so maiores
entre os falantes com menor nvel de escolaridade em relao aos de Ensino
Superior, exceto para as zonas Central e Norte Central (para as quais as
9
O mesmo padro ser observado na anlise da varivel (CV), no Captulo 7.

157
Identidades locais

60
Ensino Mdio
Ensino Superior
50
Porcentagens

40

30

20

10

0
ZLC ZLP ZO, ZS e ZNP ZC e ZNC

Regio/Zona
80
A B1
B2
C1
60 C2 D
Porcentagens

40

20

0
ZLC ZLP ZO, ZS e ZNP ZC e ZNC

Regio/Zona

Figura 6.4 Taxas de emprego de CN- no cruzamento entre Regio/Zona e Nvel


de Escolaridade (topo) e Classe Social (abaixo)

taxas foram idnticas); no entanto, entre os falantes menos escolarizados, os


habitantes da Zona Leste Central a empregam com frequncia muito maior
(53,9%) do que os das demais regies da cidade, cujas taxas variam entre 9,5
a 23,3%.
Algo semelhante se verifica no cruzamento com classe social. Na Figura
6.4, em todas as regies, h taxas gradualmente maiores de emprego de CN-
quanto mais baixa for a classe social (com exceo, novamente, das zonas
Central e Norte Central, cujas taxas se aproximam de 10%). Nas zonas
Leste Central e Perifrica, no h, nesta amostra, falantes das classes sociais
mais altas A e B1, o que deve ter contribudo para as maiores tendncias

158
Sntese

ao emprego da marca zero nessas regies. Entretanto, entre os falantes das


classes mais baixas C2 e D, a taxa de emprego de CN- muito mais alta na
Zona Leste Central (73,1%), superior ao dobro daquelas das demais regies
(29,4% para a Zona Leste Perifrica; 32,8% para as zonas Oeste, Sul e Norte
Perifrica; e 10% nas zonas Central e Norte Central).
Desse modo, no se verificam tendncias divergentes entre os residentes
da Zona Leste Central, que poderiam destac-los do restante da comunidade
por exemplo, maior emprego de CN- entre falantes mais escolarizados ou
de classe mdia/alta. A associao da variante com os falantes que residem
especificamente no bairro da Mooca parece ser decorrncia to somente de
taxas exageradas de emprego da marca zero por parte de certos residentes dessa
rea da cidade, que evidentemente destoam das mdias em outras regies.
O esteretipo acerca do portugus paulistano provavelmente advm da:
alguns dos falantes mais prototpicos da cidade, cuja variedade identificada,
nomeada e comentada no discurso popular o mooqus , apresentam taxas
bastante superiores de emprego da marca zero. Nesse aspecto, a identidade
local com o bairro ou com a cidade parece refor-las, uma vez que dois
pastel, antes de ser errado, paulistano.

6.5 Sntese
Os diversos estudos sobre a concordncia nominal no portugus brasileiro
j permitem diversas generalizaes quanto ao encaixamento lingustico das
variantes, cujo emprego se correlaciona Posio Linear e Relativa do vocbulo
dentro do SN, Salincia Fnica, ao Contexto Fnico Seguinte, ao Paralelismo
Intra- e Intersintagmtico, Configurao Sintagmtica Pr- e Ps-nuclear e
Animacidade do SN. No presente estudo, o nico resultado divergente daquele
observado em outras comunidades se refere a esta ltima varivel, em que
se verificou o favorecimento de CN- em sintagmas com o trao [+humano].
Quanto a fatores sociais, as presentes anlises reiteram a forte correlao com
o Nvel de Escolaridade dos falantes, mas permitem defender que tal resultado
seja mais apropriadamente interpretado como efeito indireto da Classe Social
e das redes sociais que os falantes estabelecem. Alm disso, observou-se a

159
Sntese

influncia do grau de Mobilidade Geogrfica e do Sexo/Gnero dos falantes


este ltimo, em um grau mais forte do que mormente se verifica em outras
comunidades urbanas.
Tendo em vista que muitos dos padres sociais e lingusticos acerca da
concordncia nominal de nmero so recorrentes em diferentes comunidades,
necessrio se voltar a novas questes. Este captulo enfoca os possveis meca-
nismos que operam na associao dos usos lingusticos com certas identidades
sociais, atravs da anlise do discurso metalingustico dos informantes, bem
como dos padres de variao na comunidade. Em especial, investigaram-
se as motivaes para a associao da marca zero especificamente com os
paulistanos, quando a varivel est presente em todo o territrio brasileiro.
Sugere-se que tal associao se deve s altas taxas de emprego das variantes
por parte de habitantes de bairros tradicionais de So Paulo, sobretudo a
Mooca, mas sinaliza-se que as percepes da comunidade esto em vias de
mudana, em direo a uma associao mais forte com o nvel de escolaridade
e condio socioeconmica dos falantes. Alm disso, a variante no padro
parece funcionar como ndice de identidade de gnero, dada a ampla dife-
rena entre as tendncias de homens e mulheres (maior do que em outras
comunidades urbanas); CN- parece funcionar como estratgia de indexao
de masculinidades (Mendes, 2014, no prelo). As anlises que este captulo
traz sobre o significado social da variao, para alm dos amplos padres
observados, conduzem a novas interpretaes da vitalidade de certas formas
lingusticas em diferentes subgrupos da comunidades.

160
7
A varivel (CV)

Este captulo contrasta os resultados das anlises multivariadas


para a concordncia verbal de 1PP e de 3PP, a fim de avaliar se se
trata de duas variveis distintas ou de uma nica varivel (Labov,
1969), com os mesmos padres e regras. Aps demonstrar que
ambas se correlacionam com o mesmo conjunto de variveis inde-
pendentes, que so selecionadas na mesma ordem de importncia
e com a mesma hierarquia interna de restries constituindo-se,
portanto, uma nica varivel sociolingustica , discute-se o status
da marca zero na comunidade quanto estabilidade ou no da con-
cordncia verbal e quanto ao maior estigma associado variante
em 1PP do que em 3PP, no sentido de avanar o entendimento
sobre a relao entre usos lingusticos e significados sociais.

A variao na concordncia verbal entre a marca zero (CV-) e a marca


explcita (CV-E) de nmero certamente um dos fenmenos mais estudados
na sociolingustica brasileira, juntamente com a concordncia nominal e a
pronncia de (-r) em coda silbica. H estudos do norte ao sul do pas,
em comunidades rurais, urbanas e rurbanas (Bortoni-Ricardo, 1985), que
incluem falantes de diferentes faixas etrias, graus de escolarizao e nveis
socioeconmicos. Entre esses estudos, predominam aqueles sobre terceira
pessoa do plural (3PP), como em eles vo vs. eles vai (ver, p.ex., Naro
1981; Guy 1981; Bortoni-Ricardo 1985; Rodrigues 1987; Scherre & Naro 2006;
Scherre et al. 2007; Monguilhott 2009; Brando & Vieira 2012; Lucchesi
A varivel (CV)

2012; Rubio 2008, inter alia). Os estudos sobre primeira pessoa do plural
(1PP), como em ns vamos vs. ns vai, apresentam-se em menor nmero
(ver, p.ex., Bortoni-Ricardo 1985; Rodrigues 1987; Naro et al. 1999; Zilles
et al. 2000; Pereira 2004; Coelho 2006; Rubio 2012), assim como os que
tratam da concordncia de 2a pessoa (em geral, com o pronome tu; ver, p.ex.,
Loregian-Penkal 2004) e de infinitivo (ver, p.ex., Grski 2000; Canever 2012).
Embora alguns trabalhos se dediquem anlise tanto de 1PP quanto de
3PP, nem sempre os resultados para cada pessoa gramatical so contrastados
sistematicamente: trata-se, afinal, de duas variveis distintas ou de uma
mesma varivel sociolingustica?
Labov (1969) depara com situao semelhante ao analisar a realizao
varivel da cpula no ingls de afro-descendentes em Nova Iorque, em que
trs formas do verbo be podem se alternar: (i) uma forma plena (1-a); (ii)
uma forma contrada (1-b); e (iii) e uma forma apagada (1-c).

(1) a. He is better than the girls is now Ele est melhor do que as meninas
agora
b. Thas my daily routine: women Essa minha rotina diria: mulheres
c. She the first one started us off Ela a primeira que nos fez comear
[alguma tarefa]
(Exemplos extrados de Labov 1969: passim)

Duas questes metodolgicas se apresentam a respeito do envelope de variao


(Labov, 1969), ou seja, quais ocorrncias devem ser includas na anlise
quantitativa: devem-se contar as trs possibilidades de realizao ou apenas
duas delas (e, neste ltimo caso, qual das formas deve ser excluda)? E
devem-se incluir os casos de am sou, estou, is , est e are so, somos,
esto, estamos ou apenas uma ou duas das formas? Essa segunda pergunta
claramente se relaciona com a presente anlise sobre a concordncia verbal:
devem-se considerar os dados de 1PP e de 3PP conjunta ou separadamente?
Quanto primeira dessas questes, Labov (1969 : 722) demonstra que o
apagamento da cpula ocorre apenas em contextos gramaticais que tambm
permitem sua contrao: quando esta agramatical em ingls (*How beautiful
youre! Que bonito(a) voc !), tambm o o apagamento (*How beautiful

162
A varivel (CV)

you! Que bonito(a) voc!). Desse modo, o autor prope que o envelope de
variao composto pelas formas contradas (1-b) e apagadas (1-c), que esto
sujeitas s mesmas restries gramaticais. Quanto segunda questo, Labov
(1969) decide analisar as ocorrncias de is e are separadamente, j que esta
apresenta uma taxa de apagamento bastante superior da primeira; os casos
de am, por sua vez, so quase categoricamente realizados (99%) na forma
contrada Im, de modo que o autor prefere descart-los.
No entanto, Rickford et al. (1991) se propem a analisar sistematicamente
essas duas decises metodolgicas, a fim de avaliar as consequncias para os
resultados de anlises quantitativas. Para a primeira das questes quais
os efeitos de se inclurem formas plenas, contradas e apagadas de be, ou
apenas um subconjunto delas , os autores constatam grandes diferenas nos
resultados a depender de quais variantes so includas na anlise. Para a
segunda se is e are podem ser consideradas conjuntamente , Rickford et al.
(1991) concluem que os efeitos no diferem significativamente e que, portanto,
is e are podem ser consideradas uma nica varivel.
Nesse sentido, o presente estudo primeiramente contrasta padres de
variao na concordncia verbal de 1PP e de 3PP, com vistas a determinar se
se trata de duas variveis distintas ou no.1 Aps fazer uma breve reviso
bibliogrfica de estudos sobre a concordncia verbal de 1PP e de 3PP no
portugus brasileiro e no portugus paulistano, a seo subsequente traz os
resultados de anlises multivariadas, pelos quais se demonstra que 1PP e
3PP constituem uma mesma varivel sociolingustica: ambas se correlacionam
com um mesmo conjunto de variveis independentes, que so selecionadas na
mesma ordem de importncia e com a mesma hierarquia interna de restries
para cada varivel.
Diante desses resultados, a seo seguinte avalia o status da marca zero
na comunidade paulistana quanto a diferentes graus de estigma na 1PP e na
3PP. Os resultados mostram que, embora as tendncias de emprego da marca
1
No se analisam aqui as ocorrncias de segunda pessoa do plural (vocs vo vs. vocs vai) pelo nmero
bastante reduzido de dados, em termos tanto absolutos quanto relativos: foram apenas 103 ocorrncias
de sintagmas verbais de 2PP, que correspondem a menos de 10% do total de dados para 1PP e a cerca de
1% dos dados para 3PP. De fato, o emprego de 2PP em situao de entrevistas sociolingusticas pouco
esperado, sobretudo quando consistem em interlocues entre um informante e um documentador, como
o caso da grande maioria de gravaes da presente amostra.

163
A concordncia verbal no portugus brasileiro e no portugus
paulistano

zero em 1PP e em 3PP no se diferenciem significativamente na comunidade


como um todo, falantes menos escolarizados, de classe social mais baixa e com
menor mobilidade geogrfica tendem a empregar a marca zero mais em 1PP
do que em 3PP; ao mesmo tempo, falantes mais escolarizados, de classe social
mais alta e com maior mobilidade evitam fortemente as formas mais salientes
de 1PP (Naro et al., 1999). Tais fatos podem explicar o maior estigma da
marca zero em 1PP do que em 3PP.
Por fim, demonstra-se que, nas regies centrais, h um movimento em
tempo aparente na direo da marca explcita de nmero, de modo semelhante
ao que se verificou para (CN), enquanto nas regies perifricas se observa um
quadro de variao estvel para 3PP e um esboo de mudana em favor da
marca zero para 1PP. Tais fatos evidenciam novamente que variao estvel
pode esconder padres mais complexos dentro da comunidade.

7.1 A concordncia verbal no portugus


brasileiro e no portugus paulistano
Em conjunto, os estudos j desenvolvidos sobre 1PP e 3PP permitem traar
certas generalizaes sobre a concordncia verbal no portugus brasileiro. As
taxas mdias de emprego das variantes sancionadas pela norma culta variam
drasticamente quando se comparam diferentes comunidades, de 30% a 100%
para 1PP e de 17% a 94% para 3PP (ver Rubio & Gonalves 2012 : 10201024
e Lucchesi 2012 : 8 para um mapeamento mais detalhado). Os extremos desses
continua so representados por falantes analfabetos ou semialfabetizados que
vivem em comunidades rurais ou rurbanas, por um lado, e habitantes das
capitais com nvel superior de escolaridade, por outro. Conforme j se notou,
1PP e 3PP normalmente so analisadas separadamente, mas alguns poucos
estudos que incluem ambas (ou diferentes estudos que se baseiam em uma
mesma amostra) revelam que as taxas de emprego da marca explcita de
nmero na 1PP so sempre maiores do que na 3PP (ver Rodrigues 1987, para
duas comunidades de favelados na periferia de So Paulo; Pereira 2004, para a
fala de residentes da zona rural no interior dos estados de So Paulo e Minas

164
A concordncia verbal no portugus brasileiro e no portugus
paulistano

Gerais; Rubio & Gonalves 2012, para a regio de So Jos do Rio Preto-SP;
Scherre & Naro 1998 e Naro et al. 1999, para a cidade do Rio de Janeiro).
Linguisticamente, a marca explcita de nmero, tanto na 1PP quanto na
3PP, favorecida em formas verbais cuja diferena entre o singular e o plural
mais saliente (p.ex., /so vs. fala/falam) (Naro, 1981; Naro et al., 1999), em
sintagmas verbais (SVs) precedidos por outros SVs com marca explcita (p.ex.,
Scherre 1998; Pereira 2004), e com sujeitos [+humano] ou [+animado] (p.ex.,
Monguilhott 2009; Brando & Vieira 2012), pronominais (p.ex., Rodrigues
1987), e imediatamente prepostos aos verbos (p.ex., Guy 1981).
Quanto distribuio social, os estudos apresentam, em geral, quadros
de variao estvel (p.ex., Rubio 2012) ou de mudana em progresso em
direo marca explcita (p.ex., Lucchesi 2012); o primeiro se constata
em comunidades urbanas e em amostras que incluem falantes de diferentes
nveis de escolaridade, e o segundo em comunidades rurais/rurbanas com
falantes menos escolarizados ou de classe social mais baixa. A maior parte
dos estudos indica o favorecimento de CV-E pelas mulheres, mas o padro
oposto encontrado em comunidades de migrantes das zonas rurais para
as capitais (Bortoni-Ricardo, 1985; Rodrigues, 1987), fato que atribudo
maior insero dos homens no mercado de trabalho nas cidades para as
quais migram e seu consequente contato com a norma culta. Em relao
escolaridade, os estudos invariavelmente apontam para o favorecimento da
marca explcita quando maior o grau de instruo do falante.
Especificamente na cidade de So Paulo, Rodrigues (1987) investigou a
concordncia de 1PP e de 3PP na fala de 40 informantes analfabetos ou
semialfabetizados, moradores do bairro da Brasilndia, na Zona Norte da
capital paulista. Os falantes (oriundos de quatro espaos geogrficos So
Paulo-capital; interior do estado de So Paulo e norte do Paran; norte de
Minas Gerais e sul da Bahia; nordeste) foram estratificados de acordo com o
sexo, dois nveis de escolaridade (nula ou primeiro grau) e trs faixas etrias
(20-35 anos; 36-50 anos; 51 ou mais anos). A autora assinala que, apesar de
seu intuito inicial de colher amostras de fala de paulistanos, a realidade das
favelas mostrou-se bastante diferente: nelas predomina uma populao de
origem rural, proveniente no s do interior de So Paulo, mas de todas as

165
A concordncia verbal no portugus brasileiro e no portugus
paulistano

regies do Brasil (Rodrigues, 1987 : 132).


O emprego da marca zero para 1PP foi de 46% (de 693 ocorrncias), 25
pontos percentuais abaixo do emprego da mesma variante para 3PP, que foi
de 71% (de 1.356 ocorrncias). Alm das variveis sociais que estratificam a
amostra, sua anlise multivariada para 1PP incluiu o acento da forma padro
paroxtona (mais saliente), como em falamosfala, ou proparoxtona (menos
saliente), como em falvamosfalava) e o tipo de sujeito (no pronominal,
pronominal explcito e pronominal no explcito); j para 3PP, a anlise
incluiu a posio do sujeito em relao ao verbo (imediatamente precedente,
imediatamente posterior, ou distante), a salincia fnica (como em Naro 1981)
e o tipo de sujeito. Seus resultados foram semelhantes queles verificados em
outras comunidades, conforme se reviu acima.
Quanto s variveis sociais, Rodrigues (1987) constatou que sexo/gnero
e nvel de escolaridade se correlacionam com 1PP com favorecimento da
marca zero pelas mulheres e por falantes de escolaridade nula , mas no
com 3PP. Os falantes provenientes do interior de So Paulo, do Paran e do
Nordeste favorecem CV- em 1PP, e aqueles do norte de Minas Gerais e sul
da Bahia a favorecem em 3PP; em ambos os casos, os paulistanos so os que
menos tendem a empregar a marca zero. Esta tambm desfavorecida pelos
falantes mais velhos, da segunda ou da terceira faixas etrias, que, segundo
a autora, so os que mais sofrem a presso normativa da comunidade mais
ampla.
A partir dos padres de variao para 1PP e 3PP e da observao etnogr-
fica da comunidade, Rodrigues (1987) avalia que a marca zero de concordncia
verbal para 1PP tem significado social diferente da marca zero para 3PP:
apesar de ambas serem proscritas na norma culta, o erro em 1PP iden-
tifica o falante de origem rural. A autora prev, no entanto, que as novas
geraes descendentes dos migrantes, por frequentarem a escola por mais
tempo, devem diferenciar seus hbitos lingusticos daqueles dos seus pais e
adotar uma variedade de lngua que vai [...] refletir a estratificao social
urbana (Rodrigues, 1987 : 99). No presente captulo, a varivel Origem dos
Pais investiga se falantes cujos pais so do interior de SP/MG/PR ou do
Norte/Nordeste teriam maior tendncia variante CV-, sobretudo para 1PP,

166
A concordncia verbal no portugus brasileiro e no portugus
paulistano

ou se seus filhos paulistanos passam a seguir a estratificao social mais ampla


da comunidade.
Coelho (2006), aproximadamente 20 anos mais tarde, investigou a variao
no emprego dos pronomes de 1PP (ns vs. a gente), bem como na concordncia
verbal (Nis V-zero vs. Nis V-mos), em uma comunidade de periferia tambm
no bairro da Brasilndia, na Zona Norte de So Paulo. Com base em uma
observao etnogrfica, o autor construiu uma amostra de 24 entrevistas
sociolingusticas a partir de parmetros sociais relevantes para a identificao
de grupos dentro da comunidade em estudo: costureiras da cooperativa,
trabalhadoras da creche, membros da associao do bairro e suas esposas,
frequentadores do projeto para jovens, filhos dos membros da associao do
bairro, os mano do gol a gol. Por ressaltar a importncia de categorias locais
de identidades sociais, a amostra desbalanceada quanto ao sexo/gnero e
a faixa etria dos falantes (p.ex., todas as costureiras da cooperativa so do
sexo feminino e tm mais de 25 anos, enquanto os mano do gol a gol so
todos do sexo masculino e tm menos de 25 anos). Assim como no estudo
de Rodrigues (1987), os falantes incluem tanto migrantes quanto seus filhos
paulistanos.
O autor observou uma taxa de 70% de marca zero em 1PP em um total
de 345 ocorrncias, relativamente mais alta do que aquela observada por
Rodrigues (1987) 46% em 693 ocorrncias. O excerto abaixo ilustra o
emprego de CV- (1PP e 3PP) na fala de um dos mano:

(2) Inf. nis vendia ropa na rua entendeu?... que... a eu arranjei o servio
n?... e... pensei que era bom n?... porque meu cunhado fal que era bom
tal... a eu falei... ah! j que bom ento v tent bot ele [o irmo]
porque ele t parado tambm... a coloquei ele n?... e eu vi que num era
nada bom... nis chegava falano dum jeito... as mul j olhava assim...
falava das ropa... elas xingava reclamava pra caramba...
Doc. memo?
Inf. vixe!... reclamava bastante... dexa de s vagabundo num sei o que
Doc. mas no jeito que c falava?
Inf. ah... sei l... talveiz pode s at pelo jeito que nis se vestia n?...
nem sei... porque nis curti umas ropa assim meia larga n?... meia
forgada... da... sei l... vai v at por isso... da... uma veiz l um tio

167
A concordncia verbal no portugus brasileiro e no portugus
paulistano

da peg... nis cheg na... na... na rua de baxo ali no no... nis tava
com umas ropa l... (ele) cheg e fic bravo... dexa de s vagabundo... c
passa todo dia aqui!

(Coelho, 2006 : 71). Grifos acrescidos.

Ao analisar tanto a varivel ns/a gente quanto a concordncia verbal,


Coelho (2006) ressalta que o uso da marca explcita de nmero com o pronome
ns no a nica estratgia de assimilao dos migrantes nova realidade
urbana e defende que a aprendizagem de significados sociais no se pauta
somente por aqueles preconizados pela norma culta. Os diversos grupos
de jovens os mano do gol a gol e filhos dos membros da associao do
bairro, por exemplo , diferenciam-se entre si quanto sua orientao para
a escola, s formas de socializao em espaos pblicos ou privados, ao uso
de lcool e de drogas, ao modo de se vestir e perspectiva de ascenso
social. No entanto, em sua anlise sobre a concordncia verbal nos grupos
vicinais da comunidade, o autor constata que o emprego da marca zero
favorecida tanto pelos mano do gol a gol quanto pelos filhos dos membros
da associao do bairro, em contraste com os falantes mais velhos (costureiras,
professores e membros da associao). As diferentes identidades sociais dos
jovens se manifestam linguisticamente atravs do emprego dos pronomes de
1PP. Segundo o autor, a expectativa de ascenso social dos filhos dos membros
da associao correlaciona-se mais substituio de nis por a gente do que
adoo da variante mos (Coelho, 2006 : 133). O emprego de ns V-mos,
propriamente, privilegiado pelos adultos, sobretudo aqueles que trabalham
fora do bairro. O autor ainda interpreta que no se trata da influncia da
escola, j que os jovens tm graus de escolaridade mais altos que os adultos
de sua amostra.
Desse modo, diferentemente de Rodrigues (1987), Coelho (2006) avalia que
variantes estigmatizadas (como Nis vai, nis), ainda que sejam evitadas por
falantes que experimentaram ascenso social, recebem nova significao entre
certos jovens da periferia paulistana, presumivelmente filhos dos migrantes
das dcadas de 1970 e 1980: a marca zero de concordncia verbal em 1PP
no mais representa o dialeto rural, mas uma identidade social de morador

168
Anlise multivariada

de periferia urbana.
Diante dessas anlises, o presente estudo aborda as seguintes questes
especificamente para a comunidade paulistana: (i) os diferentes significados
sociais da marca zero em 1PP e 3PP poderiam ser atribudos a diferentes
distribuies lingusticas e sociais, ou devem-se somente a diferentes frequn-
cias de emprego das variantes?; e (ii) em uma amostra mais abrangente
da fala paulistana, haveria evidncias de expanso da marca zero de 1PP
entre jovens de periferia, ou ainda evidncias de movimento em sua direo,
contrariamente ao que se verifica em outras comunidades urbanas?

7.2 Anlise multivariada


Tanto para 1PP quanto para 3PP, so consideradas como marca zero/
CV- as ocorrncias em que o morfema de plural verbal no realizado, que
portanto coincidem com a forma de terceira pessoa do singular (foi, vai, fez
etc.). Como marca explcita/CV-E, consideram-se as realizaes [mos],
[mo], [mu], [mus] de 1PP,2 e dos diversos morfemas de 3PP ([i], como em
crescem; [w]
como em do; [eru] ou [eru] como em comeram etc.). Para 1PP,
interessa tambm notar que, na presente amostra, no houve ocorrncias de
formas como cantemos, andemos, com alternncia da vogal temtica.
O envelope de variao abarca as ocorrncias de SVs com sujeitos explcitos
ou que tenham sido mencionados em sentena prvia com estrutura paralela.
Observem-se os dados do excerto abaixo:

(3) S1: mas eu sei que meio que (a) eles sumiram... ou (b) se eles morreram
todos ou (c) ficaram adultos (d) foram cuidar da vida no sei
D1: aham
S1: mas teve uma poca que a coisa era um pouco mais complicada... tanto
que a gente deixava/ na poca a casa no estava reformada s cabia um
carro na garagem e eu tinha um e o S. tinha outro... (e) roubaram um...
toca-fita do carro mais de uma vez (f) roubaram o step do carro mais de
uma vez... (Iolanda P., F2SP)
2
Para um contraste entre as formas [mos, mus] e [mo, mu] de 1PP, ver Zilles et al. (2000). Trata-se de
uma varivel fonolgica o apagamento de /-s/ , que sofre condicionamentos distintos da concordncia
verbal.

169
Anlise multivariada

Em (3), h seis SVs identificados pelas letras (a)-(f). Desses, os dois primeiros
(a)-(b) contm o sujeito explcito eles, diferentemente dos demais. Como (c) e
(d) possuem estruturas sentenciais paralelas s sentenas (a) e (b), tais dados
foram includos e tratados como casos de sujeito oculto. Por outro lado, a
sequncia quebrada por sentenas com outros sujeitos (a coisa era, a gente
deixava, a casa no estava etc.); desse modo, oraes com verbos como (e)
e (f) no foram includas na anlise, uma vez que no infalvel a tarefa de
determinar se o sujeito tem a mesma referncia de (a)-(d) ou no, ou ainda
se se trata de referncia indeterminada.
Excluram-se ainda os dados de SVs com os verbos ter, vir, por e
formas derivadas (manter, propor etc.) no presente do indicativo da 3PP,
pois no se distinguem fonologicamente das formas singulares (Cf. tem/tm;
vem/vm; pe/pem). Tampouco se consideram SVs com o pronome a gente;
com os verbos haver e ter com sentido existencial (tinha/tinham muitas
pessoas l...); sujeitos partitivos (a maioria das pessoas foi/foram); o
chamado infinitivo flexionado opcional (Canever 2012; ns temos tudo para
crescer/crescermos como nao...); e construes impessoais como faz/fazem
dez anos. Embora a variao seja possvel nesses casos, a marca zero aquela
considerada padro de acordo com as gramticas normativas (ver, p.ex.,
Bechara 2005; Cunha & Cintra 2007), de modo que no parece apropriada
sua comparao com casos como eles/ns vai.
Por fim, certos dados tambm foram excludos em razo do fato de que a
variante alternativa poderia causar ambiguidade no contexto:

(4) o B. nem tanto mas eu e a E. at hoje frequentamos a igreja temos o


nosso vnculo de amizade l (Eloisa D., F1SP)

(5) a ela casou com o meu pai... meu pai era trinto assim quando conheceu
ela... a casaram... e s tiveram... mais trs filhos... (Fernanda T., F1SC)

(6) infelizmente o governo a prefeitura... no... no vo te dar muita coisa


n (Regina S., F2MP)

Em (4), caso Eloisa D. houvesse dito tem o nosso vnculo, o verbo ter

170
Anlise multivariada

poderia ser entendido em seu significado existencial e, portanto, no como um


verbo com marca zero. Em (5), se Fernanda T. houvesse dito a casou... e s
teve mais trs filhos, tais sentenas poderiam ter como sujeito o pronome ela
e, de modo similar, no seriam consideradas como casos de CV-. Da tambm
a pertinncia de se inclurem sujeitos ocultos somente quando precedidos
por sujeito explcito em estrutura paralela, mesmo que os referentes sejam
recuperveis (neste caso, minha me e meu pai). Em sentenas como
(6), com dois referentes na forma singular, s se pode ter certeza de que
se trata de um SV plural pela prpria flexo do verbo ou quando h uma
conjuno que os liga (o governo e a prefeitura...). Incluir casos como (4)(6)
aumentaria artificialmente a taxa de realizao da marca explcita, uma vez
que a alternativa no necessariamente uma forma diferente de dizer a
mesma coisa (Labov, 1978).
Seguindo-se esses critrios, extrai-se um total de 1.150 dados de 1PP e
10.224 de 3PP. O primeiro fato distribucional a se assinalar que, assim como
para a concordncia nominal, no houve variao nas leituras de depoimento
e de notcia de jornal (Tabela 7.1), seja pela ausncia de contexto varivel
(no h dados de 1PP na notcia), seja porque os informantes empregaram
a marca explcita categoricamente. Os pouqussimos casos de marca zero se
encontram em 3PP. As anlises reportadas, dessarte, abarcam somente os
dados de Conversao, em que se constataram taxas de 9,4% (101/1.074) e
12,6% (1.191/9.480) de CV- para 1PP e 3PP, respectivamente. As taxas de
marca explcita de nmero (90,6% e 87,4%) esto acima daquelas observadas
em outras comunidades urbanas com amostragens at certo ponto comparveis
quanto estratificao da amostra em faixas etrias e nveis de escolaridade.3
O espectro de variao individual, no entanto, bastante amplo; para
1PP, os falantes exibem taxas de 0 a 100% de emprego da marca zero, e para
a 3PP, de 0 a 70%. Para 1PP, a distribuio mais extrema: 19 dos 118
falantes da amostra no empregaram a forma ns, seja com marca zero, seja
com marca explcita de nmero so falantes que empregaram a forma a
3
Para 1PP, a concordncia realizada em 90% dos casos por falantes com at o Ensino Mdio em Porto
Alegre-RS (Zilles et al., 2000). Para 3PP, em 73% dos casos por falantes com at o Ensino Mdio no
Rio de Janeiro no incio dos anos 1980 (Scherre et al., 2007); e, em amostras com falantes com Ensino
Mdio e Superior: 77,6% em Vitria-ES (Yacovenco et al., 2012); 78,1% em Nova Iguau-RJ (Brando
& Vieira, 2012); 80,6% em Florianpolis (Monguilhott, 2009).

171
Anlise multivariada

Tabela 7.1 Distribuio de ocorrncias de CV- de acordo com Estilo

1PP 3PP
N total = 1.150 N total = 10.224
CV- = 101 (8,8%) CV- = 1.195 (11,7%)
% N CV- N % N CV- N
Estilo
conversao 9,4 101 1.074 12,6 1.191 9.480
depoimento 0 0 76 1,1 2 373
notcia 0,1 2 371

gente categoricamente ou que simplesmente no se referiram 1PP durante


toda a entrevista sociolingustica; entre esses, 12 esto na 1a faixa etria,
que justamente aquela que tem privilegiado o emprego do pronome a gente
(Coelho, 2006; Zilles, 2005). Outros 65 falantes empregaram categoricamente
a marca explcita de nmero, e cinco categoricamente a forma zero. H ento
19 falantes sem dados de 1PP e 70 cujos empregos foram categricos, e apenas
29 falantes apresentam variao de fato para concordncia de 1PP.
A fim de lidar com tais fatos distribucionais para 1PP, foram realizadas
duas anlises sobre esses dados: numa delas, analisam-se todos os dados
do contexto varivel, conforme sua definio descrita na subseo anterior,
incluindo-se aqueles dos 70 falantes que s empregam uma das variantes; na
outra, incluem-se apenas os dados dos 29 falantes que apresentaram variao.
Tal deciso permite verificar se os resultados para a comunidade como um
todo foram distorcidos ou no pela presena de falantes cujos empregos foram
categricos.
Entretanto, o foco principal deste captulo o contraste entre 1PP e 3PP.
Para tanto, analisaram-se variveis sociais e lingusticas que, tanto quanto
possvel, pudessem ser codificadas para ambas. Embora as anlises para 1PP e
3PP tenham sido realizadas separadamente, seus resultados so apresentados
paralelamente nas tabelas, a fim de facilitar a comparao no dos pesos
relativos, que no so diretamente comparveis justamente por advirem de
diferentes anlises estatsticas, mas da ordem de seleo das variveis e de
sua hierarquia interna de restries (fatores que favorecem ou desfavorecem

172
Anlise multivariada

Salincia fnica (Naro et al., 1999)


Grau 1 oposio no acentuada
1c adio de segmento [-/-mus]
Grau 2 oposio acentuada
2a uma das formas acentuada [a/"amus]
2a nasalizao da vogal tnica ["a/"amus], ["e/"emus]
2b forma singular contm ditongo ["ew/"emus], ["iw/"imus], ["oj/"omus]
crescente, adio do segmento [-mus]
2c mudana da vogal tnica ["ow/"amus]
Paralelismo discursivo (Scherre & Naro, 1992; Scherre, 1998)
precedido de CV-E
precedido de CV- (de acordo com 5 sentenas anteriores)
primeiro de uma srie
Tipo de sujeito
composto minha esposa e eu casamos/casou
pronome ns casamos/casou
Posio do sujeito
imediatamente precedente ns fomos/foi
precedente (1-4 slabas) ns ainda no casamos/casou
precedente distante (5+ slabas) ns com o estilingue com mamona atir-
vamos/atirava no pnis do jumento
posposto a amos/ia ns... pra l
Item lexical verbo (efeito aleatrio)

Quadro 7.1 Variveis lingusticas da anlise de (CV-1PP)

CV- variante a partir da qual se analisam os dados).


As variveis lingusticas so apresentadas nos quadros 7.1 e 7.2 respectiva-
mente para 1PP e para 3PP, mas comentadas conjuntamente a fim de ressaltar
as semelhanas. Salincia Fnica foi codificada de acordo com os critrios
estipulados por Naro et al. (1999) para 1PP, e Naro (1981) e Scherre & Naro
(1998) para 3PP. A hiptese prev que formas em que o par singular/plural
mais semelhante so menos salientes foneticamente e mais propensas a
CV- e, de modo inverso, que oposies mais salientes so menos propensas
marca zero. Nos quadros, os diferentes graus se organizam em nveis cada
vez maiores de diferenciao fnica. No Grau 1, a oposio entre as formas
singular e plural ocorre em slaba no acentuada: para 3PP, no nvel 1a, a
forma plural se d pela nasalizao de [i] (come/comem); no nvel 1b, pela
nasalizao e mudana da qualidade voclica (fala/falam); e no nvel 1c pela

173
Anlise multivariada

Salincia fnica (Naro, 1981; Scherre & Naro, 1998)


Grau 1 oposio no acentuada
1a nasalizao de [i] [i/i]
1b nasalizao e mudana da [a/ u]
qualidade voclica
1c adio de segmento -/[i]
Grau 2 oposio acentuada
2a nasalizao e ditongao da vogal ["a/"w]
tnica
2b forma singular contm ditongo ["ew/"er u], ["iw/"ir
u], ["oj/"or
u]
crescente, adio do segmento [r
u]
2c mudana da vogal tnica [/"ar u], ["i/"er
u]
Paralelismo discursivo (Scherre & Naro, 1992; Scherre, 1998)
precedido de CV-E
precedido de CV- (de acordo com 5 sentenas anteriores)
primeiro de uma srie
Tipo de sujeito
composto a minha me e o meu pai casaram/casou
sintagma nominal simples os meus pais casaram/casou
pronome eles casaram/casou
Posio do sujeito
imediatamente precedente eles vieram/veio na minha direo
precedente (1-4 slabas) os equipamentos que tem l so/ importados
precedente distante (5+ slabas) as pessoas l de Gois mesmo que vieram/
veio pra c
posposto chegaram/chegou dois caras assim
pergunta do documentador D1: seus pais moravam l? S1: moravam l
Animacidade do sujeito
[+humano], [+animado] meus amigos so/ todos daqui
[humano], [+animado] as pombas foram/foi embora
[humano], [ animado] os carros no param/para
Item lexical verbo (efeito aleatrio)

Quadro 7.2 Variveis lingusticas da anlise de (CV-3PP)

174
Anlise multivariada

adio de novos segmentos (faz/fazem; falava/falvamos). Este ltimo fator


tambm se aplica a 1PP.4 No Grau 2, a oposio ocorre em slaba acentuada:
no nvel 2a, aplicvel somente 1PP, apenas uma das formas do par opositor
acentuada (fala/falamos); no nvel 2a, ambas as formas so acentuadas
(est/estamos) e, para 3PP, h nasalizao e ditongao da vogal tnica
(d/do); no nvel 2b, a forma singular contm um ditongo crescente, e h
adio de novos segmentos (comeu/comeram; vai/vamos); no nvel 2c, h
mudana na vogal tnica (falou/falaram; falou/falamos). A relevncia dessa
varivel foi demonstrada em Naro (1981), que argumenta que o trajeto da
mudana lingustica segue os diferentes graus de salincia, do menor para
o maior: a mudana se iniciou no grau 1a, como fenmeno semelhante
desnasalizao em substantivos como em homem/homi, e se difundiu gradu-
almente para outros nveis de salincia; uma evidncia para isso o fato de
os informantes mais velhos terem apresentado maior diferenciao entre os
nveis do que os mais jovens.5
A varivel Paralelismo (Scherre & Naro, 1992; Scherre, 1998) foi analisada
de acordo com a presena e a ausncia de outros SVs plurais, com ou sem
marca de nmero, nas cinco oraes que antecedem a ocorrncia. Assim
como na discusso acerca da concordncia nominal, a hiptese aventada
que marcas levam a mais marcas, e zeros levam a zeros.
Tipo de Sujeito inclui as variantes pronome (ns/eles/elas); sujeito com-
posto (1PP: minha esposa e eu, 3PP: a minha me e o meu pai); ou sintagma
nominal simples (3PP: os meus pais); este ltimo no se aplica a 1PP. No se
utilizou a categoria sujeito oculto para que essa varivel fosse independente
de outra, a Posio do Sujeito, que avalia mais propriamente a distncia e a
posio do sujeito em relao ao verbo. Para esta, os dados foram classificados
inicialmente em cinco fatores: imediatamente precedente ao verbo; precedente
e separado por uma at quatro slabas do verbo; precedente e separado por
mais de cinco slabas do verbo; posposto ao verbo; e em pergunta do docu-
4
Naro et al. (1999) nomeiam os diferentes graus de salincia para 1PP como Grau 1, Grau 2... Grau
5. Aqui se adapta a nomenclatura proposta para a 3PP (Naro, 1981) nvel 1a, 1b, 1c etc. para
indicar que so diretamente comparveis.
5
Para 1PP, trabalhos mais recentes tm argumentado em favor do papel de tempo e paradigma verbal
(no tratadas aqui), em lugar de salincia fnica. Ver, por exemplo, Scherre et al. (2014).

175
Anlise multivariada

mentador (3PP). Essa ltima categoria, que no se aplica a dados de 1PP,


foi codificada separadamente dos demais dados com sujeito precedente pelo
fato de normalmente se referir a SVs que respondem a perguntas sim/no do
documentador que, pela formao universitria e pela cincia dos propsitos
da gravao, tem maior tendncia a empregar a marca explcita. Como a
resposta mais comum para perguntas do tipo sim/no em portugus a
repetio do verbo, e no o simples uso de sim ou no (A: Eles foram?
B: Foram.), espera-se que a resposta do informante seja semelhante forma
empregada pelo documentador (Guy, 1981).
Animacidade do Sujeito se aplica somente aos dados de 3PP, uma vez que
o sujeito de 1PP, ns, tem sempre o trao [+humano].6 Os dados foram inici-
almente codificados em trs categorias [+humano], [humano,+animado] e
[humano,animado] mas, como houve apenas 39 ocorrncias da segunda
delas (que se refere a animais em geral: cachorros, gatos, papagaios etc.),
realizaram-se anlises contrastivas para determinar se o trao mais relevante
era [humano] ou [animado]. A comparao dos valores de logaritmo de
verossimilhana (Guy & Zilles, 2007 : 191) entre [humano] (l.l. -3.074,3) e
[animado] (l.l. -3.076,4) determinou que o primeiro, com valor mais prximo
de zero, gera um modelo mais adequado.
Por fim, o Item Lexical isto , o verbo da orao foi includo no modelo
estatstico como efeito aleatrio, a fim de verificar se possveis diferenas
se devem a itens especficos que eventualmente se comportam de modo
idiossincrtico ou se as variveis lingusticas analisadas de fato tm um efeito
sobre a varivel dependente.
Os resultados das anlises multivariadas para essas variveis se encontram
na Tabela 7.2, que as organiza de acordo com o range. Salincia Fnica
se apresenta como a mais importante para 1PP e 3PP, com ranges 90 e 49
respectivamente. Para 1PP, amalgamaram-se os graus 2a e 2a, e 2b e 2c
(2 = 1,27(2), p > 0,50), j que a diferena entre os fatores nesses pares no
era significativa. A forma menos saliente (nvel 1c, como falava/falvamos)
apresenta fortssima tendncia ocorrncia de CV- (P.R. 0.98), assim como
6
Em princpio, seria possvel haver ocorrncias como eu e meus cachorros, em que um dos elementos
tem o trao [+humano] e o outro no. No entanto, no houve ocorrncias desse tipo no corpus analisado.

176
Anlise multivariada

Tabela 7.2 Tendncias de emprego de CV- de acordo com variveis lingusticas

1PPa 3PPb
N total = 1.074 N total = 9.480
CV- = 101 (9,4%) CV- = 1.191 (12,6%)
P.R. % N Total P.R. % N Total
Salincia Fnicac,d
Grau 1 (oposio no acentuada)
nvel 1a NA NA NA 0.78 23,1 767
nvel 1b NA NA NA 0.60 14,9 4.049
nvel 1c 0.98 27,3 297 0.74 17,4 493
Grau 2 (oposio acentuada)
nvel 2a + 2a 0.71 6,0 250 0.45 8,6 904
nvel 2b + 2c 0.08 0,9 527 0.29 7,6 3.267
Range 90 49
Paralelismo Discursivo
precedido de CV- [.95] 61,1 36 0.81 53,1 373
isolado/primeiro de uma srie [.49] 8,0 800 0.53 12,9 5.958
precedido de CV-E [.43] 6,3 238 0.41 7,1 3.149
Range 40
Posio do Sujeitoe,f
posposto 0.99 44,4 27 0.77 26,4 881
precedente distante (5+ slabas) 0.72 15,5 213 0.61 16,8 2.782
precedente (1-4 slabas) = = = 0.47 10,9 1.252
imed. precedente/pergunta-3PP 0.40 6,7 834 0.39 7,8 4.565
Range 59 38
Animacidade do Sujeito
[humano] NA NA NA 0.66 22,0 1.448
[+humano] NA NA NA 0.47 10,9 8.032
Range 19
Tipo de Sujeitog
composto + SN 0.91 33,3 30 0.59 17,2 4.891
pronome 0.48 8,7 1.044 0.41 7,7 4.589
Range 43 18
a Input: 0,002. b Input: 0,067. NA: fator no se aplica varivel. [ ] indicam a no seleo da
varivel como significativa. = indica pesos relativos iguais aos da linha superior. c,d 2 = 1,27(2),
p > 0,50 (1PP); 2 = 0,46(1), p > 0,50 (3PP). e,f 2 = 0,77(1), p > 0,30 (1PP); 2 = 0,003(1),
p > 0,99 (3PP). g 2 = 1,36(1), p > 0,20 (3PP).

177
Anlise multivariada

as formas do nvel 2a e 2a (fala/falamos; est/estamos) (P.R. 0.71); as formas


dos nveis 2b e 2c, por outro lado, apresentam fortssimo desfavorecimento
ocorrncia de CV- (P.R. 0.08). Para 3PP, amalgamaram-se os nveis 2b e 2c
(2 = 0.46(1), p > 0,50). Aqui, os pesos relativos no seguem exatamente a
escala de salincia prevista para o Grau 1, j que o segundo fator que mais
favorece CV- o nvel 1c (P.R. 0.74) em vez de 1b (P.R. 0.60). Verifica-se,
no entanto, grande diferena entre as formas do Grau 1, todas com pesos
relativos acima do ponto neutro de 0.50 e, portanto, favorecedoras de CV-,
e as formas do Grau 2, com pesos relativos abaixo de 0.50, desfavorecedoras
da variante. Os resultados, assim, coincidem com os de outros trabalhos, na
hiptese de que formas menos salientes so aquelas que mais favorecem a
forma zero.
Paralelismo Discursivo a segunda varivel mais importante para a varia-
o em 3PP. De acordo com o que se previu, SVs precedidos por outros SVs
com marca zero favorecem CV- (P.R. 0.81), e SVs precedidos por SVs com
marca explcita a desfavorecem (P.R. 0.41); quando o SV no precedido por
outro SV plural nas cinco oraes antecedentes, a tendncia de emprego
semelhante probabilidade geral da amostra, com peso relativo pouco acima
do ponto neutro (P.R. 0.53). No entanto, Paralelismo no selecionada para
1PP, de modo que necessrio avaliar se este seria um contra-exemplo do
efeito dessa varivel, que tende a se mostrar significativa em outros estudos.
Note-se que os pesos relativos para as variantes desse grupo se diferenciam
consideravelmente entre si (de 0.95 a 0.43); sua no seleo na anlise multi-
variada se deve ao clculo, durante a rotina de regresso logstica, de que h
uma probabilidade relativamente alta de que tal distribuio tenha ocorrido
aleatoriamente.
Uma possvel causa para isso poderia ter sido a distribuio dos dados
bastante irregular para 1PP, j que, como se notou anteriormente, 70 de 118
informantes apresentam categoricamente ocorrncias ou da marca explcita ou
da marca zero; o modelo estatstico, que incluiu o falante como uma varivel
aleatria, pode ter avaliado que a tendncia de emprego de CV- depende
mais do indivduo do que da sequncia discursiva. Isso, no entanto, no parece
provvel devido a um resultado que ser visto adiante: Paralelismo no

178
Anlise multivariada

selecionada mesmo quando se consideram apenas os 29 falantes que de fato


apresentam variao. Tambm possvel que o efeito do Paralelismo no se
manifeste nos dados de 1PP em razo da variante a gente (no analisada
aqui), que mantm a referncia mas quebra a sequncia de paralelismo de
formas gramaticais. A no seleo da varivel ainda pode ser decorrncia da
distribuio desequilibrada dos dados entre os fatores; h relativamente poucos
dados de SVs precedidos de outros SVs, sobretudo em casos de marca zero (36
dados, ou 3,3% de 1PP), comparativamente s ocorrncias isoladas ou que
representam a primeira de uma srie (800 dados, ou 73% de 1PP). Por esses
fatos distribucionais, no parece adequado afirmar se Paralelismo Discursivo
de fato no tem efeito em 1PP nos dados paulistanos, ou se tal resultado se
deve mais propriamente m distribuio dos dados nessa varivel.7
A varivel Posio do Sujeito revela resultados semelhantes entre 1PP e
3PP. Para 1PP, amalgamaram-se os sujeitos precedentes que se separam do
verbo por 1-4 slabas e 5 ou mais slabas (2 = 0,77(1), p > 0,30) e, para a
3PP, os sujeitos imediatamente antecedentes e em pergunta do documentador
(2 = 0,003(1), p > 0,99). O sujeito posposto, em ambos os casos, favorece
fortemente CV (P.R. 0.99 para 1PP e 0.77 para 3PP), seguido de sujeito
precedente distante (P.R. 0.72 para 1PP e 0.61 para 3PP). Para a 3PP, h
diferenciao significativa (2 = 14,39(1), p < 0,001) entre sujeitos separados
do verbo por 5 ou mais slabas ou 1-4 slabas (P.R. 0.47), de acordo com a
hierarquia esperada de distncia do verbo. Sujeitos imediatamente precedentes
e que se encontram na pergunta do documentador so aqueles que mais
desfavorecem o emprego de CV- (P.R. 0.40 para 1PP e 0.39 para 3PP).
Quanto Animacidade, varivel que se aplica somente anlise dos dados
de 3PP, os sujeitos com trao [-humano] favorecem a marca zero (P.R. 0.66) e
aqueles com trao [+humano] a desfavorecem (P.R. 0.47), de modo semelhante
ao que j se verificou em outros estudos. Por fim, Tipo de Sujeito tambm
exibe resultados semelhantes entre 1PP e 3PP. Sujeitos compostos, para 1PP,
e sujeitos compostos ou sintagmas nominais (2 = 1,36(1), p > 0,20), para
3PP, favorecem o emprego de CV- (P.R. 0.91 para 1PP e 0.59 para 3PP),
7
A maior parte dos estudos sobre a 1PP (Rodrigues, 1987; Naro et al., 1999; Zilles et al., 2000; Coelho,
2006) no reporta resultados para essa varivel. Pereira (2004), em sua amostra da fala do interior de
SP e MG, observou efeito significativo de Paralelismo tanto para 3PP quanto para 1PP.

179
Anlise multivariada

ao passo que os sujeitos pronominais o desfavorecem (P.R. 0.48 para 1PP e


0.41 para 3PP).
Desse modo, com exceo de Paralelismo, verifica-se a seleo das mesmas
variveis como relevantes tanto para a variao na concordncia de 1PP
quanto de 3PP, na mesma ordem de importncia, e com a mesma hierarquia
interna dentro de cada varivel. Em todos os casos em que se verificou
correlao significativa para ambas as variveis, o range para 1PP maior do
que para 3PP, mas muitos dos pesos relativos extremos para 1PP se referem
a clulas com nmero reduzido de dados (p.ex., o peso relativo de 0.99 para
sujeito posposto na 1PP corresponde a apenas 27 ocorrncias). Com base
no que se argumentou acima a respeito de possveis explicaes para a no
seleo de Paralelismo para 1PP, tal diferena entre as anlises no parece
ser suficiente para afirmar que 1PP e 3PP tenham conjuntos diferentes de
regras variveis. De um ponto de vista estrutural, trata-se efetivamente de
uma mesma varivel, que se correlaciona aos mesmos fatores. Examinem-se
agora as correlaes com variveis de natureza social, para avaliar se tambm
se observam padres semelhantes entre 1PP e 3PP.
A Tabela 7.3 apresenta as variveis sociais no selecionadas como significa-
tivas para a variao na concordncia de 1PP e 3PP: Faixa Etria, Regio de
Residncia, Origem dos Pais e Mobilidade. Tampouco como varivel contnua
Idade do Falante selecionada pelo Rbrul. Tal fato indica que tanto 1PP
quanto 3PP esto em variao estvel quando se considera a comunidade
como um todo. Quanto Origem dos Pais, a previso de Rodrigues (1987)
parece se confirmar: no h diferenas significativas entre os usos por parte
dos filhos de migrantes e aqueles por parte de filhos de pais paulistanos.
Por outro lado, Classe Social e Sexo/Gnero so selecionadas, nessa ordem,
como significativamente correlacionadas variao na concordncia verbal
(Tabela 7.4). Verificam-se tendncias gradualmente maiores de emprego
da marca zero quanto mais baixa a classe social do falante, de 0.13 a
0.94 para 1PP, e de 0.27 a 0.77 para 3PP. Como varivel contnua, ndice
Socioeconmico tambm revela o mesmo tipo de correlao: quanto mais
alto o ndice socioeconmico, menor a tendncia de emprego da marca zero
para 1PP (logodds -1.44, p < 0,001) e, de modo menos expressivo, para 3PP

180
Anlise multivariada

Tabela 7.3 Variveis sociais no correlacionadas com (CV)

1PP 3PP
N total = 1.074 N total = 9.480
CV- = 101 (9,4%) CV- = 1.191 (12,6%)
P.R. % N P.R. % N
Faixa Etriaa,b
2034 anos [.46] 8,1 111 [.50] 12,6 2.922
3559 anos [.44] 7,5 398 [.46] 10,9 3.293
60+ anos [.55] 11,0 565 [.54] 14,2 3.265
Regio de Residnciac,d
bairro mais central [.60] 13,0 409 [.47] 11,4 3.980
bairro mais perifrico [.44] 7,2 665 [.52] 13,4 5.500
Origem dos Paise,f
N/NE [.66] 13,1 61 [.67] 18,9 608
So Paulo [.54] 12,0 450 [.50] 11,5 3.606
interior (SP/MG/PR) [.50] 8,5 316 [.53] 14,3 2.706
estrangeiros [.43] 8,4 83 [.46] 11,8 1.042
mista [.21] 3,0 164 [.40] 9,9 1.518
Mobilidadeg,h
baixa [.83] 27,2 202 [.59] 17,0 1.882
mdia [.46] 6,2 305 [.52] 13,3 3.253
alta [.39] 4,8 567 [.44] 10,1 4.345
a,b Input: 0,093 (1PP); 0,125 (3PP). c,d Input: 0,091 (1PP); 0,125 (3PP). e,f Input: 0,085

(1PP); 0,124 (3PP). g,h Input: 0,073 (1PP); 0,124 (3PP). [ ] indica a no seleo da varivel
como significativa.

(logodds -1.08, p < 0,001).


Sexo/Gnero tambm revela correlao que se assemelha a outras comu-
nidades urbanas, com o favorecimento da marca zero pelos homens (P.R.
0.78 e 0.57), e desfavorecimento pelas mulheres (P.R. 0.16 e 0.44). inte-
ressante assinalar que, para 1PP, a direo da correlao inversa daquela
constatada por Rodrigues (1987) na cidade de So Paulo, a partir de sua
amostra rurbana que incluiu migrantes, j que a autora havia verificado
favorecimento da marca zero pelas mulheres. O padro observado entre os
paulistanos nativos na presente amostra se diferencia daquele dos oriundos de
outras partes, sobretudo quando de zonas rurais. A diferena provavelmente
reside nos padres de formao de redes sociais, conforme a autora interpretou

181
Anlise multivariada

Tabela 7.4 Tendncias de emprego de CV- de acordo com variveis sociais (1)

1PPa 3PPb
N total = 1.074 N total = 9.480
CV- = 101 (9,4%) CV- = 1.191 (12,6%)
P.R. % N P.R. % N
Classe Social
A/B1 0.13 2,2 274 0.27 5,1 2.217
B2 0.29 6,5 245 0.40 8,8 2.857
C1 0.57 8,7 311 0.61 17,6 2.515
C2/D 0.94 21,3 244 0.77 20,4 1.891
Range 81 50
Sexo/Gnero
Feminino 0.16 9,0 466 0.44 10,4 4.826
Masculino 0.78 9,7 608 0.57 14,8 4.654
Range 62 13
a Input: 0,002. b Input: 0,067.

h mais de duas dcadas: os homens migrantes tendem a obter trabalho fora


do bairro e tm mais contato com as normas lingusticas da cidade do que as
mulheres, que geralmente so donas de casa e mantm laos mais estreitos com
a comunidade local. Os nativos da cidade, por sua vez, no necessariamente
seguem essa mesma diviso de sociabilidade entre os gneros, e o padro
se aproxima daquele observado em comunidades ocidentais industrializadas
(Labov, 2001b). A questo do Sexo/Gnero dos falantes como decorrncia
de suas posies no mercado de trabalho retomada adiante, no cruzamento
dessa varivel com Nvel de Escolaridade (p. 186).
De modo semelhante anlise de (CN), decidiu-se subdividir os falantes
menos escolarizados em at Ensino Fundamental e at Ensino Mdio, a fim de
verificar se existe uma relao gradual com a varivel dependente. Escolaridade
foi analisada separadamente de Classe Social e de ndice Socioeconmico, pelo
fato de no serem independentes entre si quando se realiza essa subdiviso. Na
Tabela 7.5, tambm se observam tendncias gradualmente maiores de emprego
de CV- na direo esperada: quanto menor o grau de escolarizao do
informante, maior a tendncia marca zero, e a diferena entre o cumprimento

182
Anlise multivariada

Tabela 7.5 Tendncias de emprego de CV- de acordo com variveis sociais (2)

1PPa 3PPb
N total = 1.074 N total = 9.480
CV- = 101 (9,4%) CV- = 1.191 (12,6%)
P.R. % N P.R. % N
Escolaridade
At Ensino Fundamental 0.95 25,6 180 0.79 23,5 1.169
At Ensino Mdio 0.60 10,7 299 0.59 15,7 3.054
Ensino Superior 0.25 3,9 595 0.37 8,3 5.257
Range 70 42
a Input: 0,002. b Input: 0,066.

de cada etapa escolar (do Ensino Fundamental para o Ensino Mdio, e do


Ensino Mdio para o Ensino Superior) significativa tanto para 1PP quanto
para 3PP.
O cotejamento dos resultados para 1PP e 3PP no que toca s variveis
sociais conduz a concluses bastante semelhantes quelas das variveis lin-
gusticas: so selecionadas como significativas as mesmas variveis tanto para
a 1PP quanto para a 3PP, na mesma ordem de relevncia, e com a mesma
hierarquia interna dentro de cada uma; em todos os casos, o range para a
1PP maior do que para a 3PP.
Interessa, por fim, verificar se as correlaes com 1PP se mantm quando
se consideram apenas os 29 falantes cujos dados de fato exibiram variao
(Tabelas 7.6 e 7.7). Esses falantes se distribuem de modo razoavelmente
equilibrado quanto ao Sexo/Gnero (11 mulheres e 18 homens), Regio de
Residncia (11 de bairros centrais e 18 de bairros perifricos) e Nvel de
Escolaridade (19 at Ensino Mdio e 10 com Ensino Superior), e menos
equilibradamente quanto Faixa Etria (3 de 2034 anos; 13 de 3559 anos;
e 13 de 60+ anos). Nessas anlises, h um total de 559 ocorrncias, pouco
mais de metade do total na anlise anterior (N = 1.074); a taxa de emprego
de CV- sobe de 9,4% para 17,2% um aumento esperado, j que, para os
70 falantes cujos usos so categricos, houve sempre CV-E na fala da grande
maioria (65 deles), e CV- na fala de apenas cinco (ver Anexo B, p. 361).

183
Anlise multivariada

Tabela 7.6 Tendncias de emprego de CV-1PP-


em dados de informantes no categricos (1)

1PP
N total = 559
CV- = 96 (17,2%)
P.R. % N
Salincia fnica
Oposio no acentuada (Grau 1)
Grau 1c 0.97 42,2 187
Oposio acentuada (Grau 2)
Grau 2a + 2a 0.69 12,1 107
Grau 2b + 2c 0.06 1,5 265
Range 91
Classe Social
A/B1 0.10 3,8 130
B2 0.49 13,9 187
C1 0.54 18,7 75
C2/D 0.84 30,5 167
Range 74
Posio do sujeito
posposto 0.99 84,6 13
precedente distante 0.72 26,9 119
imediatamente precedente 0.38 12,4 427
Range 61
Mobilidade
baixa 0.82 35,3 150
mdia 0.47 13,7 131
alta 0.32 9,0 278
Range 50
Sexo/Gnero
feminino [.56] 24,1 170
masculino [.48] 14,1 389
Tipo de sujeito
composto [.98] 52,6 19
pronome [.46] 15,9 540
Input: 0,023. [ ] indicam a no seleo da varivel como significativa.

184
Anlise multivariada

Tabela 7.7 Tendncias de emprego de CV-1PP-


em dados de informantes no categricos (2)

1PP
N total = 559
CV- = 96 (17,2%)
P.R. % N
Nvel de Escolaridade
At Ensino Fundamental 0.76 32,4 139
At Ensino Mdio 0.56 16,8 179
Ensino Superior 0.30 8,7 241
Range 46
Input: 0,024.

Em comparao com a anlise prvia, as variveis Salincia Fnica, Classe


Social e Posio do Sujeito so novamente selecionadas, nessa mesma ordem de
importncia (Tabela 7.6). A anlise em que se incluiu Nvel de Escolaridade,
em trs nveis, tambm reitera a relevncia dessa varivel (Tabela 7.7). Por
outro lado, deixam de ser selecionadas Sexo/Gnero e Tipo de Sujeito (que
so as duas ltimas na hierarquia de importncia na anlise de todos os dados
de 1PP, nas Tabelas 7.2 e 7.4).8 No caso de Tipo de Sujeito, sua no seleo
provavelmente se deve ao nmero bastante pequeno de dados de sujeitos
compostos (19 apenas), o que eleva a probabilidade de que a distribuio
seja aleatria. Para Sexo/Gnero, todavia, note-se que, embora a diferena
no seja significativa, as taxas de emprego da marca zero se invertem entre
homens e mulheres: agora so elas que mais empregam CV-, em termos de
frequncia (porcentagem), ao contrrio da tendncia que se observou para
a amostra como um todo, um padro que em princpio no esperado para
uma amostra urbana.
Isso se deve ao fato de a subamostra com 29 falantes no mais ser balan-
ceada quanto s variveis sociais, conforme se apontou acima. O cruzamento
8
Ainda que os ranges dessas duas variveis tenham sido razoavelmente altos na anlise prvia
(Sexo/Gnero: 62; Tipo de Sujeito: 43), deve-se ter em mente que tais medidas s tm um valor
relativo, dentro de cada anlise; em comparao com as demais variveis independentes, trata-se das
duas variveis menos relevantes para a variao na concordncia verbal.

185
Anlise multivariada

0.8
Feminino
Masculino

0.6

Pesos Relativos
0.4

0.2

0.0
Fundamental Mdio Superior

Nvel de Escolaridade

Figura 7.1 Tendncias de emprego de CV- (1PP) em cruzamento entre


Sexo/Gnero e Nvel de Escolaridade para 29 falantes com variao

entre Sexo/Gnero e Escolaridade revela que as variveis no so indepen-


dentes uma da outra nessa amostra reduzida. A Figura 7.1 mostra que, para
1PP, enquanto a marca zero relativamente desfavorecida pelas mulheres e
favorecida entre os homens de nvel escolar mdio ou superior (de maneira
semelhante tendncia verificada na amostra total), a tendncia se inverte
entre os falantes com menor grau de escolaridade, entre os quais so as
mulheres que mais tendem a favorecer CV- em relao aos homens. Nesse
subconjunto de dados, as mulheres com nvel fundamental de escolaridade so
representadas por quatro falantes com 49 anos ou mais (uma delas freira e
trs so donas de casa). As mulheres paulistanas mais velhas e com menor
nvel de escolaridade parecem ter padres de sociabilidade semelhantes aos
migrantes da amostra de Rodrigues (1987) e ter menos influncia da norma
culta do que os homens de mesmo nvel de escolarizao.
Nesta nova anlise, com dados de 29 informantes, Mobilidade passa a
ser selecionada como varivel significativa. Conforme se previu, falantes
com menor mobilidade favorecem fortemente CV- (P.R. 0.82); aqueles com
mobilidade mdia ficam prximos do ponto neutro (P.R. 0.47); e aqueles com
mobilidade alta a desfavorecem (P.R. 0.32).
Vale notar que os ranges das variveis lingusticas permanecem pratica-
mente idnticos aos da anlise anterior com o conjunto total de informantes:

186
Anlise multivariada

90 91 para Salincia; 59 61 para Posio do Sujeito. Por outro lado,


os ranges das variveis sociais se reduzem consideravelmente na nova anlise:
81 74 para Classe Social; 70 46 para Escolaridade. Isso indica que o
efeito das variveis lingusticas est bem representado em ambas as anli-
ses, independentemente de se considerarem todos os informantes ou apenas
os no categricos; o efeito das variveis sociais, por outro lado, parece se
distorcer ao incluir falantes que no exibem variao de fato. No entanto,
todas as variveis, lingusticas ou sociais, so selecionadas na mesma ordem
da anlise prvia e com as mesmas hierarquias internas. Paralelismo uma
varivel que novamente no selecionada, bem como Faixa Etria, Regio de
Residncia e Origem dos Pais. Desse modo, a anlise com todos os dados,
ainda que contenha falantes com distribuies categricas, revela, de modo
geral, as mesmas tendncias que a anlise do subconjunto de falantes que
individualmente exibiram variao na realizao da concordncia. Assim, as
consideraes sobre o contraste entre 1PP e 3PP se mantm: constata-se que
os fatores sociais e lingusticos que regulam a concordncia verbal de 1PP e
de 3PP so basicamente os mesmos e tm a mesma ordem de importncia.
Se 1PP e 3PP efetivamente se configuram como uma mesma varivel
sociolingustica, como explicar que a marca zero em 1PP socialmente mais
estigmatizada do que em 3PP, conforme aponta Rodrigues (1987)? Isso
decorre de diferentes frequncias no emprego das variantes como se viu
para CN- em diferentes partes da cidade de So Paulo, no Captulo 6 , ou
se refere a padres de encaixamento social um tanto divergentes como se
observou, por exemplo, para a pronncia do (-r) no Captulo 5? Ao mesmo
tempo, ainda que as anlises das variveis Faixa Etria e Idade tenham
indicado um caso de variao estvel na comunidade como um todo, haveria
evidncias de que CV- em 1PP estaria se expandindo na fala de jovens de
periferia, conforme assinala Coelho (2006)? Tais respostas podem ser obtidas
com uma anlise conjunta dos dados, que abarca tanto 1PP quanto 3PP,
desenvolvida na prxima seo.

187
O status de CV- em 1PP e 3PP: anlise conjunta de dados

7.3 O status de CV- em 1PP e 3PP: anlise


conjunta de dados
As anlises reportadas at aqui focalizaram 1PP e 3PP separadamente. Para
uma anlise desses dados em um nico conjunto, excluiu-se a varivel Ani-
macidade (que se aplica somente a dados de 3PP) e reorganizou-se Salincia
Fnica em dois nveis (Grau 1 oposio no acentuada e Grau 2 oposio
acentuada). Alm disso, adicionou-se ao modelo a varivel Pessoa Gramatical.
Ainda que as taxas de emprego de 1PP e de 3PP no coincidam (9,4%
12,6%, respectivamente), tal diferena no grande o suficiente para ser
significativa, j que a varivel Pessoa Gramatical no selecionada em anlise
multivariada (Tabela 7.8).

Tabela 7.8 Anlise de correlao entre Concordncia Verbal e Pessoa Gramatical

1PP e 3PP
N total = 10.554
CV- = 1.292 (12,2%)
P.R. % N
Pessoa gramatical
1PP [.35] 9,4 1.074
3PP [.52] 12,6 9.480
Input: 0,085. [ ] indicam a no seleo da varivel como significativa.

No entanto, ao cruzar Pessoa Gramatical com Nvel de Escolaridade, Classe


Social e Mobilidade, verifica-se que certos grupos de falantes apresentam
tendncias significativamente diferentes de emprego de CV- para 1PP e 3PP.
A Figura 7.2 apresenta tais cruzamentos em grficos. Neles, a tendncia
marca zero para a 1PP indicada com colunas escuras e para 3PP com colunas
mais claras. Na Figura 7.2a, observa-se que as diferenas entre 1PP e 3PP no
so significativas para os falantes com nvel mdio ou superior de escolaridade
(p > 0,50 e p > 0,20, respectivamente). Entretanto, tal diferena maior entre
os falantes menos escolarizados, que favorecem significativamente CV- em
1PP, relativamente a 3PP (p < 0,01). Em 7.2b, observa-se algo semelhante:

188
O status de CV- em 1PP e 3PP: anlise conjunta de dados

1.0 1.0
** 1PP 1PP
3PP 3PP **
0.8 0.8
+ +
Pesos Relativos

Pesos Relativos
0.6 0.6
+
+
0.4 0.4 +

0.2 0.2

0.0 0.0
Fundamental Mdio Superior AB1 B2 C1 C2D

(a) Nvel de Escolaridade (b) Classe Social


1.0
1PP
*** 3PP
0.8
Pesos Relativos

0.6 +
+

0.4

0.2

0.0
Baixa Mdia Alta

(c) Mobilidade

Figura 7.2 Tendncias de emprego de CV- em cruzamentos entre Pessoa


Gramatical e (a) Nvel de Escolaridade; (b) Classe Social; e (c) Mobilidade.
+p > 0,05; *p < 0,05; **p < 0,01; ***p < 0,001

no so significativas as diferenas de emprego de CV- entre 1PP e 3PP


para as classes A-B1 (p > 0,50), B2 (p > 0,50) e C1 (p > 0,20); ou seja,
nesses casos, alta a probabilidade de que a diferena seja aleatria. Por
outro lado, a diferena relevante entre os falantes da classe mais baixa C2-D,
cuja tendncia de emprego de CV- em 1PP significativamente maior do
que em 3PP (p < 0,01). Finalmente, quanto Mobilidade (Figura 7.2c), a
diferena entre 1PP e 3PP significativa para os falantes com mobilidade
baixa, que tendem a empregar CV- mais na 1PP do que na 3PP (p < 0,001).
Tal contraste no significativo para falantes com mobilidade mdia (p >
0,10) ou alta (p > 0,05).
Em suma, a Figura 7.2 mostra que os falantes menos escolarizados, de
classe socioeconmica mais baixa e que so mais enraizados em seus bairros

189
O status de CV- em 1PP e 3PP: anlise conjunta de dados

apresentam tendncias a CV- significativamente maiores em 1PP do que em


3PP, o que no se observa nos outros grupos de falantes. Pode-se depreender
da uma possvel motivao para o maior estigma de CV- para 1PP relati-
vamente a 3PP: a marca zero de 1PP favorecida por grupos cuja fala tem
maior probabilidade de ser estigmatizada socialmente.
Por outro lado, 1PP e 3PP tambm parecem se distinguir em graus de
Salincia Fnica. Como no h uma escala de salincia que abarque as
formas de 1PP e de 3PP conjuntamente, realizou-se um cruzamento entre
essa varivel (reconfigurada em dois graus) e Pessoa Gramatical, a fim de
verificar em quais formas o emprego de CV- favorecido. Esse cruzamento
se encontra na Figura 7.3, que mostra que maior a tendncia de ocorrer
CV- na 1PP do que na 3PP quando menor o grau de salincia (Grau 1),
mas que tal tendncia se inverte no Grau 2.
0.8
1PP
3PP

0.6
Pesos Relativos

0.4

0.2

0.0
Grau 1 Grau2

Salincia Fnica

Figura 7.3 Tendncias de emprego de CV- em cruzamento entre Pessoa


Gramatical e Salincia Fnica

Com base na Figura 7.3, pode-se propor que, em uma anlise conjunta de
1PP e 3PP, os graus de salincia se organizam como em (7) adiante, em que
A representa o menor grau de salincia (mais propenso forma CV-) e D
o maior grau de salincia (e menos propenso forma CV-):9
9
Trata-se, em verdade, de um artifcio analtico ad hoc; em princpio, deve-se partir de um modelo
terico a ser testado nos dados ao invs de partir dos dados para formular um modelo de anlise; caso
contrrio, corre-se o risco de oferecer argumentaes circulares. Tal artifcio se justifica aqui por dois
motivos: os resultados para Salincia Fnica so to consistentes em diversos estudos, sobretudo quanto

190
O status de CV- em 1PP e 3PP: anlise conjunta de dados

(7) A: Grau 1/1PP < B: Grau 1/3PP < C: Grau 2/3PP < D: Grau 2/1PP

Reorganizando-se Salincia Fnica dessa maneira, novos cruzamentos foram


realizados com Escolaridade, Classe Social e Mobilidade (Figura 7.4).
Nos trs cruzamentos da Figura 7.4, observa-se que a hierarquia proposta
em (7) para Salincia seguida por todos os grupos, praticamente sem exceo:
CV- tende a ocorrer mais no Grau A (menor grau de salincia) e tende a
ocorrer gradualmente menos nos graus B, C e D (conforme aumenta o grau de
salincia). Tal relao parece ser relativamente mais regular entre os falantes
do Ensino Fundamental, das classes B2 e C2-D e de menor mobilidade. Nos
demais grupos, a escada da salincia tem degraus menos regulares (em
alguns casos, bastante irregulares, sobretudo quando se atenta para os graus
C e D): no Grau D (o de maior salincia), CV- fortemente evitada pelos
falantes com Ensino Mdio e Superior; pelos falantes da classe A-B1; e por
aqueles cuja mobilidade mdia ou alta. Em outras palavras, os falantes com
maior nvel de escolaridade, maior status socioeconmico e maior mobilidade
rejeitam fortemente CV- quando alto o grau de salincia fnica.
As figuras 7.2 e 7.4 mostram que diferentes grupos sociais da comunidade
apresentam tendncias diferentes embora no divergentes quanto ao
emprego de CV- na 1PP e na 3PP: falantes cuja fala tem maior probabilidade
de ser estigmatizada socialmente exibem tendncia significativamente favorvel
ao emprego da marca zero em 1PP em relao a 3PP; ao mesmo tempo,
falantes cuja fala costuma ser associada a padres de correo gramatical
evitam fortemente o emprego de formas mais salientes de CV-, o Grau 2 de
1PP. Tais fatos devem contribuir para maior estigmatizao da marca zero
em 1PP do que em 3PP.
Essa interpretao traz consigo certas implicaes para anlises socio-
lingusticas. Em primeiro lugar, pressupe que a estigmatizao de certas
ao favorecimento de CV- em formas de Grau 1 (menos salientes) em relao a formas do Grau 2 (mais
salientes), a ponto de permitirem afirmar que a varivel tem um efeito real sobre a concordncia verbal,
de modo a no se tratar mais de uma hiptese. O raciocnio aqui, portanto, invertido: sabendo-se
do papel da Salincia Fnica na concordncia verbal, prope-se uma escala conjunta para 1PP e 3PP
a partir da distribuio dos dados. A segunda justificativa o tipo de anlise a que se destina a escala
conjunta. O objetivo aqui no o de verificar se h correlao entre a concordncia verbal e Salincia
Fnica, visto que isto j foi estabelecido acima; o intuito o de avaliar se as diferentes formas de 1PP
e 3PP quanto ao grau de salincia se distribuem diferentemente em grupos distintos da comunidade.

191
O status de CV- em 1PP e 3PP: anlise conjunta de dados

1.0
Grau A
Grau B
0.8 Grau C
Grau D
Pesos Relativos

0.6

0.4

0.2

0.0
Fundamental Mdio Superior

(a) Nvel de Escolaridade


1.0
Grau A
Grau B
0.8 Grau C
Grau D
Pesos Relativos

0.6

0.4

0.2

0.0
AB1 B2 C1 C2D

(b) Classe Social


1.0
Grau A
Grau B
0.8 Grau C
Grau D
Pesos Relativos

0.6

0.4

0.2

0.0
Baixa Mdia Alta

(c) Mobilidade

Figura 7.4 Tendncias de emprego de CV- em cruzamentos entre Salincia


Fnica e (a) Nvel de Escolaridade; (b) Classe Social; e (c) Mobilidade

192
O status de CV- em 1PP e 3PP: anlise conjunta de dados

variantes lingusticas advm do fato de que certos grupos com menor prestgio
social tendem a empreg-las; nesse sentido, falantes menos escolarizados
tendem a empregar a marca zero no porque esta a forma estigmatizada
mas, ao contrrio, a forma estigmatizada porque tende a ser empregada por
falantes menos escolarizados. H, portanto, uma direcionalidade na atribuio
de significados sociais s variantes; tais significados surgem de construtos
sociais mais amplos, que antecedem o uso da lngua. Em segundo lugar,
tal interpretao sugere que os falantes em uma comunidade so sensveis a
diferentes tendncias de uso de variantes por parte de diferentes grupos de
indivduos. Pode-se aqui questionar se isso parece plausvel de um ponto de
vista cognitivo: seriam os falantes capazes de perceber diferenas to sutis nas
regras variveis de diferentes grupos sociais, como o favorecimento de CV-
em 1PP em vez de 3PP na fala de indivduos menos escolarizados, ou a forte
rejeio da marca zero em itens lexicais mais salientes (ns falou/ns falamos)
na fala de classes mais altas? Tal discriminao certamente no consciente;
no entanto, a forte regularidade nos padres de variao de 1PP e de 3PP
leva a crer que os membros de uma comunidade so capazes de aprender
regras bastante complexas em seu convvio cotidiano com outros membros
da mesma comunidade. Rodrigues (1987) havia sugerido que o significado
social de CV- em 1PP diferia daquele para 3PP pelo fato de o primeiro se
associar a falantes de origem rural, em contraposio aos nativos da cidade.
Um olhar mais detalhado aos padres de uso por parte dos paulistanos parece
mostrar que, para alm das categorias paulistano vs. no paulistano, os
nativos da cidade tambm realizam diferenciaes entre outros subgrupos na
comunidade com base em classes sociais ou nvel de escolaridade.
Examine-se, por fim, a segunda questo colocada para a comunidade
paulistana: haveria evidncias de expanso da marca zero em 1PP entre jovens
de periferia, diferentemente daquilo que se verifica em outras comunidades
urbanas? Na seo anterior, verificou-se que a variao estvel, considerando-
se a comunidade como um todo, tanto para 1PP quanto para 3PP. A fim de
permitir a observao daquilo que ocorre entre os jovens de periferia, realizou-
se um cruzamento entre as variveis Faixa Etria, Regio de Residncia e

193
O status de CV- em 1PP e 3PP: anlise conjunta de dados

Tabela 7.9 Tendncias de emprego de CV- em cruzamento entre Regio de


Residncia, Pessoa Gramatical e Faixa Etria

Centro Periferia
1PP 3PP 1PP 3PP
P.R. % P.R. % P.R. % P.R. %
Faixa Etria
2034 anos 0.26 4,7 0.44 9,5 0.46 10,3 0.57 15,2
3559 anos 0.44 9,7 0.47 10,6 0.33 6,3 0.48 11,0
60+ anos 0.60 16,7 0.54 13,9 0.37 7,3 0.55 14,5
Input: 0,120.

Centro Periferia
0.6

0.6
Pesos Relativos

Pesos Relativos
0.4

0.4
0.2

0.2

1PP 1PP
3PP 3PP
0.0

0.0

60+ 3559 2034 60+ 3559 2034

Faixa Etria Faixa Etria

Figura 7.5 Tendncias de emprego de CV- em cruzamento entre Regio de


Residncia, Pessoa Gramatical e Faixa Etria

Pessoa Gramatical, que se apresenta na Tabela 7.9 e na Figura 7.5.10


Os resultados so apresentados separadamente na Figura 7.5 apenas para
facilitar sua visualizao, mas advm de uma mesma anlise multivariada.
Trata-se de quatro curvas para CV- em 1PP e 3PP, para habitantes de bairros
mais centrais e mais perifricos, ao longo do tempo aparente representado
pelas faixas etrias. Entre os habitantes de bairros mais centrais, essas curvas
so descendentes tanto para 1PP quanto para 3PP, sendo a primeira mais
10
Como se trata de um cruzamento complexo entre trs variveis, que gerou uma nova varivel com 12
fatores (3 faixas etrias x 2 pessoas gramaticais x 2 regies de residncia), a anlise da Tabela 7.9
incluiu apenas a nova varivel e Falante e Item Lexical como efeitos aleatrios, excluindo-se as demais
(Salincia Fnica, Sexo/Gnero etc.), a fim de no gerar interaes indevidamente.

194
Sntese

ngreme que a segunda. Isso significa que, entre esses falantes, parece haver
um movimento em direo da marca explcita de nmero, j que CV- tende a
ocorrer relativamente menos na fala dos mais jovens do que na dos mais velhos;
pela inclinao das curvas, tal movimento tem ocorrido mais rapidamente em
1PP do que em 3PP.
Entre os habitantes de bairros perifricos, a curva para 3PP do tipo
U, sendo que CV- favorecida entre os mais jovens e os mais velhos, e
relativamente desfavorecida entre os falantes da faixa etria intermediria.
Para 1PP, a tendncia menos clara: a diferena entre a terceira e a segunda
faixa etria pequena (P.R. 0.37 e 0.33, respectivamente), o que resulta em
uma curva quase plana entre esses falantes. Os jovens de periferia, assim,
parecem se destacar em seu uso de CV- em relao aos mais velhos e esboar
um quadro de mudana na direo dessa variante. Entretanto, se o emprego
de formas como nis e Nis vai uma marca identitria de jovens de
periferia, como prope Coelho (2006), possvel que tais formas passem a
ser evitadas medida que esses jovens ingressem no mercado de trabalho, seja
pelo emprego da marca explcita de nmero, seja pela adoo do pronome a
gente.
certo que a amostra de Coelho (2006) no diretamente comparvel com
a deste estudo; so diferentes as categorias sociais, assim como so diferentes
as metodologias de coleta de dados (por redes sociais naquele e amostragem
aleatria neste). Desse modo, enquanto a presente amostra no contradiz
seus resultados, tampouco fornece fortes evidncias de um movimento em
direo marca zero entre os habitantes de bairros perifricos; o exame de
uma amostra mais ampla da comunidade, como se realiza no presente estudo,
aponta apenas para um esboo de mudana em favor de CV- entre os falantes
de periferia.

7.4 Sntese
Este captulo compara padres de variao na concordncia verbal em 1PP
e em 3PP e demonstra que, na comunidade paulistana, seus padres de
encaixamento lingustico e social coincidem amplamente, pois suas anlises

195
Sntese

em separado selecionam o mesmo conjunto de variveis, na mesma ordem


de importncia e com a mesma hierarquia de restries em cada uma delas.
Trata-se de uma mesma varivel sociolingustica.
Alm de contribuir para o mapeamento dessa varivel no portugus brasi-
leiro, o captulo discute especificamente duas questes. A primeira examina se
os diferentes significados sociais de CV- em 1PP e 3PP podem ser atribudos
a diferentes correlaes com fatores lingusticos e sociais, ou se eles se devem
somente a diferenas de frequncias de ocorrncias. Em anlises do conjunto
total de dados (1PP+3PP) e em cruzamentos entre Pessoa Gramatical e
variveis sociais, observa-se que 1PP e 3PP se distribuem algo diferentemente
quanto ao Nvel de Escolaridade, Classe Social e Mobilidade dos falantes, com
favorecimento da marca zero em 1PP em relao a 3PP entre os falantes
menos escolarizados, de classe social mais baixa e menor grau de mobilidade,
cuja fala mais sujeita a estigmatizao social. Alm disso, os falantes mais
escolarizados, de classe mais alta e maior grau de mobilidade tendem a evitar
CV- fortemente quando alto o grau de salincia entre as formas singular e
plural (p.ex., falou/falamos). Apoiando-se nesses fatos, sugere-se que o maior
estigma associado ao emprego de CV- para 1PP pode advir dos diferentes
padres de emprego por parte de diferentes grupos sociais.
A segunda questo busca avaliar, com base em uma amostra mais abran-
gente da fala paulistana (relativamente a Rodrigues 1987 e Coelho 2006),
se haveria evidncias de que CV- na 1PP estaria se expandindo na fala
de jovens de periferia, ou mesmo evidncias de movimento na direo dessa
variante, contrariamente ao que se verifica em outras comunidades urbanas.
As anlises em tempo aparente indicam tendncia de mudana em direo
marca explcita de nmero entre os moradores de bairros mais centrais tanto
na 1PP quanto na 3PP, mas sobretudo na primeira, caso em que CV-
fortemente evitada pelos falantes mais jovens. Por outro lado, no se verifica
um claro indicativo de mudana entre os moradores de bairros mais perifricos,
que apresentam uma curva em U para 3PP, com desfavorecimento relativo
de CV- pelos falantes da faixa etria intermediria. Para 1PP, observou-se
uma tendncia marca zero relativamente maior entre os falantes de primeira
faixa etria do que da terceira e da segunda, mas que pode se reverter

196
Sntese

medida que esses jovens ingressem no mercado de trabalho. Tais resultados


enfatizam que a constatao de variao estvel na comunidade como um
todo no significa que todos os grupos sociais seguem um mesmo padro em
tempo aparente.

197
Parte III

So Paulo:
uma comunidade de fala
8
O indivduo e a comunidade

At este ponto, foram descritos amplos padres de variao no


portugus paulistano a respeito do encaixamento lingustico e so-
cial das variveis (e), (-r), (CN) e (CV). Verificou-se, por exemplo,
que a ditongao de (e) fortemente favorecida pelas mulheres,
que a realizao retroflexa de (-r) tende a ocorrer na fala de re-
presentantes das classes mais baixas, e que o paralelismo inter- e
intrassintagmtico tem grande poder de prever a ocorrncia da
marca zero de concordncia nominal ou verbal. Tais constataes
se basearam em anlises do conjunto total de dados da amostra,
composta de 118 informantes. O presente captulo se volta a
uma anlise sistemtica da fala de indivduos, com o intuito de
determinar se as correlaes anteriormente descritas se referem a
padres abstratos que resultam do nivelamento estatstico de uma
grande quantidade de dados, ou se so relevantes para descrever
a gramtica de falantes individuais; o segundo caso constituiria
evidncia de compartilhamento de normas de usos lingusticos en-
tre membros da comunidade. A anlise que segue demonstra que
as regras variveis ocorrem sistematicamente para os informantes
da amostra, o que permite caracterizar a cidade de So Paulo,
no obstante sua demografia amplamente heterognea, como uma
nica comunidade de fala (Labov, 2006 [1966]).
O indivduo e a comunidade

As anlises sociolingusticas tm o objetivo de descrever e explicar padres


de usos lingusticos variveis, que so vistos como parte da prpria lngua. No
entanto, pode-se indagar se as regras variveis, tais como aquelas descritas
nos captulos 4 a 7 (p.ex., o retroflexo favorecido em slabas tnicas, com
peso relativo de 0.55), referem-se a padres abstratos que emergem somente
na anlise de uma grande quantidade de dados, como uma espcie de mdia
grosseira de padres individuais independentes e possivelmente divergentes
entre si, ou se tais descries possuem alguma validade emprica para a
gramtica de cada falante individual.
Vale notar que as avaliaes sociolingusticas dos falantes da lngua assim
como de linhas de pensamento lingustico mais formalistas frequentemente
so categricas, com a frmula pessoas do tipo X empregam a forma A,
e pessoas do tipo Y empregam a forma B, ou ainda quando se est na
situao X, usa-se a forma A, e quando se est na situao Y, usa-se a forma
B. Tal perspectiva, exemplificada pelo excerto (1) abaixo, leva a crer que as
gramticas individuais seriam internamente homogneas, isentas de variao.

(1) D1: e o que que voc acha de ah me v dois pastel e um chopes?


S1: eu acho que uma pessoa que no sabe falar portugus... que so dois
pastis e um chope [risos-S1]
D1: uhum... e voc fala assim ou no?
S1: dois pastel?... e um chopes? no!... eu no
D1: [risos] e quem fala dessa maneira assim?
S1: pessoas que no no estudaram a lngua... que so menos favorecidas...
vo falar errado e vo continuar falando errado sem plural (Madalena M.,
F2SP)

V-se nesse exemplo que Madalena M., uma professora de ingls do Ensino
Mdio e com nvel superior de escolaridade, nega veementemente a possibi-
lidade de que ela possa deixar de realizar a concordncia padro e afirma
que falar errado prprio de pessoas com outro perfil social (quem no
estudou ou menos favorecido). De fato, essa falante apresenta uma baixa
taxa de CN- 4% (ver Anexo B, p. 361); no entanto, considerando-se que
mesmo em uma situao de gravao, em que se pode pressupor certo grau
de monitoramento, a informante emprega a marca zero (6 ocorrncias em 54

200
O indivduo e a comunidade

minutos de gravao), pode-se supor que sua taxa de emprego da variante seja
relativamente maior em sua fala cotidiana, quando no est sendo gravada.
Por outro lado, os mtodos sociolingusticos de anlise quantitativa j
foram criticados por um suposto irrealismo cognitivo. Pela necessidade me-
todolgica de se analisar uma grande quantidade de dados, geralmente se
volta fala de agrupamentos de indivduos, procedimento que normalmente
no permite verificar se a variao observada de fato est presente na fala
individual ou se simplesmente representa o amontoamento de comportamentos
lingusticos divergentes. Ressalte-se, nesse sentido, que a recente incorporao
de modelos de efeitos mistos (Baayen, 2008; Tagliamonte, 2011) na caixa de
ferramentas sociolingusticas um grande avano metodolgico, ao levar em
conta o peso de cada falante nos padres da amostra (Captulo 3, p. 56).
Contudo, uma crtica de Bickerton (1973, apud Labov 1980 : xv) parece ainda
ser pertinente: o autor argumenta ser impossvel a seres humanos aprender a
produzir uma forma lingustica mais frequentemente do que outra, e que, por-
tanto, os padres de variao reportados em estudos sociolingusticos devem
ser o resultado do nivelamento estatstico de diferentes padres individuais.
A questo sobre se a variao sistemtica e ordenada ocorre no nvel
individual ou comunitrio no trivial. Ela concerne a um dos proble-
mas fundamentais da Lingustica: embora a lngua desempenhe uma funo
eminentemente social comunicar-se , ela reside nas mentes de falantes indi-
viduais (Guy, 1980 : 1). Trata-se da j conhecida distino saussuriana entre
langue e parole, e da distino chomskyana entre competncia e perfrmance.
Para esses dois autores, a variao na fala individual seria inerentemente
catica, motivo pelo qual no poderia constituir o verdadeiro objeto da
Lingustica a langue ou a competncia.
Em contraposio direta a Chomsky, Hymes (1991 [1979]) prope o con-
ceito de competncia comunicativa que, como se viu no Captulo 2 (p. 21),
considera que o conhecimento lingustico do falante compreende as regras no
apenas de sua gramtica mas tambm de usos apropriados. Para a Teoria
da Variao e da Mudana Lingustica, a questo acima colocada sobre a
relao indivduocomunidade diz respeito prpria definio de uma comu-
nidade lingustica. A definio laboviana de comunidade de fala se pauta

201
O indivduo na perspectiva sociolingustica

pelo compartilhamento de normas e pela uniformidade lingustica, entendidos


como regras variveis similares entre indivduos (ver Captulo 2, p. 21). Com
efeito, ao considerar a variao como parte da competncia comunicativa,
a incorporao da regra varivel ao conhecimento do falante se torna um
corolrio.
Para a cidade de So Paulo, por suas enormes dimenses e suas fortes
diferenas sociais, parece razovel suspeitar que talvez seus milhes de habi-
tantes no compartilhem um nico conjunto de regras variveis, ainda que
se considerem apenas os falantes nativos.1 possvel, por exemplo, que as
regras variveis para o emprego de (-r) se configurem algo diferentemente por
parte de um falante de classe mais alta e por parte de outro de classe mais
baixa.
Desse modo, este captulo investiga se os mesmos padres de variao
lingustica p.ex., maior peso relativo para CN- em palavras terminadas em
vogais orais do que em plurais irregulares, ou maior tendncia de emprego de
retroflexo em slabas tnicas do que tonas so observados na fala de cada
indivduo. Em outras palavras, com base na premissa laboviana de que uma
variedade lingustica constituda por pessoas que compartilham a mesma
gramtica, caracterizada por um conjunto de regras variveis, So Paulo pode
ser considerada uma nica comunidade de fala?

8.1 O indivduo na perspectiva


sociolingustica
O aparato terico da anlise da regra varivel (Labov, 1969; Cedergren &
Sankoff, 1974; Sankoff & Labov, 1979) se caracteriza por certas proposies,
assim sintetizadas por Guy (1991 : 5):

(i) os falantes individuais podem diferir em suas taxas de aplicao


de uma regra varivel, ou seja, em seu valor de input;2
1
Cabe a lembrana de que, neste estudo, tais perguntas se aplicam aos nascidos na cidade e que viveram
aqui a maior parte de suas vidas, e no na comparao com grupos de migrantes, cuja presena
marcante em So Paulo. Um primeiro trabalho nesse sentido o de Gomes da Silva (2014), a respeito
da concordncia nominal entre paulistanos e alagoanos residentes em So Paulo.
2
Entenda-se, a taxa de emprego de uma variante, entre 0% e 100%.

202
O indivduo na perspectiva sociolingustica

(ii) os indivduos devem apresentar valores similares ou idnticos de


pesos relativos atribudos aos fatores de variveis lingusticas.3

Essas proposies afirmam que dois falantes de uma mesma comunidade


de fala podem exibir frequncias de uso de uma variante to dspares quanto
5% ou 75% (proposio 1) por exemplo, de CN- , mas que suas tendncias
de emprego, em pesos relativos, devem ser semelhantes quanto a um mesmo
contexto lingustico (proposio 2) por exemplo, maior peso relativo para a
marca zero de (CN) em palavras terminadas em vogais orais, como menino,
do que em palavras terminadas em -S, como vez.4
Em um dos primeiros estudos sobre a concordncia verbal de 3PP no
portugus brasileiro, Naro (1981) demonstra que a hierarquia de salincia
fnica em seis graus (ver Captulo 7, p. 174) tende a ser mantida na fala de
cada indivduo. Na Tabela 8.1, reproduzida de seu estudo, apresentam-se o
nmero de dados, as frequncias correspondentes do uso da marca explcita
de nmero e seus respectivos pesos relativos. O sinal de igual (=) indica que
pequena a probabilidade (p < 0,10) de ser significativa a diferena entre o
peso relativo e aquele logo abaixo; o asterisco, por sua vez, indica diferena
significativa (p > 0,10). Note-se que a variante de aplicao nesse caso (a
marca explcita) foi diferente daquela que se usou no Captulo 7 do presente
estudo (a marca zero); no estudo de Naro, esperam-se valores crescentes de
pesos relativos (maior tendncia marca explcita de plural) quanto maior o
grau de salincia fnica, de 1a at 2c.
Ao comparar tais valores para cada indivduo, percebem-se tendncias
crescentes de emprego de CV-E, de acordo com a escala de salincia, para os
falantes ELV e FAU (1a < 1b < 1c < 2a < 2b < 2c). Para HEN, embora os
pesos relativos paream no seguir estritamente a escala de salincia (1a: 0.16
< 1b: 0.24 > 1c: 0.19 < 2a: 0.51 < 2b: 0.90 > 2c: 0.88), a diferena entre
3
Traduo prpria. Texto original: 1. Individual speakers may differ in their basic rate of use of
a variable rule, that is, in their input probability for the rule. 2. Individuals should be similar or
identical in the factor values assigned to linguistic constraints on the rule. Guy (1991) ainda lista
uma terceira proposio, que no discutida aqui: 3. The factor values, or conditional probabilities
associated with each environmental constraint on a rule, can freely vary in the interval (01) [...]. In
other words, the variable rule framework imposes no a priori requirement on how close or distant the
values in a given group may be or on what ratios obtain between them.
4
Ver Captulo 6, p. 141. Os pesos relativos para esses fatores, na anlise geral, foram de 0.80 e 0.43,
respectivamente.

203
O indivduo na perspectiva sociolingustica

Tabela 8.1 Frequncias e tendncias de emprego de CV-E para seis informantes,


de acordo com Salincia Fnica (Fonte: Naro 1981 : 89)

Falante: ELV Falante: UBI


N/N Total % CV-E P.R. N/N Total % CV-E P.R.
1a 9/92 9.8 0.08 12/115 10.4 0.08
1b 102/297 34.3 0.29 89/219 40.6 0.35 *
1c 20/32 62.5 0.53 = 10/41 24.4 0.18
2a 56/91 61.5 0.57 = 86/107 80.4 0.78 =
2b 25/37 67.6 0.73 25/30 83.3 0.82 =
2c 132/152 86.8 0.87 93/110 84.6 0.86
Falante: FAU Falante: HEN
N/N Total % CV-E P.R. N/N Total % CV-E P.R.
1a 1/62 1.6 0.03 5/36 13.9 0.16 =
1b 50/380 13.2 0.22 31/144 21.5 0.24 =
1c 21/48 43.8 0.60 = 3/17 17.7 0.19
2a 46/89 51.7 0.68 25/54 46.3 0.51
2b 29/42 69.1 0.83 = 14/18 77.8 0.90 =
2c 152/197 77.2 0.89 49/59 83.1 0.88
Falante: SON Falante: SID
N/N Total % CV-E P.R. N/N Total % CV-E P.R.
1a 26/53 49.1 0.23 20/59 33.9 0.18
1b 175/223 78.5 0.54 * 107/210 51.0 0.31 =
1c 1/5 20.0 0.06 10/15 66.7 0.44 =
2a 55/62 88.7 0.70 = 66/86 76.7 0.62
2b 34/36 94.4 0.85 = 35/39 89.7 0.82 *
2c 130/144 90.3 0.76 74/96 77.1 0.63
Comparao com P.R. de fator abaixo: =p < 0,10; *p > 0,10. Grau 1a:
come/comem; Grau 1b: fala/falam; Grau 1c: faz/fazem; Grau 2a: d/do; Grau
2b: comeu/comeram; Grau 2c: falou/falaram.

1b1c e 2b2c no significativa, de modo que, tambm para ele, a escala


mantida. Os outros trs falantes (UBI, SON e SID) apresentam casos em que
a ordem relativa de fatores no segue o mesmo padro. No entanto, de modo
global, Naro (1981) chama a ateno para o fato de que, dentre 30 pares
de pesos relativos em comparao (cinco pares para cada falante), a ordem
relativa segue aquela esperada em 14 deles, a diferena neutralizada em 13
(os casos assinalados com =) e somente trs esto na ordem errada (os casos
marcados com asterisco). Ademais, em toda a tabela, h apenas um caso em
que um fator se encontra a uma distncia de mais de um grau em relao
posio prevista: na fala de SON, o peso relativo de 0.06 para a classe 1c

204
O indivduo na perspectiva sociolingustica

menor do que aqueles para 1a (0.23) e 1b (0.54); contudo, trata-se do caso


em que h um menor nmero de dados (1 de CV-E, de um total de 5), em
que as chances de flutuaes aleatrias so maiores.5 Naro (1981) depreende
da o alto grau de uniformidade nos padres de uso na fala de indivduos, em
conformidade com as regras variveis da comunidade.
A relao entre padres de variao individuais e comunitrios tambm foi
analisada sistematicamente por Guy (1980), em seu estudo sobre o apagamento
de t/d no ingls de quatro falantes de Nova Iorque e 19 da Filadlfia. O autor
nota que a uniformidade da regra varivel na fala desses indivduos no reside
em taxas iguais de apagamento, mas na manuteno do ranqueamento de
fatores dentro de uma mesma varivel, em comparao com aquele observado
na comunidade: por exemplo, a maior tendncia ao apagamento de t/d
quando seguidos de consoantes (como em eat fast comer rpido) do que
quando seguidos de vogais (como em eat a lot comer muito), e em palavras
monomorfmicas (como em mist nvoa) do que bimorfmicas (como em
miss-ed perder-pretrito).
Guy (1980) no apenas comparou os pesos relativos para os fatores de cada
varivel, mas tambm avaliou detalhadamente os casos em que se observaram
desvios dessas regras. Estes ocorreram em contextos especficos (p.ex., t/d
seguido de consoante) em que havia 10 dados ou menos para um determinado
falante. Acima de 10 dados, houve 90% de conformidade regra varivel da
comunidade e, acima de 35 dados, a acesso foi de 100%.
Por outro lado, Guy (1980) notou que pode haver diferenas que no se
atribuem a flutuaes ocasionais decorrentes de poucos dados, ao observar
uma diferena sistemtica na fala de habitantes de Nova Iorque e da Filadlfia
em relao ao contexto fnico seguinte. Embora todos os falantes de ambas as
comunidades favoream o apagamento dos segmentos antes de consoantes em
relao a vogais, eles exibem comportamento divergente quanto ao tratamento
da pausa; em Nova Iorque, esse contexto favorece o apagamento de t/d
5
Se se dispe de apenas 5 dados para certo contexto, um nico dado representa 20% do total; a flutuao
ocasional de um para dois dados pode representar um salto de 20% para 40%, de modo que pequenas
diferenas randmicas resultam em diferenas proporcionais exageradas. Por outro lado, se h 100
dados para o mesmo contexto, a flutuao em um dado equivale a um salto de 1% (de 20% para
21%, por exemplo), e mudanas entre as propores passam a ser muito menos provveis de ocorrer
aleatoriamente.

205
O indivduo na perspectiva sociolingustica

para os quatro falantes, ao passo que o desfavorece para 18 dos 19 falantes


da Filadlfia. O autor interpreta que a regra de apagamento de t/d mais
frequentemente antes de consoantes do que de vogais (que se aplica a todos os
falantes) parece ser uma restrio fonolgica universal, que evita sequncias
do tipo CVCCV em favor da estrutura silbica cannica CVCV; o
efeito da pausa, por sua vez, por no apresentar as mesmas propriedades
fsicas/acsticas de consoantes nem de vogais, seria definido arbitrariamente
em cada dialeto.
Diferentes ordenamentos na hierarquia de fatores tambm foram observa-
dos por Cameron (1994, apud Guy 2000) quanto expresso do pronome reto
em espanhol, ao comparar comunidades distintas. Em Porto Rico, os falantes
favorecem o preenchimento do sujeito em casos de tu genrico, enquanto na
Espanha a expresso do pronome favorecida em casos de tu que se refere ao
interlocutor.
Diferentemente de Guy (1980) e Cameron (1994, apud Guy 2000), Lim &
Guy (2005) reportam um caso de alterao na hierarquia de fatores de uma
varivel na fala de informantes de uma mesma comunidade. Ao examinar o
apagamento de t/d no ingls de quatro jovens de Cingapura residentes em
Nova Iorque (todos de etnia chinesa, trs universitrios e um recm-graduado
na NYU), os autores notaram diferentes ranqueamentos de fatores a depender
de um estilo mais ou menos monitorado da fala. Assim como em Guy (1980),
as consoantes sempre favorecem o apagamento relativamente s vogais, para
os quatro falantes. A pausa, por sua vez, localiza-se em diferentes pontos
da hierarquia de restries em fala formal ou informal. No primeiro caso, a
pausa atua como contexto mais conservador para o apagamento (de modo
que a hierarquia se configura como consoante > vogal > pausa) e, no segundo,
como contexto intermedirio (consoante > pausa > vogal), sistematicamente
para os quatro indivduos. Quanto ao estatuto morfolgico da palavra com
t/d, o passado irregular (como left, told) tratado de modo semelhante a
monomorfemas (como mist) em estilo informal (monomorfemas = passado
irregular > passado regular) mas, em estilo formal, os fatores se organizam no
padro monomorfemas > passado irregular > passado regular. O tratamento
diferenciado de certos contextos para o apagamento de t/d de acordo com

206
Mtodo

o estilo de fala interpretado pelos autores como evidncia de bidialetalismo


ou diglossia para esses falantes, que acessariam diferentes gramticas a da
variedade Alta ou Baixa do ingls de Cingapura (Gupta, 1991, apud Lim &
Guy 2005) a depender de seu grau de ateno prpria fala.
Desse modo, a existncia de diferentes hierarquias de restries entre
fatores de uma mesma varivel para falantes diferentes, ou para um mesmo
falante em diferentes estilos, considerada como evidncia de diferentes
gramticas, que se definem pela configurao de suas regras variveis. No
presente trabalho, as anlises que seguem buscam avaliar se os paulistanos
exibem padres semelhantes entre si, tal como no estudo de Naro (1981),
ou se h evidncias de diferentes gramticas entre indivduos, semelhana
do que descreveram Guy (1980) para habitantes de Nova Iorque e Filadlfia,
Cameron (1994, apud Guy 2000) para falantes de Porto Rico e da Espanha,
e Lim & Guy (2005) para a diglossia de cingapurianos. No caso de haver
indcios de padres significativamente distintos, avalia-se se tais falantes se
definem por uma caracterstica social especfica (menor nvel de escolaridade,
residente de bairro mais central etc.) que poderia compor uma comunidade
de fala em separado. Antes de apresentar os resultados, a prxima seo
descreve os mtodos aqui empregados.

8.2 Mtodo
O mtodo para abordar as questes acima foi a realizao de anlises mul-
tivariadas semelhantes quelas da amostra geral, mas que, em vez de levar
em conta todo o conjunto de dados, dedicam-se cada qual aos dados de um
nico informante. Ainda que conceitualmente simples, tal mtodo pode ser
bastante cansativo e demandar muito tempo na prtica; trata-se, afinal, de
mltiplas variveis sociolingusticas e de mais de uma centena de informantes.
Neste estudo, tais dificuldades foram contornadas por intermdio da aplicao
de scripts no programa R, para que as anlises de cada varivel para cada
indivduo no fossem executadas uma a uma.
De modo geral, os scripts tm uma mesma estrutura. Conforme descrito
no Captulo 3 (p. 54), o Rbrul funciona por meio de uma interface textual

207
Mtodo

com menus de comando, pela qual o usurio define qual anlise ser executada
pela seleo de opes numeradas:6

(2) MAIN MENU


1-load/save data 2-adjust data 4-crosstabs 5-modeling
6-plotting 8-restore data 9-reset 0-exit
1: 2

ADJUSTING MENU
1-change class 2-rename 3-exclude 4-retain 5-recode
6-relevel 7-center/transform 8-count 9-main menu
0-exit 10-make full interaction group 11-make partial
interaction group
1: 4
Factor group to retain using? (1-V.D. 2-INF 3-genero [...])
1: 2
Factors to retain from
INF? (1-AdolfoF 2-AdrianaP 3-AmandaA [...] 118-WilliamA)
1: 1
2:

ADJUSTING MENU
1-change class 2-rename 3-exclude 4-retain 5-recode
6-relevel 7-center/transform 8-count 9-main menu
0-exit 10-make full interaction group 11-make partial
interaction group
1: 9

Current data file is: [...]

MAIN MENU
1-load/save data 2-adjust data 4-crosstabs 5-modeling
6-plotting 8-restore data 9-reset 0-exit
1: 5 [...]

A escolha de comando pelo usurio indicada nas linhas iniciadas por 1:


ou 2:, dentre as opes do menu que as precedem. No exemplo (2), tais
escolhas foram: (i) 2 (ou seja, ajustar dados); (ii) 4 (4-reter); (iii) 2
(2-INF); (iv) 1 (1-AdolfoF); (v) ENTER (representado pelo espao em
6
Os smbolos [...] omitem informaes no relevantes para o exemplo.

208
Mtodo

branco aps 2:); (vi) 9 (9-menu principal); e (vii) 5 (5-criar modelo).


Essas selees instruram o programa, respectivamente, (i) a ajustar os dados
carregados na memria; (ii) que tal ajuste se refere manuteno de um
subconjunto de dados; (iii) que os dados a ser retidos advm da varivel 2-
INF, codificada para identificar o informante de quem o dado proveniente;
(iv) que, da varivel 2-INF, devem-se reter os dados do primeiro informante,
Adolfo-F, (v) e somente dele (a opo ENTER volta ao Menu de Ajuste); (vi)
que a partir desse subconjunto de dados de um nico informante, deve-se
voltar ao Menu Principal; e (vii) que das opes do Menu Principal, deseja-se
criar um modelo estatstico. A criao de scripts que automatizam essas
operaes possvel devido sistematicidade e previsibilidade da ordem
de comandos. Para a execuo dos comandos acima, o script contm apenas
aquilo que seria digitado pelo usurio:

(3) 2
4
2
1

9
5 [...]

O restante do script contm sequncias de comandos praticamente idnticos,


que s diferem na identificao do novo informante cujos dados devem ser
retidos e analisados no modelo seguinte (o passo iv acima).7 O programa
levou, para cada uma das variveis, cerca de 10 minutos para executar 118
modelos estatsticos, de modo que o total de centenas de anlises foi realizado
em pouco menos de uma hora.
A organizao de tamanha quantidade de resultados, para separao de
valores de pesos relativos e ranqueamento de fatores, foi feita conjuntamente
no programa R (pela funo extracao() do pacote dmsocio; Oushiro 2014)
e no programa Excel 2010 (por funes como COUNTIF).
7
Nota para programadores: infelizmente, o pacote Rbrul, at o momento, no permite a execuo de
for-loops dentro de suas rotinas.

209
Mtodo

Essas anlises, de modo geral, basearam-se nos modelos estatsticos que


se mostraram os mais explicativos e sintticos para a descrio dos padres
de variao, de acordo com os captulos 4 a 7. Desse modo, no se incluram
nos modelos as variveis que no haviam sido selecionadas como significativas
para a comunidade como um todo (p.ex., a varivel Vogal da Slaba Seguinte
para (e); ver Captulo 4, p. 75) e mantiveram-se amalgamaes entre fatores
cujo comportamento no havia se revelado significativamente distinto (p.ex.,
para (CN-atomstica), a juno de posio nuclear e ps-nuclear das palavras;
ver Captulo 6, p. 143).8 (CN) foi novamente analisada tanto da perspectiva
atomstica quanto de SNs. (CV), por sua vez, foi analisada em arquivos de
dados que incluram tanto 1PP quanto 3PP; tal deciso se baseia no fato
de que, para 1PP, houve apenas 29 falantes cujos usos foram factualmente
variveis na entrevista (ver Captulo 7, p. 172) ou seja, a no variao em
(CV-1PP) no permitiria a anlise multivariada para os demais falantes ,
mas sobretudo na constatao, naquele mesmo captulo, de que as restries
so muito semelhantes para as duas pessoas gramaticais, configurando-se
efetivamente como uma mesma varivel.
Certas amalgamaes adicionais foram feitas em variveis com mais de trs
variantes, a fim de no multiplicar indefinidamente o nmero de comparaes
e de evitar um nmero excessivo de clulas com pouqussimos dados (quantos
mais fatores em uma varivel, presumivelmente haver um menor nmero de
dados por fator). Tais amalgamaes, que sero apontadas oportunamente,
foram feitas com base nas distribuies gerais observadas, em valores mais pr-
ximos de pesos relativos e semelhanas estruturais que possam ser justificadas
linguisticamente.
As variveis sociais, por sua vez, foram excludas de todas as anlises:
alm de serem constantes para um mesmo indivduo, o foco o contraste de
hierarquia para fatores de natureza lingustica e estilstica. Quanto varivel
Estilo, foi necessrio adotar alguns cuidados adicionais, visto que no houve
8
Isso significa dizer que nem todas as possibilidades de comparao entre padres individuais e comuni-
trios foram esgotadas. possvel, por exemplo, que a varivel Vogal da Slaba Seguinte, no relevante
para (e) na anlise geral, se revelasse importante para alguns indivduos, mas sua eliminao do modelo
j de antemo no permite verificar se este o caso. Tal deciso se justifica pelo fato de que o intuito
aqui o de comparar a hierarquia entre fatores dentro de uma mesma varivel, e no a seleo de
variveis.

210
Anlises

variao para (CN) nem para (CV) (ver Captulo 6, p. 136, e Captulo 7, p.
172). Para esses dois casos, realizou-se uma anlise adicional somente com a
varivel Estilo, excluindo-se todas as variveis lingusticas.
Por fim, ainda se fazem necessrias duas notas metodolgicas. J se
notou a relevncia de atentar para o nmero de dados de cada anlise a fim
de avaliar sua real significncia. Neste estudo, adota-se o valor observado
empiricamente por Guy (1980) de 35 dados por clula como critrio para que
uma determinada distribuio seja considerada confivel; padres individuais
divergentes que forem observados com base em um nmero menor de dados
so analisados mais detidamente apenas quando h outros indcios de uma
possvel gramtica alternativa. Alm disso, em qualquer amostragem de
qualquer populao, espera-se que cerca de 5% da distribuio dos dados
exibam comportamento divergente, fora da curva. Para uma amostra com
118 indivduos, portanto, de se esperar que 56 falantes se comportem
idiossincraticamente. Somente a existncia de um nmero maior de indivduos
constituir evidncia suficiente de gramticas verdadeiramente divergentes.

8.3 Anlises
Em qualquer anlise variacionista, o primeiro passo sempre checar se h
factual variao nos dados. nesse sentido que, nas anlises dos Captulos 4
a 7, o primeiro resultado quantitativo apresentado foi a distribuio geral de
dados, com destaque para nmeros brutos e porcentagens. Para a anlise de
falantes individuais, essa preocupao se torna tanto mais importante. Por
um lado, existe a mencionada avaliao de que a variao lingustica ocorre
apenas entre grupos de falantes (pessoas do tipo X dizem A; pessoas do
tipo Y dizem B), ou na fala de um mesmo indivduo apenas em diferentes
situaes. Por outro, o mero fato de haver um menor nmero de dados na fala
individual (em relao amostra como um todo) pode conduzir a distribuies
categricas.
O Anexo B (p. 361) apresenta uma tabela com a discriminao das
caractersticas sociais de cada um dos 118 falantes da amostra, junto a suas
taxas de emprego de [ej], [], CN-, CV-1PP- e CV-3PP-. Aqui se apresenta

211
Anlises

(~e) (r)
10 15 20 25 30

10 15 20 25 30
N informantes

N informantes
5

5
0

0
0 20 40 60 80 100 0 20 40 60 80 100

Taxas de emprego Taxas de emprego

(CN) (CV)
70

70
50

50
N informantes

N informantes
30

30
0 10

0 10

0 20 40 60 80 100 0 20 40 60 80 100

Taxas de emprego Taxas de emprego

Figura 8.1 Taxas de emprego das variantes [ej], [], CN- e CV-
por nmero de informantes

um resumo dessas distribuies. Os histogramas da Figura 8.1 mostram o


nmero de falantes por diferentes faixas de emprego das variantes de aplicao
(de 0 a 10%, de 10% a 20% etc.).
As taxas de emprego de ditongao de (e) variam de 2% a 84%, com
maior nmero de falantes na faixa de 10% a 20% e de 60% a 70%. O emprego
de retroflexo tem o maior espectro de variao, de 0% a 98%; ainda que a
maioria dos falantes se localize na faixa entre 0% e 10%, apenas seis dos 118
so categricos em seu emprego de tepe (ou seja, 0% de retroflexo). As taxas
de CN- vo de 0% a 82% e, de modo semelhante distribuio do retroflexo,
a maior parte dos falantes est na faixa de at 10%; no entanto, apenas sete

212
Anlises

falantes so categricos no emprego da forma padro. Para (CV), quando


se consideram dados de 1PP e 3PP conjuntamente, as taxas de CV- so
de 0% a 69%, com pico modal tambm na faixa de at 10%, e apenas trs
falantes categricos no uso da concordncia padro. Desse modo, observa-se
que a variao nos usos lingusticos individuais constitui antes a regra do que
a exceo.
A fim de avaliar o comportamento individual de cada falante quanto
hierarquia interna de restries, ou seja, a relao entre fatores de uma mesma
varivel, realizaram-se comparaes entre pesos relativos por meio da subtra-
o de seus valores X Y, em que X representa um fator hierarquicamente
acima de outro fator Y de acordo com a anlise geral. Por exemplo, para a
varivel Raiz-Afixo de (e), a anlise do Captulo 4 indicou que o fator raiz
favorece a ditongao (P.R. 0.55) em relao a afixo (P.R. 0.42) (p. 78);
nesse caso, o valor de X o peso relativo para raiz e o de Y o peso relativo
para afixo. Falantes cuja diferena de X Y maior do que zero exibem
comportamento concordante com o da comunidade (j que X > Y), ao passo
que aqueles com um valor menor do que zero sinalizam reverso de tendncias
ou padres divergentes (j que X < Y).
Ao mesmo tempo, atentou-se ao nmero total de dados por fator. Na
mesma comparao Raiz vs. Afixo, se determinado falante tem 70 dados de
(e) em afixos, mas apenas 25 em razes de palavras, considera-se apenas o total
de 25 dados. Como argumenta Guy (1980 : 19), nenhuma comparao mais
forte do que seu elo mais fraco.9 Como o nmero de dados para qualquer
um dos fatores pode distorcer os valores de pesos relativos, a estimativa mais
conservadora ao levar em conta o menor nmero de dados permite avaliar
mais adequadamente a confiabilidade da distribuio.
Nas figuras 8.2 a 8.6, cada ponto representa um falante dentro de um plano
bidimensional, cujo eixo horizontal representado pela diferena X Y (nos
quais os valores vo de 1 a +1) e cujo eixo vertical indica o menor nmero
de dados dos fatores em questo. Os pontos do lado direito (entre 0 e 1)
representam aqueles que seguem a regra varivel da comunidade, e aqueles do
lado esquerdo (entre -1 e 0) so aqueles que apresentam tendncia oposta; a
9
Traduo prpria. Texto original: no comparison is stronger than its weaker link.

213
Anlises

linha pontilhada horizontal demarca o limite de 35 dados (Guy, 1980). Desse


modo, deve-se atentar principalmente ao quadrante superior esquerdo, que
representa falantes com mais de 35 dados e com tendncia divergente da
comunidade (assinalados por tringulos). Nessas figuras, incluem-se apenas
os falantes para os quais a varivel foi selecionada como significativa (p <
0,05).

Classe Morfolgica Raiz/Afixo


40 40






30
30
Menor N

Menor N









20 20


10 10

0 0
1.0 0.5 0.0 0.5 1.0 1.0 0.5 0.0 0.5 1.0
Substantitvo/Adjetivo/Verbo Outros Raiz Afixo

Figura 8.2 Diferenas entre pesos relativos de pares de fatores por menor nmero
de dados para a varivel (e)

A Figura 8.2 contrasta as tendncias de emprego da varivel (e). Para


Classe Morfolgica, aqui se amalgamaram os fatores Advrbio/Numeral e
Preposio/Pronome em Outras classes de palavras, uma vez que seus
pesos relativos eram prximos (0.45 e 0.41, respectivamente; ver Captulo 4, p.
77). No contraste Substantivo/Adjetivo/Advrbio menos Outras classes
de palavras, observa-se que os 30 falantes tm valor positivo da diferena de
pesos relativos, mesmo com menor N abaixo do valor sugerido de 35 dados,
o que indica que todos os falantes para os quais a varivel significativa se
conformam norma da comunidade.
Para a varivel Raiz-Afixo, o comportamento dos falantes menos claro;
dos 12 para quem a varivel selecionada, metade se encontra esquerda
(portanto, Raiz < Afixo), e metade direita (Raiz > Afixo, conforme norma
comunitria). certo que os seis falantes esquerda tm menos de 35
dados para o contexto com menor N, e que essa quantidade de falantes est
dentro do limite esperado de comportamento fora da curva, conforme se
assinalou na seo 8.2. No entanto, interessa investigar se eles formam um
grupo coeso, que potencialmente apresente uma gramtica distinta. Esses
seis falantes esquerda so Iara M. (F3SP), Iolanda P. (F2SP), Jos N.

214
Anlises

(M2SP), Lucas R. (M1MC), Pamela R. (F1MP) e Regina S (F2MP). H


nesse grupo homens e mulheres, das trs faixas etrias e de ambos os nveis
de escolaridade. A caracterstica social predominante entre eles parece ser a
residncia em reas perifricas, j que cinco deles habitam essa parte da cidade;
no entanto, dos seis falantes direita, trs tambm residem nessa regio, de
modo que este no parece ser um fator distintivo. Assim, o comportamento
dos seis falantes nomeados parece estar dentro da flutuao esperada para
uma amostra com 118 falantes, e no se pode afirmar que se localizou uma
gramtica diferente (como Guy 1980 e Lim & Guy 2005 em seus estudos, com
diferenas sistemtica entre grupos). Fica claro, no entanto, que o estatuto
da varivel Raiz-Afixo menos robusto do que de Classe Morfolgica que, por
sua vez, selecionada para um nmero maior de falantes e cuja hierarquia de
restries contundentemente mais homognea.
A anlise da varivel (-r) contm sete contrastes entre pares de fatores
(Figura 8.3) para as variveis Contexto Fnico Precedente, Contexto F-
nico Seguinte, Classe Morfolgica, Posio da Slaba e Tonicidade da Slaba.
Para as duas primeiras, no h qualquer falante esquerda, ou seja, todos
favorecem o retroflexo em vogais com o trao [+alto] em relao a [alto] e
em vogais [+coronal] do que [-coronal]. Para a varivel ternria Classe Morfo-
lgica, nos trs contrastes o nmero de falantes idiossincrticos bastante
inferior ao de falantes que seguem a norma comunitria: apenas dois na dife-
rena Verbo/Advrbio Substantivo/Adjetivo; trs em Substantivo/Adjetivo
Conjuno/Preposio/Morfema de Infinitivo; e um em Verbo/Advrbio
Conjuno/Preposio/Morfema de Infinitivo.10 Em todos esses casos, os
falantes divergentes so representados por um nmero abaixo de 35 dados. De
modo semelhante, apenas quatro de 25 no seguem a norma Final > Medial
para a varivel Posio da Slaba, e apenas dois de 24 falantes no seguem a
norma Tnica > tona para Tonicidade. Ainda que este ltimo se refira a
casos com mais de 35 dados, um nico par de falantes pouco significativo
em face ao nmero de falantes da amostra. Desse modo, tambm para (-r),
10
Nesta varivel, h ocasionalmente alguns falantes que se localizam no ponto zero da escala horizontal.
Esse evidentemente o caso de X = Y, o que pode causar surpresa: como a varivel foi selecionada se
a diferena entre os fatores zero? Isso ocorre apenas em variveis ternrias: a diferena significativa
se encontra no terceiro fator, entre outro par de fatores da varivel.

215
Anlises

Contexto Fnico Precedente Contexto Fnico Seguinte [ coronal]


50 50



40 40

Menor N

Menor N




30 30



20

20

10 10
0 0
1.0 0.5 0.0 0.5 1.0 1.0 0.5 0.0 0.5 1.0
Vogal [alto] Vogal [+alto] [+coronal] [coronal]

Classe Morfolgica (1) Classe Morfolgica (2)


50 50
40 40
Menor N

Menor N

30 30



20 20






10
10


0 0
1.0 0.5 0.0 0.5 1.0 1.0 0.5 0.0 0.5 1.0
Verbo/Advrbio Substantivo/Adjetivo Subst./Adjetivo Conj./Preposio/Infinitivo

Classe Morfolgica(3) Posio da Slaba


50 50
40 40
Menor N

Menor N

30 30



20
20





10 10




0 0
1.0 0.5 0.0 0.5 1.0 1.0 0.5 0.0 0.5 1.0
Verbo/Advrbio Conj./Preposio/Infinitivo Final Medial

Tonicidade da Slaba
50


40

Menor N

30



20


10
0
1.0 0.5 0.0 0.5 1.0
Tnica tona

Figura 8.3 Diferenas entre pares de fatores por menor nmero de dados
para a varivel (-r)

216
Anlises

verifica-se grande conformidade dos paulistanos s normas da comunidade


como um todo.
A anlise da varivel (CN) atomstica e de SNs apresenta 11 pares con-
trastivos (Figura 8.4). Em todos eles, observa-se a mesma tendncia descrita
para (e) e (-r): maioria dos falantes direita das figuras, em conformidade
com a norma da comunidade, e menor nmero de falantes que invertem
a regra varivel. O maior grau de similaridade entre o comportamento dos
informantes se verifica nas variveis Processos Morfofonolgicos de Formao
do Plural, Posio em Relao ao Ncleo e em dois contrastes de Parale-
lismo SNs precedidos de SNs com marca zero vs. primeiro de uma srie
(Paralelismo 2), e SNs precedidos de marca zero vs. SNs seguidos de marca
explcita (Paralelismo 3): todos os falantes seguem a regra de favorecimento
da marca zero em plurais regulares (palavras terminadas em vogais orais ou
nasais) em relao a plurais irregulares (palavras cujos plurais se formam
com /-is/, /js/, /js/ ou metafonia); em palavras que ocupam as posies
nuclear ou ps-nuclear em contraste com a posio nuclear (esta, altamente
favorecedora da marca explcita de nmero); e em SNs precedidos de outro SN
com marca zero. Trata-se efetivamente de variveis que se mostram relevantes
no apenas em So Paulo, mas em todo o portugus brasileiro, com resultados
amplamente consistentes; como se verifica na Figura 8.4, tal consistncia se
deve uniformidade do comportamento de todos os indivduos.
Ainda quanto ao Paralelismo, o contraste entre os fatores primeiro de uma
srie e SN precedido de SN com marca explcita (Paralelismo 3) apresenta
cinco falantes que fogem norma da comunidade, quatro dos quais com mais
de 35 dados; tambm se observam seis falantes idiossincrticos quanto ao
favorecimento da marca zero em artigos definidos, numerais e possessivos em
relao a adjetivos, quantificadores e substantivos (Classe Morfolgica 3); trs
para SNs com o trao [+humano] em relao a [-humano] (Animacidade);
dois para a presena de posies ps-nucleares nos SNs relativamente sua
ausncia (Configurao Sintagmtica Ps-Nuclear); e um para o contraste
Consoante/Pausa vs. Vogal (Contexto Fnico Seguinte). Entretanto, em
todos esses casos, o nmero de falantes divergentes se encontra dentro do
limite de 56 para a amostra, mesmo quando se considera um total de menos

217
Anlises

Processos de Formao do Plural Posio em Relao ao Ncleo


100 100

75 75
Menor N

Menor N


50 50





25





25







0 0
1.0 0.5 0.0 0.5 1.0 1.0 0.5 0.0 0.5 1.0
Plurais regulares Plurais irregulares Nuclear/PsNuclear Prnuclear

Contexto Fnico Seguinte Classe Morfolgica do Primeiro Elemento (1)


100 100

75 75
Menor N

Menor N

50
50





25 25



0 0
1.0 0.5 0.0 0.5 1.0 1.0 0.5 0.0 0.5 1.0
Consoante/Pausa Vogal Art.indef./Demonstrativo Art.def./Numeral/Possessivo

Classe Morfolgica do Primeiro Elemento (2) Classe Morfolgica do Primeiro Elemento (3)
100 100

75 75
Menor N

Menor N


50
50







25



25







0 0
1.0 0.5 0.0 0.5 1.0 1.0 0.5 0.0 0.5 1.0
Art.indef./Demonstrativo Adj./Quant.indef./Subst. Art.def./Numeral/Possessivo Adj./Quant.indef./Subst.

Paralelismo (1) Paralelismo (2)


100 100

75 75
Menor N

Menor N

50 50





25

25







0
0

1.0 0.5 0.0 0.5 1.0 1.0 0.5 0.0 0.5 1.0
SN0 Primeiro de uma Srie SN0 SNS

Paralelismo (3) Configurao Sintagmtica PsNuclear


100 100

75 75
Menor N

Menor N







50
50

25
25






0 0
1.0 0.5 0.0 0.5 1.0 1.0 0.5 0.0 0.5 1.0
Primeiro de uma Srie SNS Com posio psnuclear Sem posio psnuclear

Animacidade
100

75
Menor N

50





25

0
1.0 0.5 0.0 0.5 1.0
[+humano] [humano]

Figura 8.4 Diferenas entre pares de fatores por menor nmero de dados (CN)

218
Anlises

de 35 dados. Cabe ressaltar a consistncia da regra [+humano] > [-humano]


para o emprego da marca zero na varivel Animacidade. No Captulo 6
(p. 149), notou-se que tal regra diverge daquela em outras comunidades
brasileiras; a divergncia da regra, no entanto, internamente consistente
entre os paulistanos, j que se aplica uniformemente na comunidade.
Todavia, Contexto Fnico Seguinte merece um olhar mais atento, pelo
fato de a varivel ter sido selecionada como significativa para poucos falantes
(note-se o nmero reduzido de pontos na figura correspondente) e pelo compor-
tamento oscilante do fator pausa. Como discutem Lim & Guy (2005) e Guy
(1980), em seus respectivos estudos sobre o apagamento de t/d, esse fator
se apresentou em diferentes pontos da hierarquia de restries a depender
do estilo de fala (formal ou informal) ou da comunidade (Nova Iorque ou
Filadlfia). Desse modo, realizaram-se anlises alternativas, com separao
dos fatores consoante, pausa e vogal. Os trs pares contrastivos se
encontram na Figura 8.5.

Contexto Fnico Seguinte (1) Contexto Fnico Seguinte (2)


100 100

75 75
Menor N

Menor N



50

50







25
25

0 0
1.0 0.5 0.0 0.5 1.0 1.0 0.5 0.0 0.5 1.0
Consoante Vogal Consoante Pausa

Contexto Fnico Seguinte (3)


100

75
Menor N

50



25



0
1.0 0.5 0.0 0.5 1.0
Pausa Vogal

Figura 8.5 Diferenas entre pares de fatores por menor nmero de dados para a
varivel (CN) Contexto Fnico Seguinte

Para Consoante Vogal (Contexto Fnico Seguinte 1), a maior parte dos
falantes apresenta maior tendncia de marca zero quando a palavra seguida
por uma consoante do que quando seguida por uma vogal; h apenas dois
falantes idiossincrticos, somente um dos quais com mais de 35 dados. No

219
Anlises

contraste Consoante Pausa (Contexto Fnico Seguinte 2), a maioria dos


falantes se encontra igualmente direita da figura, em conformidade com
a regra geral da comunidade, com quatro falantes idiossincrticos, dois dos
quais com nmero de dados acima do limite estabelecido. Entretanto, no
contraste Pausa Vogal (Contexto Fnico Seguinte 3), 12 dos 15 falantes
tm peso relativo maior para vogal do que para pausa, o que significa que
a maioria dos falantes para quem essa diferena significativa vai contra a
tendncia da comunidade (em que se verificou que a pausa mais semelhante
s consoantes no favorecimento da marca zero; ver Captulo 6, p. 143). Desses
12, sete representam clulas com menos de 35 dados e cinco acima desse
limite. Por um lado, parece no haver extrapolao dos critrios estabelecidos
para a existncia de uma gramtica verdadeiramente divergente (mais de 5-6
falantes com mais de 35 dados que apresentem tendncia invertida em relao
comunidade). Por outro, esse o nico caso em que h mais falantes
esquerda do que direita, ou seja, um conjunto relativamente expressivo de
falantes que no seguem o padro da comunidade.
Os 12 falantes so Daiane M. (F1MC), Fernando B. (M1MC), Haroldo
L. (M3SP), Helder X. (M3SC), Hugo F. (M3MC), Jos N. (M2SP), Lucas
S. (M1MC), Lucio A. (M2MP), Miguel R. (M2MP), Milena F. (F1MC),
Romulo S. (M3MC) e William A. (M2SP). Nesse grupo, h oito falantes
com Ensino Mdio e quatro com Ensino Superior, sete residentes de bairros
centrais e cinco de bairros perifricos, e quatro falantes para cada faixa etria.
A caracterstica majoritariamente predominante entre eles seu sexo/gnero:
10 so do sexo masculino (e as duas nicas mulheres se encontram abaixo
da linha de 35 dados). Esses dez falantes constituem um grupo com uma
taxa particularmente alta de marca zero de concordncia na comunidade: sua
mdia de emprego da variante de 28%, acima da mdia geral da comunidade
(14%), dos homens (18%) ou mesmo de falantes menos escolarizados, com at
o Ensino Mdio (21%).
No Captulo 6, j se chamou a ateno para a alta tendncia CN- entre
falantes do sexo masculino na cidade de So Paulo, relativamente a outras co-
munidades urbanas. O comportamento desses dez falantes, no entanto, parece
ir alm da mdia geral de outros falantes de perfis semelhantes. Haveria uma

220
Anlises

subgramtica ou gramtica alternativa de certos homens paulistanos? O que


poderia motivar esse comportamento divergente em um grupo relativamente
homogneo de falantes?
Guy & Cutler (2011) identificam outro cenrio em que padres regulares
de variao so violados: na fala performativa de jovens rappers brancos que
alternam para um estilo que tenta se aproximar do ingls de afro-descendentes,
no sentido de projetar uma identidade hip-hop autntica. Os autores
verificaram tal divergncia com base no modelo de relao exponencial entre
taxas de no apagamento de t/d (Guy, 1991) em monomorfemas, passado
irregular e passado regular. Tal relao matemtica, demonstrada em Guy
(1991) e reatestada em diversos estudos posteriores, indica no s que as
propores entre o apagamento nos trs fatores se mantm na hierarquia
interna da varivel (maiores taxas de apagamento de acordo com a escala
monomorfemas (M) > passado irregular (I) > passado regular (R), conforme
reporta a seo 8.1), mas que as taxas de reteno do segmento apresentam a
relao R = I2 = M3 (ver Guy 1991 para maiores detalhes). Guy & Cutler
(2011) empregam o modelo de relao exponencial para avaliar o grau de
alternncia de estilos na fala de jovens brancos afiliados ao movimento hip-hop
em comparao com o de outros rappers negros e brancos. A premissa bsica
a de que a alternncia de estilos (aqui entendida como fala performativa,
no palco vs. no performativa, em outras situaes), tanto na direo da
forma padro quanto no padro, distorce as relaes matemticas previstas
pelo modelo. Verificou-se que rappers autnticos, como Dr. Dre, revelam
pouca alternncia entre sua fala no palco ou fora dele, de modo que sua fala
performativa no difere radicalmente de sua fala vernacular e cotidiana. Os
rappers brancos, por outro lado, apresentam taxas bastante mais altas de
apagamento de t/d em fala performativa em relao fala mais espontnea
e, como resultado, distorcida a relao exponencial entre as taxas de reteno
de t/d em monomorfemas, passado irregular e passado regular.
Para o presente estudo, aventa-se a hiptese de que a fala dos dez infor-
mantes masculinos que fogem regra Pausa > Vogal da comunidade reflete
no uma gramtica dialetal diferente, mas uma espcie de perfrmance de
masculinidades durante a gravao da entrevista sociolingustica, que pode

221
Anlises

distorcer a aplicao da regra varivel. Diante da disponibilidade de dados


provenientes apenas de uma nica situao, dentro do roteiro estipulado
para as gravaes, difcil determinar possveis motivos para tal, ou mesmo
como seria sua fala mais natural. No entanto, a taxa mdia relativamente
mais alta de emprego de CN- nesse grupo, em relao a outros falantes de
perfil semelhante na comunidade, permite especular que h certa dose de
performatividade na fala desses indivduos quando se veem na situao de
ser gravados. O emprego exagerado de CN- pode ser indicativo de certas
identidades que se deseja projetar. Uma das identidades masculinas que se
percebe nesses informantes a de pessoas que, embora no tenham o mesmo
nvel de conhecimento acadmico de alunos da USP (seus interlocutores),
possuem outras experincias da rua ou da vida:

(4) e a era bem louco ver ele fazendo as gravaes com os cara assim... famoso
saca... uns rapper vrios rapper ele gravou CD do Rappin Hood ele gravou e mixou
o CD... vrias parada assim... e a eu ia l e comecei a aprender e tal e a foi por
causa dessas fita que eu no me dava bem na escola nem fodendo... repeti duas
vezes trs vezes... a eu no aguentei mais quando eu tinha dezesseis dezessete
anos a eu achei um... na verdade o meu pai tinha trabalhado numa produtora
na S.... que do Q. que um cara que toca no F.... e a era de conhecido ele
falou que eu estava procurando um trampo o cara falou manda a pra estagiar
comecei a estagiar l... a j comecei a curtir tal comecei a ganhar um salrio
desencanei total da escola... falei foda-se n agora eu vou trampar pra caralho e eu
no preciso ter diploma (Fernando B., M1MC)

Os SNs do exemplo (4) esto destacados com negrito (CN-E) e sublinha


(CN-). A taxa de CN- para Fernando B. de 35% na entrevista socio-
lingustica (ver Anexo B, p. 362). Ainda que tal mdia possa ser esperada
para um falante que no concluiu o Ensino Mdio, seu nvel de escolaridade
atpico para os falantes de sua classe social (B1) e residentes do bairro de
classe mdia alta em que vive (Pacaembu). O falante estudou em escolas
particulares renomadas de So Paulo, e muitos de seus ex-colegas de escola
hoje estudam na USP. Sua me, fotgrafa, e seu pai, produtor musical, viajam
constantemente com a famlia para os Estados Unidos e para a Europa e
tm contatos diversos no meio artstico. pouco provvel que seu cotidiano
seja permeado por muitas pessoas cujas taxas de CN- sejam altas. No
excerto, Fernando B. parece querer sinalizar uma identidade de jovem no

222
Anlises

conformista que segue seus impulsos ao entrar em contato com o mundo


musical e por j no gostar de frequentar a escola, o caminho era largar os
estudos e trabalhar nessa rea. Na construo de tal identidade, o emprego
de CN- (juntamente ao uso frequente de grias como saca, parada, fita,
trampo e palavres como nem fodendo, foda-se, pra caralho) refora seu
distanciamento da escola e de seus valores, ao mesmo tempo que reala seu
aspecto rebelde. Sugere-se, ento, que o comportamento idiossincrtico de
falantes como Fernando B. possa estar ligado a uma fala performativa, que
tenta projetar certas identidades sociais durante a gravao.
Assim, os resultados ilustrados na Figura 8.5 mostram que o estatuto da
pausa menos robusto do que a relao entre consoantes e vogais quanto
ao papel do Contexto Fnico Seguinte para o emprego de CN-. De todo
modo, considerando-se que a diferena entre Pausa e Vogal significativa para
poucos falantes (15 no total) e que no se ultrapassou o critrio de mais de seis
informantes com muitos dados como uma evidncia expressiva da existncia
de uma gramtica distinta, pode-se afirmar que os padres observados na
comunidade se mantm tambm para a varivel (CN).
A anlise de (CV), por seu turno, contm oito pares contrastivos e,
novamente, a maior parte dos falantes exibe comportamento em consonncia
com a comunidade, encontrando-se direita nos quadros da Figura 8.6. Os
maiores graus de conformidade se verificam para os contrastes em Paralelismo
(1)(2) e Salincia Fnica, cada qual com um ou nenhum falante idiossincrtico.
Tal constatao refora aquilo que se notou para as variveis Paralelismo e
Processos Morfofonolgicos da anlise de (CN), por se referirem a variveis
cujos resultados se replicam em diversas variedades do portugus brasileiro,
pelo nmero relativamente alto de falantes para os quais tais diferenas so
significativas e pelo fato de, adicionalmente, tratar-se de princpios subjacentes
similares a tendncia manuteno de formas semelhantes no discurso
(marcas levam a marcas, zeros levam a zeros; Scherre & Naro 1992; Scherre
1998, 2001) e ao emprego de marca zero, tanto de CN quanto de CV, em
formas menos salientes. A consistncia desses padres na fala dos indivduos
paulistanos que convivem com muitos migrantes na cidade indica que
ambas as variveis funcionam com base em regras que atuam em todo o

223
Anlises

Saliencia Fnica Paralelismo (1)


100 100

75 75
Menor N

Menor N



50 50




25




25





0 0

1.0 0.5 0.0 0.5 1.0 1.0 0.5 0.0 0.5 1.0
Grau 1 Grau 2 SV0 Primeiro de uma srie

Paralelismo (2) Paralelismo (3)


100 100

75 75
Menor N

Menor N

50 50






25 25











0
0
1.0 0.5 0.0 0.5 1.0 1.0 0.5 0.0 0.5 1.0
SV0 SVS Primeiro de uma srie SVS

Posio do Sujeito (1) Posio do Sujeito (2)


100 100

75 75
Menor N

Menor N

50 50

25



25















0
0
1.0 0.5 0.0 0.5 1.0 1.0 0.5 0.0 0.5 1.0
Posposto Precedente Distante Posposto Imediatamente Precedente

Posio do Sujeito (3) Tipo de Sujeito


100 100

75 75
Menor N

Menor N






50
50








25

25









0 0
1.0 0.5 0.0 0.5 1.0 1.0 0.5 0.0 0.5 1.0
Precedente Distante Imediatamente Precedente Composto/SN Pronominal

Figura 8.6 Diferenas entre pares de fatores por menor nmero de dados
para a varivel (CV)

224
Anlises

portugus brasileiro e, possivelmente, so princpios universais que regulam a


variao lingustica de modo amplo.
A maioria dos falantes que foge ao padro comunitrio se encontra no
contraste Paralelismo (3), entre SVs que so o primeiro de uma srie e SVs
precedidos de SVs com concordncia (CV-E) resultado que, novamente,
emparelha-se com o que se viu para (CN) (Figura 8.4). Desses oito falantes, no
entanto, apenas trs tm mais de 35 dados para esses contextos. Para os demais
pares contrastivos Salincia Fnica (Grau 1 vs. Grau 2); Posio do Sujeito
(Sujeito Posposto vs. Precedente Distante, Posposto vs. Imediatamente
Precedente, e Precedente Distante vs. Imediatamente Precedente); e Tipo de
Sujeito (Composto/SN vs. Pronominal) , os poucos falantes esquerda no
ultrapassam o limite de 5-6 falantes fora da curva.
Por fim, interessa comparar os padres individuais dos falantes quanto ao
estilo de fala. Nas palavras de Lim & Guy (2005), as atitudes e avaliaes
compartilhadas em uma comunidade so mais claramente evidenciadas por
direes comuns de alternncia estilstica11 neste caso, entendida no sentido
laboviano de grau de ateno fala (Labov, 2006 [1966]). A Figura 8.7
apresenta os padres individuais da diferena entre o estilo que havia se
mostrado mais favorecedor e aquele que se mostrou desfavorecedor da variante
de aplicao nas anlises dos Captulos 4 a 7. No caso de (e), o padro
comunitrio o favorecimento da variante ditongada [ej] nas leituras de
lista de palavra, notcia de jornal e de depoimento, em contraste com a
conversao; para (-r), as leituras de jornal e depoimento se haviam revelado
mais semelhantes conversao no favorecimento de retroflexo em relao
lista de palavras; em (CN) e (CV), o contraste entre a conversao e as
leituras.
As tendncias so claras para as quatro variveis: a grande maioria dos
falantes segue o mesmo padro da comunidade. Apenas um falante foge regra
no caso de (e), (-r) e (CN); no caso de (CV), nenhum falante idiossincrtico.
Isso significa que os falantes paulistanos concordam amplamente entre si a
respeito de quais variantes se empregam em estilos que exigem maior grau de
11
Traduo prpria. Texto original: The shared attitudes and evaluations in a community are most
clearly evidenced by common directions of style shifting.

225
Anlises

Estilo (EN) Estilo (R)


40 40

30 30





Menor N

Menor N



20



20



10 10

0 0
1.0 0.5 0.0 0.5 1.0 1.0 0.5 0.0 0.5 1.0
Leituras Conversao Conversao/Jornal/Depoimento Leitura

Estilo (CN) Estilo (CV)


40 40

30 30
Menor N

Menor N
20

20












10 10

0 0
1.0 0.5 0.0 0.5 1.0 1.0 0.5 0.0 0.5 1.0
Conversao Leituras (Jornal/Depoimento) Conversao Leituras (Jornal/Depoimento)

Figura 8.7 Diferenas entre pares de fatores por menor nmero de dados para as
variveis (e), (-r), (CN) e (CV), de acordo com Estilo

ateno fala presumivelmente, as variantes de prestgio: favorecimento de


[ej], [R], CN-E e CV-E em estilos mais monitorados.
Os padres aparentemente divergentes acerca da pronncia de (-r), desse
modo, precisam ser reavaliados; no Captulo 5, haviam-se constatado dife-
renas entre habitantes de bairros mais centrais/classes mais altas e bairros
mais perifricos/classes mais baixas quanto s suas tendncias de emprego
do retroflexo em tempo aparente, j que os primeiros exibiram padro de
variao estvel (e possvel mudana em favor do tepe nas classes mais altas) e
os segundos forte tendncia de mudana em favor do retroflexo (p. 115). Em
face da consistncia de favorecimento do retroflexo em estilos menos formais
de fala, por parte de praticamente todos os indivduos, deve-se interpretar
que tais movimentos ocorrem apenas em termos relativos ou seja, ainda que
o retroflexo esteja adquirindo maior prestgio na comunidade, isso no se d
em detrimento do tepe. Os padres de encaixamento lingustico e estilstico
de (-r) se do uniformemente em toda a comunidade, assim como para as
demais variveis.
Desse modo, as anlises das diferenas entre pares de fatores revelam
forte tendncia coeso de normas de uso e de avaliao pelos membros
da comunidade; nos casos em que h mais de quatro falantes com padres

226
Sntese

divergentes, muitos se localizam na parte inferior das figuras, o que indica


pouca quantidade de dados. Verificou-se tambm maior consistncia entre
padres individuais em variveis binrias, como Contexto Fnico Precedente
[+alto] ou [alto], do que em variveis ternrias ou plurifatoriais, como
Contexto Fnico Seguinte (consoante, vogal ou pausa), tambm decorrncia
de um menor nmero de dados por clula. Em uma ampla amostra tal
como a que aqui se analisa, a existncia de apenas pouqussimos falantes
idiossincrticos revela que os padres descritos anteriormente nos captulos
4 a 7 se reproduzem sistematicamente na gramtica individual da grande
maioria de falantes o que permite caracterizar So Paulo como uma nica
comunidade de fala.

8.4 Sntese
Este captulo comparou padres de variao na fala dos 118 informantes da
amostra, a fim de estimar a validade do construto da regra varivel em um
nvel mais especfico do que a comunidade como um todo. Primeiramente,
apresentaram-se mtodos para lidar com uma grande quantidade de dados,
de uma grande quantidade de informantes. A disponibilidade de ferramentas
computacionais permite que o pesquisador automatize a execuo de certas
anlises, o que propicia o exame de corpora robustos.
Os resultados mostraram que as hierarquias internas de restrio dentro de
cada varivel independente so amplamente reproduzidas na fala individual.
Em um conjunto de 118 falantes, o pequeno nmero de excees regra
no suficiente para postular a existncia de gramticas alternativas dentro
da comunidade, com regras variveis divergentes tais como verificaram
Lim & Guy (2005) na fala de cingapurianos, Guy (1980) entre falantes de
Nova Iorque e Filadlfia, e Cameron (1994, apud Guy 2000) entre porto-
riquenhos e espanhis. A variao sistemtica ocorre desde a fala individual
at agrupamentos maiores e mais abstratos que compem a comunidade, e as
regras variveis descritas nos captulos 4 a 7 se aplicam consistentemente inter-
e intrafalante. A avaliao do prestgio das variantes, examinada pelos padres
de variao estilstica, tambm coincide rigorosamente entre indivduos.

227
Sntese

O compartilhamento de normas de uso varivel e de avaliao das variantes


justamente o que define uma comunidade de fala (Labov, 2006 [1966]). Os
milhes de falantes paulistanos, no obstante o alto grau de heterogeneidade
sociodemogrfica da cidade, compartilham um mesmo conjunto de regras
variveis que os definem como comunidade lingustica. Tais normas certamente
so inconscientes; difcil imaginar um professor de portugus que dissesse:
Deve-se empregar o retroflexo mais frequentemente em slabas tnicas do que
tonas! Contudo, trata-se de uma regra que se aplica uniformemente em
toda a comunidade.
possvel, no entanto, que a sistematicidade de certas regras seja proprie-
dade do portugus brasileiro, ou de alguma comunidade de fala cujos limites
se definem diferentemente. Nesse sentido, possvel que as regras variveis
de (e) e (-r), definidoras de dialetos locais, apliquem-se mais propriamente
cidade de So Paulo, e que certas regras de (CN) e (CV) sejam compartilhadas
por outros dialetos do portugus brasileiro questes que se reservam para
estudos futuros.
Novos trabalhos devem se debruar no s sobre novas variveis sociolin-
gusticas, mas tambm sobre os padres de grupos mais diversos de falantes.
Para a cidade de So Paulo, em especial, ser interessante comparar as regras
variveis de diferentes grupos de migrantes/imigrantes, ou mesmo da Grande
So Paulo: Guarulhos, Osasco, So Bernardo compartilham as mesmas re-
gras do portugus paulistano? Esta uma rea ainda relativamente pouco
explorada, mas necessria para o avano dos estudos lingusticos, para alm
de descrio de padres de variao em comunidades especficas.
Em especial, a anlise da fala de indivduos mostra que a suposta assiste-
maticidade da parole e da perfrmance no se verifica empiricamente; cabe
aos linguistas, portanto, revisar as premissas de suas teorias, uma vez que a
base do conhecimento lingustico dos falantes parece no residir apenas em
suas mentes. Regras como maior tendncia de emprego da marca zero em
SNs com o trao [+humano] em relao a [-humano], diferente de outras
comunidades brasileiras mas internamente consistente no portugus paulis-
tano, constituem evidncia de que as normas so aprendidas no cotidiano das
interaes sociais e fazem parte da competncia comunicativa dos falantes.

228
9
A coeso dialetal

No captulo anterior, analisaram-se padres de variao na fala


de indivduos, e demonstrou-se que os falantes paulistanos consti-
tuem uma nica comunidade de fala. Tal resultado sinaliza, em
princpio, uma ampla coeso sociolingustica, j que os indivduos
compartilham normas de avaliao e de usos lingusticos. Este
captulo se volta para o exame de tal coeso, ao analisar o encaixa-
mento simultneo de mltiplas variveis na comunidade: falantes
que tendem a empregar [ej] tambm tendem a empregar [R]? o
emprego de CN- necessariamente acompanhado de CV-1PP- e
CV-3PP-? variveis fonticas coocorrem com variveis morfossin-
tticas, ou elas so independentes umas das outras? As anlises
de covariao mostram que os falantes tendem coeso dialetal
atravs do emprego de conjuntos de variantes, mas que tal coeso
depende de restries lingusticas e sociais: da perspectiva de
fatores internos, a covariao regulada por variveis lingusticas
que subjazem a mltiplas variveis dependentes, como a Salincia
Fnica; da perspectiva de fatores externos, a coeso dialetal
consequncia da densidade de comunicao (Gumperz, 1971b,a)
entre os membros da comunidade.

Embora uma srie de trabalhos sociolingusticos tenham enfocado mltiplas


variveis em uma mesma comunidade, a anlise sistemtica de como elas
podem se inter-relacionar umas com as outras tem sido pouco frequente (Guy,
A coeso dialetal

2013; Thorburn, 2014). O estudo da covariao visa a verificar se mltiplas


variveis se correlacionam nos usos de falantes individuais e, se sim, quais
fatores sociais e lingusticos a promovem. A questo principal a seguinte:
falantes que tendem a empregar a variante x de uma varivel A tambm
tendem a empregar a variante y de uma varivel B, ou as variveis se encaixam
independentemente umas das outras no sistema lingustico e social?
Por um lado, pode-se esperar que certas variveis covariem como resultado
de presses internas lngua, como a simetria fonolgica ou a regulariza-
o paradigmtica. Mudanas voclicas em cadeia como a que ocorreu no
ingls mdio (Jespersen, 1953 [1933]) so um bom exemplo de como uma
varivel pode afetar outras no sistema lingustico. Por outro lado, os recor-
rentes padres de estratificao social, variao estilstica e mudanas em
progresso descritos em estudos sociolingusticos (ver, p.ex., Labov 2001b)
tambm conduzem expectativa de que certos pares de variveis covariem,
independentemente de suas relaes estruturais. Conforme se discutiu nos
captulos 5, 6 e 7, variveis como a pronncia de (-r) em coda silbica e as
concordncias nominal e verbal se correlacionam com Sexo/Gnero, Nvel de
Escolaridade e Classe Social em diversas comunidades; So Paulo no uma
exceo. Para as concordncias nominal e verbal (CN, CV-1PP e CV-3PP),
constatou-se estratificao bastante semelhante quanto estabilidade ou no
em subgrupos da comunidade (mudana na direo da forma padro nas
regies centrais e curva em U nas regies perifricas, exceto para CV-1PP).
Alm disso, CV-1PP e CV-3PP se correlacionam com o mesmo conjunto
de variveis sociais e lingusticas, constituindo-se, efetivamente, uma nica
varivel.
A expectativa de que certos conjuntos de variantes sejam empregados
simultaneamente tambm se revela na prtica de reificao de variedades
lingusticas: portugus paulistano, portugus carioca, norma popular,
norma padro (Oushiro & Guy, 2013). Nessa perspectiva, espera-se que
um carioca empregue, simultaneamente, a fricativa velar de (-r) em coda [x
G], a fricativa palato-alveolar de (-s) em coda [S] e a ditongao de vogais
nasalizadas [e@], por exemplo. Contudo, a suposio de que certas variantes
que caracterizam socioletos andam juntas foi poucas vezes colocada prova

230
A coeso dialetal

empiricamente.
Este captulo analisa inter-relaes entre seis variveis dependentes no
portugus paulistano. Cinco delas foram analisadas separadamente nos
captulos da Parte II: (e) como monotongo ou ditongo; (-r) como tepe ou
retroflexo; (CN) da perspectiva atomstica; (CV) na 3PP; e (CV) na 1PP.
A elas se acrescentou outra varivel de (-r): sua realizao (como tepe
ou retroflexo) vs. seu apagamento. O conjunto inclui, portanto, variveis
fonolgicas e morfossintticas, algumas das quais estruturalmente relacionadas
entre si e outras no. O objetivo identificar condicionamentos sociais e
estruturais que promovem ou inibem a covariao.
A prxima seo apresenta uma breve reviso da literatura sobre co-
variveis, cujos desenvolvimentos so relativamente recentes. Tais estudos
observam, em geral, a falta de coeso dialetal baseada em categorias sociais
(p.ex., por Nvel de Escolaridade ou Faixa Etria), e que a covariao talvez
possa ser mais bem explicada por similaridades estruturais. A seo 9.2
descreve os mtodos para a presente anlise, assim como algumas previses
baseadas na estratificao social e nas relaes estruturais entre as variveis.
Os resultados so expostos e discutidos na seo 9.3, que analisa padres
gerais de covariao entre as seis variveis, assim como o efeito de fatores
lingusticos e sociais especificamente. Da perspectiva da coeso estrutural,
demonstra-se que a covariao condicionada no apenas por similaridades
estruturais entre as variveis dependentes, mas tambm por variveis lin-
gusticas que se correlacionam com mltiplas variveis, tais como a Salincia
Fnica, a Posio do Sujeito e a Animacidade; em todos os casos, a correlao
entre pares de variveis mais forte em contextos menos marcados (p.ex.,
quando o sujeito est preposto, e no posposto, ao verbo). Da perspectiva
da coeso social, argumenta-se que a covariabilidade no promovida por
categorias sociolingusticas tradicionais como Sexo/Gnero e Faixa Etria,
mas pelo princpio mais fundamental de densidade de comunicao (Gumperz,
1971b,a) (ver Captulo 2, p. 20). Por fim, a seo 9.4 sintetiza as concluses
e vislumbra anlises futuras de covariao.

231
O estudo de covariveis

9.1 O estudo de covariveis


O estudo da covariao remonta ao trabalho seminal de Labov sobre a
estratificao social do ingls falado na cidade de Nova Iorque (Labov, 2006
[1966]). O autor fornece fortes evidncias da coeso estrutural de socioletos
ao demonstrar a covariao entre pares de variveis fonticas: o alamento
de (E) e (O) em palavras como bad mau e law lei respectivamente; entre
(aj) e (aw) como em ride andar, dirigir e loud alto; entre (A) e (O) como
em hot quente e law; e entre (E), (O) e (A). Por exemplo, a Figura 9.1, em
que cada ponto representa um indivduo, mostra a covariao entre (E) e (O):
falantes que apresentam um baixo ndice de alamento de (E) tambm tendem
a ter um baixo ndice de alamento de (O), e aqueles com ndices altos de (E)
tambm tendem a um alto ndice de (O); alm disso, os falantes tendem a se
agrupar de acordo com seu gnero e etnia (Labov, 2006 [1966] : 363).

Figura 9.1 Covariao entre (E) e (O) no ingls de Nova Iorque


(Fonte: Labov 2006 [1966] : 363)

232
O estudo de covariveis

Com essas anlises, Labov demonstra que a organizao do espao voclico


dentro do sistema fonolgico do ingls de Nova Iorque segue o princpio de
economia funcional proposto por Andr Martinet, uma tendncia simetria e
ao espaamento regular entre unidades fonmicas. Com efeito, Labov (2006
[1966] : 32) justifica sua escolha por variveis fonolgicas por serem unidades
integrais de estruturas maiores.1 Pode-se afirmar que, poca, o principal
objetivo de Labov era justamente o de demonstrar correlaes estruturais, a
fim de fornecer maiores evidncias da heterogeneidade ordenada (Weinreich
et al., 2006 [1968]).
Desde ento, a anlise de encaixamento de mltiplas variveis na fala de
indivduos foi relativamente preterida em favor de descries isoladas de cada
varivel. Mais recentemente, Guy (2013) demonstra que a covariao tambm
ocorre entre variveis de diferentes nveis lingusticos, de natureza fonolgica
e sinttica. Em sua amostra de 20 falantes cariocas, o autor analisa quatro
variveis sociolingusticas com forte estratificao social: o apagamento de
-s (em palavras como menos/meno-); a desnasalizao de vogais tonas
finais (como em vagem/vage); a concordncia nominal (como em os lees/os
leo); e a concordncia verbal de 3PP (como em disseram/disse).2 Com
base em anlises multivariadas no programa GoldVarb X, que incluram o
Falante como uma varivel independente, Guy obteve pesos relativos para as
tendncias de uso de cada falante; tais valores foram ento empregados para
calcular coeficientes de correlao de Pearson (ou r de Pearson) entre pares
de variveis.3
A Figura 9.2, reproduzida de Guy (2013 : 67), mostra que que o apagamento
de (-s) em coda covaria com a concordncia nominal (r = -0.74, p < 0,01:
quanto maior a tendncia ao apagamento, menor a tendncia concordncia),
e que a desnasalizao covaria com a concordncia verbal de 3PP (r = -0.45,
p < 0,05: quanto maior a tendncia desnasalizao, menor a tendncia
1
Traduo prpria. Texto original: integral units of larger structures.
2
Para as variveis fonticas, Guy (2013) incluiu apenas os casos de apagamento de /s/ ou de desnasa-
lizao em que o segmento faz parte da raiz da palavra, como nos exemplos citados (ou seja, no se
incluram dados como amigos/amigo ou comem/come, referentes s variveis morfossintticas).
3
Os valores de r vo de -1 a +1, e indicam correlao negativa quando prximos de -1 (quanto mais x,
menos y), correlao positiva quando prximos de +1 (quanto mais x, mais y) e no correlao quando
prximos de zero.

233
O estudo de covariveis

Figura 9.2 Covariao entre apagamento de -s e concordncia nominal (acima);


desnasalizao e concordncia verbal (meio); e concordncia nominal e
concordncia verbal (abaixo) no Rio de Janeiro (Fonte: Guy 2013 : 67)

234
O estudo de covariveis

concordncia verbal). Alm disso, a concordncia nominal coocorre com a


concordncia verbal (r = 0.59, p < 0,01). Em todos esses casos, tambm
h motivaes internas lngua para esperar que os pares de variveis se
correlacionem, uma vez que, em portugus, a marca de plural em nomes
frequentemente se realiza com -s, a marca de 3PP nos verbos se realiza com a
nasalizao em muitos casos, e as concordncias nominal e verbal se referem
ambas marcao de nmero. De fato, Guy (2013) demonstra que, de trs
pares de variveis que potencialmente possuem motivaes lingusticas para
covariar, todos se correlacionam significativamente (os trs casos citados); por
outro lado, de trs pares que no se relacionam estruturalmente, somente um
apresenta uma correlao significativa (desnasalizao/concordncia nominal).
Guy (2013) tambm investigou amplos padres de agrupamento das va-
riantes ao classificar os usos dos falantes em alto (A), mdio (M) ou
baixo (B). Pode-se inferir maior grau de coeso social se as quatro variveis
estiverem na mesma categoria (AAAA, MMMM, BBBB). Embora Guy tenha
constatado uma distribuio no aleatria, em que 50% dos falantes exibem
tendncias semelhantes para trs ou quatro variantes, os resultados no so
fortemente conclusivos: os outros 50% de sua amostra tm tendncias iguais
apenas para duas das variveis algo que forosamente deve ocorrer em uma
classificao ternria de quatro variveis (uma delas deve se repetir). Guy
(2013) conclui que seus resultados gerais para tal conjunto de variantes podem
ser mais confiavelmente atribudos a presses internas do que a motivaes
sociais de coeso do socioleto.
Tagliamonte & Waters (2011) investigaram a covariao entre variveis que
atualmente se encontram em mudana no ingls de Toronto (duas mudanas
recentes introdutores de discurso direto be like/say/go etc., intensificadores
so/very/really/pretty etc. , e duas mudanas antigas itens lexicais denticos
have to/have got to/got to ter que e possessivos have/have got/got ter). Sua
hiptese era a de que os lderes da mudana compartilhariam um repertrio
de variantes inovadoras. No entanto, seus resultados mostram que as variveis
no se correlacionam fortemente, o que indica que os falantes que lideram
uma mudana no necessariamente lideram outras.
Thorburn (2014) analisou padres de covariao entre quatro variveis

235
O estudo de covariveis

na fala de 25 falantes do ingls inute em Nain, uma comunidade aborgene


no norte do Canad cujos falantes tm substitudo o uso de lnguas nativas
pelo ingls. Os quatro fenmenos lingusticos se associam diretamente com o
dialeto local: a fortio de fricativas dentais (/d e T/t, como em that que e
think pensar), -s verbal (como em I likes it eu gosto disso) e intensificador
right (como em Hes right huge Ele bem enorme). Seus resultados tambm
demonstram pouca coeso do socioleto: apenas um dos seis pareamentos
possveis entre essas variveis se correlaciona significativamente -s verbal
e intensificador right (r = 0.47, p < 0,05). Ao analisar os dados por grupos
sociais, a autora nota que tal correlao se deve s mulheres (r = 0.77, p <
0,01), aos falantes mais jovens (r = 0.73, p < 0,05) e queles cuja primeira
lngua o ingls (r = 0.71, p < 0,05). Os jovens exibem adicionalmente uma
correlao entre fortio de e -s verbal (r = 0.78, p < 0,05). Thorburn
tambm classificou os usos de cada falante de modo semelhante ao estudo de
Guy (2013) em A, M e B. Apenas um dos falantes consistente nas quatro
variveis (BBBB), e nove tm a mesma tendncia para trs variveis; os outros
15 apresentam padres variados. A concluso geral da autora de que h
pouca coeso social, j que a nica correlao para toda a comunidade, entre
-s verbal e intensificador right, ocorre de fato apenas na fala de mulheres mais
jovens.
Desse modo, os estudos sobre covariao, at o momento, demonstram
que certos pares de variveis podem covariar nos usos individuais dos falantes,
mas que tais correlaes no so to frequentes ou to fortes quanto o que
se poderia esperar da perspectiva de coeso social, em termos de prestgio
(Guy, 2013), status inovador (Tagliamonte & Waters, 2011) ou associao
das variantes com identidade local (Thorburn, 2014). Ademais, ainda no se
sabem exatamente quais fatores sociais e lingusticos promovem ou inibem a
covariao. Seriam as correlaes o produto de motivaes mais propriamente
lingusticas, como sugerem os resultados de Labov (2006 [1966]) e de Guy
(2013)? Se alguns grupos so deveras mais coesos do que outros, quais so eles
e por qu? A prxima seo apresenta os mtodos para abordar essas questes,
bem como as hipteses para o conjunto das seis variveis aqui analisadas.

236
Mtodos e hipteses

9.2 Mtodos e hipteses


Cada uma das seis variveis foi inicialmente analisada separadamente em
modelos de efeitos mistos no Rbrul (Johnson, 2009), de modo semelhante
ao que se apresentou nos captulos 4 a 7, com a incluso de Falante e Item
Lexical como efeitos aleatrios, alm de variveis sociais e lingusticas como
efeitos fixos. No entanto, uma diferena em relao s anlises prvias o
fato de que se incluram apenas dados de Conversao para todas as variveis
a fim de torn-las maximamente comparveis. Isso necessrio j que nem
todos os informantes tm dados de leituras (ver Captulo 3, p. 36), (CN)
e (CV-3PP) tiveram distribuio categrica na leitura de depoimento e de
notcia de jornal, e no h dados de (CV-1PP) nesses estilos (ver captulos 6
e 7). As seis variveis so novamente exemplificadas em (1):

(1) a. (e): [e] vs. [ej] fazenda, sempre


b. (-r): [R] vs. [] porque, mulher
c. (R-0): [R/] vs. porque, mulher
d. (CN-atomstica):4 os menino-s vs. os menino-
e. (CV-3PP): eles falaram vs. eles falou
f. (CV-1PP): ns falamos vs. ns falou

As variveis sintticas claramente se relacionam estruturalmente. (CV-3PP) e


(CV-1PP) se referem morfologia de nmero no paradigma verbal, que tende
a formar um sistema rigidamente organizado em que as regras se definem
por analogia paradigmtica. No Captulo 7, demonstrou-se que ambas se
correlacionam basicamente com o mesmo conjunto de variveis lingusticas
que, por sua vez, organizam-se na mesma hierarquia de importncia. Alm
disso, Duarte & Varejo (2013) propem que as mudanas na morfologia
flexional verbal no portugus brasileiro, de um sistema de seis para duas
formas (oposio entre a primeira pessoa do singular e as demais pessoas
gramaticais), conduziu a uma mudana paramtrica de lngua de sujeito
nulo para uma no pro-drop, em que pessoa e nmero so marcados pelo
pronome em vez da flexo verbal. Se a marcao nmero-pessoal se relaciona
4
Assim como no Captulo 6, excluram-se os dados em primeira posio (p.ex., os em os menino(s)),
pelo fato de a marca explcita de nmero ser praticamente categrica nesse contexto. Ver p. 138.

237
Mtodos e hipteses

fundamentalmente a duas gramticas distintas, pode-se esperar grande presso


interna do sistema para a simetria entre 3PP e 1PP. Assim, de um ponto
de vista puramente estrutural, espera-se que as concordncias de 3PP e de
1PP estejam fortemente correlacionadas entre si. A concordncia nominal, de
modo semelhante, tambm envolve um processo similar em que a pluralidade
pode ser marcada de maneira no redundante apenas na primeira palavra
do sintagma, de modo que tambm se espera que esteja correlacionada com
(CV-3PP) e (CV-1PP).
Quanto s variveis fonolgicas, a retroflexo e o apagamento de (-r)
possivelmente se relacionam estruturalmente. Conforme se notou no Captulo
5 (ver p. 92), Rennicke (2011) postula que uma das trajetrias de (-r) seria o
percurso r R (da vibrante alveolar mltipla at o apagamento).
Dessa perspectiva, espera-se que falantes que tendem a empregar [] tambm
tendam a apag-lo, j que estariam um passo frente do continuum de
realizaes de (-r).
A ditongao de (e), por sua vez, no se relaciona estruturalmente com
nenhuma das demais variveis. Os demais pares entre variveis fonolgicas e
sintticas p.ex., (-r) e (CV-1PP) tambm so, em princpio, estrutural-
mente independentes. H, no entanto, uma sobreposio estrutural parcial
entre o apagamento de (-r) e (CN); embora a ltima se refira a um processo
morfossinttico, o fato de o morfema de plural nominal ser um /s/ em muitos
casos (p.ex., meninos/menino-) significa que, superficialmente, pode haver a
atuao de uma mesma regra fonolgica de simplificao de coda silbica, da
forma CVC CV. Essa sobreposio ser analisada mais detalhadamente
na seo 9.3.
Embora nem todos os pares de variveis se relacionem estruturalmente, as
seis variveis compartilham muitas das mesmas correlaes sociais. O Quadro
9.1 retoma os resultados para essas variveis, obtidos nas anlises separadas
de cada varivel dependente.5 Para cada varivel social, indica-se ou sua no
seleo pelo Rbrul () ou o fator (F, 2034 anos, C2-D etc.) que
favorece o valor de aplicao. Os nmeros entre parnteses se referem aos
5
Para uma anlise detalhada sobre o apagamento de (-r), conforme se indicou no Captulo 5, remete-se
a Oushiro & Mendes (2014).

238
Mtodos e hipteses

ej]
[ [] R-0 CN- CV-3PP- CV-1PP-
Sexo/Gnero F M M M M M
(28) (17) (14) (18) (13) (62)
Faixa Etria 2034
(26)
Nvel de Superior Mdio Mdio Mdio Mdio Mdio
Escolaridade (13) (22) (14) (53) (42) (70)
Regio de perifrica
Residncia (36)
Classe Social A-B1 C2-D C2-D C2-D C2-D C2-D
(23) (41) (13) (64) (50) (81)
Origem dos N/NE N/NE
Pais (55) (18)
Mobilidade baixa baixa baixa
(11) (28) (18)

Quadro 9.1 Quadro resumo de fatores sociais favorecedores das variantes [ej], [],
R-0, CN-, CV-3PP- e CV-1PP-

valores de range, que sinalizam a importncia relativa do fator social para a


varivel dependente.
Os resultados gerais mostram que as variantes sob anlise so favorecidas
pelos homens, falantes com nvel mais baixo de escolaridade e de classe
social em todos os casos, exceto [ej]; esta, por sua vez, favorecida pelas
mulheres, falantes com maior nvel de instruo e de classes mais altas. A
ditongao de (e) tambm favorecida pelos mais jovens, diferentemente das
demais variveis, que se encontram, de modo geral, em variao estvel na
comunidade. A Regio de Residncia relevante apenas para a retroflexo de
(-r), que favorecida pelos moradores de bairros mais perifricos; a Origem
dos Pais se correlaciona com as duas variveis de (-r), sendo o retroflexo e
o apagamento favorecidos por paulistanos cujos pais migraram das regies
Norte e Nordeste do pas; e os falantes com menor mobilidade geogrfica (que
sempre viveram no mesmo bairro) favorecem [ej], [] e CN-.
Ao comparar os valores de range, a ordem relativa de fatores sociais para
as trs variveis sintticas bastante semelhante: Classe Social a varivel
mais importante, seguida de Nvel de Escolaridade e Sexo/Gnero (alm de

239
Mtodos e hipteses

Mobilidade para CN-). Para as variveis de (-r), a Origem dos Pais tem o
maior range, enquanto Sexo/Gnero e Faixa Etria so as mais importantes
para [ej].
Da perspectiva de semelhanas sociais, a correlao com as mesmas vari-
veis conduz expectativa de que as seis variveis devam se correlacionar entre
si nos usos individuais dos falantes quanto mais x, mais y, e quanto menos x,
menos y. Todas as variveis, exceto (e), compartilham um conjunto bastante
similar de fatores favorecedores. O fato de o encaixamento social de [ej] ser
to diferente das demais variveis no implica que no deva covariar com
elas; pelo contrrio, nesse caso se esperam correlaes negativas ou opostas:
quanto mais x, menos y.
Para examinar se tais previses estruturais e sociais se observam empirica-
mente nos usos dos falantes, seus pesos relativos para cada variante em foco
(obtidos a partir da varivel Falante6 na anlise multivariada) foram analisados
de duas maneiras. Na primeira, avaliam-se amplos padres de agrupamento
social, por meio da classificao das tendncias de cada falante como alta (A)
ou baixa (B) para cada uma das seis variantes, de modo semelhante ao estudo
de Guy (2013), a depender de os valores de pesos relativos estarem acima
ou abaixo do ponto neutro 0.50. Desse modo, os falantes foram classificados
em grupos como AAAAAA (ou seja, alta tendncia de emprego de [ej], [],
R-0, CN-, 3PP- e 1PP-, respectivamente). Haver um alto grau de coeso
dialetal se todas ou a maior parte das variantes se encaixarem na mesma
categoria (p.ex., AAAAAA ou BBBBBB) para grande parte dos falantes.
Os pesos relativos tambm foram utilizados para calcular coeficientes
de correlao de Pearson entre pares de variveis, como uma medida da
coocorrncia de suas respectivas variantes.7 Tal clculo foi realizado com
auxlio da funo pairscor.fnc do pacote languageR (Baayen, 2008) no
programa R. Por fim, tambm se calcularam coeficientes de Pearson por grupos
sociais (sexo feminino, masculino, classe A-B1, B2, C1, C2-D etc.) e por
fatores lingusticos, a fim de melhor determinar o efeito de condicionamentos
6
O programa Rbrul gera um valor de peso relativo (e de logodds) para cada variante de uma varivel
aleatria, do mesmo modo que para as variantes de efeitos fixos (Sexo/Gnero, Classe Social etc.).
7
Ver nota 3 na p. 233.

240
Anlises

sociais e estruturais na covariao. A comparao entre os valores de r para


fatores distintos (p.ex., mulheres vs. homens) foi realizada no programa R
mediante a funo r.test do pacote psych (Revelle, 2014).

9.3 Anlises
9.3.1 Padres gerais de covariao
Ao atribuir A ou B para pesos relativos acima ou abaixo de 0.50, respecti-
vamente, h 64 padres possveis em que um falante pode ser classificado (26
= 64): AAAAAA, AAAAAB, AAAABB etc. A opo por uma categorizao
binria (diferentemente de Guy 2013 e Thorburn 2014) se deve ao fato de
que uma classificao ternria em alta, mdia e baixa geraria 729 (= 36 )
padres possveis, o que tornaria impossvel determinar se certos padres no
ocorreram pelo fato de no haver esse nmero mnimo de falantes ou porque
os padres so verdadeiramente raros.
Em um cenrio de completa aleatoriedade, esperaria-se uma distribuio
equilibrada do nmero de falantes por padro uma mdia de 1.84 (118
falantes / 64 padres) para a presente amostra. No cenrio oposto, os
falantes se agrupariam de acordo com alguns poucos padres diferentes. Como
normalmente o caso quando se opera com dados empricos, a real distribuio
um cenrio intermedirio: neste estudo, ocorreram 46 dos 64 padres
possveis. A Tabela 9.1 mostra os dez que ocorreram mais frequentemente.8
Os dois padres de uso mais frequentes, que ocorrem, cada qual, para
oito falantes, so ABBBBB (i) e BAAAAA (ii). Esses 16 falantes tendem a
empregar [], R-0, CN-, 3PP- e 1PP- de modo semelhante, seja favorecendo-
as ou desfavorecendo-as simultaneamente. A variante que destoa nesses dois
casos a ditongao de (e); de acordo com o encaixamento social revisado
na seo anterior, era esperado que [ej] covariasse na direo oposta. Alm
disso, sete dos oito falantes com padro ABBBBB pertencem s classes mdia
alta ou alta e habitam regies mais centrais, e seis dos falantes com padro
8
Os demais 36 padres ocorreram cada qual para menos de quatro informantes e so aqui omitidos por
conciso.

241
Anlises

Tabela 9.1 Padres de uso mais frequentes das seis variantes em foco

N [ ej] [] R-0 CN- 3PP- 1PP-


(i) 8 A B B B B B
(ii) 8 B A A A A A
(iii) 6 B B B B B B
(iv) 6 B A A A A B
(v) 5 B A B A A A
(vi) 4 A A A A A A
(vii) 4 A A B B B B
(viii) 4 B A B B B B
(ix) 4 B A A B B B
(x) 4 B B A B B B
A (alta): P.R. 0.500; B (baixa): P.R. 0.499.

BAAAAA so da classe mdia baixa e vivem em regies perifricas. Os dois


padres em que as seis variveis covariam na mesma direo BBBBBB (iii)
e AAAAAA (vi) tambm se encontram entre os mais frequentes, tendo
ocorrido para seis e quatro falantes respectivamente. Os demais padres mais
frequentes tm pelo menos quatro variveis na mesma direo como A (iv, v)
ou B (vii, viii, ix e x).
Desse modo, parece haver certa tendncia coeso social, uma vez que os
padres de agrupamento mais frequentes so aqueles em que a maior parte das
variantes so simultaneamente favorecidas ou desfavorecidas pelos falantes.
Contudo, assim como Guy (2013) e Thorburn (2014), deve-se observar que tal
evidncia no fortemente persuasiva. Os padres mais frequentes ocorreram
para apenas oito falantes, e somente 45 de 118 (38%) apresentam a mesma
tendncia (A ou B) para pelo menos cinco das variantes. Ademais, exceto
pelos dois padres mais frequentes, os falantes no parecem se agrupar em
conjuntos socialmente coerentes (como membros da classe alta ou falantes
do sexo masculino) de fato, o nmero relativamente pequeno de falantes
por padro (menos de seis) impede qualquer tentativa de maior generalizao.
Os coeficientes de correlao de Pearson revelam um quadro mais detalhado
da covariabilidade ao considerar no apenas uma tendncia binria de uso,
mas tambm a fora da correlao entre cada par de variveis. A Figura 9.3

242
Anlises

uma matriz de correlaes que contm os 15 pareamentos possveis entre


as seis variveis. Os quadros na linha diagonal mostram as distribuies dos
pesos relativos dos falantes, divididas em decis (0 a 0.10, 0.11 a 0.20, etc.);
os quadros do canto inferior esquerdo mostram os coeficientes de correlao
(r) junto a seus respectivos valores de significncia (+ p > 0,05; *p < 0,05;
**p < 0,01; ***p < 0,001); e os quadros do canto superior direito mostram os
grficos de disperso para cada par de variveis e suas respectivas linhas de
regresso.
Os resultados mostram que [ej] de fato no se correlaciona significativa-
mente com nenhuma outra varivel: os coeficientes de Pearson na primeira
coluna so todos prximos de zero e as linhas de regresso no topo da fi-
gura so praticamente planas, o que indica no correlao. De um ponto de
vista puramente lingustico, isso era esperado, j que (e) no se relaciona
estruturalmente com nenhuma das outras cinco variveis do conjunto aqui
analisado. No entanto, isso inesperado da perspectiva de correlaes sociais,
que haviam indicado diferenas sistemticas entre [ej] e as demais variantes
(favorecida por mulheres em vez de homens, classe A-B1 em vez de C2-D
etc.) Tal resultado sugere que a ditongao de (e), uma mudana de baixo
na comunidade paulistana (ver Captulo 4), est menos disponvel para a
composio de socioletos coesos do que outras variantes sobre as quais os
falantes desenvolvem um discurso metalingustico.
A retroflexo de (-r) se correlaciona moderadamente com CN- (r =
0.23*) e mais fortemente com 3PP- (r = 0.31***). Note-se que [] no
se correlaciona com R-0 (r = 0.09), com a qual a variante compartilha
semelhanas estruturais. O apagamento de (-r), por sua vez, correlaciona-
se com as trs variveis morfossintticas, mais fortemente com CN- (r =
0.37***) e menos com 3PP- e 1PP- (r = 0.29** e 0.22*). Esses resultados
mostram que variveis estruturalmente no relacionadas mas similarmente
estratificadas socialmente podem se correlacionar significativamente nos usos
dos falantes. No entanto, tais correlaes (entre r = 0.22 e 0.37) so medianas.
Por outro lado, todos os pares de variveis morfossintticas se correla-
cionam significativamente. CN- se correlaciona fortemente com 3PP- (r =
0.74***) e em menor grau com 1PP- (r = 0.36***), e 3PP- com 1PP- (r

243
Anlises

Figura 9.3 Matriz de correlaes entre seis variveis


(+p > 0,05; *p < 0,05; **p < 0,01; ***p < 0,001)

244
Anlises

= 0.47***). Para o par (CN)-(CV-3PP), a correlao mais forte encontrada


no conjunto, os falantes tendem a favorecer ou desfavorecer as variantes no
padro simultaneamente, o que significa que o uso de uma variante prediz o
uso da outra com alto grau de confiabilidade se um falante tende a empregar
CN-, alta a probabilidade de que tambm tenda a empregar 3PP-.
Embora a covariao entre as variveis morfossintticas tenha sido prevista
estrutural e socialmente, a ordem relativa da fora dessas correlaes
inesperada: as duas variveis de (CV) se correlacionam menos fortemente
entre si do que (CN) e (CV-3PP). Visto de outro modo, os dois pares entre
variveis morfossintticas que incluem 1PP (CV-1PP)-(CN) e (CV-1PP)-
(3PP) exibem correlaes relativamente mais fracas.
Um olhar mais atento correlao entre 1PP- e 3PP- (Figura 9.4)
mostra que a linha de regresso bastante irregular nesse caso: ela exibe
um pequeno declive entre os pontos 0.20 e 0.40 do eixo x, e se inclina mais
propriamente apenas no lado direito. Algo muito semelhante se verifica na
correlao entre 1PP- e CN-: declive entre 0.20 e 0.40 e curva ascendente a
partir desse ponto. Os respectivos grficos de disperso foram divididos em
quatro grupos de falantes, identificados por 14: (1) aqueles que desfavorecem
1PP- (P.R. < 0.50) e favorecem CN-/3PP- (P.R. > 0.50); (2) aqueles que
favorecem tanto 1PP- quanto CN-/3PP-; (3) aqueles que desfavorecem
tanto 1PP- quanto CN-/3PP-; e (4) aqueles que favorecem 1PP- e
desfavorecem CN-/3PP-. Observe-se que entre os falantes que favorecem
1PP- (grupos 2 e 4), h muitos mais falantes que tambm favorecem CN-
/3PP- (grupo 2) e pouqussimos que tendem a desfavorec-los (grupo 4). Os
falantes que desfavorecem 1PP- (grupos 1 e 3) esto distribudos muito mais
equilibradamente entre aqueles que favorecem e desfavorecem CN-/3PP-.
Isso significa que, se um falante tende a favorecer 1PP-, h uma probabilidade
bastante alta de que ele tambm favorecer CN-/3PP-; por outro lado,
se um falante tende a desfavorecer 1PP-, tal fato no prev como ele se
comportar em relao a CN-/3PP-. Em outras palavras, o emprego de
1PP- implica o emprego de CN- e de 3PP-, mas o emprego de 1PP padro
no implica CN e 3PP padro da a correlao mais fraca entre esses pares
de variveis. Uma possvel motivao para isso ser discutida na seo 9.3.

245
Anlises

0.0 0.2 0.4 0.6 0.8 1.0




3PP0 1 2

0.8








0.6









0.4
3 4








0.2




0.0 0.2 0.4 0.6 0.8 1.0

1PP0
r = 0.47
p = 0 ***

0.2 0.4 0.6 0.8

0.0 0.2 0.4 0.6 0.8 1.0

1.0


1 2

CN0


0.8






0.6








0.4

0.2






0.0


0.0 0.2 0.4 0.6 0.8 1.0

1PP0
r = 0.36
p = 3e04 ***

0.0 0.2 0.4 0.6 0.8 1.0

Figura 9.4 Correlaes entre 1PP- e CN- (acima) e 3PP- (abaixo)


(*p < 0,05; **p < 0,01; ***p < 0,001)

O Quadro 9.2 resume os resultados para os 15 pares de variveis em termos


de relaes estruturais e covariabilidade. Encontram-se pares que se rela-
cionam estruturalmente e covariam entre as trs variveis morfossintticas;
um par estruturalmente relacionado que no covaria as variveis de (-r);
pares que no se relacionam estruturalmente e covariam (-r) e as variveis
sintticas; e pares que no so estruturalmente relacionados e no covariam
todos os pares com [ej], bem como [] e 1PP-.
Constata-se, portanto, que semelhanas estruturais por si ss no preveem
exatamente quais pares de variveis covariam nem a fora de tais correlaes.
A retroflexo e o apagamento de (-r) no se correlacionam significativamente
nos usos dos falantes, e 3PP- e 1PP- no se correlacionam mais fortemente

246
Anlises

Estruturalmente relacionadas?
Sim No
Covariao CN- / 3PP- [] / CN-
3PP- / 1PP- [] / 3PP-
CN- / 1PP- R-0 / CN-
R-0 / 3PP-
R-0 / 1PP-
No covariao [] / R-0 [ej] / []
[ej] / R-0
[ej] / CN-
[ej] / 3PP-
[ej] / 1PP-
[] / 1PP-

Quadro 9.2 Resumo de resultados sobre covariveis

do que CN- e 3PP-. Por outro lado, os condicionamentos puramente


sociais tampouco do conta das correlaes observadas. Os padres regulares
de estratificao social conduziram expectativa de que todos os pares se
correlacionassem entre si, mas apenas cerca de metade deles (8/15) apresenta
alguma correlao significativa.
mais provvel que a covariao (ou falta de) seja motivada por uma
combinao de fatores lingusticos e sociais que ainda no foram totalmente
especificados. A separao dos dados por variantes de variveis internas e
externas, na seo que segue, iluminar essa questo.

9.3.3 O papel de fatores internos


A fim de separar o efeito de diferentes fatores lingusticos, realizaram-se novas
anlises multivariadas em subconjuntos de dados, subdividindo-os em fatores
internos por exemplo, uma anlise para as ocorrncias de (-r) em coda
precedidas de vogais com trao [+alto] e outra para as ocorrncias de (-r)
precedidas de vogais [-alto]. Com base nessas anlises, geraram-se novos
valores de pesos relativos para cada falante, que foram ento empregados
no clculo de novos coeficientes de correlao de Pearson. A questo aqui

247
Anlises

se diferentes fatores lingusticos geram correlaes diferentes entre pares de


variveis; se os coeficientes de Pearson se modificarem significativamente a
depender do subconjunto de dados, deve-se inferir que a varivel lingustica
em questo (no exemplo, Contexto Fnico Precedente) tem uma influncia
nos padres de covariao.
Na grande maioria dos casos, as correlaes entre pares de variveis no se
alteram ao considerar subconjuntos de ocorrncias. Para retomar o exemplo
acima, a retroflexo de (-r) havia se mostrado correlacionada apenas com
CN- (r = 0.23*) e 3PP- (r = 0.31***). Isso tambm ocorre quando se
consideram apenas vogais [+alto] ou apenas vogais [-alto], do mesmo modo
que no conjunto total de dados. No primeiro caso, a fora da correlao
entre [] e CN- de r = 0.19* para o contexto vogal precedente [-alto] e r =
0.22* para vogal precedente [+alto]. A diferena entre essas correlaes no
significativa (p = 0,30). Na correlao entre [] e 3PP-, r = 0.29* tanto para
vogal [-alto] quanto para vogal [+alto], e a diferena entre essas correlaes
tampouco significativa (p = 0,50). O Contexto Fnico Precedente para
(-r), portanto, no tem qualquer influncia na covariao entre essa e outras
variveis.
No entanto, h outras variveis lingusticas que significativamente afetam
a covariao entre pares de variveis. So elas: Salincia Fnica para pares
com (CN), (CV-3PP) e (CV-1PP); Posio do Sujeito para (CV-1PP); e
Animacidade para (CV-3PP).
A Salincia Fnica havia sido codificada para as trs variveis morfossin-
tticas (para (CN), com o nome de Processos Morfofonolgicos de Formao
do Plural). Os exemplos (2) a (4) retomam os fatores dessa varivel. Em-
bora codificada diferentemente para (CN), (CV-3PP) e (CV-1PP), a hiptese
subjacente e os resultados so os mesmos: formas menos salientes tendem a
favorecer a marca zero, e formas mais salientes a desfavorec-la (ver captulos
6 e 7).

(2) Fatores de Salincia Fnica para (CN)


a. Plural regular
(i) Vogal oral + s: casa, casas

248
Anlises

(ii) Vogal nasal + s: mo, mos


b. Plural irregular
(i) -r + /is/: professor, professores
(ii) -l + /is/: azul, azuis
(iii) -S + /is/: vez, vezes
(iv) -o /js/: profisso, profisses
(v) -o /js/: po, pes
(vi) metafnicos: ovo [ovu], ovos [Ovus]

(3) Fatores de Salincia Fnica para (CV-3PP)


a. Grau 1: oposio no acentuada
(i) come/comem [-i/-i]
(ii) fala/falam [-a/-u]

(iii) faz/fazem [-/-i]
b. Grau 2: oposio acentuada
(i) d/do ["a/"w]

(ii) comeu/comeram ["ew/"er u], ["iw/"ir
u], ["oj/"or
u]
(iii) falou/falaram [-"ow/"ar
u], ["i/"er
u]

(4) Fatores de Salincia Fnica para (CV-1PP)


a. Grau 1: oposio no acentuada
(i) falava/falvamos [-/-mus]
b. Grau 2: oposio acentuada
(i) fala/falamos [a/"amus]
(ii) est/estamos ["a/"amus], ["e/"emus]
(iii) foi/fomos ["ew/"emus], ["iw/"imus], ["oj/"omus]
(iv) falou/falamos ["ow/"amus]

Nas novas anlises de covariao, os fatores foram reorganizados em dois


nveis nas trs variveis, como formas menos e mais salientes. Para (CN),
opuseram-se as formas regulares de plural (2-a-i)(2-a-ii) s formas irregulares
(2-b-i)(2-b-vi); para (CV-3PP), ops-se o Grau 1 (3-a-i)(3-a-iii) ao Grau
2 (3-b-i)(3-b-iii); e para (CV-1PP), tambm o Grau 1 (4-a-i) ao Grau 2
(4-b-i)(4-b-iv).
A Tabela 9.2 compara sistematicamente as correlaes de (CN) com as
outras cinco variveis, separando-se os contextos de plurais menos e mais
salientes. Na segunda coluna esto os coeficientes de correlao da anlise
geral, para servir de base de comparao. Os valores de r de Pearson para

249
Anlises

Tabela 9.2 Comparao entre coeficientes de Pearson para formas menos e mais
salientes de CN, em correlao com outras variveis sociolingusticas

CN: Salincia Fnica


todos os dados -saliente +saliente -saliente vs. +saliente
N = 19.884 N = 16.460 N = 3.424 p
ej -0.10 -0.10 -0.12 0.39
0.23* 0.21* 0.21* 0.50
R-0 0.37*** 0.38*** 0.22* 0.01*
CN- NA NA NA NA
3PP- 0.74*** 0.72*** 0.65*** 0.08
1PP- 0.36*** 0.35*** 0.31** 0.28
*p < 0,05; **p < 0,01; ***p < 0,001.

formas menos e mais salientes se encontram na terceira e na quarta coluna


respectivamente. Na ltima, apresenta-se um valor de significncia que avalia
a probabilidade de ser aleatria a diferena entre as correlaes em cada
contexto.9
Ao comparar as correlaes com dados menos e mais salientes de (CN), o
valor de r muda apenas na correlao com R-0, que se torna significativamente
mais fraca com formas mais salientes (r = 0.38*** 0.22*, p = 0,01). Uma
tendncia similar parece se esboar para as correlaes com 3PP- e 1PP-
(Cf. 0.72*** 0.65*** e 0.35*** 0.31**), mas nesses casos maior a
probabilidade de que a diminuio nos coeficientes de Pearson tenha ocorrido
aleatoriamente (p = 0.08 e 0.28). Tal resultado indica que a correlao entre
R-0 e CN- mais motivada por formas menos salientes de CN- do que
por formas mais salientes. Recorde-se que as primeiras equivalem aos plurais
regulares, que se constituem pelo mero acrscimo de -s. Isso sugere que a
covariao entre o apagamento de (-r) e (CN) em grande parte motivada por
uma regra fonolgica de apagamento de segmentos em coda silbica que afeta
tanto (-r) quanto (-s) de slabas CVC (mulher mulhe-; meninos meni-
no-). Note-se, contudo, que R-0 e CN- tambm se correlacionam quando
9
Uma anlise alternativa poderia comparar todas as combinaes possveis entre formas mais e menos
salientes de (CN), (CV-3PP) e (CV-1PP). No entanto, tal anlise gera resultados consideravelmente
mais complexos, que no contribuem na mesma medida para a presente discusso.

250
Anlises

se consideram apenas os plurais mais salientes (-is, -es, -es e metafnicos),


o que no pode ser explicado pela mesma regra fonolgica ou por outras
regras lingusticas; deve haver, portanto, a atuao de fatores sociais para a
correlao mais fraca (r = 0.22*), mas significativa, entre uso de marca zero
em plurais irregulares e o apagamento de (-r).
Na Tabela 9.3 para a Salincia Fnica de 3PP-, os coeficientes de cor-
relao se tornam significativamente mais fracos com R-0 (r = 0.34***
0.17, p = 0,007) e com CN- (r = 0.77*** 0.55***, p < 0,001). De fato, o
apagamento de (-r) deixa de covariar com 3PP quando se consideram apenas
as formas mais salientes.
Tabela 9.3 Comparao entre coeficientes de Pearson para formas menos e mais
salientes de CV-3PP, em correlao com outras variveis sociolingusticas

CV-3PP: Salincia Fnica


todos os dados -saliente +saliente -saliente vs. +saliente
N = 9.480 N = 5.309 N = 4.171 p
ej -0.05 -0.07 -0.05 0.39
0.31*** 0.28** 0.31*** 0.33
R-0 0.29** 0.34*** 0.17 0.007**
CN- 0.74*** 0.77*** 0.55*** 0.00***
3PP- NA NA NA NA
1PP- 0.47*** 0.44*** 0.48*** 0.26
*p < 0,05; **p < 0,01; ***p < 0,001.

Como mostram os exemplos em (3) acima, os morfemas de 3PP envolvem


alteraes na nasalidade, na qualidade voclica e a adio de sufixos, de modo
que a mudana na fora da correlao no pode ser atribuda somente a
uma regra fonolgica tal como a que se postulou acima (CVC CV). Antes
de propor uma explicao para este caso, comparem-se as mudanas nos
coeficientes de Pearson para correlaes com 1PP-, j que algo muito similar
se observa quando se comparam formas menos e mais salientes (Tabela 9.4).
Os coeficientes de correlao se tornam bastante mais fracos com R-0 (r =
0.33** 0.01, p < 0,03), com CN- (r = 0.50*** 0.11, p < 0,01) e com

251
Anlises

Tabela 9.4 Comparao entre coeficientes de Pearson para formas menos e mais
salientes de CV-1PP, em correlao com outras variveis sociolingusticas

CV-1PP: Salincia Fnica


todos os dados -saliente +saliente -saliente vs. +saliente
N = 1.074 N = 297 N = 777 p
ej -0.11 -0.19 0.07 0.051
0.05 0.1 -0.13 0.076
R-0 0.22* 0.33** 0.02 0.023*
CN- 0.36*** 0.50*** 0.11 0.004**
3PP- 0.47*** 0.54*** 0.21* 0.009**
1PP- NA NA NA NA
*p < 0,05; **p < 0,01; ***p < 0,001.

3PP- (r = 0.54*** 0.21*, p < 0,01).10


As escalas de Salincia Fnica para (CN), (CV-3PP) e (CV-1PP) mostram,
em todos os casos, que as correlaes entre pares de variveis so mais fortes
entre as formas menos salientes ou, de modo inverso, que as correlaes so
mais fracas quando se consideram as formas mais salientes. Quando proposta
por Naro (1981) para os morfemas de 3PP, a escala de Salincia Fnica tinha
o objetivo de discutir o problema da implementao (Weinreich et al., 2006
[1968]), o ponto de incio de uma mudana sinttica; para a concordncia de
3PP, a mudana teria comeado em formas menos salientes (come, comem)
e se espalhado pelo sistema verbal seguindo a escala de salincia ou seja,
a variao em formas mais salientes pressupe a variao em formas menos
salientes. Sincronicamente, parece ocorrer processo semelhante na fala de
indivduos: o emprego da marca zero em formas mais salientes pressupe seu
emprego tambm em formas menos salientes, mas o contrrio nem sempre
verdadeiro (emprego de marca zero em formas menos salientes no implica
seu emprego em formas mais salientes). Como mais provvel que a variao
ocorra em formas menos salientes, decorrem da as correlaes mais fortes
10
Seria possvel questionar se os valores de r diminuem com formas mais salientes em consequncia de
um menor nmero de dados, como um efeito estatstico colateral de uma amostra menor; contudo, vale
notar que enquanto h menos dados de CN mais salientes (cf. 16.460 vs. 3.424 na Tabela 9.2) e 3PP
mais salientes (cf. 5.309 vs. 4.171 na Tabela 9.3), h mais dados de 1PP mais salientes (cf. 297 vs.
777 na Tabela 9.4), mas os coeficientes de correlao ainda assim se enfraquecem com as formas mais
salientes. No se trata, portanto, de um simples efeito de menor nmero de dados.

252
Anlises

(coeficientes de Pearson mais distantes de zero) quando se consideram essas


formas.
Os resultados tambm mostram que a escala de salincia para 1PP afeta
as correlaes com 3PP, CN e R-0; aquela para 3PP afeta CN e R-0; e aquela
para CN afeta somente R-0. Esses fatos podem ser explicados por uma escala
mais geral de salincia considerando-se as trs variveis morfossintticas. Os
morfemas de plural nominal geralmente envolvem menos material fnico [-s,
-is, -js, -js] do que os morfemas de 3PP [-i, -
u, -"w
, -"e.r
u, -"i.r
u, -"o.r
u]
que, por sua vez, envolvem menos material fnico do que para morfemas
de 1PP (-.va.mos, -a.mos, -e.mos). A Salincia Fnica, desse modo, afeta
correlaes somente com formas menos salientes de outras variveis, mas no
as mais salientes. Isso tambm pode explicar por que a 1PP no covaria to
fortemente com 3PP quanto o par 3PP-CN; o maior grau de salincia das
ocorrncias de 1PP- enfraquece as correlaes com outras variveis.
Entendida como essencialmente o mesmo fenmeno lingustico que se
correlaciona com (CN), (CV-3PP) e (CV-1PP), fica claro por que a Salincia
Fnica influencia a covariao entre variveis estruturalmente relacionadas.
No entanto, seu efeito na covariao com o apagamento de (-r) tambm deve
ser explicado. Esta varivel condicionada por fatores lingusticos que podem
igualmente ser interpretados como um efeito de salincia: o apagamento
tende a ocorrer em slabas finais e tonas em vez de mediais e tnicas, e em
classes de palavras mais frequentes como conjunes e preposies em vez de
em substantivos e adjetivos (Oushiro & Mendes, 2014). O mesmo princpio
lingustico que se aplica a (CN), (CV-3PP) e (CV-1PP) tambm atua em R-0.
Desse modo, a covariao parece ser promovida no apenas por similaridades
estruturais entre variveis dependentes, mas tambm por outras variveis
lingusticas com as quais mltiplas variveis se correlacionam, como o caso
de Salincia Fnica.
Corrobora a constatao acima o fato de que as manipulaes nos arquivos
de dados quanto a Posio do Sujeito e quanto a Animacidade tambm mudam
significativamente certas correlaes com outras variveis.
Posio do Sujeito havia sido codificada para (CV-3PP) e (CV-1PP) de
acordo com os seguintes fatores:

253
Anlises

(5) Posio do Sujeito (3PP e 1PP)


a. imediatamente precedente
b. precedente e separado por 1 a 4 slabas
c. precedente e separado por 5 ou mais slabas
d. posposto
e. pergunta do documentador (somente para 3PP)

As anlises do Captulo 7 haviam indicado que sujeitos prximos (5-a)(5-b)


desfavorecem a marca zero, ao passo que sujeitos distantes (5-c)(5-e) a
favorecem. Nas novas anlises, os dados foram separados nesses dois conjuntos,
que so comparados na Tabela 9.5.

Tabela 9.5 Comparao entre coeficientes de Pearson para sujeitos prximos e


distantes de CV-1PP, em correlao com outras variveis sociolingusticas

CV-1PP: Posio do Sujeito


todos os dados prximo distante prximo vs. distante
N = 1.074 N = 834 N = 240 p
ej -0.11 -0.16 0.04 0.06
0.05 0.02 -0.14 0.11
R-0 0.22 0.21 0.07 0.14
CN- 0.36*** 0.40*** 0.16 0.03*
3PP- 0.47*** 0.50*** 0.23* 0.01**
1PP- NA NA NA NA
*p < 0,05; **p < 0,01; ***p < 0,001.

Os resultados indicam que a correlao se enfraquece com sujeitos mais


distantes no caso do par com CN- (r = 0.40*** 0.16, p = 0,03) e com
3PP- (r = 0.50*** 0.23*, p = 0,01). Como visto no Captulo 7, a Posio
do Sujeito uma varivel que tambm se correlaciona com (CV-3PP); a
Tabela 9.5 mostra que seus efeitos em 1PP alteram a covariao com a 3PP.
O fato de a fora da correlao tambm se alterar com CN- possivelmente
se deve ao efeito estrutural da presena de marcas de nmero no sintagma
nominal do sujeito, que favorecem a presena de marcas no verbo. Essa tabela
mostra que a presena de sujeitos prximos tem influncia sobre a presena
ou no de marcas no verbo, mas sujeitos distantes no tm o mesmo efeito
ou tm um efeito atenuado.

254
Anlises

A Tabela 9.6 compara os coeficientes de Pearson de acordo com o trao


de Animacidade do Sujeito para (CV-3PP) com o trao [+humano], como
os amigos, ou [-humano], como as cadeiras. Os resultados indicam que tal
varivel interfere apenas na covariao com (CN) (r = 0.73*** 0.58***, p
< 0,01), cuja alternncia tambm se correlaciona com Animacidade.

Tabela 9.6 Comparao entre coeficientes de Pearson para sujeitos [+humano] e


[-humano] de CV-3PP, em correlao com outras variveis sociolingusticas

CV-3PP: Animacidade do Sujeito


todos os dados [+hum.] [-hum.] [+hum.] vs. [-hum.]
N = 9.480 N = 8.032 N = 1.448 p
ej -0.05 -0.09 -0.01 0.17
0.31*** 0.26** 0.32*** 0.22
R-0 0.29** 0.28** 0.22* 0.23
CN- 0.74*** 0.73*** 0.58*** 0.004**
3PP- NA NA NA NA
1PP- 0.47*** 0.44*** 0.43*** 0.45
*p < 0,05; **p < 0,01; ***p < 0,001.

Todos os casos em que se verificaram alteraes significativas nas correla-


es se referem comparao de fatores de variveis independentes que atuam
sobre mltiplas variveis sociolingusticas. Em todos eles, modificaram-se os
coeficientes de Pearson apenas na correlao com outras variveis que tambm
so condicionadas pelos mesmos fatores lingusticos: Salincia Fnica para
as relaes entre (-r), (CN), (CV-3PP) e (CV-1PP); Posio do Sujeito para
(CV-1PP) e (CV-3PP); e Animacidade para (CV-3PP) e (CN).
Os contextos que propiciam correlaes mais fortes entre pares de variveis
formas menos salientes, sujeito prximo e sujeito com o trao [+humano]
tm em comum o fato de serem menos marcados. As formas menos salientes
de (CN), (CV-3PP) e (CV-1PP) se referem, em geral, aos plurais regulares
(nominais: casa/casas; e verbais: come/comem; falava/falvamos). Sujeitos
precedentes e prximos correspondem ordem cannica SV (sujeito-verbo)
do portugus. Os sujeitos com o trao [+humano] tambm podem ser con-
siderados mais prototpicos, pois tal posio sinttica preferencialmente

255
Anlises

ocupada por entes volitivos e agentivos (Hopper & Thompson, 1980). Assim,
um princpio que parece estar subjacente covariao entre pares de variveis
o de marcao: contextos menos marcados promovem a covariao, ao passo
que aqueles mais marcados tendem a inibi-la.
A prxima seo se volta ao papel de fatores sociais, que tambm revelam
contextos especficos que privilegiam a coocorrncia de pares de variantes.

9.3.2 O papel de fatores externos


Assim como para fatores lingusticos, os coeficientes de correlao de Pearson
foram calculados para subgrupos de falantes, de acordo com as sete variveis
sociais includas nas anlises multivariadas: Sexo/Gnero, Faixa Etria, Nvel
de Escolaridade, Regio de Residncia, Classe Social, Origem dos Pais e
Mobilidade. A Tabela 9.7 mostra todos os pareamentos possveis e seus
respectivos coeficientes de correlao para a amostra geral nas primeiras duas
linhas. Os valores de r tambm foram comparados dentro de cada varivel
social, com vistas a determinar se a fora da correlao entre um par de
variveis para um grupo especfico (p.ex., mulheres) significativamente
maior do que para outro fator (p.ex., homens). As clulas sombreadas
indicam casos em que houve diferena significativa no tamanho de efeito. A
ltima coluna a mdia dos valores absolutos dos coeficientes de Pearson,
considerando-se todos os 15 pares para cada fator. Tal valor foi calculado
tomando-se o valor absoluto de cada coeficiente (ou seja, desconsiderando-se
o sinal positivo ou negativo), sobre o qual se aplicou a transformao-z de
Fisher; a mdia foi calculada com base nos 15 valores de z para cada fator, e
essa medida foi convertida novamente para o coeficiente de Pearson.11 Desse
modo, a ltima coluna contm uma medida (de 0 a 1) da fora das correlaes
em cada grupo social e indica quais deles so mais coesos.
Examine-se a tabela primeiramente por colunas. Observam-se mais corre-
11
O uso de valores absolutos se deve ao interesse no tamanho de efeito em vez da direo da correlao
(positiva ou negativa). A transformao-z de Fisher recomendada como passo intermedirio (em vez
de simplesmente calcular a mdia de valores de r) j que o coeficiente de Pearson no uma medida
linear; como tal, no adequado somar ou calcular a mdia de tais valores diretamente (Gries, 2009a).
Alm disso, Corey et al. (1998) defendem que a distribuio de r distorcida quando o valor absoluto
maior do que zero, o que introduz um fonte potencial de enviesamento no coeficiente de correlao.

256
Tabela 9.7 Correlaes de Pearson por fatores sociais

[
ej] [
e
j] [
e
j] [
e
j] [
e
j] [] [] [] [] R-0 R-0 R-0 CN CN 3PP |z| r
[] R-0 CN 3PP 1PP R-0 CN 3PP 1PP CN 3PP 1PP 3PP 1PP 1PP
r de Pearson: -0.04 -0.12 -0.10 0.05 -0.11 0.09 0.23 0.31 0.05 0.37 0.29 0.22 0.74 0.36 0.47 0.25
* *** *** ** * *** *** ***
Sexo/ feminino ** * ** *** *** *** 0.28
Gnero masculino * *** ** *** * 0.25
Faixa 20-34 * *** * *** * 0.28
Etria 35-59 * * * ** *** * ** 0.27
60+ ** ** *** ** *** 0.27
Nvel de Ens. Mdio * * * * *** *** *** *** 0.32
Escolaridade Ens. Superior * * *** * *** 0.20
Regio de central * * ** ** * ** *** *** *** 0.34
Residncia perifrica * ** *** ** 0.19

257
Classe A-B1 * * ** 0.22
Social B2 * ** ** *** 0.27
Anlises

C1 * ** * *** ** 0.30
C2-D * *** ** ** 0.31
Origem dos N/NE * * * * * ** 0.31
Pais interior * *** 0.22
estrangeiros * * ** *** 0.29
So Paulo * * ** ** *** ** *** 0.49
mista * * * 0.25
Mobilidade baixa ** ** *** *** *** * ** 0.38
mdia * *** * * 0.23
alta * * * *** * 0.22
*p < 0,05; **p < 0,01; ***p < 0,001. Clulas sombreadas indicam correlao significativamente mais forte do que em outro subgrupo da mesma varivel social.
Anlises

laes significativas direita, que correspondem aos pares entre as variveis


morfossintticas. A forte correlao entre CN- e 3PP- (r = 0.74***) resulta
do fato de todos os subgrupos da comunidade se comportarem de maneira
similar: quando CN- favorecido, 3PP- tambm o , e quando CN- des-
favorecido, 3PP- tambm o . Isso significa que a comunidade como um todo
concorda ainda que de maneira inconsciente que tais variantes andam
juntas, independentemente de o falante favorecer uma ou outra variante.
Outros pares tm correlaes mais fracas ou no apresentam correlao em
virtude de que nem todos os grupos demonstram o mesmo nvel de coeso
dialetal.
interessante notar que (e) e (-r), as duas variveis locais, correlacionam-se
significativamente apenas na fala de paulistanos cujos pais tambm nasce-
ram em So Paulo (r = -0.34*). Essa uma correlao negativa: falantes
que tendem a favorecer [ej] tendem a desfavorecer [], ou favorecer o mais
prototpico [R]. Diferentemente de R-0 e das variveis morfossintticas, que
esto presentes em outros dialetos do portugus brasileiro, o favorecimento
de [ej] e o desfavorecimento de [] so duas regras sociofonticas que devem
ser aprendidas localmente; desse modo, apenas os falantes mais prototpicos
na comunidade tendem a segui-las simultaneamente. O fato de que [ej] e [R]
se restringem a So Paulo e arredores tambm pode explicar por que suas
respectivas variveis no se envolvem em tantos padres de covariao quanto
o apagamento de (-r) e a concordncia de nmero.
Conforme exposto nos captulos anteriores, outra diferena entre as vari-
veis o grau de conscincia social e o discurso metalingustico dos informantes
sobre as variantes. As concordncias nominal e verbal so marcadores e
esteretipos em todo o Brasil, e suas variantes no padro so frequentemente
associadas a falantes de classes mais baixas ou pouco escolarizados. Em So
Paulo, raro encontrar falantes que no reconheam que CN-, 3PP- e 1PP-
so variantes proscritas pela norma culta (ainda que admitam utiliz-las).
Mesmo que isso no determine seu emprego ou seu evitar por parte dos
falantes, claro est que a maioria das pessoas tem conscincia de seu valor
social do ponto de vista da norma culta. As variveis fonolgicas, por sua
vez, geralmente no so classificadas como certas ou erradas. Conforme

258
Anlises

j se assinalou, a maior parte dos paulistanos no tem conscincia da varivel


(e). O retroflexo normalmente associado a falantes do interior e de regies
perifricas da cidade mas, ainda que possa ser negativamente avaliado por
alguns, geralmente no considerado errado, mas sim como o modo como
certas pessoas falam a depender de suas identidades sociais e geogrficas. O
apagamento de (-r) mais negativamente avaliado do que o retroflexo quando
empregado em substantivos e adjetivos (como em cerveja, celular ou pior),
mas a maioria dos falantes tende a empreg-lo frequentemente em verbos
do infinitivo (como em andar). A forte coeso social que se verifica para as
variveis sintticas em relao s fonolgicas pode ser consequncia de um
consenso mais generalizado sobre seu significado social.
Considerem-se agora as correlaes por fatores sociais, nas linhas da Tabela
9.7. No h nenhum grupo que se destaque por apresentar correlaes mais
fortes do que suas contrapartes em todos os pares de variveis (ver clulas
sombreadas). Quando se leva em conta a mdia dos coeficientes de correlao,
a maior parte dos grupos se equilibra. Por exemplo, a mdia de r para as
mulheres (0.28) apenas um pouco acima daquela para os homens (0.25);
por idade, os falantes das trs faixas etrias se assemelham com as mdias
0.28, 0.27 e 0.27, respectivamente.
No entanto, a diferena maior para os moradores de bairros mais centrais
(0.34) em comparao com os de regies mais perifricas (0.19), para falantes
cujos pais so paulistanos (0.49) em relao queles cujos pais migraram do
Norte/Nordeste (0.31), do interior (0.22), de outros pases (0.29) ou so de
origem mista (0.25), e para aqueles com menor mobilidade geogrfica (0.38)
em contraste com falantes que j viveram em diferentes bairros (0.23) e zonas
da cidade (0.22). Esses trs grupos de falantes so aqueles com os maiores
valores absolutos de r de Pearson e que apresentam a maior diferena em
comparao com outros grupos da mesma varivel.
Isso significa que os moradores de bairros mais centrais, aqueles cujos
pais so paulistanos e com menor mobilidade so mais coesos em seus usos
lingusticos do que outros grupos de falantes. Note-se que tais grupos no
so aqueles que demonstraram o maior nmero de correlaes significativas
com as variveis dependentes nas anlises multivariadas (diferentemente, por

259
Anlises

exemplo, de Sexo/Gnero e Nvel de Escolaridade, que foram selecionadas para


as seis variveis; ver Quadro 9.1, p. 239). Note-se tambm que covariao
significativa no implica que tais falantes tendem a empregar as mesmas
variantes para cada varivel por exemplo, concordncia padro de CN e de
3PP , mas que seus padres de uso revelam pares de variantes que coocorrem
por exemplo, seja os menino e eles come, seja os meninos e eles
comem. Em outras palavras, os falantes nesses grupos sociais se comportam
de modo semelhante no necessariamente por empregar as mesmas variantes,
mas por empregar pares de variantes mais consistentemente.
O fato de a covariao ser mais frequente para esses grupos sugere que a
coeso dialetal se relaciona intimamente com a densidade de comunicao.
Divises sociais como gnero ou faixa etria no implicam normalmente que
h uma maior quantidade de interaes com membros do mesmo grupo. Em
geral, no h motivo para imaginar que mulheres ou homens tenham mais
conversas com pessoas do mesmo sexo do que conversas mistas; de modo
semelhante, os falantes tendem a interagir com pessoas de diferentes idades
cotidianamente. possvel que certos grupos de falantes, como adolescentes
no Ensino Mdio ou idosos em um asilo, interajam substancialmente mais com
pessoas da mesma faixa etria; no entanto, tal no o caso dos falantes da
presente amostra que tm, em sua maioria, entre 20 e 70 anos. Desse modo,
no surpreendente que homens, mulheres ou falantes de diferentes faixas
etrias no sejam sociolinguisticamente mais coesos do que suas contrapartes.
Por outro lado, mais provvel que os moradores de bairros mais centrais
tenham mais chances de interagir com outros moradores da regio central,
enquanto os habitantes de bairros mais perifricos costumem interagir com
ambos os grupos diariamente. Milhes de pessoas se deslocam diariamente
para as regies mais centrais de So Paulo durante sua conhecida hora do
rush, para onde se encontra a maior parte dos trabalhos, faculdades, comrcios
e diversos servios pblicos e privados; o trajeto centro-periferia relativa-
mente menos comum. De modo semelhante, os filhos de paulistanos tm
maior probabilidade de interagir mais frequentemente com outros paulista-
nos prototpicos do que aqueles cujos pais vieram de outros lugares e cujas
redes sociais tm maior probabilidade de incluir migrantes de outras reas.

260
Sntese

Tambm vale notar que, embora Regio de Residncia e Origem dos Pais
sejam variveis ortogonais e independentes nesta amostra, elas no o so de
fato na experincia cotidiana dos falantes; muitos migrantes se estabelecem
nos bairros perifricos, o que torna o contato dialetal muito mais intenso
nessas reas do que nas regies centrais. Os moradores com baixa mobilidade
geogrfica, mais enraizados em seus bairros, tendem a estabelecer laos mais
fortes com redes locais do que os falantes com maior mobilidade, que por sua
vez entram em contato com maior variedade de normas lingusticas.
Dessa maneira, a coeso dialetal nos usos lingusticos parece ser uma
consequncia direta da frequncia com que os falantes tm a oportunidade
de interagir com outros falantes do mesmo grupo; nesse sentido, amplas
categorias sociais como Sexo/Gnero e Faixa Etria, embora importantes
para as identidades dos falantes, desempenham um papel pequeno na coeso
dialetal, j que tais divises no acarretam maior ou menor grau de interao
entre as pessoas dentre esses grupos. Em vez disso, a covariabilidade mais
propriamente promovida por outros fatores sociais, como a frequncia de
interao com os vizinhos ou com outras famlias h tempos enraizadas na
cidade.

9.4 Sntese
Este captulo descreve padres de covariao entre seis variveis presentes
no portugus paulistano. Na comparao desses padres, foram identificados
fatores lingusticos e sociais que subjazem o uso simultneo de diferentes
variantes pelos falantes. Da perspectiva de fatores internos, demonstrou-se
que a covariao promovida no apenas por similaridades estruturais entre
as variveis dependentes por exemplo, as concordncias de 3PP e de 1PP
, mas tambm por restries lingusticas mais gerais que se correlacionam
com mltiplas variveis, como a Salincia Fnica, a Posio do Sujeito e a
Animacidade. A covariao tende a ocorrer mais fortemente nos contextos
lingusticos menos marcados: formas menos salientes, sujeitos prximos e
sujeitos com trao [+humano].
Da perspectiva de fatores externos, sugere-se que a coeso social no

261
Sntese

motivada por amplas categorias sociodemogrficas como Sexo/Gnero e


Faixa Etria, mas que decorrente da densidade de comunicao: os falantes
tendem a exibir maior coeso social se interagem mais com membros do
grupo do que com no membros. Em So Paulo, Regio de Residncia,
Origem dos Pais e Mobilidade tm um papel importante na coeso dialetal.
Se a covariao consequncia da densidade de comunicao, um corolrio
disso que amostras aleatrias ou semialeatrias podem no ser o melhor
tipo de corpora para se verificar a coeso dialetal; este pode ser um dos
motivos pelos quais estudos prvios (Guy, 2013; Tagliamonte & Waters, 2011;
Thorburn, 2014) e o presente constataram que pares de variveis estratificadas
de modo semelhante quanto a condicionamentos sociais no covariam to
frequentemente ou to fortemente quanto se esperaria.
A extenso geogrfica de uma varivel se local ou mais abrangente
e o nvel geral de consenso sobre a avaliao social das variantes tambm
influenciam se a comunidade como um todo ou apenas certos subgrupos
de falantes exibem padres similares de covariao. Verificou-se que [ej] e
[], variantes de duas variveis locais, tendem a coocorrer somente na fala
de paulistanos cujos pais tambm so da cidade, mas CN- e 3PP-, duas
variantes de variveis estveis do portugus brasileiro, coocorrem em todos os
grupos sociais.
Tais consideraes estabelecem hipteses mais especficas a ser testadas em
estudos futuros. Sendo uma rea relativamente pouco explorada em trabalhos
sobre a variao e a mudana lingustica, a covariao entre pares de variveis
ainda levanta muitas questes. Anlises em comunidades de prticas (ver
Captulo 2, p. 16) ou em grupos menores de indivduos que frequentemente
interagem entre si possivelmente observaro maior coeso dialetal entre os
falantes. Novos estudos tambm devem incluir variveis sociolingusticas
que sejam tanto estruturalmente relacionadas quanto no relacionadas, dos
domnios fonolgico, morfossinttico e discursivo, a fim de explorar os limites
da covariao e gerar modelos sociolingusticos mais coerentes com a realidade
dos falantes, que empregam variantes de mltiplas variveis em seu cotidiano.

262
10
Percepes sociolingusticas e
significados sociais

Este captulo apresenta uma anlise de percepes, desenvolvida


com base na tcnica de estmulos pareados (Lambert et al., 1960),
sobre as variantes tepe e retroflexa de (-r) em coda silbica na
comunidade paulistana. O objetivo discutir mais profundamente
os mecanismos pelos quais certos significados sociais vm a se as-
sociar a usos lingusticos, atravs da tica de reaes inconscientes
por parte de ouvintes. Aps a reviso de certos trabalhos nesse
campo de estudos sociolingusticos, apresentam-se o mtodo e os
resultados. A varivel (-r) se associa a identidades geogrficas, a
graus de formalidade, de escolarizao e a classes sociais, alm
de outras dimenses que se referem ao status dos falantes. Ao
final, prope-se um mtodo para computar o campo indexical
(Eckert, 2008) de variveis, que permite interpretar de modo mais
preciso as correlaes observadas e prever significados sociais com
maior probabilidade de ser atribudos s variantes, por parte de
diferentes grupos sociais.

Os captulos anteriores demonstraram que certos padres de estratificao


social dos usos lingusticos so semelhantes para diversas variveis na comuni-
dade paulistana (captulos 4 a 7); que tais padres quanto a condicionamentos
lingusticos so reproduzidos sistematicamente na fala de todos os membros
Percepes sociolingusticas e significados sociais

da comunidade de fala (Captulo 8); e que o conhecimento desses padres


adquirido no convvio social, resultado da densidade de comunicao (Captulo
9).
De fato, nos ltimos 50 anos, muitos desses padres foram verificados em
diferentes comunidades nos estudos variacionistas (ver, p.ex., Labov 2001b).
Sua grande maioria certamente se concentra em anlises de produo, sobre
amostras da fala espontnea ou semiespontnea dos informantes (Campbell-
Kibler, 2006, 2009, 2010b; Thomas, 2002; Labov, 2006 [1966]). Entretanto,
uma viso mais abrangente da variao lingustica tambm deve abarcar o
modo como diferentes variantes so ouvidas e processadas pelos membros de
uma comunidade (Campbell-Kibler, 2006), algo que tem sido relativamente
menos explorado nos estudos variacionistas.
bastante razovel aventar a hiptese de que, do mesmo modo como
os usos lingusticos so heterogneos, a percepo sobre variantes tampouco
homognea e que, ademais, deve ser socialmente estratificada. Uma tal
hiptese, portanto, prev que as percepes de diferentes membros de uma
comunidade no necessariamente coincidem entre si, mas ao mesmo tempo
no so aleatrias ou radicalmente subjetivas. sobre tal hiptese que se
debrua o presente captulo.
O discurso metalingustico dos informantes quanto s variantes [ej], []
e CN- foi examinado nos captulos 4 a 6. J nessas anlises foi possvel
perceber que o discurso dos falantes sobre uma mesma variante no ho-
mogneo, mas ainda assim certas noes so recorrentes. Ao mesmo tempo,
notou-se que mesmo variveis sobre as quais os falantes no detm um meta-
discurso elaborado, como a pronncia de (e), tambm esto sujeitas a forte
estratificao social.
Em razo de serem por vezes contraditrios ou incompletos, o valor in-
formativo de tais comentrios nem sempre pode ser tomado como evidncia
direta de processos lingusticos. Aquilo que um informante diz sobre certas
variantes no necessariamente reflete seus prprios usos lingusticos ou de
determinados grupos sociais caso contrrio, o linguista certamente pres-
cindiria de todo o aparato de coleta e de anlise de dados, j que bastaria
consultar certos informantes sobre o que pensam a respeito de determinadas

264
Percepes sociolingusticas e significados sociais

variantes. Conforme assinala o Captulo 2 (p. 32), o presente estudo faz uma
distino conceitual entre avaliao e percepo lingustica; as anlises do
presente captulo dizem respeito a inferncias feitas pelos usurios de uma
lngua ao ouvir outro falante, que podem ou no ser conscientes e que,
portanto, podem no ser objeto de comentrio metalingustico.
A habilidade de realizar inferncias ao ouvir uma pessoa to automtica
que muitas vezes passa despercebida. Como exemplifica Guy (Ms.), ao ouvir
uma voz no corredor, na rua ou atrs de algum no metr, imediatamente se
tem uma impresso do falante, mesmo sem um estmulo visual. Sem qualquer
esforo consciente, possvel imaginar o falante como homem ou mulher,
jovem ou velho, saudvel ou doente, mano ou playboy etc. Independentemente
de essas inferncias estarem corretas ou no, tais impresses provavelmente
tm um papel no modo como os membros da comunidade se relacionam e se
comunicam entre si. Determinar quais informaes contextuais so recolhidas
pelo ouvinte e como se do tais inferncias o principal desafio metodolgico
para a modelagem de percepes sociolingusticas, uma vez que qualquer
evento de fala vem acompanhado de uma mirade de variveis: o contedo da
mensagem, a qualidade da voz e o ritmo de fala, fatores suprassegmentais,
emprego simultneo de mltiplas variveis fonticas, morfolgicas, sintticas,
sem contar inmeros outros fatores situacionais ou sociais que variam de caso
a caso.
Este captulo examina especificamente o efeito das variantes tepe e re-
troflexa nas percepes de ouvintes moradores da cidade de So Paulo e
prope um modelo de como certos significados sociais vm a se associar a
usos lingusticos. A varivel foi escolhida por ser uma das mais salientes no
portugus brasileiro e por ter apresentado forte estratificao social no portu-
gus paulistano quanto Regio de Residncia, Classe Social e Sexo/Gnero
dos falantes (ver Captulo 5). As tendncias divergentes entre moradores de
diferentes regies e classes sociais levantam a questo sobre como as variantes
de (-r) so percebidas por diferentes grupos, o que pode conduzir a um melhor
entendimento dos movimentos verificados na comunidade.
A prxima seo faz uma breve sntese de uma seleo de trabalhos sobre
percepes. Em seguida, descreve-se o mtodo empregado no presente estudo,

265
O estudo de percepes sociolingusticas

a saber, a tcnica de estmulos pareados (Lambert et al., 1960). A descrio dos


resultados na seo 10.3 retoma uma anlise preliminar (Mendes & Oushiro,
2011a) e avana na discusso sobre as associaes feitas pelos moradores de
So Paulo com as variantes de (-r) em coda silbica. O captulo se conclui
com um resumo dos resultados e suas consequncias para a modelagem do
conhecimento lingustico dos falantes de uma comunidade de fala.

10.1 O estudo de percepes sociolingusticas


Ainda que, da perspectiva dos estudos variacionistas, o nmero de trabalhos
sobre percepes seja bastante reduzido em relao queles sobre produo,
existe um campo j bastante bem constitudo e prolfico a respeito de atitudes
lingusticas, interdisciplinar com a Psicologia Social, no qual se podem incluir
os trabalhos sobre percepo. Conforme se apontou acima, esta seo no
pretende realizar uma extensa reviso bibliogrfica de tais trabalhos (para
tanto, recomendam-se Thomas 2002; Giles & Billings 2004; Campbell-Kibler
2006, 2010b; Garrett 2010); o intuito aqui o de retomar alguns estudos que
demonstram a variabilidade e a sistematicidade de percepes, bem como
algumas generalizaes j traadas, a partir das quais se levantam as hipteses
especficas deste estudo.
O trabalho de Pear (1931, apud Giles & Billings 2004 : 188; Campbell-
Kibler 2006 : 12, 64) considerado pioneiro nessa rea. O autor pediu que
ouvintes da BBC fornecessem perfis sobre a personalidade de diversas vozes
escutadas na rdio, que foram ento comparadas com os perfis fornecidos
por pessoas prximas dos falantes, que os conheciam pessoalmente. De modo
geral, Pear constatou que as descries dos ouvintes tinham pouco em comum
com os perfis traados pelas pessoas que conviviam com os falantes, de modo
que impresses baseadas apenas na voz podem diferir bastante das percepes
que englobam o convvio social. No entanto, apesar dessas diferenas, o autor
constatou que havia um amplo consenso dos ouvintes a respeito dos traos
estereotpicos que foram associados a cada voz. Por um lado, o trabalho de
Pear pode ser considerado um fracasso na tentativa de inferir a verdadeira
personalidade dos falantes (Campbell-Kibler, 2006); por outro, contudo, abre

266
O estudo de percepes sociolingusticas

caminho para investigar o poder dos esteretipos na organizao social, ao


demonstrar a consistncia das impresses reportadas pelos ouvintes.
A partir da dcada de 1960, os estudos sobre percepo adquiriram uma
valiosa ferramenta metodolgica, a tcnica de estmulos pareados,1 desen-
volvida por Lambert et al. (1960). Com base na premissa de que reaes
abertas fornecidas por ouvintes podem no refletir suas opinies pessoais, a
tcnica busca a eliciao de atitudes subjetivas e encobertas a respeito de
diferentes variedades ou lnguas. Nesse estudo, Lambert et al. (1960) analisam
as reaes ao ingls e ao francs na cidade de Montreal (Canad). Os autores
gravaram previamente quatro falantes bilngues, que leram um mesmo texto
de natureza filosfica nas duas lnguas (escrito originalmente em francs e
traduzido para o ingls). A essas oito leituras, os autores adicionaram mais
duas gravaes como distratoras. Tais gravaes foram ento apresentadas a
130 ouvintes, estudantes universitrios de duas universidades de Montreal,
distribudos equilibradamente entre anglfonos e francfonos. Para cada
um dos 10 estmulos, os sujeitos deveriam julgar2 os falantes quanto a 14
caractersticas pessoais, organizadas em escalas de seis pontos (de muito
pouco a bastante): altura, boa aparncia fsica, liderana, senso de humor,
inteligncia, religiosidade, autoconfiana, confiabilidade, jovialidade, bondade,
ambio, sociabilidade, carter e simpatia. Fundamental para a anlise foi a
crena dos participantes de que ouviam 10 falantes distintos, sobre os quais
os julgamentos, em princpio, so independentes uns dos outros. O objetivo
dos autores, entretanto, foi o de comparar se os mesmos quatro falantes
seriam caracterizados diferentemente a depender da lngua do estmulo, ingls
ou francs. Como o contedo das mensagens e a qualidade da voz foram
controlados no experimento, a lgica por trs da tcnica que eventuais
diferenas na caracterizao dos falantes possam ser atribudas a diferentes
1
Traduo para matched-guise technique (MGT). De conhecimento pessoal, tais estudos so bastante
escassos na lingustica brasileira. Outras metodologias de investigao de atitudes lingusticas incluem
a Dialetologia Perceptual (ver, p.ex., Preston 1999; Long & Preston 2002) e o Teste de Associao
Implcita (ver, p.ex., Campbell-Kibler 2012), que no sero tratadas aqui.
2
Lambert et al. (1960) usam os termos evaluate/evaluation para fazer referncia aos valores as-
sinalados nas escalas semnticas por parte dos ouvintes. Como a presente tese traa uma distino
conceitual entre avaliao e percepo, aqui se empregam os termos julgar/julgamento para
que tal distino seja mantida. Este termo, evidentemente, no deve ser entendido em sua acepo
jurdica, mas sim no sentido de apreciao, juzo ou parecer.

267
O estudo de percepes sociolingusticas

atitudes quanto lngua empregada, e no ao falante em si.


Os resultados indicaram que os ouvintes anglfonos perceberam os est-
mulos em ingls mais favoravelmente do que os estmulos em francs em sete
caractersticas (altura, boa aparncia, inteligncia, confiabilidade, bondade,
ambio e carter), e os estmulos em francs foram julgados mais positi-
vamente do que aqueles em ingls quanto ao senso de humor. Por outro
lado, os ouvintes francfonos no reverteram tais julgamentos em favor de
sua prpria lngua, mas, de modo semelhante aos sujeitos de fala inglesa,
julgaram os estmulos em ingls mais favoravelmente em 10 caractersticas
(as mesmas sete dos ouvintes anglfonos exceto bondade, alm de liderana,
autoconfiana, sociabilidade e simpatia) e os estmulos em francs mais favo-
ravelmente quanto a religiosidade e bondade. Em resumo, ambos os grupos
de ouvintes julgaram os estmulos em ingls mais favoravelmente, sobretudo
em relao a caractersticas relacionadas a sucesso socioeconmico, como
liderana, ambio e aparncia. A concluso dos autores ressalta a influncia
de esteretipos sobre o ingls e o francs na comunidade como um todo, que
afetam os falantes de ambas as lnguas.
Desde ento, a tcnica de estmulos pareados tem sido aplicada e apurada
em uma srie de outros estudos. Giles & Billings (2004) a avaliam como
um mtodo rigoroso e elegante que, ao controlar uma srie de variveis com
a criao de estmulos comparveis, permite investigar apropriadamente o
papel da linguagem na formao de impresses e julgamentos sociais. A
ttulo de exemplificao,3 a tcnica permitiu demonstrar que diferentes va-
riedades lingusticas tm influncia na discriminao a potenciais locatrios
de imveis (falantes de variedades chicanas e de ingls afro-americano tm
menor preferncia do que falantes de ingls padro dos brancos Purnell;
Idsardi; Baugh 1999); na avaliao de professores sobre a perfrmance escolar
de crianas (falantes de variedades no padro tendem a receber notas mais
baixas Seligman, Tucker & Lambert 1972; Choy & Dodd 1976); no julga-
mento de culpabilidade quanto a diferentes tipos de crimes cometidos (crimes
do colarinho branco se associam a falantes de variedades padro e crimes
violentos se relacionam com falantes de variedades no padro Seggie 1983);
3
Todas as referncias neste pargrafo foram extradas de Giles & Billings (2004).

268
O estudo de percepes sociolingusticas

na seleo de candidatos em entrevistas para diferentes tipos de trabalho


(Hopper & Williams 1973.) Tais estudos certamente levantam um grave alerta
sobre processos de deciso social que permeiam o cotidiano das pessoas.
Por outro lado, os falantes de variedades no padro tendem a ser julgados
mais positivamente em caractersticas que se relacionam a solidariedade,
integridade, benevolncia e dinamismo (Giles & Billings, 2004). Atualmente,
no campo de estudos sobre atitudes lingusticas, prtica comum distinguir
os traos avaliativos nas dimenses de status (p.ex., confiante, ambicioso),
solidariedade (p.ex., generoso, amigvel) e dinamismo (p.ex., ativo, animado).
Os estudos de percepo de cunho variacionista, em geral, deslocaram o
interesse sobre diferentes lnguas ou variedades lingusticas, como nos estudos
supracitados, para o papel de variantes especficas na formao de impresses
sociais (Thomas, 2002).
Um dos primeiros trabalhos nesse sentido foi o de Labov (2006 [1966]) em
seu abrangente estudo sobre o ingls de Nova Iorque. Aps observar que a
variao lingustica fortemente estruturada pelo grau de formalidade (estilo)
e pela classe social dos falantes, e que a escala de formalidade se relaciona com
status social, Labov (2006 [1966]) projetou seu experimento de percepo que
denominou de reaes subjetivas a fim de confirmar e validar os resultados
sobre produo lingustica. Em seu experimento, o autor obteve verses de
leituras por cinco falantes do sexo feminino de um texto com cinco pargrafos,
cada qual com concentrao das variveis de seu estudo: no primeiro, nenhuma
varivel; no segundo, (O); no terceiro, (E); no quarto, (r); e no quinto, (T) e ().
Selecionou-se ento uma sentena por pargrafo que continha variantes de
interesse. Os ouvintes (112 novaiorquinos de diferentes idades, sexos, classes
socioeconmicas e etnias) foram instrudos a se imaginar na posio de um
gerente que est entrevistando candidatos a emprego em uma grande empresa;
para cada estmulo, deveriam preencher um questionrio com uma escala
de adequao ocupacional com as seguintes opes: personalidade televisiva,
secretria executiva, recepcionista, operadora de telefone, vendedora, operria
de fbrica, nenhuma das anteriores. A escolha de determinada ocupao
implicava que a falante poderia desempenhar aquele emprego ou qualquer
outro abaixo na escala. Os resultados indicaram que as variantes favorecidas

269
O estudo de percepes sociolingusticas

pelas classes sociais mais privilegiadas recebem julgamentos mais altos na


escala de adequao ocupacional do que as variantes favorecidas pelos falantes
de status socioeconmico mais baixo. Tal correlao se replica em todas as
classes sociais e grupos tnicos. Diante desses resultados, Labov conclui que
a estratificao social do ingls de Nova Iorque profundamente arraigada na
comunidade, sendo reconhecida por todos os seus membros.
Mais recentemente, Labov et al. (2011) mostraram que os ouvintes so
sensveis no apenas ao emprego de diferentes variantes em seus julgamentos
de adequao ocupacional (nesse estudo, uma escala de sete pontos para
um candidato a apresentador de TV), mas tambm a diferentes taxas de
emprego de uma variante em um trecho de fala. Os autores manipularam
digitalmente uma mesma gravao que continha 10 sentenas com (ING)
(como em confirming confirmando) para produzir diferentes estmulos com
0%, 10%, 20%, 30%, 50%, 70% e 100% de ocorrncias de /in/ e /i/. Os
sujeitos discriminaram diferenas to pequenas quanto 10% de emprego das
variantes da varivel. Contudo, a sensibilidade diminui medida que as
frequncias aumentam e a relao quanto mais /in/, menor adequao
ao cargo de apresentador de TV se caracteriza mais propriamente por
uma funo logartmica do que por uma funo linear. Os autores tambm
observaram diferenas de percepo de acordo com o gnero do ouvinte nos
estados da Pensilvnia e de New Hampshire (mas no no estado meridional
da Carolina do Sul), uma vez que as ouvintes mulheres demonstraram reaes
mais negativas a desvios da norma-padro do que os homens. Tal diferena,
no entanto, mais quantitativa do que qualitativa: embora os julgamentos das
mulheres tenham sido em mdia mais baixos em relao aos mesmos estmulos,
a relao logartmica se manteve em ambos os sexos. Por outro lado, tambm
se verificaram diferenas de percepo quanto idade do ouvinte; apesar de
a funo logartmica descrever bem os padres dos adultos, os adolescentes
parecem se pautar por uma funo linear entre taxas de /in/ e a escala de
adequao ocupacional. Tal estudo evidencia que o consenso da comunidade
sobre o valor social de variantes no isento de variabilidade interna.
Campbell-Kibler (2006, 2009) analisou a variao em percepes sobre
a varivel (ING) atravs da tcnica de estmulos pareados, com enfoque

270
O estudo de percepes sociolingusticas

sobre o significado social das variantes e o papel de fatores contextuais


na formao de impresses e julgamentos dos ouvintes. A varivel (ING),
com efeito, uma das mais estudadas na lngua inglesa, e se correlaciona
consistentemente com classe socioeconmica, formalidade e origem do falante
(a variante /in/ associada s classes mais baixas, informalidade e ao sul
dos EUA). Seu experimento incorpora uma srie de inovaes metodolgicas
de estudos prvios: a utilizao de conversas naturais em vez de leituras
para a criao de estmulos; a manipulao digital de gravaes para obter
estmulos pareados; a conduo de entrevistas abertas antes da aplicao de
questionrios, a fim de determinar que tipos de reaes surgem naturalmente
ao se escutarem as gravaes; e a coleta de questionrios via redes sociais
na Internet. Os estmulos pareados foram criados a partir de trechos de
gravaes com oito falantes, estratificados por sexo/gnero e regio de origem
(Califrnia e sul dos EUA). Os resultados indicam que os falantes tendem a ser
julgados como menos inteligentes nos estmulos com /in/, mas apenas quando
percebidos como no sendo de uma regio especfica e no pertencentes
classe trabalhadora. Nas palavras da autora, esses falantes so prova de
bala contra os efeitos de (ING). Os falantes do sul dos EUA (identificados
por outras caractersticas como a monotongao de (aj), como em time
tempo), no so percebidos diferentemente quanto inteligncia ou ao nvel
de escolaridade de acordo com o uso de /in/ ou /i/. A autora conclui que os
mltiplos significados sociais da varivel nvel de escolaridade, eloquncia,
formalidade, regio, rural/urbano dependem de fatores contextuais, como
o contedo da mensagem e qualidades pessoais atribudas ao falante pelos
ouvintes. Embora as correlaes globais se assemelhem a resultados de estudos
prvios de produo lingustica, Campbell-Kibler enfatiza que as percepes
no se alteram uniformemente para todos os falantes e para todos os estmulos,
pois interagem com outras percepes que bloqueiam certas inferncias.
Em um estudo subsequente, Campbell-Kibler (2010a) utilizou os mesmos
estmulos e controlou, adicionalmente, o modo como os falantes foram apresen-
tados aos ouvintes: como professores universitrios, profissionais experientes
ou candidatos polticos. Quando acadmicos, os falantes foram percebidos
como mais competentes nos estmulos com /i/ do que com /in/; entretanto,

271
O estudo de percepes sociolingusticas

quando apresentados como profissionais, a percepo da competncia foi


privilegiada nos estmulos com /in/ em vez de /i/. A incluso do contexto
candidato poltico se baseou na hiptese de que os falantes seriam percebidos
como de esquerda nos estmulos com /i/, o que, contudo, no se confirmou
nos resultados.
O estudo de Campbell-Kibler (2010a) dialoga diretamente com o trabalho
prvio de Niedzielski (1999), que havia demonstrado o papel de informaes
sociais na percepo dos ouvintes sobre variveis sociolingusticas. Nesse
estudo, os sujeitos, nativos da cidade norte-americana de Detroit, ouviram
vogais isoladas e foram instrudos a escolher qual de seis vogais sintetizadas
mais se aproximava da que haviam escutado. Ainda que todos os estmulos
tenham sido extrados da fala de habitantes da mesma cidade, metade dos
ouvintes recebeu um formulrio com Detroit no cabealho, e a outra metade
com Windsor, Ontario, cidade vizinha no Canad. O segundo grupo
apresentou a tendncia de classificar as vogais como mais aladas do que os
sujeitos na condio Detroit, refletindo o esteretipo de que os canadenses
empregam a variante [@w] em vez de [aw] em palavras como house casa.
Alm disso, os ouvintes com o formulrio Detroit perceberam as vogais
que atualmente participam da Mudana Voclica das Cidades do Norte,
como o fronteamento e alamento de /A/ em pop refrigerante, como mais
prximas do que pode ser considerado ingls padro norte-americano do que
nas variantes em que realmente foram apresentadas. Niedzielski (1999) conclui
que os ouvintes de Detroit no escutam o alamento canadense em sua prpria
variedade e representam seu espao voclico de modo semelhante quilo que
pode ser considerado ingls padro.
Campbell-Kibler (2010a) e Niedzielski (1999) ilustram como a prpria
apresentao dos estmulos pode influenciar as respostas dos ouvintes aos
questionrios. Um exemplo ainda mais extremo o estudo de Hay & Dra-
ger (2010), com desenho experimental semelhante ao de Niedzielski (1999),
que descrevem que a mera visualizao de bichos de pelcia associados s
nacionalidades australiana (cangurus e coalas) ou neozelandesa (pssaros
kiwi) alterou a percepo dos sujeitos quanto altura e centralizao de
vogais dos estmulos utilizados em seu trabalho. Do ponto de vista metodol-

272
O estudo de percepes sociolingusticas

gico, tais estudos lembram a importncia do controle rigoroso das condies


experimentais.
Por fim, o trabalho de Mendes (no prelo) a respeito de percepes so-
bre a varivel (CN) na cidade de So Paulo de grande interesse para a
presente pesquisa tanto pela varivel quanto pela comunidade. Tambm
com base na tcnica de estmulos pareados, Mendes analisou a variao nas
percepes sobre quatro falantes do sexo masculino, dois heterossexuais (que
soavam masculinos) e dois gays (que soavam efeminados), quanto ao em-
prego das formas padro e no padro de concordncia nominal (como em
os meninos/menino-). Seu principal interesse era investigar o impacto
da varivel sobre percepes de masculinidade dos falantes, bem como se
haveria diferenas de percepo a depender do sexo do ouvinte. Os resultados
mostraram que os falantes foram percebidos como menos escolarizados, menos
efeminados, menos formais, menos inteligentes e como membros de classe
social mais baixa nos estmulos com concordncia no padro. Para todos os
falantes e para ambos os sexos de ouvintes, a dimenso de escolaridade foi a
mais relevante, no sentido de que foi aquela em que as percepes foram mais
substancialmente divergentes a depender da variante escutada. Entretanto,
Mendes assinala que, enquanto as escalas de inteligncia e classe social vm
logo em seguida na hierarquia de importncia para as ouvintes mulheres,
para os homens, a escala de efeminidade ganha destaque. A marca zero de
(CN) parece significar masculinidade para os ouvintes homens, enquanto
tal significado preterido em favor de menor inteligncia e classe social
mais baixa entre as mulheres. Esse resultado potencialmente sinaliza que
ouvintes de diferentes perfis podem atribuir maior ou menor importncia a
certos significados sociais das variantes.
Da dcada de 1960 at o presente, parece ter havido um deslocamento no
foco de anlise e na interpretao de resultados, de estudos que enfatizam o
consenso das percepes entre os ouvintes (como Pear 1931, apud Giles &
Billings 2004, Lambert et al. 1960 e Labov 2006 [1966]) para estudos que
informam que as percepes podem no se distribuir uniformemente de acordo
com as caractersticas dos falantes, o contedo da mensagem ou as condies
do experimento (como Niedzielski 1999, Campbell-Kibler 2006, 2009, 2010a e

273
Mtodos

Hay & Drager 2010), ou de acordo com as caractersticas dos ouvintes que
pertencem a diferentes comunidades ou grupos sociais (como Labov et al.
2011 e Mendes no prelo). Essas questes tambm se fazem presentes neste
estudo.

10.2 Mtodos
Os mtodos aqui empregados se baseiam no estudo de Campbell-Kibler
(2006). O experimento pode ser esquematicamente dividido em trs partes:
(i) preparao de estmulos pareados a partir de trechos de fala natural; (ii)
realizao de entrevistas abertas de percepo; (iii) formulao e aplicao
de questionrios cujas respostas possam ser quantificadas.

10.2.1 Preparao dos estmulos


Na preparao do experimento, quatro falantes paulistanos foram gravados
em entrevistas sociolingusticas individuais de cerca de 30 minutos cada,
especificamente para esse fim (no se referem, portanto, amostra de 118
entrevistas das anlises de produo). Trata-se de dois homens (M) e duas
mulheres (F), todos com cerca de 30 anos de idade, com nvel superior de
escolaridade e residentes na Zona Oeste da cidade de So Paulo. A amostra
relativamente homognea de falantes quanto ao perfil social, exceto por seu
sexo/gnero, teve o objetivo de minimizar o efeito de outras variveis alm
do (-r) em coda silbica.
A opo por excertos de fala natural em vez de leituras de um mesmo
texto escrito tem a vantagem de criar impresses mais ricas nos ouvintes, que
percebem os falantes como pessoas reais, dotadas de histria e personali-
dade prpria, e no apenas como falantes que se dispuseram a participar de
uma pesquisa (ver prxima subseo). A disponibilidade de ferramentas de
manipulao de arquivos digitais contribui para esse fim; hoje no mais
necessrio depender da habilidade dos falantes em manter o mesmo ritmo
de fala, altura de voz, prosdia etc. por longos trechos de gravao para
que se obtenham estmulos devidamente controlados (Campbell-Kibler, 2006;

274
Mtodos

Thomas, 2002).
Dessas entrevistas, foram selecionados trechos curtos, de 15 a 20 segundos
de durao, cada qual com 4 a 7 ocorrncias de (-r) em coda silbica, negritadas
e sublinhadas nos excertos transcritos em (1)(4).4

(1) T: R: Falante 1 (M): mas a voc tem aqueles outros aspectos meio
meio... bizarros n que nem a questo do passaporte interno... ahn... (D1:
ahn) se voc do interior... (vo)c no pode i(r) pra capital... sem a ordem
do governo... (D1: ahn) se voc no tive(r)... eh (vo)c ainda- / o que
que o pessoal faz? eles pula(m) a fronteira faz(em) que nem no Mxico

(2) T: R: Falante 2 (F): e brincava muito assim de Barbie sabe? e


brincava muito sozinha tambm mesmo quando eu no tinha as amiguinhas
eu brincava... (D1: (vo)c no tem irmos?) sozinha... tenho uma irm
mais nova cinco anos... ento nessa poca da infncia no dava pra brinca(r)
n com ela era muito diferente... porque assim (de/)... na adolescncia at
quando ela tinha vai quinze eu tinha vinte at dava pra conversa(r) e tal
hoje em dia d pra... sai(r) com ela normalmente...

(3) T: R: Falante 3 (M): O BG era meio que um... quartel de elite... n...
a gente tinha muito acampamento... e a gente tinha horas e horas todo
dia de ordem unida... (D1: ahn) ordem unida marcha(r)... esquerda
volve(r) direita volver... (D1: uhum) (n) eu odiava... eu odiava... com
toda minha fora

(4) T: R: Falante 4 (F): ah a gente tinha... diversas atividades n... tipo...


coleta de jornal... eh entrega pra reciclagem... eh organizao de bazar... e
ah e tinha os... os acampamentos n... que era bem legal assim

Aps a gravao inicial, os falantes foram informados dos propsitos do


experimento, para com os quais concordaram que suas vozes fossem utilizadas.
Novas gravaes foram ento realizadas, em condies to semelhantes quanto
da gravao original em especial, o mesmo ambiente e o mesmo horrio,
para que os rudos de fundo fossem compatveis.5 O intuito da segunda
gravao foi o de obter produes controladas das instncias de (-r) em coda
silbica como tepe ou como retroflexo. Os falantes ouviram cada palavra-alvo
dentro de trechos mais curtos (por exemplo, que nem a questo do passaporte
4
Note-se que os casos de apagamento de (-r), todos referentes a morfemas de infinitivo, no foram
considerados.
5
Apesar de os informantes serem gravados com microfones, a existncia de rudos foi inevitvel; preferiu-
se no grav-los em ambientes acusticamente isolados a fim de que a conversa fosse mais natural.

275
Mtodos

interno, se voc do interior..., sem a ordem do governo) e a eles se


pediu que tentassem reproduzir a gravao original do modo mais fiel possvel
mesma entonao, pitch, durao de segmentos, altura de voz etc. , com
exceo da pronncia de (-r), que deveria ser realizada como uma das variantes.
Cada frase foi repetida mltiplas vezes tanto com tepe quanto com retroflexo,
at que se chegasse a uma ou duas produes que parecessem ter sido claras
quanto variante empregada e bastante semelhantes ao original nos demais
aspectos fonticos. Dessas novas realizaes, selecionaram-se, para cada
palavra de cada gravao, uma instncia de tepe e uma instncia de retroflexo
que mais se aproximavam da gravao original em termos de durao, altura,
pitch etc.6 As produes controladas de (-r) em coda silbica foram ento
substitudas nas gravaes originais, atravs dos comandos copiar/colar do
programa Praat (Boersma & Weenink, 2014), para a criao de oito estmulos
controlados, um par para cada falante: um estmulo apenas com tepes, e outro
apenas com retroflexos. Os estmulos em cada par, portanto, so idnticos
entre si em todos os aspectos exceto pela pronncia de (-r) em coda silbica,
uma vez que foram produzidos a partir de uma mesma gravao original.
Os oito estmulos foram separados em dois grupos, cada qual com um
estmulo de cada falante, conforme a distribuio do Quadro 10.1. Doravante,
a referncia a cada um dos estmulos ser feita pela identificao do falante e
da variante empregada (p.ex., 1.t, 3.r etc.).

Grupo A Grupo B
Falante 1 (M) tepe (1.t) retroflexo (1.r)
Falante 2 (F) retroflexo (2.r) tepe (2.t)
Falante 3 (M) retroflexo (3.r) tepe (3.t)
Falante 4 (F) tepe (4.t) retroflexo (4.r)

Quadro 10.1 Distribuio dos estmulos de (-r) em dois grupos

6
Tal procedimento se faz necessrio para garantir a naturalidade dos estmulos criados: diferenas entre
a gravao original e as produes controladas quanto durao, altura de voz ou pitch, e mesmo
de rudos no ambiente, dificultam a criao de estmulos, uma vez que essas diferenas se tornam
perceptveis ao se manipular a gravao original. Os estmulos finais foram ouvidos por cinco pessoas,
antes da fase de entrevistas abertas, para verificar sua naturalidade.

276
Mtodos

10.2.2 Realizao de entrevistas abertas de percepo


A fase seguinte teve o objetivo de fazer um levantamento dos tipos de percep-
es que surgiam a partir dos estmulos criados. As consultas so chamadas
abertas porque no tinham um roteiro pr-definido: aos ouvintes consultados
(10 na fase piloto e mais 20 na continuao da pesquisa), fizeram-se perguntas
bastante gerais (p.ex., Como voc imagina essa pessoa que est falando?
Como ela fisicamente? Qual a personalidade dela? Onde voc acha que ela
vive?), com o objetivo de deix-los discorrer sobre suas impresses, pedindo
posteriormente alguns detalhamentos (Por que voc tem essa percepo?
Voc poderia me apontar o que exatamente na fala dessa pessoa causou essa
impresso?). Alguns exemplos de reaes dos ouvintes se encontram em
(5)(9):

(5) Jos: ele [1.t] parece que (es)t dando uma aula... eu imagino assim um
um professor universitrio tipo- algum dando uma palestra...

(6) Antnio: meu muito paty essa mina! [2.t] [risos] a patricinha de Higien-
polis! 7 (D1: [risos] ah ? por que voc acha...?) ah tipo ela brin-/ brincava
de Barbie... no tinha amigos... parece aquelas menininha meio riquinha...
fresquinha...

(7) Joana: [risos] eu acho ela... [2.r] maloqueira... maloqueirona assim... no


sei... eu acho que ela da zona leste... bem... bem suburbana...

(8) Marcos: ele [3.t] deve se(r) um nego tipo armrio!... trs por quatro!...
[risos] mas no sei onde ele mora... po- poderia se(r) qualquer lugar de So
Paulo

(9) Mariana: ela [4.r] uma pessoa tmida mais recatada... diferente da outra...
[2.t] deve ter crescido em apartamento... ou... no sei ela pode ser do
interior

Os informantes tiveram pouca dificuldade em visualizar uma situao em que


tais eventos de fala poderiam ter ocorrido e em atribuir caractersticas pessoais
aos falantes. certo que tais consideraes muitas vezes vm cercadas de
modalizadores (eu acho, deve, poderia, no sei etc.), que revelam
a hesitao dos ouvintes em fazer afirmaes taxativas quanto aos falantes,
7
Bairro de classe mdia-alta da cidade de So Paulo.

277
Mtodos

mas a riqueza das descries chega a ser impressionante, considerando-se


que se baseiam em curtos trechos de fala: professor universitrio dando
palestra, patricinha, residente de Higienpolis, riquinha, fresquinha,
maloqueirona, zona leste, suburbana, nego trs por quatro, tmida,
recatada, cresceu em apartamento, interior.
Aps ouvir quatro estmulos (do grupo A ou do grupo B; ver Quadro
10.1), nessa fase do experimento os ouvintes tambm escutaram os respectivos
pares de gravao (portanto, o grupo alternativo de estmulos), para verificar
que tipos de contrastes poderiam surgir entre cada par. A maioria apontou
explicitamente as diferentes pronncias de (-r) em coda silbica, o que refora o
argumento de que se trata de uma varivel saliente na comunidade paulistana.
Ao comentar abertamente suas avaliaes acerca das variantes tepe e retroflexa,
surgiram no apenas noes como paulistano(a) e caipira/do interior (do
estado de So Paulo), mas tambm caractersticas como de classe social
mais alta, mais educado(a)/escolarizado(a), patricinha/mauricinho e
metido(a), associadas primeira, e caractersticas como trabalhador(a),
honesto(a), mano/mina, maloqueiro(a), associadas segunda.8
interessante notar que a mesma Falante 2 foi caracterizada tanto como
paty de Higienpolis (6) quanto como maloqueira da zona leste (7) em
estmulos que diferiam quanto pronncia de (-r). A fim de discernir se tais
consideraes podem ser atribudas especificamente a essa varivel lingustica
ou, alternativamente, a idiossincrasias dos ouvintes, a seu perfil social ou a
outras tantas variveis possveis, a quantificao desses julgamentos se torna
fundamental.

10.2.3 Formulao e aplicao de questionrios


As percepes e avaliaes que surgiram mais recorrentemente nas entre-
vistas abertas a respeito dos quatro falantes foram sistematizadas em um
questionrio de percepo (ver Anexo D, p. 367), que inclui 10 variveis
contnuas/quantitativas, em escalas de diferenciais semnticos de cinco pontos
8
Como se v nos exemplos (5)(9), algumas dessas noes surgiram antes mesmo que fosse feito o
contraste explcito entre variantes.

278
Mtodos

(10);9 quatro variveis discretas/qualitativas (11); e 30 caixas de seleo com


caractersticas pessoais (12).

(10) Variveis quantitativas

Para voc, essa pessoa parece...


(Escolha uma opo em cada linha)
Pouco Bastante
Extrovertida     
Escolarizada     
Masculina/Feminina     
Inteligente     
Formal     
Amigvel     
Paulistana     
Ter sotaque     
Ter amigos     

Essa pessoa deve morar num...


(Escolha uma opo)

Bairro mais perifrico Bairro mais central


    

(11) Variveis qualitativas

Em que zona da cidade essa pessoa deve morar?


 Norte
 Sul
 Leste
 Oeste
 Centro
 No sei

Voc acha que esta pessoa est em que faixa etria?


 Na adolescncia
 20 e poucos anos
 Por volta dos 30
 Por volta dos 40
9
O termo Masculino era apresentado nos formulrios de falantes homens e Feminino nos formulrios
de falantes mulheres.

279
Mtodos

Voc acha que esta pessoa estudou...


 At o Ensino Fundamental I
 At o Ensino Fundamental II
 At o Ensino Mdio
 At o Curso Superior
 At a Ps-graduao

Voc acha que esta pessoa pertence ...


 Classe baixa
 Classe mdia baixa
 Classe mdia
 Classe mdia alta
 Classe alta

Para as caixas de seleo, pergunta de resposta no obrigatria, os ouvintes


tinham a opo de marcar todas as caractersticas que acreditassem se aplicar
ao falante.

(12) Caixas de seleo

Do que voc ouviu, voc acha que essa pessoa deve ser...
(Assinale todas que achar pertinente)

 Alta  Confivel  Sincera


 Branca  Simples  Gay/Lsbica
 Tmida  Trabalhadora  Mimada
 Descolada  Confiante  Conservadora
 Maconheira  Solidria  Caipira
 Religiosa  Prtica  Deprimida
 Ligada Famlia  Preguiosa  Nerd
 Articulada  Mal-educada  Sofisticada
 Irritante  Engraada  Independente
 Metida  Desencanada  Patricinha/Mauricinho

Para cada falante, os ouvintes tinham a opo de descrever outras im-


presses que no constavam nas questes do formulrio e, ao final, fazer
comentrios e sugestes adicionais quanto ao questionrio como um todo.
Na ltima parte, pedia-se ao sujeito que fornecesse as seguintes informaes
pessoais para fins de tabulao estatstica:

280
Mtodos

(13) Dados pessoais

Por fim, por favor, fale-me um pouco sobre voc:


Sexo  Feminino  Masculino
Idade
Ocupao
Bairro em que mora
Local de nascimento  So Paulo capital
 So Paulo interior
H quanto tempo mora na cidade de So Paulo?

 Outro estado
H quanto tempo mora na cidade de So Paulo?

10.2.4 Hipteses e expectativas


O conjunto de variveis quantitativas e qualitativas pode ser organizado em
trs tipos de significados sociais que possivelmente se associam s variantes
de (-r) (Quadro 10.2). Paulistanidade, Sotaque, Centralidade do Bairro e
Zona se referem a identidades baseadas em um parmetro geogrfico. A
anlise do Captulo 5, a respeito de avaliao e de produo lingustica, havia
mostrado que o principal significado do retroflexo no discurso dos informantes
diz respeito distino capital-interior, mas que, em termos de produo,
a variante tambm bastante frequente na fala de paulistanos das regies
perifricas e de classes mais baixas da cidade. A partir desses resultados, a
expectativa para esta anlise de percepes que o retroflexo seja julgado
como menos paulistano, como um sotaque mais marcado,10 e associado a
10
Deve-se reconhecer que o conceito de sotaque no isento de controvrsia. Muitos paulistanos no
hesitam em afirmar que sua variedade de fala aquela que mais se aproxima do portugus padro,
ouvido em telejornais e no rdio, e que no tm sotaque (ver, p.ex., os excertos (4) de Marcelo B. no
Captulo 2, p. 27, e (13) de Carolina A. no Captulo 4, p. 68); muitos outros, no entanto, consideram
que o portugus paulistano uma variedade como outras tantas, com caractersticas prprias, e que,
portanto, tambm um sotaque. O comentrio de uma respondente na Internet diz: A pergunta
sobre se a pessoa tem sotaque , no mnimo, estranha. Respondi, mas no sei se deveria valer. Eu
tenho sotaque de paulistana. Alguns tinham sotaques interioranos. Todos temos sotaques. (sujeito 37,
F2SP). O questionrio, do modo como elaborado, no permite discernir a opinio de cada sujeito, salvo
comentrios espontneos nesse sentido. Feita essa ressalva de que sotaque pode ter parmetros dife-
rentes para pessoas distintas, tal fato no invalida a anlise que segue. Um dos interesses justamente
o de contrastar percepes de diferentes grupos de ouvintes: se o conceito de sotaque for realmente
to fluido e relativo, o resultado esperado que as mdias de julgamento quanto varivel Sotaque
sejam praticamente idnticas para tepe e retroflexo para todos os grupos; se, por outro lado, diferentes

281
Mtodos

Identidade geogrfica Status Solidariedade/


Dinamismo
Variveis Paulistanidade (Centralidade do Bairro) Amicabilidade
quantitativas Sotaque Formalidade Ter amigos
Centralidade do Bairro Escolarizao Extroverso
Inteligncia Feminilidade
Masculinidade
Variveis Zona Escolaridade Faixa etria
qualitativas Classe social
Caixas de caipira (caipira) tmida
Seleo alta descolada
branca religiosa
articulada ligada famlia
metida confivel
confiante solidria
prtica preguiosa
conservadora engraada
sofisticada desencanada
independente sincera
simples
patricinha/mauricinho

Quadro 10.2 Classificao das variveis quanto a tipos de significado social

moradores de bairros menos centrais. A incluso de Zona como uma varivel


qualitativa tem o objetivo de verificar se, no imaginrio dos ouvintes, as
variantes se associam a partes especficas da cidade. Diante da produtividade
do retroflexo em reas perifricas, cabe observar se os moradores dessas reas
fazem distines entre capital-interior e centro-periferia de modo semelhante
aos residentes de reas mais centrais ou se, diferentemente, o retroflexo
considerado to paulistano quanto o tepe. No Captulo 5, sugeriu-se tambm
que o aumento da frequncia do retroflexo pode estar relacionado com a
forte presena de migrantes na cidade, sobretudo do Norte/Nordeste, que o
teriam interpretado como variante local, distinta em significado e valor social
das variantes fricativas, mais prototpicas daquelas localidades; interessa,
portanto, contrastar as percepes de paulistanos e no paulistanos quanto a
essas variveis.
grupos de falantes tm diferentes conceitos sobre o que sotaque, tais diferenas devem transparecer
nos resultados quantitativos.

282
Mtodos

O nvel de escolaridade foi includo no questionrio tanto como varivel


quantitativa quanto qualitativa. Apenas para fins expositivos, utiliza-se o
termo Escolarizao para a varivel quantitativa e Escolaridade para a
varivel qualitativa. Essas variveis, junto a Formalidade, Inteligncia e Classe
Social, referem-se dimenso de status. Visto que a anlise de produo
mostrou que o retroflexo favorecido por falantes menos escolarizados e de
classe social mais baixa, a presente anlise busca verificar se tais correlaes se
reproduzem nas percepes dos ouvintes e se o valor simblico de escolaridade e
classe social se estende para significados associados a formalidade e inteligncia
do falante.
Visto que estudos prvios sobre percepes e atitudes lingusticas cos-
tumam demonstrar que variantes associadas a grupos menos privilegiados
socialmente tendem a ser julgadas mais positivamente na dimenso de traos
de solidariedade e dinamismo, as variveis do terceiro grupo preveem, a ttulo
de hiptese, que os falantes sejam percebidos como mais amigveis, tendo
mais amigos, sendo mais extrovertidos e mais jovens quando escutados nos
estmulos com retroflexo. As dimenses de feminilidade e masculinidade
se baseiam na correlao com Sexo/Gnero na anlise de produo: uma
vez que o retroflexo favorecido pelos homens, aqui se indaga se falantes
desse sexo seriam percebidos como menos masculinos quando escutados com
o tepe e mais masculinos com o retroflexo; as mulheres, inversamente, se
seriam percebidas como mais femininas com o tepe e menos femininas com o
retroflexo. Em dilogo com o trabalho de Mendes (no prelo) na comunidade
paulistana, aqui se questiona se, assim como para a concordncia nominal, a
pronncia de (-r) funcionaria como ndice de masculinidade/feminilidade.
Por fim, nem todas as caractersticas listadas nas Caixas de Seleo se
enquadram perfeitamente em uma dessas trs amplas categorias. Entretanto,
pode-se considerar caipira como um tipo de identidade geogrfica associado
a certas partes do interior (e, possivelmente, como uma atribuio de sta-
tus); atributos fsicos como alta e branca, e outras caractersticas como
confiante, sofisticado e patricinha/mauricinho se relacionam com status;
e traos como religioso, ligado famlia, confivel e descolado se
relacionam com a dimenso de solidariedade e dinamismo.

283
Mtodos

10.2.5 Coleta e perfil dos respondentes


Esses questionrios foram aplicados a 185 ouvintes residentes na cidade de
So Paulo;11 44 desses formulrios foram coletados pela prpria pesquisadora
na fase piloto e, na expanso da pesquisa, outros 40 foram coletados por
Larissa Soriano (membro do GESOL-USP) e 101 por meio da plataforma de
pesquisas online Qualtrics.12
Na coleta presencial, a pesquisadora trazia consigo uma prancheta, fones
de ouvido, e os estmulos em um aparelho de reproduo sonora (celular
Sony Xperia X10 no caso da presente pesquisadora e Ipod no caso de Larissa
Soriano). Os ouvintes foram abordados individualmente ou em grupos de
at quatro pessoas, a quem se perguntava se tinham disponibilidade de
ajudar a pesquisadora com um trabalho de faculdade sobre percepes
sociolingusticas. Os participantes voluntrios foram instrudos a ouvir cada
gravao, tentar imaginar como era o falante, e ento preencher os formulrios
de acordo com suas percepes. Eles podiam ouvir cada estmulo quantas
vezes quisessem.
Na coleta online, usou-se o Facebook para recrutar os sujeitos, por meio
de uma postagem que direcionava os voluntrios pgina do Qualtrics em que
se encontrava o questionrio. A pesquisadora havia contatado previamente
20 colegas, explicando-lhes os objetivos da pesquisa e, caso concordassem,
pedindo-lhes que postassem a mensagem em seus respectivos perfis do Fa-
cebook.13 A nica restrio quanto ao perfil dos respondentes era a de que
residissem na cidade de So Paulo, sendo paulistanos ou no.
De modo geral, pode-se afirmar que a maioria dos ouvintes no apresentou
dificuldade ou hesitao na realizao da tarefa. Na fase piloto, apenas dois
ouvintes a quem se aplicaram os questionrios manifestaram hesitaes como
Ah, puxa, no d pra saber... e Voc s tem isso? Eu no posso ouvir um
trecho mais longo?. Deve-se ter em mente que a tarefa de emitir julgamentos
sobre os falantes socialmente carregada, j que, como afirma a sabedoria
11
As respostas de ouvintes que no residem na cidade no foram computadas.
12
Ver portal em http://www.qualtrics.com/.
13
A prpria pesquisadora no postou a mensagem em seu perfil, para que a coleta abrangesse pessoas de
outras redes sociais.

284
Mtodos

popular, no se pode julgar um livro pela capa. O comentrio de uma


participante pela Internet bem ilustra essa regra social:

(14) Achei o questionrio interessante, porque me aguou a curiosidade. Con-


fesso que fiz temendo ser preconceituosa e depois fiquei me questionando
acerca do ponto de partida para julgar o sotaque de algum. Tive a sensa-
o de que o questionrio falaria mais sobre mim do que sobre as pessoas
ouvidas. Gostei!! (Qualtrics, sujeito 8, F2SC)

Assim como o Paradoxo do Observador em entrevistas sociolingusticas (Labov,


2006 [1966]), pode-se assumir que o receio apontado acima se fez presente em
todos os participantes, em maior ou menor grau. Contudo, a observao dos
sujeitos na coleta presencial e os comentrios da coleta online indicam que os
ouvintes compreenderam bem o objetivo de sua tarefa: ela no consistia em
acertar as verdadeiras caractersticas dos falantes, mas sim em expressar
suas percepes.
Tendo em mente a possvel interferncia das prprias condies de aplicao
do questionrio nas respostas dos sujeitos (ver Niedzielski 1999 e Hay &
Drager 2010), necessrio avaliar se a coleta de dados por parte de duas
pesquisadoras diferentes e em situao presencial ou online gerou percepes
significativamente diferentes que possam enviesar os resultados. Para tanto,
realizaram-se testes de qui-quadrado para as variveis qualitativas, e testes de
Anlise de Varincia (anova) nos dados de variveis quantitativas, seguidas
do teste Tukey de mltiplas comparaes, a fim de verificar se e onde houve
diferenas significativas nas respostas dos sujeitos.
Para as variveis qualitativas, no houve grandes diferenas entre os con-
juntos de dados. Para todas as escalas de diferenciais semnticos, tampouco
houve diferenas significativas entre as respostas coletadas pelas duas pesqui-
sadoras. No entanto, houve diferenas entre as respostas presenciais e aquelas
coletadas pela Internet quanto s escalas Escolarizao (Qualtrics vs. Livia:
p < 0,001; Qualtrics vs. Larissa: p < 0,01) e Ter amigos (Qualtrics vs. Livia:
p < 0,01; Qualtrics vs. Larissa: p < 0,001). No primeiro caso, a diferena
consiste no fato de que, nos dados Qualtrics, os sujeitos atriburam nveis
de escolarizao significativamente diferentes a depender da variante ouvida

285
Mtodos

(p < 0,01), enquanto a varivel no se mostrou significativa nos conjuntos de


dados Livia (p = 0,55) e Larissa (p = 0,34). Algo semelhante ocorre na
escala Ter amigos: no conjunto Qualtrics, os ouvintes atriburam valores
cuja diferena se aproxima do limite de significncia (p = 0,06), mas a mesma
escala bastante marginal nos dados Livia (p = 0,70) e Larissa (p = 0,75).
Em ambos os casos, os respondentes se comportaram de modo mais neutro
na presena de uma pesquisadora, e mais opiniosos na sua ausncia. Isso
provavelmente ocorreu em consequncia do perfil das pesquisadoras: ambas
so claramente alunas universitrias que haviam abordado os sujeitos para
que as ajudassem em um trabalho da faculdade. Conscientemente ou no,
os sujeitos podem ter se sentido mais constrangidos a no revelar julgamentos
extremos sobre os falantes. Ainda que o formulrio online tambm deixasse
claro que se tratava de uma pesquisa acadmica, os sujeitos parecem ter se
sentido menos inibidos no emitir de julgamentos negativos, o que resultou em
diferenas significativas nas percepes sobre tepe e retroflexo.
Nos dois casos discriminados acima, as diferenas entre os conjuntos
de dados so de grau, mas a relao entre as variantes de (-r) a mesma:
na escala de escolarizao, os trs conjuntos de dados revelam mdias de
julgamento menores para o retroflexo do que para o tepe (ou seja, os falantes
so percebidos como menos escolarizados quando ouvidos com o retroflexo),
e, na escala ter amigos, a mdia para retroflexo maior do que para tepe
(os falantes so percebidos como tendo mais amigos quando ouvidos com
retroflexo). Dadas as semelhanas nas tendncias, as anlises da prxima
seo incluram os trs conjuntos de dados indistintamente. A se pautar pelas
observaes acima, poderia-se esperar que, caso os dados englobassem apenas
aqueles coletados presencialmente, as correlaes reportadas adiante seriam
mais fracas ou menos significativas, ou as correlaes dos dados online seriam
mais fortes e mais significativas.
Os 185 sujeitos ouvintes so todos residentes da cidade de So Paulo e
se diferenciam quanto a seu perfil social conforme a Tabela 10.1. Percebe-se
que a amostra razoavelmente equilibrada quanto ao Sexo/Gnero (Cf. 97
mulheres vs. 88 homens) e Regio de Residncia (94 de regies centrais vs.

286
Mtodos

Tabela 10.1 Distribuio dos perfis sociais dos sujeitos ouvintes quanto a
Sexo/Gnero, Regio de Residncia e Nvel de Escolaridade

Feminino Masculino
(N = 97) (N = 88)
1 a 2a 3a 1 a 2a 3a N
Central Ens. Mdio 1 0 0 0 0 0 1
(N = 94) Ens. Superior 24 20 0 42 6 1 93
Perifrica Ens. Mdio 0 0 1 4 1 0 6
(N = 91) Ens. Superior 43 7 1 31 3 0 85
N 68 27 2 77 10 1 185

91 de regies perifricas),14 mas muito desbalanceada quanto Faixa Etria


(Cf. 145, 37 e 3 ouvintes para 1a , 2a e 3a faixas etrias, respectivamente) e ao
Nvel de Escolaridade (7 com at Ensino Mdio vs. 178 com Ensino Superior).
A grande maioria dos respondentes tm curso superior e idades entre 20 a 34
anos (1a faixa etria). Desse modo, quaisquer diferenas de percepo quanto
a caratersticas sociais dos ouvintes podem ser traadas mais propriamente
apenas de acordo com o Sexo/Gnero e Regio de Residncia.
Ainda que a aplicao dos questionrios no tenha se restringido a pau-
listanos, mas a residentes da cidade, 70% (N = 129) dos ouvintes de fato
nasceram em So Paulo (Tabela 10.2). Assim, as consideraes adiante sobre
diferenas de percepes quanto origem dos ouvintes sero de cunho mais
descritivo e a ttulo de hiptese para trabalhos futuros, uma vez que mesmo
resultados estatisticamente significativos podem se alterar em uma amostra
balanceada.15
Na prxima seo, as variveis quantitativas (escalas de diferenciais se-
mnticos) foram analisadas em testes-t e em modelos lineares; as variveis
nominais qualitativas em testes de qui-quadrado; e as caractersticas pessoais
atribudas aos falantes em testes de qui-quadrado e em modelos lineares de
efeitos mistos.
14
Aos sujeitos, pediu-se que informassem os bairro de residncia, conforme em (13) acima. Eles foram
classificados como residentes de bairros mais centrais ou mais perifricos de acordo com os critrios do
Projeto SP2010 (Mendes & Oushiro, 2013).
15
O termo Grande SP, apesar de englobar a cidade de So Paulo, aqui empregado para se referir
apenas s demais cidades da Regio Metropolitana.

287
Anlises

Tabela 10.2 Distribuio dos perfis sociais dos sujeitos ouvintes quanto a
Sexo/Gnero, Regio e Residncia e Origem

Feminino Masculino N
Origem Central Perifrico Central Perifrico
So Paulo capital 34 36 28 31 129
Grande SP 0 4 3 1 8
So Paulo interior 8 9 9 2 28
Outros estados 3 3 9 5 20

10.3 Anlises
Mendes & Oushiro (2011a) haviam realizado uma anlise preliminar com
uma amostra de 24 sujeitos ouvintes, todos jovens universitrios paulista-
nos: 13 mulheres e 11 homens, de 20 a 30 anos. Nesse conjunto de dados,
os resultados haviam indicado diferenas significativas quanto s escalas de
Paulistanidade, Sotaque e Centralidade do Bairro a depender do estmulo
escutado: os falantes ouvidos em estmulos com retroflexo foram percebidos
como significativamente menos paulistanos, como tendo mais sotaque e
como residentes de bairros menos centrais, em relao a quando ouvidos
em estmulos com tepe. As variveis qualitativas no haviam revelado di-
ferenas significativas, mas sugeriram uma associao do retroflexo com os
moradores da Zona Leste, adolescentes, e com nveis de escolaridade e classe
socioeconmica mais baixas. As caractersticas pessoais nas caixas de seleo
no haviam sido analisadas.
Uma vez que valores de significncia so sensveis ao tamanho da amostra,
a presente anlise busca, em primeiro lugar, verificar se tais resultados se
sustentam em um maior conjunto de dados. A prxima seo mostra que essas
correlaes se mantm e que outras tendncias no constatadas previamente
agora se revelam significativas. Alm disso, analisam-se certas diferenas no
apenas de acordo com os falantes, mas tambm a partir do perfil social dos
ouvintes.

288
Anlises

10.3.1 Variveis quantitativas


Esta subseo analisa as respostas dos ouvintes atribudas s escalas de
diferenciais semnticos (quo extrovertidos, escolarizados, inteligentes etc.
soam os falantes) de acordo com a variante de (-r) e os pares de estmulos
por falante. As figuras 10.1 e 10.2 resumem as respostas por meio de boxplots,
que ilustram sua distribuio e disperso nas escalas de cinco pontos.16 Entre
cada par de variantes (por falantes, esquerda, e para a amostra geral,
direita), incluem-se valores de significncia (+p > 0,05; *p < 0,05; **p <
0,01; ***p < 0,001), obtidos atravs de testes-t unicaudais,17 que indicam a
probabilidade de as diferenas observadas serem aleatrias. Marca-se com
a mdia de cada distribuio, valor a partir do qual se baseiam os testes-t.
As escalas so apresentadas de acordo com a diferena das mdias de
julgamento para estmulos com retroflexo e tepe, de maior para menor. Todas
as comparaes da Figura 10.1 so significativas; a Figura 10.2 contm
variveis que no se mostraram correlacionadas com a pronncia de (-r).
As escalas que mais se diferenciam a depender do estmulo ouvido so as
de Paulistanidade, Sotaque e Centralidade do Bairro (ver quadros direita na
Figura 10.1). Esses resultados so bastante semelhantes queles j constatados
no estudo piloto (Mendes & Oushiro, 2011a). Trata-se das trs variveis
quantitativas que se relacionam com identidades geogrficas, o que indica
que o principal significado social das variantes diz respeito a uma oposio
paulistano vs. no paulistano, ou paulistano prototpico vs. paulistano
no prototpico. interessante notar que, nas escalas de Paulistanidade
e Centralidade do Bairro, os julgamentos aos estmulos com retroflexo se
concentram no ponto mdio de 3 (ver linhas horizontais negritadas nas figuras,
16
Em cada boxplot, as barras horizontais da caixa central indicam o primeiro, o segundo e o terceiro
quartis, ou seja, onde se encontram os limites de 25%, 50% e 75% das medies, e mostram os pontos
em que h maior concentrao de valores; as barras horizontais ao final da linha tracejada indicam a
disperso dos dados; por fim, os pequenos crculos indicam valores atpicos (outliers).
17
Significa dizer que as hipteses testadas foram unidirecionais (one-tailed t-tests), por exemplo, se o
retroflexo soa menos paulistano (R < T) ou como um sotaque mais marcado (R > T). Alternativa-
mente, os testes poderiam ter sido bidirecionais ou bicaudais (two-tailed t-tests), caso em que o teste
estatstico avaliaria simplesmente se h diferenas significativas entre as mdias de cada variante, in-
dependentemente da direo da correlao. Com base nos resultados prvios do estudo piloto e de
outros trabalhos sobre percepo, parece seguro assumir que a relao entre as variantes tem uma
direcionalidade definida, de acordo com as hipteses da seo 10.2.4 (p. 281). Conforme revelam os
resultados desta seo, nenhuma assuno foi violada.

289
Anlises
5

5

Paulistanidade
4

4




3

3
2

2

1

1.r ** 1.t 2.r *** 2.t 3.r *** 3.t 4.r *** 4.t R *** T
5

5

4

4


Sotaque

3

2

2
1

1.r + 1.t 2.r *** 2.t 3.r *** 3.t 4.r ** 4.t R *** T
5


Centralidade do Bairro
4

2
1

1.r + 1.t 2.r *** 2.t 3.r * 3.t 4.r ** 4.t R *** T
5

4
Formalidade

2
1

1.r + 1.t 2.r + 2.t 3.r *** 3.t 4.r * 4.t R *** T
5


Escolarizao
4

3
2

1.r + 1.t 2.r ** 2.t 3.r * 3.t 4.r + 4.t R ** T


falante.variante variante

Figura 10.1 Variveis quantitativas significativas para percepes sobre (-r)


+p > 0,05; *p < 0,05; **p < 0,01; ***p < 0,001

290
Anlises

que correspondem mediana), o que aponta antes para uma neutralidade das
respostas (vistas de modo global) do que para um categorizao mais extrema;
na escala de Sotaque, isso ocorre nos estmulos com tepe. A disperso das
respostas mostra que h menor consenso sobre a paulistanidade do retroflexo,
quo marcado o sotaque com o tepe, e o local de residncia de quem emprega
o retroflexo; por exemplo, na escala de Sotaque, note-se que os estmulos com
tepe foram julgados tanto com baixo (1 ou 2) quanto com alto (4 ou 5) graus
de marcao, em propores semelhantes, algo que reflete a divergncia de
opinies sobre se paulistanos tm sotaque ou no. Por outro lado, h maior
consenso na comunidade de que o tepe mais paulistano, que o retroflexo
um sotaque mais marcado, e que o tepe se associa a residentes de bairros
mais centrais, como se v pela concentrao de respostas acima do valor 3
nas escalas verticais.
Alm da dimenso de identidade geogrfica, a correlao com Centralidade
do Bairro tambm pode ser interpretada como uma diferenciao de status
entre as variantes de (-r). Uma vez que as classes mais altas se concentram
nos bairros mais centrais da cidade, a associao do tepe com esses residentes
possivelmente tambm reflete uma associao com Classe Social (ver discusso
em 10.4). As correlaes com Formalidade e Escolarizao, no constatadas
no estudo piloto, vo ao encontro dessa interpretao. Relativamente ao
tepe, os falantes foram percebidos como menos formais e com menor grau de
escolarizao quando ouvidos em estmulos com retroflexo.
Entretanto, as correlaes com Paulistanidade, Sotaque, Centralidade
do Bairro, Formalidade e Escolarizao no se reproduzem uniformemente
para todos os falantes (quadros esquerda). A escala de Paulistanidade a
nica em que h diferenas significativas para todos os falantes a depender
da variante escutada. Nos demais casos, as correlaes globais tm maior
contribuio de certos falantes, enquanto outros parecem no ser afetados
pelas variantes. O Falante 1, em especial, parece ser imune ao impacto do
retroflexo ou do tepe nos julgamentos que recebeu dos ouvintes.
Vislumbram-se trs possveis motivos para isso: (i) relativamente aos
demais falantes, o grau de retroflexo de (-r) do Falante 1 menos acentuado;
(ii) o excerto desse falante o nico em que o texto est na terceira pessoa;

291
Anlises

(iii) os estmulos sempre foram ouvidos na mesma ordem por todos os sujeitos,
a comear pelo Falante 1. O primeiro desses fatos provavelmente aquele
que mais contribuiu para a indiferenciao de percepes; ainda que o tepe
tenha influenciado a percepo dos ouvintes quanto a sua paulistanidade,
os estmulos com retroflexos menos marcados parecem ter sido percebidos
como uma forma relativamente neutra de fala. O fato de esse excerto no
se referir a uma narrativa em primeira pessoa, diferentemente dos demais
(ver excertos (1) a (4), p. 275), deve ter contribudo para a impresso de
uma fala mais distanciada e impessoal releia-se, nesse sentido, a reao
em (5), em que o ouvinte descreve o falante como um professor universitrio;
o distanciamento da fala parece torn-la menos suscetvel a atribuies de
caractersticas pessoais como grau de sotaque e local de residncia. No se
descarta, tampouco, a possvel influncia da ordem em que os estmulos foram
ouvidos; sendo sempre o primeiro, plausvel que os ouvintes tenham se
comportado de modo mais neutro em relao a essa gravao e usaram-na
como base comparativa para os demais falantes. Tais fatores parecem ter
bloqueado certas inferncias sobre o Falante 1, de modo semelhante aos
falantes prova de bala dos estudos de Campbell-Kibler (2006, 2009).18
Ainda que nem todas as escalas se mostrem relevantes para todos os
falantes, observe-se que, em cada par de estmulos, a relao entre retroflexo
e tepe tem uma direcionalidade definida: por exemplo, na escala de Sotaque,
nenhum falante percebido como tendo um sotaque menos marcado quando
ouvido com o retroflexo, sendo tal diferena significativa ou no. A relao
entre as variantes nunca invertida.
Por outro lado, interessa tambm verificar quais escalas no se mostraram
significativamente correlacionadas com a pronncia de (-r): Amicabilidade, Ter
amigos, Extroverso, Inteligncia, Feminilidade e Masculinidade (Figura 10.2).
Diferentemente das hipteses levantadas, os falantes no foram percebidos
18
Vale notar que o mesmo Falante 1 emprega a variante no padro de concordncia verbal ao final
desse excerto: o que que o pessoal faz? eles pula(m) a fronteira faz(em) que nem no Mxico (ver
excerto (1), p. 275). Curiosamente, tal fato no parece afetar o julgamento dos ouvintes quanto a seu
grau de escolarizao, em mdia mais alto do que o que se atribuiu aos demais falantes (ver escala de
Escolarizao na Figura 10.1, quadro esquerda). Isso refora a constatao de que, em certos casos,
determinadas inferncias so bloqueadas. Nesse caso, possvel que o Falante 1, ao ser julgado como
uma pessoa mais escolarizada, residente de bairro mais central etc., tenha sido imunizado contra os
efeitos da concordncia verbal no padro.

292
Anlises
5

5

Amicabilidade
4

4



3

3

2

2
1

1.r + 1.t 2.r + 2.t 3.r + 3.t 4.r + 4.t R + T


5

5

4

4

Ter amigos

3


2

2
1

1.r + 1.t 2.r + 2.t 3.r + 3.t 4.r + 4.t R + T


5

4
Extroverso

1.r + 1.t 2.r * 2.t 3.r + 3.t 4.r + 4.t R + T


5

5
4


Inteligencia

3
2

1.r + 1.t 2.r + 2.t 3.r ** 3.t 4.r + 4.t R + T


5

4
Fem.Masc
3

3
2

1.r + 1.t 2.r + 2.t 3.r + 3.t 4.r + 4.t R + T


falante.variante variante

Figura 10.2 Variveis quantitativas no significativas para percepes sobre (-r)


+p > 0,05; *p < 0,05; **p < 0,01; ***p < 0,001

293
Anlises

como mais amigveis, tendo mais amigos, sendo mais extrovertidos, menos
inteligentes, menos femininas (no caso das mulheres) ou mais masculinos (no
caso dos homens)19 quando ouvidos com o retroflexo. Apenas a Falante 2 foi
percebida como relativamente mais extrovertida e o Falante 3 como menos
inteligente nos estmulos com retroflexo, mas o conjunto total de respostas
revela diferenas no significativas.
Mendes (no prelo), em seu estudo de percepes sobre a concordncia
nominal, tambm no havia observado diferenas quanto escala de Amica-
bilidade, mas, diferentemente do presente, havia constatado diferenas nas
escalas de Efeminidade e de Inteligncia de acordo com a variante ouvida. A
dimenso da sexualidade deve ter se destacado no estudo de Mendes (no prelo)
pelo fato de dois dos falantes escolhidos soarem efeminados, e a escala medir
quo efeminados soavam os falantes todos do sexo masculino. A escala
de Inteligncia, entretanto, parece ser mais diretamente comparvel entre os
dois estudos: diferentemente da concordncia nominal, as realizaes de (-r),
ainda que correlacionadas com percepes de escolarizao, no parecem se
estender para o julgamento do grau de inteligncia dos falantes. Recorde-se,
a partir do discurso dos informantes nos captulos 5 e 6, que enquanto a
concordncia nominal no padro avaliada como errada por muitos, a
pronncia retroflexa de (-r), ainda que possa ser avaliada negativamente, no
interpretada do mesmo modo. Junto a esta anlise de percepes, isso
evidencia que variantes que possuem distribuies sociais semelhantes na co-
munidade no necessariamente recebem a mesma interpretao ou os mesmos
significados sociais tanto o retroflexo quanto a concordncia no padro so
favorecidas por homens, falantes menos escolarizados e de classes sociais mais
baixas, mas as percepes sobre essas variantes parecem diferir entre si. A
relao entre correlaes nos usos lingusticos e avaliaes/percepes sobre
as variantes no ocorre de maneira direta. Essa observao ser retomada
adiante, na seo 10.4.
As anlises reportadas at aqui se referem s percepes da comunidade
como um todo, sem levar em conta o perfil do ouvinte. Trata-se de anlises
19
Os testes-t das escalas de Feminilidade e Masculinidade foram realizados em conjuntos de dados que
separaram os falantes de acordo com seu sexo, j que a hiptese previa direes opostas para os Falantes
1 e 3, por um lado, e as Falantes 2 e 4, por outro.

294
Anlises

monofatoriais que testaram a influncia da variante nos julgamentos dos


ouvintes sobre as diferentes escalas. Para verificar se mulheres e homens,
residentes de regies centrais e perifricas, ou de diferentes origens geogrficas
percebem as variantes de modos semelhantes ou no, realizaram-se anlises
multifatoriais em modelos lineares que incluram, alm da variante ouvida, as
possveis interaes entre variante, por um lado, e o Sexo/Gnero, Regio de
Residncia e Origem dos ouvintes, por outro.20
Na grande maioria dos casos, as interaes no se mostraram significativas,
o que indica que as percepes no diferiram substancialmente a depender
de caractersticas sociais dos ouvintes. Entretanto, houve duas escalas com
interaes relevantes: a de Paulistanidade em que a variante ouvida interage
com a Regio de Residncia e a Origem do ouvinte e a de Sotaque em que
a variante interage com Regio de Residncia. As interaes mostram que
indivduos que residem em diferentes regies da cidade bairro mais central
ou mais perifrico e que so originrios de diferentes lugares So Paulo-
capital, Grande So Paulo, interior do estado ou outros estados percebem o
retroflexo e o tepe diferentemente quanto a seu grau de Paulistanidade e de
Sotaque.
A Figura 10.3 descreve tais relaes para a escala de Paulistanidade. As
barras horizontais indicam a diferena das mdias de julgamento dos estmulos
com retroflexo e com tepe (R - T), para residentes de diferentes regies
(figura acima) e origens (figura abaixo). A figura tambm indica a mdia de
valores atribudos a cada variante. Em todos os casos, tal diferena tem valor
negativo, o que indica que o retroflexo foi percebido como menos paulistano
do que o tepe para todos os grupos, de modo semelhante anlise global. As
interaes consistem no fato de tal diferena ser muito mais extrema para os
residentes de bairros mais centrais e para os falantes que nasceram na cidade
de So Paulo, Grande So Paulo ou interior do estado. Para residentes de
bairros mais perifricos, a diferena tambm significativa, mas bem menor
do que para ouvintes de regies centrais; para ouvintes provenientes de outros
estados, tepe e retroflexo se assemelham em graus de paulistanidade.
20
No programa R, isso se traduz na aplicao da funo lm frmula escala variante +
variante*sexo + variante*regiao + variante*origem, em que escala se refere s variveis de dife-
renciais semnticos (Paulistanidade, Sotaque, Extroverso etc.).

295
Anlises

Paulistanidade (R T)

1.5 1.0 0.5 0.0 0.5 1.0 1.5

Central (R = 2,88; T = 3,86)


***
* Perifrica (R = 3,14; T = 3,73)
***

So Paulo (R = 3,06; T = 3,83)


***
Grande SP (R = 3,00; T = 4,00)
**
** Interior (R = 2,46; T = 3,76)
***
Outros estados (R = 3,49; T = 3,55)

Figura 10.3 Diferena entre mdias de julgamento para Paulistanidade (R - T)


de acordo com Regio de Residncia (acima) e Origem do ouvinte (abaixo)
+p > 0,05; *p < 0,05; **p < 0,01; ***p < 0,001

Examinem-se, primeiramente, as diferenas quanto Regio de Residncia


dos ouvintes. A anlise de produo (Captulo 5) havia demonstrado que essa
varivel uma das que se correlacionam mais fortemente com a pronncia de
(-r), sobretudo entre os mais jovens (trao que caracteriza a maior parte dos
ouvintes desta anlise de percepo). A Figura 10.3 mostra que a distino
paulistano vs. no paulistano para as variantes de (-r) feita mais propria-
mente pelos residentes de bairros mais centrais, que percebem o retroflexo
como uma forma no nativa da comunidade; os residentes de bairros mais
perifricos, ainda que mostrem a mesma tendncia, no fazem uma distino
to drstica, o que revela que certos ouvintes aceitam o retroflexo como
uma forma tambm paulistana. A diferena entre esses grupos significativa
ao nvel de 5% de confiana (p = 0,02).
Quanto Origem dos ouvintes, verifica-se que os nascidos no estado de
So Paulo na capital, na Grande So Paulo ou no interior diferenciam as
variantes significativamente, principalmente os do ltimo grupo. interessante
notar que os interioranos fazem uma diferenciao mais radical entre as
variantes, e que os prprios nativos da cidade ou da Regio Metropolitana

296
Anlises

parecem ser relativamente mais tolerantes a certo grau de paulistanidade


do retroflexo (ainda que o diferenciem do tepe). Os ouvintes provenientes
do interior e hoje residentes na capital so os mais conscientes da associao
retroflexo - no paulistano, provavelmente por serem porventura destacados
como no nativos da comunidade justamente por esse trao lingustico. Por
outro lado, os ouvintes provenientes de outros estados praticamente no
diferenciam as variantes quanto a seu grau de paulistanidade: a mdia de
julgamentos foi de 3,49 para o retroflexo e de 3,55 para o tepe, ambas acima
do ponto mdio de 3,0; isso significa que, para esses ouvintes, o retroflexo
to paulistano quanto o tepe.
A maior parte deles migrante do Nordeste, de acordo com suas respostas
nos questionrios. Esse resultado parece fornecer uma evidncia adicional
interpretao das anlises de produo; no Captulo 5, sugeriu-se que
a expanso do retroflexo entre paulistanos, sobretudo na fala de filhos de
nordestinos e de residentes de bairros mais perifricos, pode estar relacionada
com a interpretao da variante como um trao local, distinta em valor social
das variantes fricativas e indistinta da realizao como tepe. Como a amostra
de ouvintes no balanceada quanto a local de origem, tal resultado no pode
ser tomado como prova do argumento acima, mas certamente merece ser
considerado como uma hiptese plausvel a ser mais rigidamente testada em
anlise futuras (em uma amostra balanceada quanto Origem do ouvinte).
A Regio de Residncia dos ouvintes tambm interage com as variantes e
(-r) quanto percepo de Sotaque (Figura 10.4). Neste caso, as diferenas
entre R - T revelam valores positivos, o que significa que o retroflexo
julgado em todos os grupos como um sotaque mais marcado do que o tepe
(R > T). No entanto, os residentes de bairros mais centrais consideram o
primeiro muito mais marcado do que o segundo, diferentemente dos residentes
de bairros mais perifricos, que no diferenciam as variantes de modo to
drstico (ainda que significativo).
Embora a interao variante-origem no tenha se revelado significativa
para a escala de Sotaque (p = 0,18), vale a pena apontar para certas diferenas
em termos descritivos, que merecem ser controladas em estudos futuros que
avaliem o papel especfico dessa varivel. Essas diferenas evidenciam que

297
Anlises

Sotaque (R T)

1.5 1.0 0.5 0.0 0.5 1.0 1.5

Central (R = 3,69; T = 2,73)


***
Perifrica (R = 3,09; T = 2,84) ***
*

So Paulo (R = 3,38; T = 2,69)


***
Grande SP (R = 3,19; T = 3,06)
+
Interior (R = 3,34; T = 3,07)

Outros estados (R = 3,65; T = 2,93)


**

Figura 10.4 Diferena entre mdias de julgamento para Sotaque (R - T) de


acordo com Regio de Residncia (acima) e Origem do ouvinte (abaixo)
+p > 0,05; *p < 0,05; **p < 0,01; ***p < 0,001

os conceitos de paulistanidade e sotaque no so os reversos da mesma


moeda. Para Paulistanidade, verificou-se que os ouvintes provenientes de
outros estados se contrapem a todos os grupos de paulistas em seu julgamento
sobre as variantes; j na escala de Sotaque, os migrantes de outros estados
se aproximam dos paulistas da capital, j que ambos percebem o retroflexo
como um sotaque mais marcado do que o tepe. Ainda que no paulistas
considerem o retroflexo to paulistano quanto o tepe, isso no significa que
as variantes sejam percebidas de modo idntico: o retroflexo mais sotaque
do que o tepe. Ao mesmo tempo, embora os interioranos e os provenientes
da Grande So Paulo avaliem o retroflexo como muito menos paulistano do
que o tepe, sua percepo quanto a Sotaque atenuada: as variantes no
apresentam diferenas significativas nesse quesito, pois ambas so percebidas
como formas marcadas: para esses grupos, tanto tepe quanto retroflexo so
sotaque.

298
Anlises

10.3.2 Variveis qualitativas


As variveis qualitativas ou nominais se referem atribuio de Zona de
Residncia, Faixa Etria, Nvel de Escolaridade e Classe Social aos falantes.
Esses dados foram analisados em testes de qui-quadrado e so representados
visualmente na Figura 10.5.
Zona Faixa Etria
200

200
+ +
+ Retroflexo
150

150
Tepe
100

100

**
+ **
+ +
50

50

+
+
0

No sei Central Norte Sul Leste Oeste Na adolescncia Por volta dos 30

Escolaridade Classe Social


+ +
200

200

*
150

150

+
100

100

**
50

50

*
+ *
+ +
0

Fund.I Fund.II Mdio Superior PsGrad. Baixa Mdia Baixa Mdia Mdia Alta Alta

Figura 10.5 Atribuio de Zona, Faixa Etria, Escolaridade e Classe Social de


acordo com variante ouvida
+p > 0,05; *p < 0,05; **p < 0,01; ***p < 0,001

Percebe-se que a maioria dos ouvintes no soube atribuir uma zona es-
pecfica, uma vez que as respostas se concentram na opo No sei, para
estmulos tanto com retroflexo quanto com tepe.21 Embora os ouvintes asso-
ciem as variantes com moradores de diferentes regies (central ou perifrica),
o mesmo no ocorre para as cinco zonas. Os demais ouvintes atriburam uma
zona da cidade em propores razoavelmente equilibradas entre si e entre as
21
A incluso dessa opo apenas para Zona da Cidade decorre justamente do fato de que, na fase de
entrevistas abertas, a maioria dos sujeitos afirmaram que no possvel saber de que zona de So
Paulo um falante.

299
Anlises

variantes. O comentrio de uma respondente do questionrio online afirma


sobre o estmulo 3.r:

(15) O sotaque [de 3.r] se parece muito com o de um amigo, que mora na Zona
Norte de SP por isso, escolhi esta opo. (Qualtrics, sujeito 10, F2SP)

possvel que muitas dessas respostas tenham sido motivadas por semelhanas
fortuitas entre as vozes dos falantes e a de conhecidos dos ouvintes, o que,
sendo absolutamente casuais, resultam em distribuies aleatrias. A nica
diferena significativa se verifica para a Zona Leste: falantes ouvidos com a
variante retroflexa foram percebidos mais frequentemente como dessa zona
em relao aos estmulos com tepe (p = 0,005). A distribuio geral das
respostas para essa varivel tem baixa probabilidade de ser aleatria (2 =
14,55(5), p = 0,01).
Para Faixa Etria, h uma concentrao de respostas nos fatores Por
volta dos 20 e Por volta dos 30, provavelmente em decorrncia da prpria
caracterstica dos falantes: todos eles tm cerca de 30 anos e soam como
pessoas nessa faixa de idade. Aqui tambm no se verificam diferenas a
depender de qual variante foi ouvida, exceto para a faixa Por volta dos 40
(p = 0,004): houve uma tendncia significativamente mais alta de atribuir
essa faixa etria quando os falantes foram escutados com tepe em vez de
retroflexo. De modo semelhante a Zona, a distribuio geral de qui-quadrado
provavelmente no aleatria (2 = 10,13(3), p = 0,02).
As variveis Escolaridade (2 = 14,33(4), p = 0,006) e Classe Social (2 =
19,78(4), p < 0,001) parecem apresentar correlaes relativamente mais fortes.
Houve novamente uma distribuio bastante irregular das respostas, com con-
centrao nos fatores Ensino Mdio e Ensino Superior, que se aproximam
do real nvel de escolaridade dos falantes. A percepo de que so jovens
adultos tambm deve ter contribudo para essa caracterizao: atualmente,
difcil encontrar jovens que no tenham concludo pelo menos o Ensino Mdio
na cidade de So Paulo possivelmente da decorre a baixssima atribuio
de nveis Ensino Fundamental I e II aos falantes, independentemente da
variante ouvida. Houve, no entanto, uma tendncia significativamente maior
em se atribuir Ensino Mdio quando se ouviu retroflexo (p = 0,012), e

300
Anlises

em se atribuir Ps-graduao quando se ouviu tepe (p = 0,02). Embora


as diferenas no sejam significativas para os fatores Ensino Fundamental
II e Ensino Superior, as tendncias que se esboam parecem seguir a
direo esperada de correlao: associao do retroflexo a nveis mais baixos
de escolaridade e do tepe a nveis mais altos.
Algo semelhante ocorre na varivel Classe Social. Embora a atribuio de
Classe Baixa seja rara para esses falantes, isso ocorreu mais frequentemente
quando se ouviu o retroflexo em vez de o tepe (p = 0,02); a atribuio de
Classe Mdia Alta, por sua vez, teve lugar significativamente mais vezes em
estmulos com o tepe do que com o retroflexo (p = 0,002). As diferenas nos
fatores Classe Mdia Baixa e Classe Mdia, embora no significativas,
parecem seguir a relao retroflexo-classes mais baixas e tepe-classes mais
altas. A aparente exceo em Classe Alta se refere a apenas quatro estmulos
ouvidos com retroflexo e dois com tepe, cuja diferena certamente deve ser
subestimada.
Desse modo, as variveis nominais tambm revelam a importncia das
dimenses de identidade geogrfica e status para os significados sociais das
variantes de (-r), ainda que de modo menos contundente do que as variveis
quantitativas. Uma nova correlao, relativa dimenso de dinamicidade,
sugerida pela varivel Faixa Etria, uma vez que o tepe parece se associar a
falantes mais velhos. No entanto, o fato de que no se verifica a correlao
retroflexo-falantes mais jovens e que a grande maioria das respostas se
concentra nos fatores intermedirios, cujas diferenas no so significativas,
indica que a atribuio de Faixa Etria depende mais de caractersticas
pessoais dos falantes do que da intermediao de variantes de (-r).
Para nenhuma das variveis qualitativas se observaram interaes entre a
variante e o perfil social dos ouvintes em anlises multifatoriais. Ainda que
haja pequenas diferenas, todas as correlaes seguem a mesma direo. A
Figura 10.6 exemplifica as semelhantes tendncias de diferentes grupos de
ouvintes quanto atribuio de Classe Social aos falantes, de acordo com
a variante escutada: na grande maioria dos subgrupos, verifica-se a maior
frequncia de atribuio de classes mais baixas quando se ouviu o retroflexo,
e de classes mais altas quando se ouviu o tepe; aparentes excees se referem

301
Anlises

Feminino Masculino
Retroflexo
+ Tepe
120

120
+
80

80
* ** + +
40

40
* +
+ +
0

0
Baixa Mdia Alta Baixa Mdia Alta

Regio Central Regio Perifrica


140

+ 140
+
100

100

*
60

60

+ + **

*
0 20

0 20

+ + +

Baixa Mdia Alta Baixa Mdia Alta

Origem So Paulo (capital) Origem Grande So Paulo


+
150

150
100

100

**
+
50

50

* + +
+ + + +
0

Baixa Mdia Alta Baixa Mdia Alta

Origem So Paulo (interior) Origem Outro Estado


10 20 30 40 50 60

10 20 30 40 50 60

+
**
+ +
+
+ + + +
0

Baixa Mdia Alta Baixa Mdia Alta

Figura 10.6 Atribuio de Classe Social de acordo com variante escutada e


caractersticas dos ouvintes
+p > 0,05; *p < 0,05; **p < 0,01; ***p < 0,001

302
Anlises

a clulas com poucos dados, cujas diferenas no atingem significncia (por


exemplo, a atribuio de Classe Mdia Baixa entre os falantes de outros
estados).

10.3.3 Lista de caractersticas


Esta seo se volta anlise da lista de caractersticas (pessoa alta, branca,
articulada, metida, tmida etc.) que podiam ser atribudas aos falantes
atravs de caixas de seleo. A questo aqui examinar se a atribuio de
determinada caracterstica se deve a impresses sobre os falantes individuais
ou se possvel inferir o efeito das variantes de (-r). Assim como na anlise
das variveis quantitativas e qualitativas, a expectativa que impresses
provocadas pelos falantes ou pelo contedo de sua fala, mas no pelo emprego
de uma variante de (-r), devem se neutralizar ao ser assinaladas tanto nos
estmulos com tepe quanto com retroflexo; se, por outro lado, h um efeito da
prpria variante, isso deve se refletir em taxas significativamente diferentes
de assinalamento das caixas de seleo.
Cada caracterstica foi inicialmente analisada em testes de qui-quadrado a
fim de contrastar a frequncia com que foi assinalada para cada variante. Dos
30 atributos, apenas cinco se correlacionam significativamente com a varivel
(-r): caipira, simples, articulada, sofisticada, trabalhadora. A Tabela 10.3
mostra a frequncia e a proporo com que as caractersticas foram assinaladas
(X) em estmulos com cada variante, bem como o teste de qui-quadrado e
seus respectivos valores de p. As clulas sombreadas destacam a variante que
favoreceu o assinalamento da caixa de seleo.
Na ltima linha da tabela, as variantes de (-r) se distribuem equitati-
vamente no total dos dados (50% de retroflexo e 50% de tepe), uma vez
que foram controladas na aplicao dos questionrios. Trs das caracters-
ticas se associam ao retroflexo: caipira (p = 2,24-6 ), simples (p = 0,0002),
e trabalhadora (p = 0,04). A principal delas diz respeito a uma identidade
geogrfica, termo fortemente associado aos paulistas do interior do estado,
mas que tambm tem conotaes de status por evocar a imagem de pessoas
provenientes de zonas rurais, em geral menos escolarizadas e de baixa condio

303
Anlises

Tabela 10.3 Caractersticas correlacionadas com (-r)

Caracterstica R %R T %T Total 2 p
Caipira
O 329 47,6 362 52,4 691
X 41 83,7 8 16,3 49 22,38(1) 2,24-6
Simples
O 228 45,2 276 54,8 504
X 142 60,2 94 39,8 236 13,74(1) 0,0002
Articulada
O 263 54,0 224 46,0 487
X 107 42,3 146 57,7 253 8,67(1) 0,003
Sofisticada
O 357 51,2 340 48,8 697
X 13 30,2 30 69,8 43 6,32(1) 0,01
Trabalhadora
O 255 47,6 281 52,4 536
X 115 56,4 89 43,6 204 4,23(1) 0,04
Total 370 50,0 370 50,0 740
R = retroflexo; T = tepe; O = no assinalada; X = assinalada.

socioeconmica. A associao com a caracterstica simples se relaciona


com a dimenso de status, e trabalhadora com a dimenso de solidariedade.
As outras duas caractersticas, articulada (p = 0,003) e sofisticada (p =
0,01), associam-se ao tepe e dizem respeito ao status dos falantes.
A anlise por perfil dos ouvintes (Quadro 10.3) revela tendncias bas-
tante semelhantes comunidade como um todo: em cada grupo, muitas
das caractersticas relevantes representam uma subseleo das caractersticas
acima, sempre associadas s mesmas variantes. Surgem, entretanto, algumas
novas correlaes: as ouvintes do sexo feminino associam os atributos patri-
cinha/mauricinho e mimada ao tepe, e os originrios da Grande So Paulo,
do interior e de outros estados associam solidria/sincera ao retroflexo.
Realizou-se, finalmente, uma anlise multivariada de efeitos mistos, com
a incluso de falante e ouvinte como efeitos aleatrios, a fim de verificar
se as mesmas caractersticas so relevantes em uma anlise multifatorial.
Nessa anlise, variante (tepe ou retroflexo) foi includa como varivel

304
Anlises

Ouvintes Retroflexo Tepe


Sexo feminino simples articulada
caipira sofisticada
trabalhadora mimada
patricinha/mauricinho
Sexo masculino caipira
Regio Central caipira articulada
simples
Regio Perifrica
Origem So Paulo capital caipira articulada
simples sofisticada
Origem Grande SP solidria
Origem So Paulo interior caipira
simples
solidria
Origem Outro estado sincera

Quadro 10.3 Caractersticas correlacionadas com (-r) por perfil dos ouvintes

dependente, ainda que, em rigor, ela seja independente na amostra;22 o intuito


foi poder analisar correlaes com diversas caractersticas simultaneamente.
Incluram-se como variveis independentes as caractersticas que se mostraram
relevantes seja na amostra geral, seja para um subgrupo de ouvintes. Tal
anlise confirmou as correlaes com as caractersticas assinaladas na amostra
geral caipira, simples, articulada e sofisticada com exceo de
trabalhadora, que deixou de ser significativa.
A Figura 10.7 resume visualmente a relao entre a lista completa de
caractersticas e as variantes de (-r). A frequncia com que as caractersticas
foram assinaladas com retroflexo e com tepe representada nos eixos x e
y, respectivamente: quanto mais direita e para baixo, mais associada ao
retroflexo; e quanto mais para a esquerda e para cima, mais associada ao tepe.
A linha diagonal representa um ponto neutro, de igual proporo entre
as variantes. Por exemplo, a caracterstica ligada famlia foi assinalada
frequentemente, mas em propores praticamente idnticas entre as variantes
22
Diferentemente das anlises de produo, a questo no se outras variveis tm influncia no emprego
de (-r), mas sim se a variante ouvida tem influncia na atribuio de caractersticas aos falantes.

305
Anlises

Caractersticas em relao a Tepe e Retroflexo

150 branca

articulada

ligada..familia
independente
100

confianteprtica
sincera simples
alta trabalhadora
Tepe

descolada

solidria
desencanada
confivel
conservadora
tmida
50

engraada
religiosa
paty.mauricinho
mimada irritante
sofisticada metida
deprimida

nerd
preguiosa
gay.lsbica
mal.educada caipira
maconheira
0

0 50 100 150
Retroflexo

Figura 10.7 Frequncia de seleo de caractersticas em estmulos


com Retroflexo e com Tepe

(R = 103; T = 107). As correlaes mais fortes so com os termos que mais


se distanciam desse ponto neutro.
Nota-se que, para todas as caractersticas, a no seleo bastante mais
frequente do que a seleo; por exemplo, a caracterstica branca (canto
superior direito), a mais frequentemente assinalada pelos ouvintes (R = 146,
T = 156), representa 41% (=302/740) do total de respostas. A concentrao
de termos no canto inferior esquerdo mostra que a seleo de caractersticas
foi, em geral, infrequente. Isso significa que as correlaes descritas no
querem dizer que as variantes impeliram os ouvintes diretamente, mas que as
correlaes se do apenas em termos relativos. O termo articulada foi mais
frequentemente assinalado em estmulos com tepe do que com retroflexo (R
= 107, T = 146), mas o nmero de vezes em que o termo foi marcado quando
se ouviu o retroflexo supera o total de vezes em que se assinalou caipira (R

306
Rumo a um modelo do significado social de variveis

= 41, T = 8).
Por outro lado, tambm interessa acusar quais caractersticas no se
mostraram significativamente correlacionadas com a realizao de (-r). Visto
que apenas nove das 30 caractersticas se correlacionam com a varivel (ou
quatro, quando se considera apenas a anlise multivariada), digno de nota
que atributos como alta, branca, religiosa e ligada famlia no se
correlacionem com a varivel, diferentemente, por exemplo, dos resultados
de Lambert et al. (1960). De um modo geral, os ouvintes tambm parecem
ter evitado a atribuio de traos negativos como irritante, metida,
preguiosa, deprimida e mal-educada, para ambas as variantes, tanto
na coleta presencial quanto na coleta online.
Embora a linha diagonal da Figura 10.7 represente uma diviso entre
caractersticas associadas ao tepe e ao retroflexo, a proximidade dos termos
dessa linha e a relativa ausncia de termos nos cantos superior esquerdo
e inferior direito que indicariam fortes correlaes demonstram que a
atribuio de caractersticas a depender das variantes est longe de ser clara
e categrica. Decorre da que retroflexo no significa caipira e simples e
tepe no significa articulada e sofisticada por si ss, pois competem com
muitos outros significados sugeridos pelo mesmo estmulo.
Faz-se necessrio um modelo mais abrangente, que permita englobar os
mltiplos significados sociais das variantes e analisar suas inter-relaes. A
prxima subseo discute uma proposta nesse sentido.

10.4 Rumo a um modelo do significado social


de variveis
At este ponto, demonstrou-se que as variantes de (-r) se correlacionam sig-
nificativamente, na percepo dos ouvintes, com o grau de paulistanidade,
sotaque, centralidade do bairro, formalidade, escolarizao, classe social, e
atributos como caipira, simples, articulada e sofisticada. Ao mesmo
tempo, viu-se que certas correlaes esperadas inicialmente no se mostraram
significativas por exemplo, a associao de tepe com alta ou patrici-

307
Rumo a um modelo do significado social de variveis

nha/mauricinho, ou do retroflexo com solidria, ligada famlia e mais


amigvel. Verificou-se, em especial, uma ampla variabilidade nas respostas,
para todas as variveis. Os resultados sugerem que, longe de estar diretamente
associadas com essas caractersticas, as variantes de (-r) interagem com uma
rede de significados ideologicamente relacionados entre si, a partir dos quais
os ouvintes realizam inferncias sobre o falante.
Eckert (2008) prope um modelo mais dinmico e complexo do significado
social da variao lingustica por meio do conceito de campo indexical.

[...] os significados das variveis no so precisos ou fixos, mas consti-


tuem um campo de significados potenciais um campo indexical, ou
constelao de significados ideologicamente relacionados, qualquer um
dos quais pode ser ativado no uso situado da varivel. O campo
fluido, e cada nova ativao tem o potencial de mud-lo ao ampliar as
ligaes ideolgicas. Assim, a variao constitui um sistema indexical
que incorpora a ideologia na linguagem e que , por sua vez, parte
essencial da construo da ideologia. (Eckert 2008 : 454. Grifo no
original.)23

O conceito de campo indexical parte de uma crtica aos estudos variacionis-


tas que, desde o trabalho inicial de Labov (2008 [1963]) em Marthas Vineyard,
tm abandonado o interesse sobre o significado social da variao em favor
de amplos processos lingusticos, como a Mudana Voclica das Cidades do
Norte no ingls norte-americano; nesse percurso, o significado social passou a
se confundir com as correlaes demogrficas que identificam as categorias
de falantes que tendem a empregar determinadas variantes (Eckert, 2008,
2012). A presente anlise fornece mais evidncias para a interpretao de que
a relao entre variantes e significados sociais se d indiretamente; o fato de
que homens favorecem o emprego de retroflexo (Captulo 5) no implica que a
variante significa masculino feminilidade e masculinidade nada tm a ver
diretamente com as variantes de (-r). Uma questo que permanece em aberto
23
Traduo prpria. Texto original: [...] the meanings of variables are not precise or fixed but rather
constitute a field of potential meanings an indexical field, or constellation of ideologically related
meanings, any one of which can be activated in the situated use of the variable. The field is fluid, and
each new activation has the potential to change the field by building on ideological connections. Thus
variation constitutes an indexical system that embeds ideology in language and that is in turn part
and parcel of the construction of ideology.

308
Rumo a um modelo do significado social de variveis

nos estudos sociolingusticos como certos significados vm a se associar com


determinadas categorias sociais.
Eckert (2008) se baseia no conceito de Silverstein (2013) de ordem
indexical para compor um modelo de significados sociolingusticos. Em
dilogo com os conceitos labovianos de indicadores, marcadores e esteretipos
(ver Captulo 2, p. 30), Silverstein define os ndices de primeira ordem de
modo semelhante a indicadores, variantes geogrficas ou diastrticas que no
se diferenciam em graus de formalidade. A avaliao social sobre os falantes
que as empregam pode vir a se associar ao ndice e se internalizar nos dialetos
dos falantes para indexar outros elementos especficos; segundo Silverstein,
nesse ponto o trao se torna um marcador ou ndice de segunda ordem. A
diferena entre o conceito laboviano e o de Silverstein que, para o ltimo,
um ndice sempre est disponvel para reinterpretao ou atribuio de novos
significados, processo que se d no discurso e em contexto, em um constante
reexame das formas lingusticas. Eckert chama a ateno para o fato de que,
embora os termos primeira, segunda, ensima ordem possam implicar uma
linearidade, a possibilidade de superposio de novos significados caracteriza
o campo ideolgico de associaes de modo fluido e dinmico.
No plano terico, o modelo de ordens e campos indexicais certamente
abre caminho para uma representao mais complexa e coerente com o que
se observa nos usos e nas percepes lingusticas. Eles permitem explicar,
por exemplo, por que nem todos os falantes e grupos sociais reagem s
mesmas variantes homogeneamente; por que o termo articulada, apesar
de correlacionado com o tepe, tambm foi atribudo a muitos estmulos em
que os falantes empregavam o retroflexo; ou por que a correlao de (-r) com
escolarizao do falante no se estende para a atribuio de inteligncia, como
se verifica em muitos outros estudos (p.ex., Mendes no prelo; Campbell-Kibler
2006). certo que a perspectiva variacionista j prev variao; contudo,
mesmo o linguista informado da heterogeneidade ordenada corre o risco de
atribuir significados estticos s variantes: classe social baixa menor grau
de escolaridade sexo masculino.
Por outro lado, uma grave limitao desse modelo o fato de no explicitar
como se formam campos indexicais, para alm de exemplos genricos e

309
Rumo a um modelo do significado social de variveis

especulativos. Tome-se como exemplo a proposta de Eckert (2008) para o


campo indexical de (ING) (Figura 10.8).24

Figura 10.8 Campo indexical de (ING). (Fonte: Eckert 2008 : 466)

Na figura, os termos em negrito se referem a /i/ e aqueles em cinza a /in/.


A autora se baseia nos resultados do experimento de percepo de Campbell-
Kibler (2007a, 2007b, apud Eckert 2008), em que os sujeitos associaram a
variante velar a escolaridade, inteligncia e eloquncia (articulateness), e a
variante apical a informalidade (casual) e descontrao (relaxed). Partindo
da pressuposio de que os significados de /i/ advm da produo total
e portanto mais dispendiosa em relao forma reduzida /in/, a autora
tambm atribui variante apical os significados potenciais de preguioso
(lazy), indiferente (not caring), rebeldia (rebellion) e falta de educao
(impoliteness). Nem todos esses termos figuram no campo indexical, mas este
inclui caractersticas no necessariamente mencionadas pelos sujeitos. Ainda
que a autora afirme que os pares de caractersticas educated/uneducated,
formal/relaxed etc. no devem ser interpretados de modo inflexvel, no fica
claro por que as variantes devem se relacionar atravs de pares de opostos.
Um segundo exemplo de campo indexical fornecido para a pronncia
hiperarticulada de /t/, em palavras como but mas, em contextos em que
normalmente no se espera que seja foneticamente realizado. Diferentes
estudos mostraram a associao desse trao lingustico a figuras sociais como
jovens judeus ortodoxos, homens gays e garotas nerds (respectivamente, Benor
24
As nuvens de palavras nos Captulos 4 a 6 podem ser consideradas um tipo de campo indexical; nelas,
no entanto, representam-se apenas frequncias, mas no a relao entre os termos.

310
Rumo a um modelo do significado social de variveis

2001, Podesva et al 2002, Bucholtz 2001, apud Eckert 2008). A Figura 10.9
representa um campo indexical da varivel que engloba tais personas e outros
significados sociais levantados nesses estudos, em um esforo de imaginar
como se articulam ideologicamente.

Figura 10.9 Campo indexical de (t). (Fonte: Eckert 2008 : 469)


.

Nesse caso, os termos no se relacionam por meio de pares de opostos,


mas pela proximidade de conceitos: elegante formal claro articulado
escolarizado; irritado furioso exaltado enftico. A representao de
Eckert coerente no sentido de propor uma explicao plausvel de como uma
mesma variante se associa a significados sociais e personas aparentemente
desconexos.
Contudo, os problemas que se depreendem desses campos indexicais so
sua falseabilidade e replicabilidade: como garantir que as relaes propostas
tm alguma realidade cognitiva na percepo dos ouvintes? Um pesquisador
independente chegaria mesma representao do campo indexical da varivel?
Como assegurar que o pesquisador no privilegiar certos atributos, de acordo
com suas prprias percepes? Um modelo que no sofra dessas limitaes
deve se pautar por mtodos objetivos o suficiente para que possa ser replicado
em outros estudos, e se basear solidamente nos dados de que se dispe.

311
Rumo a um modelo do significado social de variveis

10.4.1 Modelagem de campos indexicais atravs da


rvore de distncias mnimas
Prope-se aqui um mtodo para computar a coocorrncia e inter-relaes
de mltiplas variveis: a rvore de distncias mnimas, criada a partir de
uma matriz de distncia ou de dissimilaridade. Na criao desse modelo, os
fatores da varivel Zona da Cidade (Zona Oeste, Zona Norte, Zona Sul etc.)
foram transformados em variveis binrias, dependendo de cada fator ter
sido assinalado ou no. Classe Social foi reorganizada em apenas dois nveis
(classe.baixa ou classe.alta), assim como Faixa Etria (at30anos, 30+anos).
A varivel Escolaridade foi descartada, uma vez que j representada pela
varivel quantitativa Escolarizao. Excluram-se tambm quatro termos da
lista de caracterstica que foram assinalados muito infrequentemente (menos de
30 vezes): maconheira, mal-educada, gay/lsbica e nerd. Os demais
se mantiveram como variveis binrias assinalamento vs. no assinalamento
da caracterstica.
O mtodo consiste no clculo de correlaes (ou outras medidas de seme-
lhanas/diferenas) entre todos os pares possveis de variveis, que resulta
em uma matriz com n colunas e n linhas, sendo n o nmero de variveis (no
presente experimento, 63 variveis). Tal clculo foi realizado no programa
R atravs da funo Dist() do pacote amap (Lucas, 2014). A partir da
matriz, computou-se a rvore de distncias mnimas, com auxlio da funo
spantree() do pacote vegan (Oksanen et al., 2013).
A Figura 10.10 uma representao visual da rvore de distncias mnimas.
Os ns mais prximos entre si indicam fatores que coocorreram mais frequen-
temente. A figura permite avaliar no apenas a relao entre as variantes
de (-r) e as demais variveis, mas tambm as interligaes realizadas pelos
ouvintes, conscientemente ou no, entre conceitos evocados nos questionrios.
A variante tepe aparece prxima s noes de paulistanidade, bairro
mais central e classe alta; a atribuio de classe alta, por sua vez, coocorre
frequentemente com o julgamento de maior escolarizao e inteligncia,
e os atributos articulada e branca. A variante retroflexa, por outro
lado, aparece mais fortemente associada s noes de sotaque, caipira e

312
Rumo a um modelo do significado social de variveis

rvore de Distncias Mnimas


irritante

metida
mimada

extroverso

paty.mauricinho

amigos

amicabilidade

at30anos
religiosa


ligada..familia
femininidade
engraada

deprimida
ZN

desencanada
descolada

solidria
tmida
sofisticada

sincera sotaque
articulada prtica

independente confivel

confiante trabalhadorasimples


RETROFLEXO
paulistanidade bairro.central caipira

TEPE

classe.alta

inteligncia escolarizao

classe.baixa

branca ZL

preguiosa

alta
ZO

ZS

masculinidade

30+anos

conservadora ZC

formalidade

Figura 10.10 Campo indexical de (-r) em So Paulo

simples, termo que se relaciona com trabalhadora e classe baixa.


No se pretende propor que a figura seja uma representao fiel do mapa
mental dos ouvintes, ou que a srie de inferncias tenha seguido exatamente
os caminhos sugeridos. Ao explicitar as relaes estabelecidas pelos sujeitos
entre conceitos diversos na formao de uma imagem do falante, a rvore
permite inferir, de modo mais confivel e menos impressionstico, quais termos
so relativamente mais associados entre si e as possveis rotas de associao
que conduziram os ouvintes no preenchimento do questionrio.
Ainda que o foco de interesse aqui seja sobre o tepe e o retroflexo, pouco
plausvel que os ouvintes tenham se baseado nas variantes como ponto de
partida de suas inferncias. possvel imaginar, por exemplo, que a primeira
impresso do ouvinte foi a de um professor universitrio dando uma aula ou
palestra, como no excerto (5) (p. 277), a partir de um julgamento de boa
articulao verbal do falante; o ouvinte pode ento ter inferido um maior grau
de escolarizao e sofisticao, e possivelmente que se trata de uma pessoa

313
Rumo a um modelo do significado social de variveis

de classe mdia ou mdia alta que vive em um bairro correspondente a sua


classe; nesse sentido, escutar uma ou outra variante conscientemente ou
no pode levar ao reforo de uma determinada imagem, sua conciliao
ou reviso de outros elementos, ou a formulao de uma nova imagem por
completo. Vale notar que foi possvel observar, na coleta presencial, a troca
ou o ajuste de respostas previamente assinaladas e, por vezes (embora muito
mais raramente), at mesmo a reviso de respostas fornecidas para outro
estmulo ouvido previamente.
A conexo entre todos os termos da rvore mostra que possvel se chegar
a qualquer um deles, mas com diferentes probabilidades de associao. O
termo articulada, por exemplo, encontra-se prximo ao centro da rvore,
quase a meio caminho entre o tepe e o retroflexo, embora um pouco mais
prximo do primeiro; isso explica a correlao observada anteriormente com
o tepe, ao mesmo tempo que permite compreender por que o termo tambm
foi frequentemente assinalado quando se ouviu o retroflexo. Por outro lado, o
termo caipira se encontra mais prximo apenas de retroflexo, sotaque e
simples, e bastante distante do tepe, o que explica sua forte correlao com
o retroflexo, ainda que assinalado menos frequentemente do que articulada.
O modelo de Eckert (2008) prev a dinamicidade dos significados sociais
das variantes, que podem diferir de acordo com os falantes, os ouvintes, a
situao de fala, a postura (stance; ver, p.ex., Jaffe 2009) dos interlocutores
etc. certo que as prprias condies experimentais nesta anlise procuraram
diminuir o efeito de todas essas variveis, mas j se observou que ouvintes de
diferentes perfis sociais tm tendncia a atribuir maior ou menor importncia
para cada varivel. Essas diferenas de percepo podem ser visualizadas
nas figuras adiante, que apresentam rvores de distncias mnimas de acordo
com o Sexo/Gnero (Figura 10.11), a Regio de Residncia (Figura 10.12) e
a Origem (Figura 10.13) dos ouvintes (esta ltima, em uma diviso binria
paulistanos vs. no paulistanos).
A comparao desses diagramas com o da amostra geral possibilita a
identificao de padres recorrentes em todos os grupos, bem como suas
especificidades. Certos clusters de associaes aparecem em todas as rvo-
res: paulistanidade-bairro.central-classe.alta-escolarizao; retroflexo-caipira-

314
Rumo a um modelo do significado social de variveis

rvore de Distncias Mnimas Masculino


sotaque

RETROFLEXO

metida
preguiosa deprimida

paty.mauricinho caipira



tmida
irritante

classe.baixa ZL
mimada

simples

at30anos

amigos femininidade

amicabilidade

engraada trabalhadora

extroverso
descolada
confivel 30+anos

desencanada prtica
masculinidade

independente ligada..familia


alta

branca articulada

religiosa

solidria confiante

formalidade

ZS sincera conservadora

ZC

ZO

inteligncia

sofisticada

ZN

escolarizao

bairro.central

classe.alta

paulistanidade

TEPE

Figura 10.11 Campos indexicais de (-r) de acordo com Sexo/Gnero dos ouvintes

315
Rumo a um modelo do significado social de variveis

rvore de Distncias Mnimas Regio Central


confivel

sincera

independente

sofisticada

prtica

confiante

engraada articulada

ZS desencanada

descolada

extroverso

ZN

irritante

amigos at30anos metida

amicabilidade paty.mauricinho preguiosa deprimida



ZO branca solidria mimada


ZL

classe.alta femininidade trabalhadora tmida sotaque





ligada..familia simples

paulistanidade bairro.central religiosa



classe.baixa

ZC

RETROFLEXO

TEPE escolarizao
caipira

inteligncia

formalidade

masculinidade

30+anos

alta

conservadora

rvore de Distncias Mnimas Regio Perifrica


RETROFLEXO sotaque

irritante
ZL
caipira
mimada

classe.baixa

metida

sincera

paty.mauricinho simples

TEPE paulistanidade


ZN
escolarizao bairro.central

trabalhadora deprimida

inteligncia classe.alta

sofisticada confivel
tmida

confiante ligada..familia

articulada religiosa

solidria

prtica conservadora

extroverso
formalidade

independente masculinidade

30+anos alta ZC

amicabilidade

femininidade
at30anos amigos


branca ZS

descolada

engraada

ZO

desencanada

preguiosa

Figura 10.12 Campos indexicais de (-r) de acordo com


Regio de Residncia dos ouvintes

316
Rumo a um modelo do significado social de variveis

rvore de Distncias Mnimas Paulistanos


branca

alta caipira

conservadora sotaque

30+anos

masculinidade

RETROFLEXO

formalidade

classe.baixa
ZC
ZL

inteligncia religiosa simples



escolarizao ZOligada..familia trabalhadora


paulistanidade amigos tmida

TEPEbairro.central femininidade at30anos



deprimida


ZS amicabilidade

classe.alta extroverso

paty.mauricinho descolada

mimada

metidaarticulada engraada

irritante confiante prtica




sofisticada desencanada

preguiosa

independente

sincera

solidria

confivel

ZN

rvore de Distncias Mnimas No Paulistanos



deprimida tmida


preguiosa 30+anos

formalidade
metida masculinidade

conservadora
paty.mauricinho

mimada


alta

irritante
at30anos

independente confiante

femininidade

amicabilidade prtica

sincera

descolada
ZO

desencanada amigos

articulada ZN RETROFLEXO



extroverso escolarizao caipira


ZS
classe.alta branca

confivel

sofisticada solidria

inteligncia bairro.central

sotaque

trabalhadora

paulistanidade

ZC

simples

TEPE classe.baixa

engraada
ligada..familia
ZL

religiosa

Figura 10.13 Campos indexicais de (-r) de acordo com Origem dos ouvintes

317
Rumo a um modelo do significado social de variveis

simples; simples-trabalhadora-classe baixa-ZL; patricinha/mauricinho-mimada-


metida-irritante; amigos-amicabilidade-extroverso. Os dois primeiros sempre
aparecem prximos s variantes tepe e retroflexa, respectivamente, o que
mostra a consistncia da associao desses termos em toda a comunidade.
A correlao verificada entre o retroflexo e a Zona Leste (e com nenhuma
outra zona) pode ser explicada por essa rede de relaes. No imaginrio
da comunidade, essa parte da cidade se associa classe baixa e a pessoas
simples e trabalhadoras. Tal associao se d parcialmente com base
nas experincias cotidianas e parcialmente por um processo de apagamento
no sentido de Irvine (2001) , em que certos dados so ignorados, como a
presena macia da classe mdia e mdia alta nessa zona, ou a existncia da
classe baixa em todas as zonas. A percepo de que os falantes eram da Zona
Leste quando ouvidos com o retroflexo, desse modo, ocorre pela associao
indireta, mas recorrente, entre os termos dessa rede de conceitos.
O termo sotaque, apesar de figurar no cluster retroflexo-caipira-simples
na amostra geral, aparece mais indiretamente relacionado com o retroflexo
para os ouvintes da regio perifrica (mediado pelo n classe baixa) e em
posio bastante distante na rvore dos no paulistanos para esses ltimos,
alis, mais prximo do tepe do que do retroflexo. Essas diferenas refletem as
correlaes observadas anteriormente: para os moradores de regies perifricas,
o retroflexo no um sotaque to marcado, e para os provenientes de outras
cidades, tanto o retroflexo quanto o tepe so sotaques.
Outros clusters surgem em diferentes pontos. O cluster patricinha/mauri-
cinho-mimada-metida-irritante figura mais prximo da variante tepe nas
rvores das mulheres, da regio perifrica e de paulistanos, mas relativamente
equidistante das variantes nas rvores dos homens, da regio central e no pau-
listanos. O fato de certas redes de conceitos se moverem em bloco d pistas
dos caminhos possveis para novas inferncias e potenciais significados sociais
das variantes nas palavras de Silverstein (2013, apud Eckert 2008 : 464),
sempre imanentes, o valor n + 1 da ordem indexical. So noes que se
associam no imaginrio das pessoas de modo relativamente independente de
usos lingusticos (ou de certas variantes especficas); uma vez que um dos
conceitos se aproxima de uma variante, toda aquela rede de relaes se torna

318
Sntese

disponvel para novos significados.


O modelo de rvore de distncias mnimas tambm mostra que nem
todos os significados imanentes tm a mesma probabilidade de associao a
variantes. O cluster que engloba patricinha parece ter entrada preferencial
via classe.alta na rvore de mulheres, paulistanos e da regio perifrica ou
via feminilidade na rvore de homens, regio central e no paulistanos. Na
anlise das escalas de diferenciais semnticos, constatou-se que as diferentes
pronncias de (-r) se correlacionam significativamente com Classe Social,
mas no com Feminilidade. Tal fato prev que os ouvintes que associam o
cluster patricinha/mauricinho-mimada-metida-irritante classe alta (como
as mulheres) tm maior probabilidade de tambm associ-lo ao tepe do que
os ouvintes que associam o cluster a Feminilidade (como os homens). De fato,
nas correlaes da lista de caracterstica por grupos de ouvintes, verificou-se
que as mulheres associam o tepe a patricinhas (p < 0,02), diferentemente dos
homens (p = 0,71) (ver Quadro 10.3, p. 305).
Desse modo, a rvore de distncias mnimas permite representar a dina-
micidade de relaes entre variantes lingusticas e seus potenciais significados
sociais, ao mesmo tempo que mostra que tais relaes no so fortuitas,
caticas ou radicalmente subjetivas: h estrutura nessas relaes e certas
inferncias so mais provveis do que outras. Um modelo coerente dos signifi-
cados sociais da variao deve abarcar tais associaes que fazem parte da
competncia comunicativa dos membros da comunidade.

10.5 Sntese
As anlises das variveis quantitativas, qualitativas e da lista de caractersticas
revelaram resultados concordantes entre si sobre os significados sociais de
(-r) na cidade de So Paulo. O principal significado das variantes se refere
a identidades geogrficas (capital vs. interior; centro vs. periferia), e tais
significados se estendem para o status relativo dos falantes na comunidade e,
em menor grau, a inferncias sobre o carter dos indivduos.
Quando houve correlaes significativas, todas elas seguiram a direo
prevista: o retroflexo julgado mais negativamente em traos que se refe-

319
Sntese

rem ao status dos falantes (classe social, nvel de escolaridade, formalidade,


centralidade do bairro, articulao e sofisticao), e mais positivamente em ca-
ractersticas associadas s dimenses de solidariedade e dinamismo (trabalho,
simplicidade, sinceridade, solidariedade). Tais resultados esto de acordo com
estudos prvios, que verificaram que lnguas, variedades e variantes favorecidas
pelas classes menos privilegiadas so percebidas mais negativamente quanto
a atributos de status e valorizadas quanto a traos de solidariedade.
Se todas as correlaes observadas seguem as previses, por que realizar
anlises de percepo?
Primeiramente, necessrio atentar para o fato de que certas hipteses
aventadas no se concretizam nos dados, como a correlao com Intelign-
cia, Feminilidade/Masculinidade, e atributos pessoais como aparncia fsica
e religiosidade. Um modelo de percepes sociolingusticas deve explicitar
diferenas entre comunidades e entre variveis sob investigao. Diferente-
mente dos resultados de Mendes (no prelo) para a (CN) em So Paulo, os
significados sociais de (-r) no parecem se estender para noes de masculi-
nidade/feminilidade o que mostra que correlaes verificadas nas anlises
de produo no se replicam automaticamente na percepo dos ouvintes.
Alm disso, no caso de (-r), julgamentos sobre a escolaridade no se estendem
para o grau de inteligncia dos falantes os falantes so percebidos como
menos escolarizados quando ouvidos com retroflexo, mas no como menos
inteligentes.
Ao mesmo tempo, verificaram-se interaes entre as variantes, por um
lado, e a Regio de Residncia e Origem dos ouvintes, por outro, quanto
ao grau de Paulistanidade e de Sotaque dos falantes, o que revela que tais
conceitos diferem entre grupos sociais. Tais diferenas tm consequncias para
a interpretao dos significados sociais das variantes de (-r): os habitantes
de regies mais perifricas so mais tolerantes quanto paulistanidade do
retroflexo, bem como os migrantes de outros estados, para quem o retroflexo
to paulistano quanto o tepe. Entretanto, enquanto os moradores de bairros
perifricos, os paulistas advindos da Regio Metropolitana e os do interior do
estado atenuam a marcao do retroflexo como um sotaque, os migrantes
de outros estados se alinham com os paulistanos de regies mais centrais ao

320
Sntese

considerar o retroflexo como uma forma mais marcada do que o tepe.


Um modelo de percepes sociolingusticas e dos significados sociais de
variantes deve dar conta no apenas das inferncias realizadas pelos ouvintes,
mas tambm daquelas que se do diferentemente ou que no se realizam, e
por qu. Este captulo se baseou no conceito de Eckert (2008) de campos
indexicais para propor um modelo de como os significados sociais se associam
a determinadas variantes, e apresentou o modelo de rvores de distncias
mnimas para computar e representar, de modo falsevel e no impressio-
nstico, a rede de associaes realizadas pelos ouvintes. Tal modelo permite
interpretar as correlaes observadas e prever quais significados tm maior
probabilidade de ser atribudos s variantes; permite, enfim, entrever a dina-
micidade de percepes e de significados sociais das variantes, sua estrutura e
seu encaixamento social.

321
11
Concluso

O presente trabalho teve como principal objetivo analisar as relaes entre


processos de variao e mudana lingustica, por um lado, e a manifestao
de identidades e de significados sociais atravs de usos lingusticos, por outro,
em uma comunidade ainda pouco estudada mas particularmente frtil para
o desenvolvimento de investigaes sociolingusticas. Por meio do exame de
quatro variveis do portugus paulistano a realizao de (e) como monotongo
ou ditongo; a pronncia de (-r) como tepe ou retroflexo; a alternncia entre
marca zero e marca explcita de concordncia nominal; e a alternncia de
nmero na concordncia verbal , exploraram-se as relaes entre avaliao,
produo e percepo lingustica.
Mais especificamente, a pesquisa se voltou s seguintes questes: (i)
quais identidades urbanas se associam ao emprego dessas variantes; (ii) como
funcionam os mecanismos que regulam a adeso ou a resistncia a certas
normas lingusticas por parte de diferentes grupos sociais; e (iii) se a cidade
de So Paulo pode ser considerada uma nica comunidade de fala.
Demonstrou-se que os falantes paulistanos, no obstante o alto grau de
heterogeneidade e diversidade sociodemogrfica da comunidade, revelam usos
e avaliaes amplamente concordantes: os indivduos exibem as mesmas regras
variveis e compartilham de avaliaes quanto ao valor social das variantes.
Os padres de regras variveis, do tipo h maior tendncia de emprego de
marca zero em plurais regulares do que em plurais irregulares, ou em SNs com
o trao [+humano] do que [-humano], aplicam-se consistentemente na fala de
indivduos e na comunidade como um todo. No entanto, o compartilhamento
Concluso

de normas de uso e de avaliao no implica homogeneidade, tampouco a


atuao independente de uma srie de variveis.
As anlises das quatro variveis sociolingusticas mostram que a consta-
tao de variao estvel ou de mudana em progresso pode esconder
um encaixamento mais complexo, mas igualmente estruturado, dentro da
comunidade. Ao mesmo tempo, os fluxos e contrafluxos podem ser mais
bem compreendidos pela anlise das associaes feitas pelos membros da
comunidade com certos significados e identidades sociais. Se a mudana
lingustica nem sempre unidirecional, o que a faz ser em certos casos?
Quando se verificam tendncias divergentes, quais as motivaes para tal?
Esta tese explora o possvel impacto dos significados sociais das variantes
nesses processos.
A anlise sobre o encaixamento social e lingustico de (e) revelou uma
provvel mudana em curso, em tempo aparente, na direo da variante
ditongada [ej]. Tal mudana tem sido liderada pelas mulheres e membros
de classes mais altas, e tem ocorrido abaixo da conscincia dos falantes.
Argumentou-se que tal mudana tem se dado vigorosa e unidirecionalmente
justamente pelo fato de a varivel constituir um marcador para os paulistanos,
que conscientemente no associam a variante a grupos sociais especficos,
tampouco apresentam um metadiscurso elaborado sobre suas regras de uso,
diferentemente do que ocorre com (-r), (CN) e (CV).
Essas trs variveis, em contraste, encontram-se em aparente variao
estvel na comunidade, mas certos grupos sociais tm se movimentado em
direes diferentes ou at contrrias. No caso de (-r), os falantes de classes
mais baixas e os residentes de regies perifricas demonstram um movimento
na direo da variante retroflexa, enquanto os de classes mais altas e regies
mais centrais exibem estabilidade ou incio de mudana em direo ao tepe.
O movimento do primeiro grupo na direo do retroflexo possivelmente foi
motivado pela presena de uma terceira variante na comunidade, a realizao
fricativa de (-r), associada a migrantes do Norte e do Nordeste do pas.
Sugeriu-se que o retroflexo foi reinterpretado como variante local e de prestgio
por parte desses grupos, interpretao que tambm se apoia na anlise de
percepes, j que migrantes de outros estados que hoje vivem em So Paulo

323
Concluso

parecem no diferenciar o retroflexo e o tepe em termos de paulistanidade


(embora considerem o retroflexo como um sotaque mais marcado do que o
tepe). Por parte dos jovens de classes mais altas, seu movimento divergente
na direo do tepe (contrrio aos falantes mais velhos de mesma classe social)
tem se dado como reao percepo de que o retroflexo se associa no s a
interioranos, mas tambm a falantes de classes mais baixas e de periferia.
As concordncias de nmero em SNs, SVs de 1PP e SVs de 3PP apresentam
estratificao bastante similar na comunidade. As concordncias nominal
e verbal exibem um quadro de mudana na direo da marca explcita de
plural em regies mais centrais e se configuram em curvas em U nas regies
perifricas possvel exceo feita apenas para a concordncia verbal de
1PP, que esboa mudana em favor da marca zero entre os habitantes da
periferia. No caso da concordncia nominal, tal mudana para a variante
sancionada pela norma padro por parte dos jovens de reas centrais parece
estar relacionada com o enfraquecimento da associao da marca zero com
identidades locais, com bairros tradicionais e com noes de paulistanidade,
prevalecendo o discurso do erro, da falta de escolaridade e de ignorncia
do bom portugus. Sugeriu-se, entretanto, que a variante tambm funciona
como ndice de masculinidades para os homens paulistanos, o que resgata seu
valor social em determinados contextos e renova sua vitalidade.
Quanto concordncia verbal, 1PP e 3PP se distribuem de modo muito
semelhante na comunidade, com um mesmo conjunto de regras variveis, mas
se diferenciam em valor social pelo fato de a marca zero de 1PP ser favorecida,
em relao de 3PP, por falantes menos escolarizados, de classe mais baixa e
de menor mobilidade, cuja fala tem maior probabilidade de ser estigmatizada
(nos demais grupos sociais, 1PP e 3PP no se diferenciam em tendncias de
uso).
Os recorrentes padres de correlao entre as quatro variveis sob anlise
e variveis sociais Sexo/Gnero, Faixa Etria, Nvel de Escolaridade, Regio
de Residncia, Classe Social, Origem dos Pais e Mobilidade se refletem em
certo grau de coeso dialetal na comunidade, atravs do emprego simultneo
de certos pares de variantes. Entretanto, a covariao entre pares de variveis
sociolingusticas no to frequente ou to robusta quanto similaridades

324
Concluso

lingusticas e de estratificao social levariam a supor: a varivel (e) se encaixa


de modo independente das demais, e a pronncia retroflexa de (-r) no covaria
com seu apagamento ou com o emprego de 1PP-; as concordncias verbais
de 1PP e de 3PP, embora constituam uma mesma varivel sociolingustica,
no necessariamente covariam nos usos dos falantes. Argumentou-se que a
coeso dialetal no promovida por amplas categorias sociodemogrficas
como Sexo/Gnero ou Faixa Etria, mas pelo princpio mais fundamental de
densidade de comunicao e por variveis lingusticas que se correlacionam
com mltiplas variveis dependentes, sendo as formas menos marcadas as
mais propensas covariao.
Associaes entre variantes lingusticas e significados sociais no decorrem
diretamente das correlaes verificadas nas anlises de produo lingustica.
Para compreender o impacto de seus mltiplos significados sociais nunca
estticos, mas sempre dinmicos e situados em processos de variao e de
mudana, necessrio se voltar aos mecanismos pelos quais certas variantes
vm a adquirir certos valores. A anlise de percepes sobre (-r) em So
Paulo mostrou que as variantes se associam a uma rede de significados
que se organizam em clusters, cada qual com diferentes probabilidades de
associao com variantes lingusticas. Tais probabilidades so mediadas por
caractersticas sociais dos ouvintes; embora diferentes grupos demonstrem
grande consenso quanto aos valores relativos das variantes p.ex., maior
grau de paulistanidade do tepe ou maior grau de sotaque do retroflexo ,
as diferenas de graus de avaliao so relevantes, pois constituem o locus
privilegiado para a atribuio de novos significados sociais e o desencadeamento
de novos movimentos lingusticos.
Todos esses padres fazem parte da competncia comunicativa dos mem-
bros de uma comunidade. Este estudo se voltou ao desenvolvimento de
modelos sobre tais conhecimentos, que compreendem:
(i) as taxas de emprego de variantes em diferentes grupos com os quais os
falantes tm contato;
(ii) as tendncias de emprego de variantes em contextos especficos, sociais
(quanto situao de fala, aos interlocutores envolvidos, a grupos sociais
locais e censitrios etc.) e lingusticos (quanto ao contexto fnico,

325
Concluso

classe da palavra etc.);


(iii) quais variantes tendem a coocorrer e quais se encaixam de modo inde-
pendente;
(iv) o valor e os significados sociais de variantes em contextos situados de
usos lingusticos, sejam tais significados imanentes ou ratificados pela
comunidade.
Tais conhecimentos no precisam ser conscientes para ser colocados em
prtica. Do mesmo modo que no necessrio saber equaes de segundo grau
para se atravessar uma rua e tal conhecimento est envolvido no clculo de
velocidades, de tempos e de distncias , tampouco os falantes precisam saber
falar sobre as competncias envolvidas em suas interaes cotidianas para se
comunicar eficientemente. Esses conhecimentos so aprendidos na experincia
cotidiana (que difere de indivduo para indivduo) e so bem estruturados.
Alm dessas questes mais amplas, o presente estudo avana em certos
pontos de interesse especficos das anlises sociolingusticas:
(i) a discusso a respeito de escolaridade e de classes sociais em comunidades
brasileiras;
(ii) a utilizao de novas ferramentas de anlise, como o programa R;
(iii) mtodos para a manipulao de grandes quantidades de dados;
(iv) mtodos para a computao de campos indexicais de variveis e variantes
lingusticas.
Os estudos sociolingusticos brasileiros tradicionalmente se baseiam em
nveis de escolaridade para traar inferncias a respeito de influncias tanto su-
pravernaculares quanto da posio socioeconmica dos falantes sobre sua fala.
Ainda que indubitavelmente interligadas, essas variveis e seus respectivos
efeitos no coincidem, sobretudo em uma comunidade em que o aumento dos
nveis mdios de escolarizao no conduziu erradicao de classes sociais
longe disso. Linguisticamente, as regras variveis quanto presena de marca
zero de (CN) de acordo com a Posio Linear do vocbulo, em termos binrios
(primeira posio vs. outras) ou em termos contnuos (primeira, segunda, ter-
ceira posio etc.), revela o impacto da escolarizao, mas no de classe social.
As correlaes com Nvel de Escolaridade e Classe Social observadas neste
estudo sempre sinalizaram a preponderncia da segunda sobre a primeira,

326
Concluso

como uma varivel com maior poder explanatrio dos padres de variao.
No se pretende haver apresentado aqui um modelo acabado para a anlise
da varivel Classe Social, em So Paulo ou para o portugus brasileiro, mas
se propem critrios que devem ser refinados em estudos futuros.
As anlises deste trabalho foram desenvolvidas com o programa R, que
no apenas permite realizar o teste estatstico de correlaes em anlises
multivariadas como no Varbrul/GoldVarb, mas tambm empregar uma gama
de outras ferramentas estatsticas e computacionais (modelos de efeitos mistos,
testes-t, correlaes de Pearson, automatizao de rotinas atravs de scripts
para manipulao de grande quantidades de dados, criao de grficos, entre
muitas outras). Trata-se de um valiosssimo recurso adicional na caixa de
ferramentas de anlises sociolingusticas.
Em especial, apresentou-se um mtodo para computar a coocorrncia de
associaes realizadas pelos ouvintes do experimento de percepo, com vistas
a criar modelos falseveis e empiricamente embasados de campos indexicais
de variveis/variantes lingusticas. Tais modelos possibilitam uma melhor
interpretao de resultados sobre correlaes e de como os significados sociais
podem ser a um tempo no estticos e estruturados.
Finalmente, cabe ressaltar que este trabalho atualiza uma agenda de
pesquisas sobre o portugus da cidade de So Paulo, na qual tambm se
incluem o contato lingustico com italianos, rabes, japoneses, bolivianos,
peruanos e brasileiros de toda parte; inmeras comunidades de prticas que
convivem no espao urbano; os padres de variao dos falantes que residem
nas dezenas de outros municpios que compem a Regio Metropolitana e
transitam pela capital cotidianamente. A diversidade sociodemogrfica de
So Paulo ainda deixa muito a se explorar.

327
Referncias Bibliogrficas

Abaurre, Maria Bernadete Marques & Pagotto, Emilio Gozze. Nasa-


lizao fontica e variao. In: Abaurre, Maria Bernadete M. (Ed.),
Gramtica do portugus culto falado no Brasil: a construo fonolgica da
palavra, pp. 141164. So Paulo: Contexto, 2013.

Amaral, Amadeu. O dialeto caipira. (Domnio Pblico), 1920.


URL http://www.dominiopublico.gov.br/download/texto/bi000004.
pdf

Antonino, Vivian. A concordncia nominal em predicativos do sujeito e em


estruturas passivas no portugus popular do interior do estado da Bahia.
Dissertao de Mestrado. Salvador: UFBA, 2007. 119f.
URL https://repositorio.ufba.br/ri/bitstream/ri/12040/1/
Vivian%20Antonino%20-%20Disserta%C3%A7%C3%A3o.pdf

Ash, Sharon. Social class. In: Chambers, J.K. & Schilling-Estes,


N. (Eds.), The handbook of language variation and change, pp. 350367.
Malden, MA: Blackwell, 2013 [2002].

Baayen, R. Harald. Analysing linguistic data: a practical introduction to


Statistics. Cambridge: Cambridge University Press, 2008.

Battisti, Elisa. Elevao das vogais mdias pretnicas em slaba inicial de


vocbulo na fala gacha. Dissertao de Mestrado. Porto Alegre: UFRGS,
1993. 125f.

. A reduo dos ditongos nasais tonos. In: Bisol, Leda & Brescan-

328
Referncias

cini, Claudia (Eds.), Fonologia e variao: recortes do portugus brasileiro,


pp. 183202. Porto Alegre: EdiPUCRS, 2002.

. Redes sociais, identidade e variao lingustica. In: Freitag,


Raquel Meister Ko (Ed.), Metodologia de coleta e manipulao de dados
em Sociolingustica, pp. 7998. So Paulo: Blucher, 2014.
URL http://blucheropenaccess.com.br/pdf/mcmds/7cap.pdf

Battisti, Elisa, Dornelles Filho, Adalberto Ayjara, Lucas, Joo


Ignacio Pires & Bovo, Nnive Magdiel Peter. Palatalizao das oclusivas
alveolares e a rede social dos informantes. ReVEL Revista Virtual de
Estudos da Linguagem, vol. 5(9), 129, 2007.
URL http://www.revel.inf.br/files/artigos/revel_9_
palatalizacao_das_oclusivas_alveolares.pdf

Bayley, Robert. The quantitative paradigm. In: Chambers, J.K. &


Schilling-Estes, N. (Eds.), The handbook of language variation and
change, pp. 85107. Malden, MA: Blackwell, 2 ed., 2013 [2002].

Bechara, Evanildo. Moderna gramtica portuguesa. Rio de Janeiro: Lucerna,


37 ed., 2005.

Becker, Kara. /r/ and the construction of place identity on New York
Citys Lower East Side. Journal of Sociolinguistics, vol. 13(5), 634658,
2009.

Bentes, Anna Christina & Rios, Vivian Cristina. Razo e rima: reflexes
em torno da organizao tpica de um rap paulista. Cadernos de Estudos
Lingusticos, vol. 48(1), 115124, 2006.
URL http://revistas.iel.unicamp.br/index.php/cel/article/
view/1547/1120

Bieler da Silva, Mariane Esteves. Entre duas metrpoles: a sociolin-


gustica de Itanhandu. Projeto de Mestrado (CAPES) apresentado ao
Programa de Ps-Graduao em Semitica e Lingustica Geral do DL
FFLCHUSP, 2013. Ms.

329
Referncias

Bisol, Leda. A nasalidade, um velho tema. DELTA, vol. 14, 2746, 1998.
URL http://www.scielo.br/scielo.php?script=sci_arttext&pid=
S0102-44501998000300004&lng=en&nrm=iso

Bloomfield, Leonard. Language. London: George Allen and Unwin Ltd.,


1973 [1933].

Boersma, Paul & Weenink, David. Praat: doing phonetics by computer.,


2014. ltimo acesso em 25 set./2014.
URL http://www.fon.hum.uva.nl/praat/

Bortoni-Ricardo, Stella Maris. The urbanization of rural dialect speakers.


Cambridge: Cambridge University Press, 1985.

Bourdieu, Pierre. Language and Symbolic Power. Cambridge: Polity Press,


1991.

Brando, Silvia. Nas trilhas do -R retroflexo. Signum: Estudos Lingusti-


cos, vol. 10(2), 265283, 2007.
URL http://www.uel.br/revistas/uel/index.php/signum/article/
view/4448/5073

. Variantes [+ant] de R na fala fluminense. Anais do VI Congresso


Internacional da ABRALIN, vol. 1, 26852692, 2009.
URL http://abralin.org/site/publicacao-em-anais/
abralin-joao-pessoa-2009/

Brando, Silvia Figueiredo & Vieira, Silvia Rodrigues. Concordncia


nominal e verbal: contribuies para o debate sobre o estatuto da variao
em trs variedades urbanas do portugus. Alfa, vol. 56(3), 10351064,
2012.
URL http://seer.fclar.unesp.br/alfa/article/view/4913/4371

Brescancini, Claudia & Monaretto, Valria Neto de Oliveira. Os rticos


no sul do Brasil: panorama e generalizaes. Signum: Estudos Lingusticos,
vol. 11(2), 5166, 2008.

330
Referncias

URL http://www.uel.br/revistas/uel/index.php/signum/article/
view/3041/2584

Callou, Dinah, Leite, Yonne & Moraes, Joo. Processo(s) de enfra-


quecimento consonantal no portugus do Brasil. In: Abaurre, B. &
Rodrigues, A. (Eds.), Gramtica do portugus falado: novos estudos
descritivos, vol. VIII, pp. 537555. Campinas: Editora da Unicamp, 2002.

Callou, Dinah, Moraes, Joo & Leite, Yonne. Variao e diferenciao


dialetal: a pronncia do /r/ no portugus do Brasil. In: Gramtica do
portugus falado, vol. VI. Campinas: Editora da Unicamp, 1996.

. Apagamento do R final no dialeto carioca: um estudo em tempo


aparente e tempo real. DELTA [online], vol. 14, 0000, 1998.
URL http://www.scielo.br/scielo.php?pid=
S0102-44501998000300006&script=sci_arttext

Camacho, Roberto Gomes. Uma reflexo crtica sobre a teoria sociolingus-


tica. DELTA, vol. 26(1), 141162, 2010.
URL http://www.scielo.br/pdf/delta/v26n1/06.pdf

Campbell-Kibler, Kathryn. Listener perceptions of sociolinguistic varia-


bles: the case of (ing). Tese de Doutorado. Stanford University, 2006. 282f.
URL http://www.ling.ohio-state.edu/~kbck/KCK_diss.pdf

. The nature of sociolinguistic perception. Language Variation and


Change, vol. 21, 135156, 2009.

. The effect of speaker information on attitudes toward (ING).


Journal of Language and Social Psychology, vol. 29(2), 214223, 2010a.

. Sociolinguistics and perception. Language and Linguistics Compass,


vol. 4(6), 377389, 2010b.

. The Implicit Association Test and sociolinguistic meaning. Lingua,


vol. 122(7), 753763, 2012.

331
Referncias

Canever, Fernanda. Evidncias para um modelo de lngua baseado no uso:


o infinitivo flexionado em portugus brasileiro. Dissertao de Mestrado.
So Paulo: FFLCH-USP, 2012. 165f.
URL http://www.teses.usp.br/teses/disponiveis/8/8139/
tde-02082012-133430/pt-br.php

Castilho, Ataliba T. (Ed.). Gramtica do portugus falado. Campinas:


Editora da Unicamp, 1990.

. Histria do portugus paulista, vol. I Srie Estudos. Campinas:


Instituto da Linguagem/UNICAMP, 2009.

Castilho, Ataliba T., Jubran, Cllia Cndida A. S. & Koch, Ingedore


G. V. (Eds.). Gramtica do portugus culto falado no Brasil. Campinas:
Editora da Unicamp, 2006.

Castilho, Ataliba T. & Preti, Dino (Eds.). A linguagem falada culta na


cidade de So Paulo: materiais para seu estudo, vol. I Elocues Formais.
So Paulo: T.A. Queiroz, 1986.

. A linguagem falada culta na cidade de So Paulo: materiais para


seu estudo, vol. II Dilogos entre dois informantes. So Paulo: T.A.
Queiroz/FAPESP, 1987.

Cedergren, Henrietta J. & Sankoff, David. Variable rules: Performance


as a statistical reflection of competence. Language, vol. 50(2), 333355,
1974.
URL http://www.ling.upenn.edu/courses/cogs501/
CedergrenSankoff1974.pdf

Celia, Gianni Fontis. As vogais mdias pretnicas na fala culta de Nova


Vencia. Dissertao de Mestrado. Campinas: IEL/Unicamp, 2004.
URL http://www.bibliotecadigital.unicamp.br/document/?code=
vtls000316849

Chambers, Jack K. Sociolinguistic Theory. Linguistic variation and its


social significance. Oxford: Blackwell, 1995.

332
Referncias

Cheshire, Jenny. Sex and gender in variationist research. In: Chambers,


J. K., J., Trudgill, P. & Schilling-Estes, N. (Eds.), The handbook of
language variation and change, pp. 423443. Malden, MA: Blackwell, 2002.

Clements, G. N. & Hume, Elizabeth V. The internal organization of speech


sounds. In: Goldsmith, John A. (Ed.), The handbook of phonological
theory, pp. 245306. Oxford: Blackwell, 1995.

Coelho, Rafael F. nis na fita! Duas variveis lingusticas numa vizi-


nhana da periferia paulistana. O pronome de primeira pessoa do plural
e a marcao de plural no verbo. Dissertao de Mestrado. So Paulo:
FFLCH-USP, 2006. 182f.

Colley, Michael. Variao fontica nas vogais nasais e nasalizadas no


portugus carioca. Trabalho apresentado no VII Congresso da ABRALIN
Curitiba, 2011.

Corey, David M., Dunlap, William P. & Burke, Michael J. Averaging


correlations: expected values and bias in combined Pearson rs and Fishers
z tranformations. The Journal of General Psychology, vol. 125(3), 245261,
1998.

Coupland, Nikolas. Style. Language variation and identity. Cambridge:


Cambridge University Press, 2007.

Cristfaro Silva, Thas. Fontica e fonologia do portugus. Roteiro de


estudos e guia de exerccios. So Paulo: Editora Contexto, 9 ed., 2007.

Cunha, Celso & Cintra, Lindley. A nova gramtica do portugus contem-


porneo. Rio de Janeiro: Lexikon Informtica, 3 ed., 2007.

Demasi, Rita de Cssia Benevides. A ditongao nasal no portugus


brasileiro. Dissertao de Mestrado. So Paulo: FFLCH-USP, 2009. 234f.
URL http://www.teses.usp.br/teses/disponiveis/8/8139/
tde-15032010-123909/pt-br.php

333
Referncias

Dias, Ju Fialho Vazzata & Fernandes, Marisa. A inter-relao da


concordncia nominal e da concordncia nos predicativos/particpios
passivos, sob enfoque da teoria da variao e mudana lingustica.
Organon, vol. 14(2829), 115131, 2000.
URL http://seer.ufrgs.br/index.php/organon/article/view/
30199/18708

Dodsworth, Robin. Social class. In: Kerswill, Paul, Johnstone,


Barbara & Wodak, Ruth (Eds.), The SAGE Handbook of Sociolinguistics,
pp. 192208. London: SAGE Publications, 2011.

Dorneles, Darlan Machado & Cerqueira, Vicente Cruz. O apagamento


do /R/ na fala urbana de Rio Branco AC: um estudo sociolingustico.
Revista Philologus, vol. 51, 112123, 2011. Rio de Janeiro.
URL http://www.filologia.org.br/revista/51supl/10.pdf

Duarte, Maria Eugnia Lamoglia & Varejo, Filomena. Null subjects


and agreement marks in European and Brazilian Portuguese. Journal of
Portuguese Linguistics, vol. 12(2), 101124, 2013.

Eckert, P. & McConnell-Ginet, S. Think practically and look locally.


Annual Review of Anthropology, vol. 21(21), 46190, 1992.

Eckert, Penelope. Style and social meaning. In: Style and sociolinguistic
variation, pp. 119126. Cambridge: Cambridge University Press, 2001.

. Variation and the indexical field. Journal of Sociolinguistics,


vol. 12(4), 453476, 2008.

. Three waves of variation study: the emergence of meaning in the


study of variation. Annual Review of Anthropology, vol. 41, 87100, 2012.
URL http://www.stanford.edu/~eckert/PDF/
ThreeWavesofVariation.pdf

Fernandes, Marisa. Concordncia nominal na regio sul. Dissertao de


Mestrado. Florianpolis: UFSC, 1996. 143f.

334
Referncias

URL https://repositorio.ufsc.br/bitstream/handle/123456789/
112113/104707.pdf?sequence=1&isAllowed=y

Ferreira, Jesuelem Salvani & Tenani, Luciani. A reduo do gerndio


luz da fonologia lexical. Estudos Lingusticos, vol. 38(1), 5968, 2009.
URL http://gel.org.br/estudoslinguisticos/volumes/38/EL_
V38N1_05.pdf

Freitag, Raquel Meister Ko., Martins, Marco Antonio & Tavares, Ma-
ria Alice. Bancos de dados sociolingusticos do portugus brasileiro e os
estudos de terceira onda: potencialidades e limitaes. Alfa, vol. 56(3),
917944, 2012.
URL http://seer.fclar.unesp.br/alfa/article/view/4907/4367

Garrett, Peter. Attitudes to language. Cambridge: Cambridge University


Press, 2010.

Giles, Howard & Billings, Andrew C. Assessing language attitudes:


speaker evaluation studies. In: Davies, Alan & Elder, Catherine (Eds.),
The handbook of applied linguistics. Malden, MA: Blackwell, 2004.

Gomes da Silva, Fernando. Alagoanos em So Paulo e a concordncia


nominal de nmero. Dissertao de Mestrado. So Paulo: FFLCH-USP,
2014.

Gonalves, Sebastio Carlos Leite. Banco de dados Iboruna: amostras


eletrnicas do portugus falado no interior paulista., s/d. ltimo acesso
em 25 set./2014.
URL http:://www.alip.ibilce.unesp.br/iboruna

Grski, Edair. Variao no uso do infinitivo pessoal. Organon, vol.


28/29(14), 95113, 2000. Porto Alegre, UFRGS.
URL http://seer.ufrgs.br/index.php/organon/article/view/
30198/18707

Gries, S. T. Statistics for Linguistics with R. Berlin/New York: Mouton de


Gruyter, 2009a.

335
Referncias

Gries, Stefan Th. Quantitative Corpus Linguistics with R: a practical


introduction. New York and London: Routledge, 2009b.

Guiotti, Luciana Prudente. O estudo da variante retroflexa na comunidade


de So Jos do Rio Preto. Dissertao de Mestrado. So Jos do Rio Preto:
UNESP, IBILCE, 2002. 106f.

Gumperz, John J. Language and communication. Annals of the American


Academy of Political and Social Science, vol. 373, 219231, 1967.
URL http://www.jstor.org/stable/1037362

. Linguistic and social interaction in two communities. In: Dil,


Anwar S. (Ed.), Language in social groups. Essays by John J. Gumperz, pp.
151176. Standford: Standford Univesity Press, 1971a.
URL http://www.jstor.org/stable/668168

. The speech community. In: Dil, Anwar S. (Ed.), Language in social


groups. Essays by John J. Gumperz, pp. 114128. Standford: Standford
Univesity Press, 1971b.

. Types of linguistic communities. In: Fishman, Joshua A. (Ed.),


Readings in the sociology of language, pp. 460472. The Hague: Mouton,
1972.
URL http://www.jstor.org/stable/30022343

Guy, Gregory R. Variation in the group and the individual: the case of
final stop deletion. In: Labov, William (Ed.), Locating language in time
and space, pp. 136. New York: Academic Press, 1980.

. Linguistic variation in Brazilian Portuguese: aspects of the phonology,


syntax and language history. Tese de Doutorado. Philadelphia: University
of Pennsylvania, 1981. 405f.

. Explanation in variable phonology: An exponential model of morpho-


logical constraints. Language Variation and Change, vol. 3, 122, 1991.

336
Referncias

. The quantitative analysis of linguistic variation. In: Preston, D.


(Ed.), American Dialect Research, pp. 223249. Amsterdam: Benjamins,
1993.

. A identidade lingustica da comunidade de fala: paralelismo


interdialetal nos padres de variao lingustica. Organon, vol. 14(2829),
1732, 2000.
URL http://seer.ufrgs.br/index.php/organon/article/view/
30194/18703

. Varbrul: anlise avanada. In: Guy, Gregory R. & Zilles, Ana M.


(Eds.), Sociolingustica quantitativa: instrumental de anlise, pp. 4770.
So Paulo: Parbola, 2007 [1988].

. The cognitive coherence of sociolects: how do speakers handle


multiple sociolinguistic variables? Journal of Pragmatics, vol. 52, 6371,
2013.

. Language variation and linguistic theory., Ms.

Guy, Gregory R. & Cutler, Cecelia. Speech style and authenticity:


quantitative evidence for the performance of identity. Language Variation
and Change, vol. 23, 139162, 2011.

Guy, Gregory R. & Zilles, Ana. Sociolingustica quantitativa: instrumental


de anlise. So Paulo: Parbola, 2007.

Hay, Jennifer & Drager, Katie. Stuffed toys and speech perception.
Linguistics, vol. 48(4), 865892, 2010.

Head, Brian. Propriedades fonticas e generalidade de processos fonolgicos:


o caso do r caipira. Caderno de Estudos Lingusticos, vol. 13, 539, 1987.
Campinas.

Hoffman, Michol & Walker, James A. Ethnolects in the city: ethnic


orientation and linguistic variation in Toronto English. Language Variation
and Change, vol. 22, 3767, 2010.

337
Referncias

Hopper, Paul J. & Thompson, Sandra A. Transitivity in grammar and


discourse. Language, vol. 56(2), 251299, 1980.

Hymes, Dell. Models of interaction of language and social life. In: Gum-
perz, John J. & Hymes, Dell (Eds.), Directions in Sociolinguistics, pp.
3571. New York: Holt, Rinehart and Wilson, 1972.

. Foundations of Sociolinguistics. Philadelphia: University of Pennsyl-


vania Press, 1974.

. On communicative competence. In: Brumfit, C. J. & Johnson,


K. (Eds.), The Communicative Approach to Language Teaching, pp. 526.
Oxford: Oxford University Press, 1991 [1979].

IBGE. Instituto Brasileiro de Geografia e Estatstica Censo Demogrfico


2010., 2010. ltimo acesso em 06 mai./2012.
URL ftp://ftp.ibge.gov.br/Censos/Censo_Demografico_2010/
resultados/total_populacao_sao_paulo.zip

Ilari, Rodolfo (Ed.). Gramtica do portugus falado culto no Brasil. Campi-


nas: Editora da Unicamp, 2008.

IPEA. Comunicados do IPEA no. 115 Perfil dos migrantes em So


Paulo., 2011. ltimo acesso em 16 nov./2011.
URL http://www.ipea.gov.br/portal/images/stories/PDFs/
comunicado/111006_comunicadoipea115.pdf

. Comunicados do IPEA no. 159 Duas dcadas de desigualdades e


pobreza no Brasil medidas pela Pnad/IBGE., 2013. ltimo acesso em 15
set./2014.
URL http://www.ipea.gov.br/portal/images/stories/PDFs/
comunicado/131001_comunicadoipea159.pdf

Irvine, Judith T. Style as distinctiveness: the culture and ideology of linguis-


tic differentiation. In: Eckert, Penelope & Rickford, John R. (Eds.),
Style and sociolinguistic variation. Cambridge: Cambridge University Press,
2001.

338
Referncias

Jaffe, Alexandra. Stance. Oxford: Oxford University Press, 2009.

Jespersen, Otto. Essentials of English Grammar. London: George Allen


and Unwin Ltd., 1953 [1933].

Johnson, Daniel Ezra. Getting off the GoldVarb standard: introducing


Rbrul for mixed-effects variable rule analysis. Language and Linguistics
Compass, vol. 3(1), 359383, 2009.

Kiesling, Scott F. Constructing identity. In: Chambers, J. K. &


Schilling, Natalie (Eds.), The handbook of language variation and change,
pp. 448467. Malden, MA: Wiley-Blackwell, 2 ed., 2013.

Labov, William. Contraction, deletion, and inherent variability of the


English copula. Language, vol. 45(4), 715762, 1969.

. Where does the sociolinguistic variable stop? A response to Beatriz


Lavandera. In: Working Papers in Sociolinguistics 44. Austin: Southwest
Educational Development Laboratory, 1978.

. Introduction. In: Labov, William (Ed.), Locating language in time


and space, pp. xiiixx. New York: Academic Press, 1980.

. Field methods of the project on linguistic change and variation.


In: Baugh, J. & Sherzer, J. (Eds.), Language in Use. Englewood Cliffs:
Prentice Hall, 1984.

. Principles of linguistic change: internal factors. Oxford UK &


Cambridge USA: Blackwell, 1994.

. The anatomy of style-shifting. In: Eckert, P. & Rickford,


J. R. (Eds.), Style and Sociolinguistic Variation, pp. 85108. Cambridge:
Cambridge University Press, 2001a.

. Principles of linguistic change: social factors. Oxford & Cambridge:


Blackwell, 2001b.

339
Referncias

. The social stratification of English in New York City. So Paulo:


Cambridge University Press, 2006 [1966].

. A motivao social de uma mudana sonora. In: Padres sociolin-


gusticos, vol. 19, pp. 273309. So Paulo: Editora Parbola, 2008 [1963].
Traduo de Marcos Bagno, Maria Marta Pereira Scherre e Caroline R.
Cardoso.

. Padres sociolingusticos. So Paulo: Editora Parbola, 2008 [1972].


Traduo de Marcos Bagno, Maria Marta Pereira Scherre e Caroline R.
Cardoso.

Labov, William, Ash, Sharon & Boberg, Charles. The Atlas of North
American English. Berlin, New York: Mouton de Gruyter, 2006.

Labov, William, Ash, Sharon, Ravindranath, Maya, Weldon, Tracey,


Baranowski, Maciej & Nagy, Naomi. Properties of the sociolinguistic
monitor. Journal of Sociolinguistics, vol. 15(4), 431463, 2011.

Ladefoged, Peter & Maddieson, Ian. The sounds of the worlds languages.
Blackwell: Oxford UK/Cambridge USA, 1996.

Lambert, W. E., Hodson, R. C., Gardner, R. C. & Fillenbaum, S.


Evaluational reactions to spoken languages. Journal of Abnormal and
Social Psychology, vol. 60(1), 4451, 1960.

Leite, Cndida M. Britto. Atitudes lingusticas: a variante retroflexa em


foco. Dissertao de Mestrado. Campinas: Unicamp, 2004. 138f.
URL http://www.bibliotecadigital.unicamp.br/document/?code=
000304373

. O /R/ em posio de coda silbica no falar campineiro. Tese de


Doutorado. Campinas: Unicamp, 2010. 227f.
URL http://www.bibliotecadigital.unicamp.br/document/?code=
000770829

340
Referncias

Lim, Laureen T. & Guy, Gregory R. The limits of linguistic community:


speech styles and variable constraint effects. Penn Working Papers in
Linguistics, 2005.
URL http://repository.upenn.edu/cgi/viewcontent.cgi?article=
1363&context=pwpl

Lindau, Mona. The story of /r/. Working Papers in Phonetics (UCLA),


(51), 114119, 1980.

Long, Daniel & Preston, Dennis. Handbook of perceptual dialectology vol.


2. Amsterdam & Philadelphia: John Benjamins, 2002.

Lopes, Norma da Silva. Concordncia nominal, contexto lingustico e socie-


dade. Tese de Doutorado. Salvador: UFBA, 2001. 408f.
URL http://linguagemnacidade.com.br/painel/downloads3/normal/
128.pdf

Loregian-Penkal, Loremi. (Re)anlise da referncia de segunda pessoa na


fala da regio sul. Tese de Doutorado. Curitiba: UFPR, 2004. 261f.
URL http://dspace.c3sl.ufpr.br/dspace/handle/1884/22530

Lucas, Antoine. Package amap., 2014. ltimo acesso em 25 set./2014.


URL http://cran.r-project.org/web/packages/amap/amap.pdf

Lucchesi, Dante. A concordncia verbal e a polarizao sociolingustica do


Brasil. Ms., 2012.

Mangabeira, Andra Burgos de Azevedo. Participao, identidade e va-


riao na EJA: o uso varivel da concordncia nominal de nmero como
recurso simblico e estilstico na construo de uma comunidade de prtica
na sala de aula de lngua portuguesa. Dissertao de Mestrado. Porto
Alegre: Universidade Federal do Rio Grande do Sul, 2012.

Martins, Iara Ferreira de Melo. Apagamento da oclusiva dental /d/:


perspectivas variacionista e fonolgica. In: Hora, Dermeval da (Ed.),
Estudos sociolingusticos: perfil de uma comunidade, pp. 5582. Santa
Maria: Palotti, 2004.

341
Referncias

McLaughin, Brittany. Connecting and comparing animacy effects in


three sociolinguistic variables. Trabalho apresentado na University of
Pennsylvania, 2013. Ms.

Medeiros, Beatriz Raposo de. Vogais nasais do portugus brasileiro:


Reflexes preliminares de uma revisita. Revista Letras, vol. 72, 165188,
2007.
URL http://ojs.c3sl.ufpr.br/ojs-2.2.4/index.php/letras/
article/view/7460

Mendes, Ronald Beline. Ter + particpio e Estar + gerndio: aspecto


verbal e variao no portugus do Brasil. Tese de doutorado. Campinas:
IEL/Unicamp, 2005.
URL http://www.bibliotecadigital.unicamp.br/document/?code=
vtls000347284

. Sounding Paulistano: Variation and correlation in So Paulo., 2010.


Trabalho apresentado no NWAV39, San Antonio, Texas.
URL http://colfa.utsa.edu/nwav39/talks/Mendes.pdf

. A pronncia retroflexa do /-r/ na fala paulistana. In: Hora, D. &


Negro, E. V. (Eds.), Estudos da Linguagem. Casamento entre temas e
perspectivas, pp. 282299. Joo Pessoa: Ideia, 2011.

. Gendered perceptions of noun agreement in Brazilian Portuguese.


Revista Internacional de Lingustica Iberoamericana, vol. 12(23), 93108,
2014.

. Nonstandard noun phrase agreement as an index of masculinity. In:


Levon, Erez & Mendes, Ronald Beline (Eds.), Language, sexuality and
power: studies in intersectional sociolinguistics. Oxford: Oxford University
Press, no prelo.

Mendes, Ronald Beline & Oushiro, Livia. Percepes sociolingusticas


sobre as variantes tepe e retroflexa na cidade de So Paulo. In: Hora, D.
& Negro, E. V. (Eds.), Estudos da Linguagem. Casamento entre temas
e perspectivas, pp. 229245. Joo Pessoa: Ideia, 2011a.

342
Referncias

. Production and perception of retroflex /r/ in Sao Paulo Portuguese.,


2011b. Trabalho apresentado no VaLP2011, Chester, England. ltimo acesso
em 25 set./2014.
URL http://sites.google.com/site/valp2011/programme

. O paulistano no mapa sociolingustico brasileiro. Alfa, vol. 56(3),


9731001, 2012.
URL http://seer.fclar.unesp.br/alfa/article/view/4942/4369

. Documentao do Projeto SP2010 Construo de uma amostra


da fala paulistana., 2013. ltimo acesso em 25 set./2014.
URL http://projetosp2010.fflch.usp.br/producao-bibliografica

Mendoza-Denton, Norma. Language and identity. In: Chambers, J.K.,


Trudgill, P. & Schilling-Estes, N. (Eds.), The handbook of language
variation and change, pp. 475499. Malden, MA: Blackwell, 2002.

Meyerhoff, Miriam & Strycharz, Anna. Communities of practice. In:


Chambers, J. K. & Schilling, Natalie (Eds.), The handbook of language
variation and change, pp. 428447. Malden, MA: Wiley-Blackwell, 2 ed.,
2013 [2002].

Milroy, Leslie. Language and social networks. Oxford: Basil Blackwell, 2


ed., 1987 [1980].

Milroy, Leslie & Llamas, Carmen. Social networks. In: Chambers, J.K.
& Schilling-Estes, N. (Eds.), The handbook of language variation and
change, pp. 409427. Malden, MA: Blackwell, 2 ed., 2013 [2002].

Mollica, Maria Cecilia. Um padro etrio recorrente em fenmenos de


variao fonolgica. Estudos Lingusticos, vol. 17, 513520, 1989.

Monaretto, Valria Neto de Oliveira. Anlise sociolingustica da vibrante


no sul do Brasil. Graphos, vol. 2(1), 2534, 1997.
URL http://periodicos.ufpb.br/ojs/index.php/graphos/article/
view/9193/4888

343
Referncias

Monguilhott, Isabel de Oliveira e Silva. Estudo sincrnico e diacrnico da


concordncia verbal de terceira pessoa do plural no PB e no PE. Tese de
Doutorado, Florianpolis: UFSC, 2009. 229f.
URL https://repositorio.ufsc.br/bitstream/handle/123456789/
92838/268683.pdf?sequence=1

Moraes, Joo Antnio de. Produo e percepo das vogais nasais. In:
Abaurre, Maria Bernadete M. (Ed.), Gramtica do portugus culto falado
no Brasil: a construo fonolgica da palavra, pp. 95112. So Paulo:
Contexto, 2013.

Nagy, Naomi & Irwin, Patricia. Boston (r): Neighbo(r)s nea(r) and fa(r).
Language Variation and Change, vol. 22, 241278, 2010.

Naro, Anthony J. The social and structural dimensions of a syntactic


change. Language, vol. 57, 6398, 1981.
URL http://www.jstor.org/stable/414287

Naro, Anthony J., Grski, Edair & Fernandes, Eullia. Change without
change. Language Variation and Change, vol. 11, 197211, 1999.

Naro, Anthony J. & Scherre, Maria Marta Pereira. Variao e mudana


lingustica: fluxos e contrafluxos na comunidade de fala. Caderno de
Estudos Lingusticos, Campinas, vol. 20(jan./jun), 916, 1991.
URL http://revistas.iel.unicamp.br/index.php/cel/article/
view/2904/2375

. Remodeling the age variable: number concord in Brazilian Portu-


guese. Language Variation and Change, vol. 25, 115, 2013.

Niedzielski, Nancy. The effect of social information on the perception


of sociolinguistic variables. Journal of Language and Social Psychology,
vol. 18(1), 6285, 1999.

Oksanen, Jari, Blanchet, F. Guillaume, Kindt, Roeland, Legendre,


Pierre, Minchin, Peter R., OHara, R. B., Simpson, Gavin L., Solymos,
Peter, Stevens, M. Henry H. & Wagner, Helene Wagner. Package

344
Referncias

vegan., 2013. ltimo acesso em 25 set./2014.


URL http://cran.r-project.org/web/packages/vegan/vegan.pdf

Oliveira, Josane M. O apagamento do /R/ implosivo na norma culta de


Salvador. Dissertao de Mestrado. Salvador: UFBA, 1999. 80 f.

Oliveira, Marco Antnio. Phonological variation and change in Brazilian


Portuguese: the case of the liquids. Tese de Doutorado. Philadelphia:
University of Pennsylvania, 1983. 286f.

Oushiro, Livia. Uma anlise variacionista para as Interrogativas-Q.


Dissertao de Mestrado. So Paulo: FFLCH-USP, 2011. 174f.
URL http://www.teses.usp.br/teses/disponiveis/8/8139/
tde-14102011-135709/en.php

. How to recognize a Paulistano. Trabalho apresentado no Sociolin-


guistics Symposium 19 Berlin Alemanha, 2012.
URL http://neon.niederlandistik.fu-berlin.de/ss19/paper/881

. Tratamento de dados com o R para anlises sociolingusticas. In:


Freitag, Raquel Meister Ko (Ed.), Metologia de coleta e manipulao de
dados em Sociolingustica. So Paulo: Blucher, 2014.
URL http://blucheropenaccess.com.br/pdf/mcmds/10cap.pdf

Oushiro, Livia & Guy, Gregory R. The social clustering of linguistic


variables in So Paulo Portuguese., 2013. Trabalho apresentado no NWAV
42 (Pittsburgh, PA EUA, out/2013).

Oushiro, Livia & Mendes, Ronald Beline. A pronncia do (-r) em coda


silbica no portugus paulistano. Revista do GEL, vol. 8(2), 6695, 2013.
URL http://revistadogel.gel.org.br/rg/article/view/39/21

. O apagamento de (-r) em coda nos limites da variao. (sob reviso),


2014. Ms.

Paiva, Maria da Conceio de & Scherre, Maria Marta Pereira. Retros-


pectiva sociolingustica: contribuies do PEUL. DELTA, vol. 15(n.esp.),
201232, 1999.

345
Referncias

Patrick, Peter L. The speech community. In: The handbook of language


variation and change. Malden, MA: Blackwell, 2002.

Pereira, Deize Crespim. Concordncia verbal na lngua falada nas trilhas


das bandeiras paulistas. Dissertao de Mestrado. So Paulo: FFLCH-USP,
2004. 116f.
URL http://www.teses.usp.br/teses/disponiveis/8/8142/
tde-27022013-120141/pt-br.php

Podesva, Robert J. Phonation type as a stylistic variable: the use of


falsetto in constructing a persona. Journal of Sociolinguistics, vol. 11(4),
478504, 2007.

Preston, Dennis. Handbook of Perceptual Dialectology, vol. 1. Amsterdam


& Philadelphia: John Benjamins, 1999.

Preti, Dino & Urbano, Hudinilson (Eds.). A linguagem falada culta na


cidade de So Paulo: materiais para seu estudo, vol. III: Entrevistas. So
Paulo: T.A. Queiroz/FAPESP, 1988.

. A linguagem falada culta na cidade de So Paulo: materiais para


seu estudo, vol. IV: Estudos. So Paulo: T.A. Queiroz/FAPESP, 1990.

R Core Team. R: A language and environment for statistical computing.


R Foundation for Statistical Computing, Vienna, Austria, 2013. ltimo
acesso em 25 set./2014.
URL http://www.R-project.org/

Rennicke, Iiris. The retroflex /r/ of Brazilian Portuguese: theories of


origin and a case study of language attitudes in Minas Gerais. Revista de
Estudos Lingusticos da Universidade do Porto, vol. 1(6), 149170, 2011.
URL http://ler.letras.up.pt/uploads/ficheiros/9917.pdf

Revelle, William. Package psych v.1.4.5. Procedures for psychologi-


cal, psychometric, and personality research., 2014. ltimo acesso em 25
set./2014.
URL http://personality-project.org/r/psych.manual.pdf

346
Referncias

Rezende, Tnia Ferreira. Tendncias padronizao da realizao fontica


do /R/ em Gois. In: Cardoso, Caroline Rodrigues, Scherre, Maria
Marta Pereira, Lima-Salles, Heloisa Maria Moreira & Pacheco, Cintia
(Eds.), Variao lingustica. Contato de lnguas e educao, pp. 1535.
Campinas: Pontes, 2013.

Rickford, John R. The need for new approaches to social class analysis in
sociolinguistics. Language & Communication, vol. 6(3), 215221, 1986.

Rickford, John R., Ball, Arnetha, Blake, Renee, Jackson, Raina &
Martin, Nomi. Rappin on the copula coffin: Theoretical and metho-
dological issues in the analysis of copula variation in African-American
Vernacular English. Language Variation and Change, vol. 3, 103132,
1991.

Robinson, John, Lawrence, Helen & Tagliamonte, Sali. Goldvarb


2001., 2001.
URL http://courses.essex.ac.uk/lg/lg654/
GoldVarb2001forPCmanual.htm.

Rodrigues, Angela C. S. A concordncia verbal no portugus popular em


So Paulo. Tese de Doutorado. So Paulo: FFLCH-USP, 1987.

. Fotografia sociolingustica do portugus do Brasil: o portugus


popular em So Paulo. In: Castilho, Ataliba T. (Ed.), Histria do por-
tugus paulista. Campinas: Instituto de Estudos da Linguagem/UNICAMP,
2009.

Rubio, Cssio Florncio. A concordncia verbal na lngua falada na regio


noroeste do Estado de So Paulo. Dissertao de Mestrado. So Jos do
Rio Preto: UNESP, IBILCE, 2008. 152f.
URL http://base.repositorio.unesp.br/handle/11449/86592

. Padres de concordncia verbal e de alternncia pronominal no


portugus brasileiro e europeu: estudo sociolingustico comparativo. Tese de
Doutorado. So Jos do Rio Preto: UNESP, IBILCE, 2012. 393f.
URL http://base.repositorio.unesp.br/handle/11449/100100

347
Referncias

Rubio, Cssio Florncio & Gonalves, Sebastio Carlos Leite. A fala


do interior paulista no cenrio da sociolingustica brasileira: panorama
da concordncia verbal e da alternncia pronominal. Alfa, vol. 56(3),
10031034, 2012.
URL http://seer.fclar.unesp.br/alfa/article/viewFile/4950/
4370

Salomo, Mircia Hermenegildo. A variao de pluralidade nas estruturas


predicativas da variedade falada na regio de So Jos do Rio Preto. Dis-
sertao de Mestrado. So Jos do Rio Preto: UNESP, IBILCE, 2010. 162f.
URL http://base.repositorio.unesp.br/handle/11449/86554

. A variao de nmero e a construo de identidade social em duas


comunidades de prtica. Trabalho apresentado no 62 Seminrio do GEL,
2014.
URL http://gel.org.br/detalheResumo2014.php?id=2171

Sankoff, David. Sociolinguistics and syntactic variation. In: Newmeyer,


Frederick J. (Ed.), Language: the socio-cultural context, pp. 140161. Cam-
bridge: Cambridge University Press, 1988.

Sankoff, David & Labov, William. On the uses of variable rules. Language
in Society, vol. 8(2), 189222, 1979.

Sankoff, Gillian. A quantitative paradigm for the study of communicative


competence. In: The social life of language, pp. 4779. Philadelphia:
University of Pennsylvania Press, 1980.

Sankoff, Gillian & Blondeau, Hlne. Language change across the


lifespan: /r/ in Montreal French. Language, vol. 83(3), 560588, 2007.

Santos, Wendel da Silva. A morfologia do indicativo na expresso do


modo subjuntivo em So Paulo e So Lus. Projeto de Mestrado (CNPq)
apresentado ao Programa de Ps-Graduao em Semitica e Lingustica
Geral do DLFFLCHUSP, 2012. Ms.

348
Referncias

Scherre, Maria Marta Pereira. A regra de concordncia de nmero no


sintagma nominal em portugus. Dissertao de Mestrado. Rio de Janeiro:
Faculdade de Letras da UFRJ, 1978. 158f.

. Reanlise da concordncia nominal em portugus. Tese de Doutorado.


Rio de Janeiro: UFRJ. Dois volumes, 1988. 555f.

. Concordncia nominal e funcionalismo. Alfa, vol. 41(n.esp.), 181


206, 1997.
URL http://seer.fclar.unesp.br/alfa/article/view/4038/3702

. Paralelismo lingustico. Revista Estudos Lingusticos, vol. 7(2),


2959, 1998. Belo Horizonte.
URL http://periodicos.letras.ufmg.br/index.php/relin/article/
view/2293/2242

. Phrase-level parallelism effect on noun phrase number agreement.


Language Variation and Change, vol. 13, 91107, 2001.

. Doa-se lindos filhotes de poodle: variao lingustica, mdia e precon-


ceito. So Paulo: Parbola, 2 ed., 2008.

Scherre, Maria Marta Pereira & Naro, Anthony J. The serial effect on
internal and external variables. Language Variation and Change, vol. 4,
113, 1992.

. Sobre a concordncia de nmero no portugus falado do Brasil. In:


Ruffino, G. (Ed.), Dialettologia, geolinguistica, sociolinguistica (Atti del
XXI Congresso Internazionale di Linguistica e Filologia Romanza), vol. 5,
pp. 509523. Tbingen: Max Niemeyer Verlag, 5, 1998. Centro di Studi
Filologici e Linguistici Siciliani, Universit di Palermo.
URL http://www.ai.mit.edu/projects/dm/bp/scherre-naro98.pdf

. Mudana sem mudana: a concordncia de nmero no portugus


brasileiro. SCRIPTA, vol. 9(18), 107129, 2006.
URL http://www.pucminas.br/imagedb/documento/DOC_DSC_NOME_
ARQUI20070621143829.pdf

349
Referncias

Scherre, Maria Marta Pereira, Naro, Anthony J. & Cardoso, Caroline Ro-
drigues. O papel do tipo de verbo na concordncia verbal no portugus
brasileiro. DELTA, vol. 23(n.esp.), 283317, 2007.
URL http://www.scielo.br/pdf/delta/v23nspe/v23nspea12.pdf

Scherre, Marta, Naro, Anthony, Mattos, Shirley, Foeger, Camila &


Benfica, Samine. Concord without concord: 1st plural pronoun ns we
in Brazilian Portuguese. Trabalho apresentado no NWAV44, ChicagoIL,
EUA, 2014.
URL http://www.nwav43.illinois.edu/program/documents/
Scherre-Longabstract_2014_09_13_23_16_18_965.pdf

Schwindt, Luiz Carlos & Silva, Tas Bopp da. Panorama da reduo da
nasalidade em ditongos tonos finais do portugus do sul do Brasil. In:
Bisol, Leda & Collischonn, Gisela (Eds.), Portugus do sul do Brasil:
variao fonolgica, pp. 1333. Porto Alegre: EdiPUCRS, 2009.
URL http://www.pucrs.br/edipucrs/portuguesdosuldobrasil.pdf

Silva, Caio Cesar Castro da. A preliminary study on the nasal diphthon-
gization in cariocas speech. Trabalho apresentado no Phonetics and
Phonology in Iberia 2013, Lisboa, Portugal, 2013.
URL http://ww3.fl.ul.pt/laboratoriofonetica/papi2013/files/
posters/poster51.html

Silva, Janana Biancardi da & Scherre, Maria Marta Pereira. A concor-


dncia nominal na fala capixaba: fatores sociais. In: Cardoso, Caro-
line Rodrigues, Scherre, Maria Marta Pereira, Lima-Salles, Heloisa
Maria Moreira & Pacheco, Cintia (Eds.), Variao lingustica: contato de
lnguas e educao, pp. 129143. Campinas: Pontes Editores, 2013.

Silva Neto, Serafim da. Um trao da pronncia caipira. In: Lngua,


cultura e civilizao: estudos de filologia portuguesa, pp. 6790. Rio de
Janeiro: Acadmica, 1960.

Skeete, Nadir Arruda. O uso varivel da vibrante na cidade de Joo Pessoa.


Graphos, vol. 2(1), 7796, 1997.

350
Referncias

URL http://periodicos.ufpb.br/ojs/index.php/graphos/article/
view/9199/4894

Tagliamonte, Sali. Analysing sociolinguistic variation. So Paulo: Cam-


bridge University Press, 2006.

. Variationist sociolinguistics: change, observation, interpretation.


Malden, MA: Wiley-Blackwell, 2011.

Tagliamonte, Sali & Waters, Cathleen. Co-variation in the speech


community: methods for identifying innovators and their repertoires.
Trabalho apresentado no Methods in Dialectology 14, London, ON, 2011.
URL http://westernlinguistics.ca/methods14/abstracts/Friday_
August_5/Variation_Studies/Tagliamonte_Waters_co_variation.
pdf

Tarallo, Fernando Luiz. Relativization strategies in Brazilian Portuguese.


Tese de Doutorado. Philadelphia: University of Pennsylvania, 1983. 288f.

Tenani, Luciani & Silveira, Ana Amlia Menegasso da. O alamento das
vogais mdias na variedade culta do noroeste paulista. Alfa, vol. 52(2),
447464, 2008.
URL http://seer.fclar.unesp.br/alfa/article/view/1527/1234

Thomas, Erik R. Sociophonetic applications of speech perception experi-


ments. American Speech, vol. 77(2), 115147, 2002.

Thorburn, Jennifer. Dialect development in Nain, Nunatsiavut: emerging


English in a Canadian aboriginal community. Tese de Doutorado, St. Johns
(Newfoundland), Memorial University, 2014. 328 f.
URL http://research.library.mun.ca/6412/

Trudgill, Peter. The social differentiation of English in Norwich. Cambridge:


Cambrige University Press, 1974.

van Hout, Roeland & Van de Velde, Hans. Patterns of /r/ variation.
In: Van de Velde, Hans & van Hout, Roeland (Eds.), r-atics: Socio-

351
Referncias

linguistic, phonetic and phonological characteristics of /r/, vol. tudes &


Travaux, pp. 19. Bruxelas: Universit Libre de Bruxelles, 2011.

Viegas, Maria do Carmo. O alamento das vogais mdias pretnicas e


as consequncias de diferentes recortes na amostragem. Letras de Hoje,
vol. 38(4), 307318, 2003. Porto Alegre.
URL http://revistaseletronicas.pucrs.br/fabio/ojs/index.php/
fale/article/view/14013/9288

Vieira, Marclio Melo. Para um estudo das influncias fonolgicas do


italiano no portugus falado na cidade de So Paulo. Dissertao de
Mestrado. So Paulo: FFLCH-USP, 2010. 73f.
URL http://www.teses.usp.br/teses/disponiveis/8/8148/
tde-30092011-111755/pt-br.php

Vieira, Marlia Silva. Apagamento de /d/: abordagem sociolingustica sob


a perspectiva do gnero textual. Web-Revista Sociodialeto, vol. 1(4), 127,
2011. Campo GrandeMS: UEMS.
URL http://www.sociodialeto.com.br/edicoes/9/28092011063729.
pdf

. A, da e ento como articuladores de oraes em Campo Grande


(MS) e So Paulo (SP). Projeto de Doutorado (CAPES) apresentado
ao Programa de Ps-Graduao em Semitica e Lingustica Geral do DL
FFLCHUSP, 2013. Ms.

Votre, Sebastio Josu. Aspectos da variao fonolgica na fala do Rio de


Janeiro. Rio de Janeiro: Pontifcia Universidade Catlica do Rio de Janeiro,
1978.

. Relevncia da varivel escolaridade. In: Mollica, Maria Cecilia


& Braga, Maria Luiza (Eds.), Introduo sociolingustica: o estudo da
variao. So Paulo: Editora Contexto, 2004.

Weinreich, Uriel, Labov, William & Herzog, Marvin I. Fundamentos


empricos para uma teoria da mudana lingustica. So Paulo: Parbola,
2006 [1968]. Traduo de Marcos Bagno.

352
Referncias

Wolfram, Walt. Identifying and interpreting variables. In: Pres-


ton, D. R. (Ed.), American Dialect Research, pp. 193221. Amster-
dam/Philadelphia: John Benjamins, 1993.

Yacovenco, Lilian Coutinho, Scherre, Maria Marta Pereira, Tesch,


Leila Maria, Bragana, Marcela Langa L., Evangelista, Elaine Mei-
reles, Mendona, Alexandre Kronemberger de, Calmon, Elba Nusa,
Campos Jnior, Heitor da Silva, Barbosa, Astrid Franco, Baslio,
Jucilene Oliveira Sousa, Deoclcio, Carlos Eduardo, Silva, Janana Bian-
cardi da, Berbert, Aline Tomaz Fonseca & Benfica, Samine de Almeida.
Projeto Portvix: A fala de Vitria/ES em cena. Alfa, vol. 56(3), 771806,
2012.
URL http://seer.fclar.unesp.br/alfa/article/view/4946/4361

Zilles, Ana. The development of a new pronoun: The linguistic and social
embedding of a gente in Brazilian Portuguese. Language Variation and
Change, vol. 17, 1953, 2005.

Zilles, Ana Maria Stahl, Maya, Leonardo Zechlinski & Silva, Karine
Quadros da. A concordncia verbal com a primeira pessoa do plural na
fala de Panambi e Porto Alegre, RS. Organon, vol. 28/29(14), 195219,
2000. Porto Alegre, UFRGS.
URL http://seer.ufrgs.br/index.php/organon/article/view/
30205/18712

353
Anexos

Anexo A: Roteiro de entrevista

PARTE I

Bairro (aprox. 10 min.)


Objetivos: descobrir o grau de enraizamento do informante no bairro onde
vive/outros bairros; descobrir o grau de mobilidade da pessoa
(1) H quanto tempo voc mora na (Mooca, Pinheiros, Bexiga...)?
(2) Voc gosta de morar aqui?
(3) Por que voc escolheu morar neste bairro? (manter em mente que o
informante pode no ter escolhido morar ali: pode ter sido porque a
famlia j morava l etc.)
(a) Se o informante mora h bastante tempo: Como era o bairro an-
tes/quando voc se mudou pra c? Mudou muito?
(b) Se o informante no mora l h muito tempo, ou se nem sempre viveu
ali: Em que outros lugares voc j morou? Como era l comparado
com esse bairro aqui? Onde voc preferia morar?
(4) Voc tem bastante contato com as pessoas aqui do bairro?
(5) Hoje, tem algum outro bairro em que voc gostaria de morar?

Infncia (aprox. 5 min.)


Objetivos: relaxar o informante (em geral, as pessoas gostam de falar
sobre sua infncia); obter informaes sobre mudanas no bairro/cidade
de So Paulo; grau de mobilidade do informante; obter informaes sobre
Anexos

escolaridade
(6) E como foi a sua infncia (no bairro X)? Voc pode contar um pouco de
como foi, o que voc fazia...?
(a) brincava na rua/dentro de casa? Do que vocs brincavam?
(b) como eram os seus pais? eram rgidos...?
(7) Voc foi pra escola no mesmo bairro? Como era a escola? Voc sempre
estudou na mesma escola? Voc gostava de ir pra escola? Tem algum
professor que te marcou? At que srie voc estudou?
(8) Enquanto ainda era criana/adolescente, voc ia pra outros lugares dentro
da cidade de So Paulo? (pra onde, pra fazer o qu...)

Famlia (aprox. 5 min.)


Objetivos: obter informaes sobre rede social do informante, grau de
enraizamento no bairro/cidade
(9) Voc tem irmos? ( possvel que esta informao j tenha aparecido na
parte sobre infncia; neste caso, falar algo como: Voc disse que tem
uma irm... Voc tem outros irmos?) Quantos anos eles tm?
(10) Seus pais so daqui de So Paulo mesmo? (Se sim, perguntar tambm
sobre avs, bisavs... at encontrar a primeira gerao da famlia que veio
pra c). Quantos anos eles (pais) tm? Quando seus (pais/avs/bisavs)
vieram pra So Paulo? Voc sabe por que eles vieram?
(11) Voc tem filhos? Quantos anos eles tm?
(12) E o resto da famlia, tios, primos, tambm vivem aqui em So Paulo?
(Se sim, em que bairros? Moram prximo? Se no, onde? Tem contato
sempre?)

Trabalho/Ocupao (aprox. 5 min.)


Objetivos: obter informaes sobre rede social do informante; caracters-
ticas socioeconmicas
(13) Voc trabalha aqui por perto? (se no souber onde a pessoa trabalha)
(14) O que voc faz?
(15) Voc gosta do seu servio? (Se no, o que a pessoa preferiria fazer?)

Lazer (aprox. 5 min.)

355
Anexos

Objetivos: obter informaes sobre rede social do informante; mobilidade


na cidade; caractersticas socioeconmicas
(16) E nas horas de lazer, o que voc e sua famlia gostam de fazer? (Se
saem, vo pra que lugares?) Voc acha que a cidade de So Paulo tem
boas opes de lazer? Quais?
(17) A maioria dos seus amigos mora aqui nesse bairro mesmo? (Se no,
onde?)
(18) Voc tem algum atividade de recreao em grupo, algum clube...?
(19) Quais so seus amigos mais antigos? Voc mantm contato com os
amigos de colgio?
(20) Voc costuma viajar? Pra que lugares j viajou? Que lugares gostaria
de conhecer?

PARTE II

A Cidade de So Paulo (aprox. 20 min.)


(21) Uma pesquisa recente mostrou que 57% das pessoas em So Paulo dei-
xariam a cidade caso pudessem. O que voc acha disso? (se o informante
perguntar, a pesquisa do Ibope e foi publicada em janeiro/20101 )
(22) Voc gosta de morar em So Paulo? (Se no, em que lugar preferiria
morar?) Por qu?
(23) O que voc acha que caracteriza a cidade (tanto as coisas boas quanto
ruins)?
(24) O que voc acha que caracteriza o paulistano (tanto as coisas boas
quanto ruins)?
(25) Olhando pra mim, voc diria que eu sou paulistano(a)? Por qu?
(26) O que voc mais gosta em So Paulo?
(27) O que voc no gosta em So Paulo? (a depender do tpico mencionado
pelo informante violncia, trnsito, poluio etc. procurar explorar
mais o assunto. P.ex.: voc j foi assaltado? O que aconteceu? (para
obter narrativa pessoal) O que o governo poderia fazer pra solucionar esse
1
Disponvel em http://www.nossasaopaulo.org.br/portal/arquivos/Pesquisa_IRBEM_Ibope_2010_
completa.pdf.

356
Anexos

problema? (para obter uma fala mais distanciada)) (explorar o subtpico


por aproximadamente 10 min.)
(28) Pras pessoas que no vivem em So Paulo, como voc acha que elas
imaginam que seja a cidade? Qual a imagem que as pessoas de fora de
So Paulo tm da cidade?
(29) Voc falou que j foi pra (X, Y, Z). Quando voc foi pra esses lugares, as
pessoas percebiam que voc era paulistano? (Se sim) como elas percebiam?
(30) Quando voc conhece algum, voc percebe se a pessoa no daqui de
So Paulo?
(a) (Se sim) como voc percebe? (Se o informante mencionar o modo de
falar, seguir nessa linha e tentar conseguir informaes mais precisas.
normal as pessoas no saberem definir o porqu, mas devemos
tentar tirar mais informaes).
(b) (Se no) Quando voc ouve uma pessoa falando, por exemplo, voc
percebe que ela de fora pelo sotaque?

Avaliaes Lingusticas (aprox. 10 min.)


(31) Qual o sotaque do Brasil que voc mais gosta? E tem algum que te
irrita? Como que (o gacho/o carioca/o mineiro/o caipira etc. a
depender dos sotaques mencionados) fala(m)?
(32) Aqui em So Paulo tem muito (i)migrante, n? De onde vm a maioria
das pessoas? Tem algum bairro especfico em que eles (italianos, coreanos,
nordestinos etc.) se concentram?
(33) E como que as pessoas falam na cidade de So Paulo? (evitar usar a
palavra sotaque)
(34) E aqui dentro da cidade de So Paulo, voc v diferenas entre as diferen-
tes regies, diferentes bairros? (Se sim) Voc poderia dar alguns exemplos?
( normal as pessoas responderem que no, mas se responderem que sim,
tente obter informaes mais precisas)

(Imprimir a lista de palavras, a notcia e o trecho, todos abaixo, para


mostrar ao informante)

357
Anexos

Lista de palavras: Apresentar ao informante a lista de palavras e


dizer: Agora eu queria te pedir pra ler algumas coisas. Eu tenho aqui
uma lista de palavras, e eu queria que voc lesse cada uma delas. Voc
pode dar uma olhada primeiro, antes de comear a ler. Esperar que o
informante leia a lista de palavras. Depois perguntar:
(35) A gente estava falando de sotaques agora h pouco... Como voc acha que
uma pessoa do interior falaria algumas dessas palavras? Tem diferenas?
(36) E como um carioca falaria algumas dessas palavras?
(37) Tem mais algum sotaque no Brasil que voc conhece?

Leitura de notcia de jornal: Dizer ao informante: Agora eu


queria que voc lesse esse texto. Voc pode ler em voz baixa antes de
falar em voz alta. Esperar que o informante leia a notcia.

Depoimento: Dizer ao informante: Agora eu queria que voc lesse esse


texto. Voc pode ler em voz baixa antes de falar em voz alta. Esperar
que o informante leia a notcia.
(38) O que voc acha desse modo de falar: Voc t entendendo o que eu
t dizendo? (com en ditongado e exagerado). Se a pessoa manifestar
uma atitude negativa, perguntar: Como voc acha que deveria ser? O
que tem de errado a?
(39) Quem voc acha que fala assim? (se falar paulistanos, perguntar:
voc acha que todos os paulistanos falam assim ou uma coisa de uma
regio mais especfica na cidade?)
(40) Voc fala desse modo?
(41) E o que voc acha de Me v dois pastel e um chopps? (Fazer as
mesmas perguntas 3840 acima)
(42) E o que voc acha de A porta t aberta. (com tepe exagerado). Fazer
as mesmas perguntas 3840 acima.
(43) E tem mais algum modo de falar que voc acha assim bem paulistano?

358
Anexos

Palavras

alma gula
amargo Hrcules
animao hilrio
argola irm
atitude justia
barqueiro lento
biscoito mortadela Marba
cacique mosca
carteiro necessidade
cerca noite
chcara orca
circo Ordem e progresso
cisne orgnico
curto rgo
defender ostracismo
discoteca penteado
elefante pertencimento
enchente perto
entender porto
entretenimento presente
erguer rapidez
fazenda riqueza
felicidade sabor de menta
firme soberba
fornalha trabalho
furgo turco
fusquinha urgente
geleira utilidade
grmen de trigo vulto
gordo zebra

359
Anexos

Notcia
08/02/2010
Moradores cobram soluo para rea alagada em SP e aguardam encontro com
prefeito
Moradores da regio do Jardim Pantanal protestaram nesta segunda-feira em frente
Prefeitura de So Paulo contra a inundao em bairros da zona leste, que completa
dois meses hoje. Uma comisso de manifestantes foi recebida pela Secretaria de
Relaes Institucionais e apresentou reivindicaes, mas o prefeito Gilberto Kassab
(DEM) no participou do encontro.
Representantes dos manifestantes esperam que o governador Jos Serra (PSDB)
tambm participe da reunio de sexta. De acordo com os integrantes da comisso,
no havia integrantes do governo estadual no encontro realizado hoje na prefeitura.
Alm de cobrar a limpeza imediata das guas nos bairros, os moradores cobram uma
soluo para a falta de moradia. A maioria dos desalojados continua em escolas
municipais e, com o incio do ano letivo, temem no ter para onde ir.

Depoimento
T chovendo muito! Choveu tanto, tanto na semana passada que ficou uma piscina
na minha casa. , pra voc ver: Molharam todos os armrios, a cama, os colches,
tudo... Foi um sacrifcio... O que a gente fez? Ns tivemos que erguer os mveis
pra limpar tudo: a geladeira, o forno... minha irm at veio me ajudar, sabe? E
meus filhos compraram umas cadeiras novas, mas aquela coisa, assim... quando
chover de novo, vai molhar tudo outra vez. Voc fica sem ter o que fazer. E tem
um rio l perto que sempre alaga... quer dizer, gua dentro e fora de casa! Da,
o que acontece? Fica aquele trnsito, os carros todos parados, a gente demora um
tempo pra chegar em casa... No aguento mais enchente nessa cidade... Agora
que eu vou fazer? Os polticos falam, falam, mas eles tinham que fazer alguma
coisa urgente. Voc t entendendo o que eu t dizendo?

360
Anexos

Anexo B: Informantes do corpus de


entrevistas sociolingusticas
O quadro apresenta o significado dos cdigos utilizados na Tabela 1 a seguir.

S - Sexo F: feminino
M: masculino
I - Idade em anos
E - Escolaridade F: at Ens. Fund. II
M: at Ens. Mdio
S: Ens. Superior
R - Regio C: bairro mais central
P: bairro mais perifrico
Z - Zona C: central
N: norte
S: sul
L: leste
O: oeste
P - Origem dos Pais E: estrangeiros
I: interior SP/MG/PR
N: norte/nordeste
P: So Paulo-capital
X: mista (pais de origens diferentes)
M - Mobilidade B: sempre morou no mesmo bairro
Z: sempre morou na mesma zona
M: morou em diferentes zonas
C - Classe Social A: alta
B1: mdia alta
B2: mdia mdia
C1: mdia baixa
C2: baixa alta
D: baixa mdia
IS - ndice Socioeconmico ndice 1 5
%[ej] (T) taxa de emprego de ditongao (Total de dados)
%[] (T) taxa de emprego de retroflexo (Total de dados)
%CN- (T) taxa de marca zero de concordncia nominal (Total
de dados)
%1PP- (T)+ taxa de marca zero de concordncia verbal de 1PP
(Total de dados)
%3PP- (T) taxa de marca zero de concordncia verbal de 3PP
(Total de dados)
+
Para 1PP-, informantes com no tm dados do pronome ns.

361
Tabela 1 Caractersticas sociais dos informantes e respectivas taxas de emprego de [ej], [], CN-, 1PP- e 3PP-

Informante S I E R Z P M C IS %[
ej] (T) %[] (T) %CN- (T) %1PP- (T) %3PP- (T)
AdolfoF M 21 S C C I B B2 3.2 16% (50) 44% (50) 46% (123) 0% (2) 8% (63)
AdrianaP F 24 S C C X M C1 3.0 16% (50) 4% (50) 6% (121) 0% (2) 8% (72)
AmandaA F 20 S P L P Z C1 3.0 58% (50) 34% (50) 7% (166) 0% (1) 19% (152)
AmaralM M 60 F P N I Z D 1.6 6% (50) 80% (50) 14% (194) 0% (11) 14% (116)
AnaM F 73 S P N X M B2 3.1 48% (67) 18% (92) 1% (148) 0% (7) 7% (85)
Anas F 32 M P O X M C2 2.2 58% (67) 54% (99) 16% (90) 0% (4) 18% (72)
AndreaC F 45 S P S X B B1 3.6 68% (67) 28% (56) 5% (131) 0% (2) 8% (53)
AngelicaL F 61 F P S I M C1 3.0 62% (68) 20% (96) 0% (212) 0% (12) 5% (105)
AnisioC M 70 F P N P Z D 1.7 6% (50) 42% (50) 18% (101) 40% (5) 24% (50)
AnselmoN M 63 S P N I M B2 3.1 14% (66) 12% (96) 10% (176) 0% (2) 23% (105)
CamilaA F 43 S C O P M B2 3.3 48% (50) 16% (50) 3% (122) 0% (3) 1% (81)
CarlosE M 73 S P O I Z B1 4.0 24% (68) 14% (94) 13% (165) 11% (18) 5% (113)
CarmenC F 72 F C L P B C2 2.2 28% (50) 8% (50) 83% (52) 69% (36) 50% (16)
CarolinaA F 24 M C C I M C2 2.5 12% (68) 0% (100) 9% (223) 0% (8) 6% (168)
CelinaA F 42 S P L N Z C1 2.9 52% (50) 60% (50) 13% (149) 50% (2) 42% (48)

362
CesarP M 43 S C L P Z C1 3.0 28% (50) 40% (50) 10% (135) 0% (31) 3% (64)
Anexos

CicaN F 67 F C O X M C2 2.5 32% (50) 42% (50) 19% (104) 0% (11) 33% (57)
ClaraC F 40 S C C I B B1 3.7 82% (68) 34% (81) 1% (139) (0) 9% (69)
ClaudiaH F 36 S P O E M B1 3.7 52% (69) 6% (55) 0% (212) 0% (2) 2% (127)
ClaudomiroS M 48 S P S X Z B2 3.2 48% (69) 38% (97) 1% (277) 0% (6) 4% (138)
CleliaE F 69 F C S X M C2 2.1 56% (69) 26% (94) 71% (102) 17% (23) 13% (99)
CristianoS M 33 S C C I M C1 2.9 40% (69) 34% (101) 4% (116) 0% (6) 12% (84)
DaianeM F 33 M C O N B C1 2.8 54% (65) 14% (88) 12% (164) 0% (11) 1% (68)
DanielC M 22 M P O X B B2 3.4 72% (68) 70% (88) 19% (156) (0) 12% (67)
DecioA M 60 M P O I B C2 2.2 2% (68) 60% (97) 64% (103) 16% (32) 31% (32)
DercyF F 72 S P O X M B2 3.4 44% (50) 24% (50) 5% (211) 0% (20) 6% (117)
EdnaS F 45 M C O X Z C2 2.4 32% (50) 8% (50) 13% (128) 0% (3) 9% (78)
EduardoG M 44 S C C X M B1 3.6 26% (67) 12% (92) 2% (205) (0) 0% (75)
EduardoK M 82 M C L I B C1 2.6 14% (50) 86% (50) 50% (180) 22% (9) 61% (95)
EloisaD F 23 S P O X B B2 3.1 72% (68) 6% (88) 2% (178) 10% (21) 6% (142)
S = Sexo; I = Idade; E = Escolaridade; R = Regio; Z = Zona; P = Origem dos pais; M = Mobilidade; C = Classe social; IS = ndice socioeconmico
Tabela 1: Informantes (cont.)
Informante S I E R Z P M C IS %[
ej] (T) %[] (T) %CN- (T) %1PP- (T) %3PP- (T)
EthelM F 60 S P N X B B2 3.4 10% (69) 22% (102) 7% (123) 0% (5) 6% (78)
EvandroO M 30 M P S P B C1 2.8 26% (50) 58% (50) 3% (134) 0% (1) 4% (91)
FabioR M 49 F C L P B C2 2.2 4% (50) 26% (50) 63% (88) (0) 40% (47)
FabioS M 23 S P S X M B2 3.1 46% (63) 2% (78) 11% (155) 100% (1) 25% (79)
FelipeL M 31 M C O P M B1 3.6 22% (69) 22% (100) 21% (71) (0) 17% (24)
FernandaT F 31 S C S X Z B1 3.9 66% (68) 6% (85) 1% (123) (0) 6% (54)
FernandoB M 23 M C O P Z B1 3.6 70% (68) 0% (102) 35% (137) 100% (1) 10% (49)
GilsonS M 36 F P L N B C2 2.4 6% (50) 46% (50) 25% (105) 25% (20) 27% (49)
GiovanaA F 34 S P L N Z C1 2.7 34% (50) 66% (50) 27% (211) 0% (10) 14% (74)
HaroldoL M 64 S P S P M B2 3.4 20% (67) 38% (77) 30% (158) 0% (26) 4% (123)
HelderX M 67 S C O I B B2 3.1 18% (69) 36% (102) 39% (163) 0% (7) 14% (76)
HeloisaS F 68 F P O P Z C2 2.1 4% (50) 30% (50) 39% (98) (0) 20% (101)
HugoF M 83 F C O X M C2 2.5 4% (68) 22% (104) 61% (145) 0% (5) 18% (68)
IaraM F 65 S P S E Z C1 2.8 32% (70) 10% (96) 4% (185) 3% (34) 7% (167)
IaraS F 59 S C O I M B1 4.0 42% (69) 16% (103) 1% (179) 0% (17) 1% (78)

363
InaeA F 75 F P N X M D 1.8 36% (50) 56% (50) 22% (115) 12% (17) 32% (37)
Anexos

InesC F 47 M P L I Z D 2.0 44% (50) 72% (50) 1% (155) 0% (9) 7% (91)


IolandaP F 51 S P N X Z B1 3.8 54% (68) 12% (101) 3% (373) 0% (8) 1% (244)
IreneR F 60 S C O I M B2 3.3 60% (69) 48% (79) 7% (99) 0% (2) 4% (96)
IvanaB F 30 F P S X M D 2.0 24% (50) 72% (50) 48% (85) 100% (1) 68% (41)
JairS M 29 M P L X B C1 2.6 50% (68) 58% (97) 22% (160) (0) 15% (75)
JandiraF F 41 M C O I Z B2 3.2 84% (69) 6% (97) 9% (186) 0% (16) 11% (109)
JasminM F 59 M P L I Z C2 2.2 24% (69) 20% (96) 30% (145) 18% (11) 22% (89)
JonasM M 25 M P L N B C1 2.8 40% (50) 76% (50) 10% (166) 0% (6) 9% (104)
JoseL M 27 M P O P M B2 3.4 42% (63) 82% (85) 26% (105) (0) 24% (37)
JoseM M 72 S C N X M B1 3.7 8% (50) 16% (50) 3% (159) 0% (28) 7% (54)
JoseN M 46 S P N I M C2 2.5 44% (69) 20% (101) 51% (231) 0% (11) 23% (127)
JulianaW F 70 S C O E M A 4.1 16% (69) 6% (101) 0% (81) 0% (6) 0% (45)
KarolinaM F 53 M P S I M C1 2.8 32% (67) 44% (95) 5% (153) 0% (12) 1% (98)
LeilaB F 60 S C S X M B1 3.6 58% (68) 0% (104) 2% (155) 0% (26) 6% (65)
S = Sexo; I = Idade; E = Escolaridade; R = Regio; Z = Zona; P = Origem dos pais; M = Mobilidade; C = Classe social; IS = ndice socioeconmico
Tabela 1: Informantes (cont.)
Informante S I E R Z P M C IS %[
ej] (T) %[] (T) %CN- (T) %1PP- (T) %3PP- (T)
LeoM M 62 S P S I M B2 3.5 20% (50) 52% (50) 14% (132) 0% (17) 17% (59)
LucasR M 20 F C C X M C2 2.4 54% (50) 32% (50) 13% (82) (0) 18% (11)
LucasS M 25 M C C I B C2 2.4 66% (69) 80% (105) 9% (245) 0% (4) 8% (129)
LucianaM F 63 M C O X M B2 3.3 78% (50) 12% (50) 2% (207) 0% (6) 8% (71)
LucioA M 54 M P L E M C1 2.7 8% (66) 6% (99) 9% (161) 57% (7) 9% (101)
LuisA M 31 S P S P Z B1 3.9 68% (70) 2% (100) 21% (292) 0% (10) 9% (132)
MadalenaM F 51 S P O P Z B2 3.5 36% (67) 6% (101) 4% (161) 0% (4) 2% (102)
MarceloB M 22 M P N X M B2 3.2 20% (68) 42% (101) 9% (138) (0) 9% (64)
MarceloH M 62 S P O E Z B2 3.4 6% (50) 2% (50) 0% (169) 0% (7) 1% (95)
MarcoP M 24 S P O I B B2 3.5 52% (69) 98% (105) 1% (109) 100% (1) 3% (68)
MarianaB F 49 F P L E Z C2 2.4 48% (70) 60% (104) 17% (127) 13% (8) 19% (79)
MarioM M 50 F C O E M C1 2.8 14% (50) 40% (50) 78% (116) 33% (3) 57% (49)
MartaL F 69 S C O I M B1 3.6 66% (68) 24% (88) 4% (91) 0% (12) 8% (61)
MauraC F 57 M C C P M C1 2.9 60% (69) 62% (88) 0% (87) 0% (4) 2% (43)
MauricioB M 36 M C L P B C1 2.8 36% (69) 8% (98) 25% (133) 25% (4) 23% (71)

364
MauricioC M 44 M P O N Z B2 3.1 6% (69) 66% (80) 9% (91) 0% (1) 13% (52)
Anexos

MauroB M 36 S C O X M B1 3.9 36% (50) 20% (50) 1% (232) 8% (13) 4% (94)


MeireC F 48 M C S X M C2 2.5 26% (69) 20% (102) 14% (161) 0% (3) 17% (70)
MiguelR M 57 F P O X Z C1 2.6 16% (50) 94% (50) 22% (203) 6% (17) 31% (109)
MilenaF F 19 M C N P M C1 2.7 48% (67) 74% (100) 25% (88) (0) 25% (56)
NairC F 79 S C O I M B2 3.4 58% (50) 4% (50) 3% (172) 0% (12) 6% (113)
NeideE F 61 S P S I Z B1 4.0 70% (50) 8% (50) 4% (117) 0% (21) 9% (66)
NicolauS M 25 M C O N B C1 2.9 16% (50) 84% (50) 54% (156) 100% (1) 49% (63)
NiltonG M 58 S P O X M B1 3.7 12% (70) 30% (103) 1% (241) 1% (85) 3% (118)
OsvaldoR M 50 S C O I B B2 3.5 18% (67) 22% (92) 18% (118) 50% (18) 4% (57)
PamelaR F 27 M P L I Z C1 2.7 68% (50) 30% (50) 36% (152) 20% (5) 40% (52)
PatriciaT F 31 S C O I M A 4.1 26% (50) 2% (50) 0% (204) 0% (1) 5% (95)
PauloP M 24 S C O X M A 4.5 50% (50) 0% (50) 1% (157) 0% (2) 2% (125)
PedroS M 36 S P S I B B2 3.2 24% (68) 40% (92) 48% (149) 0% (2) 38% (66)
PietroC M 58 S C C X M B2 3.2 12% (70) 6% (98) 10% (166) 8% (26) 14% (59)
S = Sexo; I = Idade; E = Escolaridade; R = Regio; Z = Zona; P = Origem dos pais; M = Mobilidade; C = Classe social; IS = ndice socioeconmico
Tabela 1: Informantes (cont.)
Informante S I E R Z P M C IS %[
ej] (T) %[] (T) %CN- (T) %1PP- (T) %3PP- (T)
PlinioC M 71 M P S P M C1 2.7 18% (67) 40% (92) 40% (243) 10% (82) 16% (105)
PriscilaA F 37 S C O I B B1 3.7 60% (69) 8% (91) 1% (69) (0) 20% (10)
RebecaC F 32 S C O E M B1 3.8 68% (70) 0% (97) 2% (219) 0% (2) 1% (126)
ReginaS F 43 M P L X Z C1 2.6 62% (68) 44% (93) 7% (129) 0% (7) 7% (59)
ReinaldoS M 60 S C C P M B1 3.7 12% (50) 36% (50) 19% (201) 7% (14) 10% (115)
RenataC F 35 M C C X B B2 3.2 62% (69) 0% (105) 5% (138) 0% (3) 2% (92)
RicardoT M 29 S C O X Z B1 3.8 24% (66) 10% (93) 1% (124) (0) 2% (52)
RobertoC M 77 F C L X B D 1.9 40% (50) 12% (50) 78% (98) 40% (10) 64% (28)
RobertoM M 39 S P L I Z B2 3.5 70% (66) 54% (101) 8% (118) 0% (15) 6% (48)
RodrigoC M 22 S P O N B C1 3.0 64% (68) 84% (106) 25% (93) (0) 36% (44)
RodrigoS M 38 M C O X B C1 2.8 40% (69) 38% (104) 20% (87) (0) 9% (56)
RogerioA M 65 S C C P M B2 3.2 66% (69) 0% (106) 2% (192) 0% (3) 0% (93)
RomuloS M 60 M C S P M B1 3.6 10% (66) 4% (94) 11% (152) (0) 14% (50)
RosineideA F 65 M P L E Z D 1.7 60% (50) 40% (50) 54% (158) 0% (6) 37% (119)

365
SabrinaD F 59 S P L I B C1 2.7 68% (50) 20% (50) 4% (167) 0% (7) 12% (73)
Anexos

SamantaV F 32 M P L X Z C2 2.5 64% (69) 70% (94) 54% (105) 20% (5) 21% (67)
SergioP M 62 F C O P Z B2 3.1 22% (50) 0% (50) 0% (165) 0% (1) 1% (107)
SeverinoN M 63 S C O E Z B1 3.7 14% (50) 16% (50) 3% (166) 0% (3) 12% (60)
SoniaL F 34 S C O P Z A 4.2 82% (67) 4% (104) 2% (133) 0% (3) 5% (62)
SoraiaS F 72 M C N X M C1 2.6 10% (69) 2% (97) 7% (81) 13% (8) 4% (54)
TaisP F 21 M P N P M C2 2.5 44% (70) 52% (101) 7% (99) 0% (1) 8% (50)
TatianaM F 26 S P O X M B2 3.4 42% (66) 16% (92) 0% (172) 0% (1) 2% (54)
ThaissaB F 26 S P S X M B2 3.2 20% (67) 72% (92) 1% (196) (0) 12% (102)
VeraD F 77 M P S E M C1 2.9 6% (67) 18% (108) 5% (83) 0% (5) 5% (74)
WagnerL M 28 S C L P Z B2 3.1 34% (50) 28% (50) 7% (165) (0) 30% (54)
WaldemarN M 59 M P S P M C1 2.9 16% (70) 40% (94) 5% (233) 0% (8) 8% (114)
WaldemarS M 74 M P O I Z C1 2.8 10% (50) 72% (50) 39% (192) 31% (16) 47% (95)
WilliamA M 47 S P O N Z B2 3.5 40% (68) 36% (87) 6% (205) 10% (10) 8% (106)
S = Sexo; I = Idade; E = Escolaridade; R = Regio; Z = Zona; P = Origem dos pais; M = Mobilidade; C = Classe social; IS = ndice socioeconmico
Anexos

Anexo C: Distribuio geogrfica dos


informantes

Figura 1 Distribuio dos informantes da amostra


por Sexo/Gnero e Regio de Residncia
(Mapa criado no My Maps do Google)

366
Anexos

Anexo D: Formulrio da anlise de percepo

Figura 2 Formulrio de percepes da coleta presencial

367
Anexos

368
Anexos

Figura 3 Formulrio de percepes da coleta online

369
Anexos

370
Anexos

371
Anexos

372

Вам также может понравиться