Вы находитесь на странице: 1из 22

Extrait de la publication

Cet ouvrage se situe au carrefour de


quatre sciences nouvelles : la science
politique, la Iinguistique, la statistique
et I'informatique. n a ete con\lu d'abord
comme instrument de reference pour
tous ceux, universitaires, journalistes ou
simples citoyens, qui se preoccupent de
la vie politique et qui pourront trouver,
grace it un index complet, tous les mots
qui ont ete prononces par Ie generai
de Gaulle dans ses allocutions radio..
televisees.
Mais ce livre contient egalement
d'autres renseignements statistiques
totalement inedits ; en outre, les me..
thodes utilisees peuvent aider d'autres
chercheurs. n est evident que I'origi..
nalite d'une telle experience reside
surtout dans I'utilisation systematique
de l'ordinateur. N'ont ete presentes que
les documents dont I'objectivite etait
indiscutable ; ceux dont les resultats
pouvaient pr@ter it contestation ou fai..
saient intervenir quelque appreciation
subjective ont ete exclus. L'ouvrage a
perdu ainsi, peut..@tre, une part de son
attrait, mais il a gagne en homogeneite
et enrigueur scientifique.
La reailisation d'une telle entreprise n'a
pu @tre menee it bien que par la colla..
. boration etroite des auteurs dont les
formations sont complementaires. Jean..
Marie Cotteret, professeur it la Faculte
de droit et des sciences economiques de
Nice, enseigne la sociologie politique
depuis plusieurs annees et a publie
un oUVrage et des travaux de science
politique, notamment en matiere elec..
torale. Rene Moreau, directeur de re..
cherches dans une entreprise privee,
enseigne la statistique Iinguistique au
Centre de linguistique quantitative de
la Faculte des sciences de Paris et a
publie plusieurs articles sur cette
question.
Extrait de la publication
recherchs
sur le
vocabulaire
du
gnral
de Gaullg
,l
ISBN de la version numrique : 9782724684803
travaux
et recherches
de science
Politique
Dans le cadre d'une rorganisation
de ses publicatioru,
la Fondation nationale des scrences
politiques a cr la
collection
< Travaux et recbe,rchepde
science.
politique >'
Elle se
prog)se d'y accueillir des
&udes
provenagt
soit de sis ntres e recherche
(Centre d'tude de la
vie
politique franaise
contemporaine,
Centre d'tude
aes relatins
internationales...),
soit de
groupes ou de
chercheurs
qui ne lui sont
pas directement rattachs'
Cette nouvelle collection est distincte des < Cahiers de
la Fondation natironale des sciences
politiqu >
-
'dont
elle est complmentaire.
Les manuscrits
sont
afiects Iune ou i'autre collection en fonction de la
nature et de I'ampleur des recherches dont ils
pr-
sentent les rsultats.
Les sries di coostitues
(< Etudes syndicales >,
< Etudes maghrbines >, < Nations et alliances >) se
raccordent
-la
collection
< Travaux et recherches
de
science
politique >, avec une numrotation
particulire'
\
.\
\
Extrait de la publication
FONDATION
NATIONALE
DES SCIENCES
POLITIQTIES
trava,ux et recherches
de science
politique
JEAN.MARIE COTTERET
ET R,EN uongEu
1969 ARMAI{ID COLIN 1O3 Bd SAINT-MICI{EL PAIIISV
3
R,EICI{ER,CI{ES
STIR
LE
VOCABULAIR,E
DTI
GNRAL
DE GAIILLE
A1ralyse statistique
des allocutions radiodiffuses
195A-1965
Extrait de la publication
Le
autqurs tiennmt pri'mer ic. Ieurs re-
m,cienxents tous cetn
qu leu,r ont
fourn
concottrs, aide et collabordon, mas plu's sp-
calmprt Lours Boow qu.
'lan
a pns
de composar,
parti.r un manascri,t m,par-
fat,
un ouarage
qu'To* ma,ns; Cuenr.ns
CosreuecNe dont fam,it. et le souten dont
iantats fai.t
dfaut; Hr.lrE Ver"esRcur a,
lrer-Fnenors
Renrown pou,r lau.r ard.e tech-
nque; anr tud,ars de scmce polit,que de
la Facult de ilroi;t et des sciences conom,i-
ques de N,oe
qu
ont accontpl.i une tchp
quelquefols n grute, mas tnd.iryensabln.
f.-M.
Cmrmm et R. Monneu
@
$69 LrBnarnrn ARMAND colrN
e FONDATION
NATIONALE DEs scIENcEs PoIJTIQU
TABLE DES MATIERES
AVANT.PROPOS
PREMIERE PARTIE
LES CARACTERES STATISTIQUES DES ALLOCUTIONS. ... ...
|
.
Lo technique de dpouillement . . .
I - Le raitement par ordinateur
II - Les prograrlmes
1) Programme d'indexation . . .
2) Programme de concordance .
3) Prrcgramme de recherche de mo nouveaux
III - Dfense et illustration du
'mot-forme'
.
ll
-
Les deux types d'ollocutions rodiot6lvises
I - Les critres de la ilistinction . .
II- Caractre statistie des discours-appels et des discours-
bilans
III - Les discours-appels
. .
IV - Les discours-bilans . .
lll - Etude
quontitotive
des ollocutions
I - Nombre
de mots par anne
II - La longueur-des phrases
A) Remarque s
mthodo Io gr q,r"t
B) Evolution de la longueur de la phrase
C) Etude des phrases de longueur aberrante
D) Evolution du coefficient de variation de la longueur des
phrases
III - La richesse du vocabulaire
DEUXIEME PARTIE
TEXTE DES ALLOCUTIONS
TROISIEME PARTIE
INDEX ANALYTIQUE DES MOTS CONTENUS DANS LES
1I
l3
t3
L4
L4
I5
15
L6
t9
19
27
3l
35
39
39
42
42
42
45
4B
5t
59
ALLOCUTIONS L27
Extrait de la publication
IVII
TABLE DES GRAPHIOUES
' 20 26
!.
J'
er
JE.
II. vous.
III. NOUS.
rv. rRANArs
V. REPUBLIQUE
(S).
VI.
.ETAT.
VII. FRANCE.
Test de la normalit de la longueur des discoursr
. . . . . . . W
Pourcentge dtapparitiop des mots, ouveaux par rapport au
nombre total de mots pour chaque discourt
. 30
Frguence des mots dans.les discours.appels
g2
Frquence des mots
rlqrrs
lee discors-bilans
. .
Longueur
rnoyenne
de la phrase de chaqne discours, Fepor-
te dans I'ordre chronologie des discoure

Longueur moyenne des phrases des discurs-rypels


47
Valeur du coeffrcie,nt de variation pour les 46 discours
classsdansl'ordrechronologie
... . 49
Erod" du la ricesse ." di"-*s 12 et I3 52
Accroissernent d'un vocabulaire . .... . 54-55
Richesse du vocabulaire dans les di'scours du gn&al de
Ganlle ......... 56
vm
I)c
x.
n:
xIL
xIIL
ilv.
xv.
xvL
xvIl
i
tl
I
;.
'
I
,I
,l
-.!,r-
!: --':*-*
.-=r=st'-ll :
-
4rrrr.-::):Li1.-.,!
AVANT
- PROPOS
A la question gu'on lui posa un
iour:
"Quels
sont vos dix mots
prfrs ?tt Camus
rpondit:
"le
monde, la douleur, [a terre, [a mre,
ies hommesn le dseri, Ithonneur, la misre
,
L't, la mertt
l.
'Si
la mme
question tait pose au gnral de Gaulle
on ne sait ce qu'i[ rpondrait,
mais I'ordinateur, interrog,
Peut
nous dire que ses dix mots de prdilec'
tion, conscients ou inconscienrs,
sont :
ttla
France, le pays, la Rpu'
blique, I'Etat, le monde, le peuple, la nation, le progrs, la paix, I'ave'
nirn
2.
,l[
serait certes possible partir des mots choisis par Camus,
partir de ceux tablis par I'ordinateur
Pour
le gnral de Gaulle,
de
reconstituer leur univers. Tel ntest
pas notre
ProPos
dans cette tude.
Nous
avons interrog ltordinateur et nous livrons ses rponses.
Les travaux
sur le vocabulaire
politique sont en France
assez'
rares et procdent de mthodes trs diverses. [l
est difficile
qu'il en,
soit autrment dans un domaine encore peu explor, Cette tude se
ressent du manque dtanalyses
quantiatives des diffrents discours
d'hommes politiques contemporains,
comme d'ailleurs de rfrences
statistiques sur le reste de ltuvre du gnral de Gaulle,
qui nous au'
raient permis des comparaisons utiles. Aussi [e but principal du livre
est-il de commencer combler cette lacune en fournissant
aux cher-
cheurs une premire source de renseignements
statistiques sur un corPus'
ceries limit, mais
qui nous
a sembl tre une premire tape indis'
pensable.
Ce
sont donc des ttonnements
supplmentaires
que nous aPPortons
dans un secteur de la science policique qui connatra probablement de
grands dveloppements
dans les annes venir. En attendant les pro'
ioog.ur.ot"
futurs que cette tude
pourrait susciter, nous proposons ici
un instrument
de travail
qui a
Pour
toute ambition de dcrire une techni'
que - l'utilisation d'un ordinateur - aPPlique un vocabulaire
'celui
des allocutions radiotlvises
du gnral de Gaulle.
La mthode
de dpouillement
consiste mettre
sur cartes perfores
tous les mots drun texte, pour les emmagasiner dans un ordinateur
qui
1.
LEBESQUE
(Morvan),
Camus
par lui-mme, Paris, Editions du Seuil,
1964,
P.165.
'
2, n laissiant de ct les mots
"conjoncturels"
comme Algrie.
Extrait de la publication
donne les rsultats demands
grce aux instructions qui lui sont
prala-
blement fournies sous forme de
ptogrammes,
La finesse des rsultats
obtenus est fonction des programmes
labors. De toutes faons la
machine ne peut se livrer aucune-inteqprtation.,Les
lments qutelle
fournit n'en sont pas moins rrs importnrs et abrgent considrable-
ment le temps que [e chercheur aurait dt consacrer ces travaux quel-
quefois dpou.rvus d'intrt. Il peut
mme arriver que la machine permeme
d'obtenir des rsultars que la longueur des calculs avaienr fair ngliger
et qui donc, en lttat acruel des sciences sociales,
sont difficiles
interprter:
'c'est
le cas par exemple de ltvolution de la longueur de Ia
phrase.
,
une
premire lecture des rsultats a permis de classer les allocu-
tions radiotlvises: des indices inrernes, comme Ia frquence d'urili-
sation des pronoms et des mots, et des indices externes, comme la
longueur des discourq onr constitu des critres suffisants pour sparer
ce que
nous avons appel les discours-appels
des discours.blans.
Ces regroupemenrs
une fois oprs, il a sembl
utile de rechercher
d'autres lments statistiques.
Il a t possible de procder un inven-
taire quantitatif du nombre de mors prononcs chaque anne par le gn-
ral de Gaulle et de recenser la frquence d'utilisation de chaque mor.
ces tableaux statistiques
onr t complts par une tude sur l'volution
de la longueur de la phrase dans, le temps, et par une analyse de la
richesse du vocabulaire des diffrents rexres des allocurions..Ces pre-
miers lments de ltanalyse sont rests au
niveau des caractres statis-
tiques du mot. Les concordances permettent de situer le mot dans son
environement et dten ilgager
ainsi le sens.'Si nous nous intressons,
par exemple, au mot systme,
ltordinateur pourra fournir toutes les
phrases qui le contiennent. Il suffira alors dtassembler ces phrases pour
mettre en valeur ses diffrentes significations..
Un dernier instrument de rravail est consriru par I'index exhaustif
de toutes les
fotmes
des mots coRrenus dans les allocutions du prsi-
dent de la Rpublique. Certes il et t possible de consrituer
un dic-
tionnaire en regroupant les diffrentes formes de ltindex, mais il nous a
sembl que les donnes brures, bien que grossires, taient
une meil-
leure source de renseignements pour le chercheur dsireux d'approfon-
dir ses connaissances sur le vocabulaire du gnral de Gaulle.
Il tait impensable d'tudier tout le vocabulaire du gnral de
Gaulle:
'notre choix srest port sur les seules llocutions radiotlvi-
ses, car nous tions en prsence dtun vocabulaire politique trs riche.
Il fallait ensuite disposer d'un coqpus ni trop vsre - pour une question
de cot -, ni trop rduit - pour la validit des rsultats.
Les 62 47L
mots prononcs la radio et la tlvision par le gnral de Gaulle
Extrait de la publication
entre L958 et 1965 constituaient un champ d'investigation acceptable.
Tous
les textes retenus devaient prsenter
une certaine homognit:
le vocabulaire des allocutions n'est pas celui des confrences de pres-
se, ni celui des mmoires, ni celui des cournes en province.
Les textes
des ailocutions prsentent des caractres identiques: il.s sont prpars
pour tre adresss au moyen de la radio et de la tlvision, directemenr
aux Franais. La pratique des causeries au coin du feu, inaugure par
le prsident
Roosevelt et reprise par le prsident
Mends France, se
trouve institutionalise avec le gnral de Gaulle; il est vrai que son
habimde de la radio date du L8juin 1940
3.,Le
dveloppemenr de ce nou-
veau moyen de communication entre gouvernants et gouverns semble
donc
justifier
notre choix.
,Nous
avons assimil aux allocutions pronon-
ces par le gnral de Gaulle aux moments qu'il choisit, et selon les
mthodes
qui lui sont personnelles, Ies messages du chef de lrEtatla
lrJatioq,
prws, eux, par la Constitution et que le prsident de la Rpu-
blique a eu peu droccasions d'utiliser, sauf pendant les insurrecrions
d'Alger. [1 nous a paru aller de soi galement dfy incorporer les trois
interviews de la campagne prsidentielle qui n'taient autres ciue des
monologues dirigs.,Encor que les statistiques fassent apparatre des
diffrences sensibles entre les interviews et les aurres textes, ces
variantes ne remettent pas en cause I'homognit des allocutions.
Ce travail pourrait, semble-t-il, connatre des prolongements dans
deux directions.
'
D'abord, Itanalyse des moyens de communication peut faciliter une
nouvelle approche des phnomnes politiques.,Toute tude des phno-
mnes politiques se fait en premier lieu au niveau des textes constitu-
tionnels qui sont plus ou moins appliqus, mais qui sont toujours une
indicarion prcieuse sur les
iustifications
recherches par les gouver-
nants les moins soucieux de les appliquer.
Une
seconde approche est
celle de lranalyse du fonctionnement rel dtun systme politique et des
phnomnes qu'il implique: rle des partis politiques, des groupes de
pression, du mcanisme de dcision, etc.
Une troisime approche consis-
te apprhender les phnomnes politiques au niveau de leur reprsen-
tation dans la conscience des citoyens..A travers les mots
se dgagent
des images que les gouvernants imposent aux gouverns. Il est certes
intressant
d'tudier le
"domaine
rservn du prsident de la Rpubli-
que, il est non moins passionnant de savoir quelle
image les Franais
se font de leur prsident et de ses pouvoirs. Or cette image est fonction
des mots, des phrases, des slogans, qui leur sont rpts la radio et
la tlvision et qu'ils ne peuvent qutassimiler plus ou moins vite.
3. Pour tre plus prcis, le'prsident Doumergue
avait utilis la technique du dis-
cours radiodiffus pour la premire fois, le 24 mars 1934, puis le l7
iuillet
1934.
Ce qui
permettait Lon Blum d'crire dans Le Pofulaite du 18
iuilletl934:ile
ie
etlemoi dt
prsident
Doumergue
icommencent
prendre un peu trop de place'.
Extrait de la publication
I
i
?ar les moyens
audio-visuels sttablissent de nouvelles relations entre
gouvernants
et gouverns, les premiers dirigeant et conditionnant les
seconds. Voil
pourquoi l'tude de la reprsentation au niveau collec-
tif et individuel, travers les moyens de communication, semble tre
un champ dtinvestigation plein de promesses. On pourra ainsi connaitre
en profondeur ce qui est vital pour les citoyens: ce qu'ils croient. Les
phnomnes se situent au point de rencontre d'une conception singulire
et dtune image collective: le contenu de la communicarion est le rsul-
tat de ce qui est la fois demand et impos. En dplaant l'analyse
politique, on atteint le niveau des croyances: mais ntest-ce pas la raIt-
t politique profonde si le prcepte de Machiavel est touiours'vrai selon
lequel gouverner c'est faire croire ?
La
seconde voie possible serait un approfondissement de ltunivers
du gnral de Gaulle partir de I'analyse des mots. Les premiers rsul-
tats statistiques obtenus suggrent dj un grand nombre d'interprta-
tions. Il faut se garder d'une trop grande rapidit de
jugement.
Drabord
parce que cette tude ne concerne gue des textes trs particuliers: ils
sont probablement symptomatiques dtune pense, mais encore faudrait-ii
le vrifier, Ensuite parce que, comme nous I'avons constat, il existe
un dcalage assez grand entre les renseignements statistiques que
fournit la machine et la comprhension de ces phnomnes. Cela
s'ex.
plique aisment. Les
performances de I'ordinateur permettent d'obtenir
des rsultatsque le chercheura quelquefois du mal interprter. La seu-
le solution pour rattraper ce retard de I'homme sur la machine consiste
former des quipes de chercheurs qr.li en runissant leurs comptences
arriveront faire progresser les sciences sociales. L'tude de I'univers
du gnral de Gaulle
peut constituer un excellent banc d'essai.
IO
Extrait de la publication
PREMIBRE
PARTIE
LEs cARAcrnrs
srATlsrlQUEs
DES ALLOCUTIONS
| ,Ji,
..T]:{
/
"
"i
j
?--
.!i
i.F
,
:^;.
r
,.
r';1i+
-
t'''
'l
iJ \
'
:
:l
tj
'''r
;
,:
-'r:l-r','i
r'..
V:'
_,I
li;
'....
Extrait de la publication
I
LA TECHNIQUE
DE DEPOUILLE{ENT
I. LE TRAITEMENT PAR ORDINATEUR
sans entrer dans Ia_lescription dtun ordinateur, disons seulement que crest
une machine capable dteffectuer de trs grandes
vitesses dee op-rations
simples, soit aritmtiques
(addition,
sousbaciion),
soit logiEres
(comparaison
de deux..terme.s pour dterminer si ltun dtentre eux est rupri-eur, gal-ou inf-
rieur I'autre), soit techniques
(transfert
de renseigr."r"oir, lectur de bandes
magntiques, etc.).
Ce_s oprations
-sont
effechres sur des donnes
qui sont enregistres
au
cc,urs du haitement dans diff-rents t).pes de mmoires.
Une mmoire-est conpo-
se dtun trs grand nombre il'lmenis, en gnral lectries ou magnties,
qui peuvent prendre seulement deux tats. Cee deux tats sont I'{at zto ei
I'6tat un. Une lettre de I'alphabet est alors reprsente par une suite ile zro et
de un.
A deux lettres diffrentes correspondent deux suites diffrentes de zro
el te an.
Un mot de la langue est repreent par un ensemble de zo et de un
se rapportant chacune des lettres le composant.
Si dans la mmoire de ltordinateur nour avong inhoduit un lexie, savoir
si un- mot fait partie de ce lexique revient effectuer une opratio-n logique.
En effet, nous allons confronter les suites de zro et d,e un du mot rechlrch
et des mots existant dans la mmoire de lrordinateur.
Si la iliffrence est
positive ou ngative, le mot n'existe pas puisque les suites sont diffrentes.
Si la diffrence est nulle, le mot existe puisque deux suites soni identies.
Il est clair que, s'il fallait reprsenter la main les lettres et les .otr p"t
des z1o et des u7, la transcription serait dmesurment longue, et la lectur
peu prs impossible. La transcription est faite automatiemnt par la machine,
encore faut-il lui fournir les donnes ncessaires
Le passage du texte manuscrit au langage machine a t fait I'aide de
cartes perfores. Certes, il existe bien dtautres moyena de fournir des donnes
aux ordinateurs; mais crest la technique que nous avons retenue. Une carte
mcanographie peut tre considre comme une ligne d'criture de quabe-
vingts caractres. Dans le haut de la carte eat souvent imprim en clair le
texte correspondant aux pedorations reprsentant ces caractres. Les vrifica-
tions sont ainei plus aises. Sur la car.te, chaque lettre se voit affecter une
t3
F
I
colone
.forme d'une suite e zrc
(iI
y a un trou dans la ca$e) ou de un
(il
nty a pas de trou dans la carte). [,e corpus des quarante-six discouns a t
ainsi mis sur eartes perfores.
Un tel procd prsente queles inconvnients. Dtune part, la transcrip-
tion est longue, et les rises dterreurs ne sont pas-exclusl de nombreuses
vrifications ont t effectues pour les liminer. Dtautre part, nous avons
rencontr le problme de ltaccentuion. Le clavier qre nous possfrions ren-
dait impossible de reprsenter les lettres avec des accents. Ltinconvnient
est minur: le traitemnt sur machine est si souple
'il
est toujours possible
de ltliminer. Ainsi
la rencontre du mot
pofie
Frurtt
nous faire hsiter
entre
pofie et port. Si ce mot se rvle tre intressent, on demandera la
machine
de restituer les phrases dans leselles ce mot est inclus. Et ainsi, on sera
trs vite fix.
Ltentre
des donnes en ordinateur ne ncessite par consquent aucune
connaissance spciale, aucun codage particulier, la seule prcaution dane
nore tude ayant consist sparer soipeusement les discours.
II
.
LES PROGRAMMES
Lrordinateur
peut effectuer des oprations sur des donnes pour obtenir
un rsultat: on dit gnralement
e
ltordinateur traite de l'information. Maie
Itordinateur nta aocJo" connaissAnce du monde extrieur, aucune intuition. On
doit lui dire, chae moment du travail,
elles
donnes il doit traiter et
quelle Opraiion il dit elfectuer sur ces donnes. Cela fait I'objet de ce
e
foo .pp"ll" un progremme. Les
Progr'mmes
sont crits en l"n-gagss situ-s
mi-c[min entre le l"og.g" de Ia nachine, pour
'il
lui soit facile
4e
traduire
automatiement
ce quilst
dit dans Ie progra--e, et le langgge de lthomme,
po*
'if
soit facile ce demier d'exprimer la machine ce
'iI
attend d'elle.
Noue allons passer rapidement en revue les principaux
Progranunes
que
nous avons utiliss
r.
| - Progrcmme
d'indexotion
Le
,programme
baptis lndexa
{onqe,
par ordre alphabtie, Ies diffrents
mo fis;ran"t dans un texte avec ltindication de leur frence et les rfren-
c"s
i"
peuvent tre dsires. Par exenple, aprs_ appl1c_ation
d'Ind_exa,
arrx
qtrar;te-;ix
discours, or rencontre pour Ie mot de Gaulle
les indications
suivantes:
13
-
r0. 14. 30. 32. 33. 44.45,
qui signifient que le mot de Gaulle apparat treize fois et qu'il frgure dans les
discours 10. 14. 30. 32. 33.44. 45.
l-Nous avons bniici d'unensemble complet de programme
qui avait t rdige, dans
un langage trs volu, pour d'autres problmes linguistiques.
l4
Une version d'lndera donne les mota non plus par ordre alphabtie, mais
par ordre de frqrence dcroissante, le plus frquent dans le texte figurant le
premier, puis le mot immdiatement moins frent, etc. Les mots dt.gale
frence sont classs entre eux par ordre alphabtie.
Le programme lndexa a t notre instrument de Eavail eseentiel. Il attire
en effet immdiatement ltattention sur les mots frents ou peu frquents et
permet de les retrouver rapidement dans leur texte puistil indique o ces
mots figurent. Il permet ventuellement de dcider s'il vaut la peine de s'int-
resser un mot donn ou non. Ctest donc un rvlateur et peu importe pour
notre tude si dans ce rvlatew poe et port
figurent comme une seule
entito et si poiles figuie une autre rubrie. Lrordinateur ne peut en aucun
cas remplacer le travail du linguiste, mais il lui facilite ses dpouillements
d'une faon considrable.
Nous avons appliqu le programme Indexa ltensemble des
arante-six
discours et chae discours en particulier.
2
.
Progromme de concordonce
Si lton dcide de stintresser un mot, on va chercher ds quel sens
exact il est utilis dans le texte. Pour cela, nous avons utilis un nouveau
type de progrmme: les programmes de concordance.
Le premier programme, appel Concdisk, donne toutes les phrases dtun
tex[e o figure un mot donn en indiErant de plus eertains renseignements tels
que, pour notre tude, le numro du diecours o le texte est appanr, co-hien de
pbrases prcdaient la phrase donne dans ce discours, etc.
Une autre version de ce programme de concordance pemet dtlargir le
voisinage dms leqrel figure le mot en demandant par exemple, otre la phrase
o figure le mot, la phrase prcdente et la phrase suivante, etc.
Le, second programme, appel Concmul, pennet de faire desconcordances
multiples, ctesi--dire de sortir les phrases dtun texte o figurent plusieurs
mots donns. Avec le prograrnme Concmul on pourait par exemple sortir toutes
les phrases o figurent les mots les,
pailis, de,
jadis.
Le nombre de mots
sp6cifis, donc ltensemble des mots qui doivent figurer dans une phr^ase, en-
smble dtermin par Ie chercheur, est fix neuf, au maximumr
Pour
ltinstant.
3
.
Progromme de recherche de mots nouveoux
Un autre prograrnme a galement t trs utile notre travail. Ctest le
programme de recherche de mots nouveaux. Ce progre--e a pour but dtindier
les-mots gui viennent dtapparatre a! cours dtun chapitre, dtun paragraphe, ou
de toute entit dsigner, mots qui n'taient
pas
apparus dans les chapitres,
paragraphes ou toute autre entit prcdente. Ce programme existe sous deux
versions.
t5
Extrait de la publication
r
Dans une premire version, Itentit est une division naturelle'du texte.
Dans notre tude, ctest, par exemple, le discours. En plaant les quarante-six
iliscours les uns la suite des autres dans ltordre chronologie on aura, qrre
application de ce programme, les mots de chaque discours qui nrteient pas
encore apparus dans les discours antrieurs. Si I'on utilise ce programme en
classant lee discours dans un ordre inveree ltordre chronologie, le premier
devent Ie ilernier, etc., le rsultat de I'application du programme estla liste
de mots de chae discours qui ne seront plus
jamais
utiliss par la suite.
Ce procd permet dttudier la naissance puis la disparition drun mot.
Dans une deuxime version, le texte est
ponsidr
comme un tout et divis
en tranches gales de x mots, x tant la grandeur de la tranche choieie par le
linguiste. Ltordinaieur va dterminer pour chacune des n tranchee ainsi formes
quels sont les mots nouvearx de la tranche nouvelle gui nttaient pas appanrs
dans Ies tranches prcdentes. Nous avons utilis cette technie pour nrdier
la richesse du vocabulaire du gnral de Gaulle.
III
.
DEFENSE ET ILLUSTRATION DU
NMOT.FORMEN
Si nous avions voulu regrouper en machine toutes les formes possibles
d'un mme mot, sparer les homographes, etc., il aurait fallu applier un
vritable programme de traduetion automatie du franaie.
En
ad6sttant
run
tel programme existe, cela aurait conduit rm traitemenu long et coteux.
Pour faciliter le traitement en machine nous avons systmatiement consi-
dr eomme mot Iintervalle entre deux blancs. Cette dfinition a I'avantage
dttre extrmemen[ simple et suffrsante puise ltordinateur ne nous sert que
d'outil pour les bavaux de dgrossissage. Mais, avec elle, les diffrens for-
roes flchies
dtun mme mot apparaissent comme autant de mots diffrents, et
cela notamment ilans les index. Les diffrents homographes appahaiesent sous
une seule rubrie, mais on utilise en cas de diffrcult, comme nous ltavons
dj vu, des concordances. Les mots composs comme gnral de bigade sont
clats: Itexpression gnral, de, brigade donne trois mots. Le prograrnme ds
concon:lance multiple permet l encore de pallier cette difficult. Dane I'exem-
ple prsent, il suffrt de'demander par ltintermdiaire de ce progrq*-e toutes lea
phrases dans leselles frgurent les deux mota gnrd et btigade.
Notre
dfinition grossire du mot pourrait peut-tre conduire critiquer
les rsultats statisties qrre nous prsenterons par la suite. En fait, nous
verrons que pour chae tude nous avons
Pris
des prcauti.ons suffisantes
pour que
-ltimprcision
de la dfinition du mot soit sans consence sur les
rsultats que nous dgageons.
Dtautre part, nous avons conduit une tude sur les rryports entre le nombre
de formes flchies sous leselles se prsentent les diffrents mots et le
nombre rel de ces mota.
I6
Extrait de la publication
En rruici les rsultats:
Numro
du dlgcours
Nombre
de fornes
Nombro
de mols
Ropporr
I
5
l0
l5
20
25
30
35
40
45
380
232
625
533
5.r7
DT
275
708
360
405
323
210
516
453
476
2sr
230
578
313
339
l,l7
1,20
1,20
1',18
I,23
1, l6
lrl9
I,22
1,15
l,l9
Nous ntavons tudi qurun discours sur cin mais lton est surpris par la
remarqrable stabilit du rqport entre le nombre de mots-formes et le nmbre
vritable de mo[s. Ce rapport a une valeur moyenne de lrlg et un cart type de
fonhg
de 0,02
Ainei I'ordinateur nous indique que le gnral de
,Gauile
a,
dans le coryus tudi, un vocabulaire de 6 195 mots-forms diffrents.
cela
signifie qre sotr vocabulaire est dtenviron 4000 mots, ce qui est dj appr
ciable.
L'rse par la suite nous parlerons de vocabulaire, ensemble des mote
diffrents d'un texte, il stagira de Itensemble des mots-fomes.
n
Extrait de la publication
t'
GRAPHIQUES
I
YII
Sur
chacun
de ces graphiques ont t por-
ts, en abscisse,
le numro
du discoursl
tr or-
donne
la frquence
relative du mot. La
frquen-
ce
poyenne po Itensemble
des discours
est
reprsente
par une ligne tirete.
On
remarque
que cette ligne constitue as-
sez bien la dmarcation
entre les deux types
de discours.
Extrait de la publication

./
L"
l:n
;"t -
il-
Extrait de la publication
Volumes parus, ou a parahre prochai-
nement, dans la collection Travaux
et recherches de science politique)l :
1. GOGUEL (Frangois) - Modernisation
economique et comportement politique,
d'apres un echantillon d'un trentieme
du C01'pS electoral frangais. 1969, 92 p.
2. SIWEK-POUYDESSEAU Geanne) - Le
corps p1'efectoml sous la Troisieme et la
Quatrieme Republique. 1969, 184 p.
3. COTTERET Gean-Marie) et MOREAU
(Rene) - Recherches sur le vocabulaire
du general de Gaulle : analyse statistique
des allocutions 1'adiotelevisees (1958.
1965). 1969, 252 p.
4. Hoss Gean-Pierre) - Communes en
banlieue : Argenteuil et Bezons. Sous
presse.
5. FREYSSINET Gacqueline) - Les 1nanuels
d'histoil'e de l'enseignement primaire pri-
ve, de la Troisieme a la Quatrieme
Republique. En preparation.
Un catalogue general des publications
de la Fondation nationale des sciences
politiques sera envoye, sur simple
demande adressee. au :
Service des publications
de la Fondation nationale
des sciences politiques
27, rue Saint-Guillaume - Paris 7"
Extrait de la publication

Вам также может понравиться