quatre sciences nouvelles : la science politique, la Iinguistique, la statistique et I'informatique. n a ete con\lu d'abord comme instrument de reference pour tous ceux, universitaires, journalistes ou simples citoyens, qui se preoccupent de la vie politique et qui pourront trouver, grace it un index complet, tous les mots qui ont ete prononces par Ie generai de Gaulle dans ses allocutions radio.. televisees. Mais ce livre contient egalement d'autres renseignements statistiques totalement inedits ; en outre, les me.. thodes utilisees peuvent aider d'autres chercheurs. n est evident que I'origi.. nalite d'une telle experience reside surtout dans I'utilisation systematique de l'ordinateur. N'ont ete presentes que les documents dont I'objectivite etait indiscutable ; ceux dont les resultats pouvaient pr@ter it contestation ou fai.. saient intervenir quelque appreciation subjective ont ete exclus. L'ouvrage a perdu ainsi, peut..@tre, une part de son attrait, mais il a gagne en homogeneite et enrigueur scientifique. La reailisation d'une telle entreprise n'a pu @tre menee it bien que par la colla.. . boration etroite des auteurs dont les formations sont complementaires. Jean.. Marie Cotteret, professeur it la Faculte de droit et des sciences economiques de Nice, enseigne la sociologie politique depuis plusieurs annees et a publie un oUVrage et des travaux de science politique, notamment en matiere elec.. torale. Rene Moreau, directeur de re.. cherches dans une entreprise privee, enseigne la statistique Iinguistique au Centre de linguistique quantitative de la Faculte des sciences de Paris et a publie plusieurs articles sur cette question. Extrait de la publication recherchs sur le vocabulaire du gnral de Gaullg ,l ISBN de la version numrique : 9782724684803 travaux et recherches de science Politique Dans le cadre d'une rorganisation de ses publicatioru, la Fondation nationale des scrences politiques a cr la collection < Travaux et recbe,rchepde science. politique >' Elle se prog)se d'y accueillir des &udes provenagt soit de sis ntres e recherche (Centre d'tude de la vie politique franaise contemporaine, Centre d'tude aes relatins internationales...), soit de groupes ou de chercheurs qui ne lui sont pas directement rattachs' Cette nouvelle collection est distincte des < Cahiers de la Fondation natironale des sciences politiqu > - 'dont elle est complmentaire. Les manuscrits sont afiects Iune ou i'autre collection en fonction de la nature et de I'ampleur des recherches dont ils pr- sentent les rsultats. Les sries di coostitues (< Etudes syndicales >, < Etudes maghrbines >, < Nations et alliances >) se raccordent -la collection < Travaux et recherches de science politique >, avec une numrotation particulire' \ .\ \ Extrait de la publication FONDATION NATIONALE DES SCIENCES POLITIQTIES trava,ux et recherches de science politique JEAN.MARIE COTTERET ET R,EN uongEu 1969 ARMAI{ID COLIN 1O3 Bd SAINT-MICI{EL PAIIISV 3 R,EICI{ER,CI{ES STIR LE VOCABULAIR,E DTI GNRAL DE GAIILLE A1ralyse statistique des allocutions radiodiffuses 195A-1965 Extrait de la publication Le autqurs tiennmt pri'mer ic. Ieurs re- m,cienxents tous cetn qu leu,r ont fourn concottrs, aide et collabordon, mas plu's sp- calmprt Lours Boow qu. 'lan a pns de composar, parti.r un manascri,t m,par- fat, un ouarage qu'To* ma,ns; Cuenr.ns CosreuecNe dont fam,it. et le souten dont iantats fai.t dfaut; Hr.lrE Ver"esRcur a, lrer-Fnenors Renrown pou,r lau.r ard.e tech- nque; anr tud,ars de scmce polit,que de la Facult de ilroi;t et des sciences conom,i- ques de N,oe qu ont accontpl.i une tchp quelquefols n grute, mas tnd.iryensabln. f.-M. Cmrmm et R. Monneu @ $69 LrBnarnrn ARMAND colrN e FONDATION NATIONALE DEs scIENcEs PoIJTIQU TABLE DES MATIERES AVANT.PROPOS PREMIERE PARTIE LES CARACTERES STATISTIQUES DES ALLOCUTIONS. ... ... | . Lo technique de dpouillement . . . I - Le raitement par ordinateur II - Les prograrlmes 1) Programme d'indexation . . . 2) Programme de concordance . 3) Prrcgramme de recherche de mo nouveaux III - Dfense et illustration du 'mot-forme' . ll - Les deux types d'ollocutions rodiot6lvises I - Les critres de la ilistinction . . II- Caractre statistie des discours-appels et des discours- bilans III - Les discours-appels . . IV - Les discours-bilans . . lll - Etude quontitotive des ollocutions I - Nombre de mots par anne II - La longueur-des phrases A) Remarque s mthodo Io gr q,r"t B) Evolution de la longueur de la phrase C) Etude des phrases de longueur aberrante D) Evolution du coefficient de variation de la longueur des phrases III - La richesse du vocabulaire DEUXIEME PARTIE TEXTE DES ALLOCUTIONS TROISIEME PARTIE INDEX ANALYTIQUE DES MOTS CONTENUS DANS LES 1I l3 t3 L4 L4 I5 15 L6 t9 19 27 3l 35 39 39 42 42 42 45 4B 5t 59 ALLOCUTIONS L27 Extrait de la publication IVII TABLE DES GRAPHIOUES ' 20 26 !. J' er JE. II. vous. III. NOUS. rv. rRANArs V. REPUBLIQUE (S). VI. .ETAT. VII. FRANCE. Test de la normalit de la longueur des discoursr . . . . . . . W Pourcentge dtapparitiop des mots, ouveaux par rapport au nombre total de mots pour chaque discourt . 30 Frguence des mots dans.les discours.appels g2 Frquence des mots rlqrrs lee discors-bilans . . Longueur rnoyenne de la phrase de chaqne discours, Fepor- te dans I'ordre chronologie des discoure
Longueur moyenne des phrases des discurs-rypels
47 Valeur du coeffrcie,nt de variation pour les 46 discours classsdansl'ordrechronologie ... . 49 Erod" du la ricesse ." di"-*s 12 et I3 52 Accroissernent d'un vocabulaire . .... . 54-55 Richesse du vocabulaire dans les di'scours du gn&al de Ganlle ......... 56 vm I)c x. n: xIL xIIL ilv. xv. xvL xvIl i tl I ;. ' I ,I ,l -.!,r- !: --':*-* .-=r=st'-ll : - 4rrrr.-::):Li1.-.,! AVANT - PROPOS A la question gu'on lui posa un iour: "Quels sont vos dix mots prfrs ?tt Camus rpondit: "le monde, la douleur, [a terre, [a mre, ies hommesn le dseri, Ithonneur, la misre , L't, la mertt l. 'Si la mme question tait pose au gnral de Gaulle on ne sait ce qu'i[ rpondrait, mais I'ordinateur, interrog, Peut nous dire que ses dix mots de prdilec' tion, conscients ou inconscienrs, sont : ttla France, le pays, la Rpu' blique, I'Etat, le monde, le peuple, la nation, le progrs, la paix, I'ave' nirn 2. ,l[ serait certes possible partir des mots choisis par Camus, partir de ceux tablis par I'ordinateur Pour le gnral de Gaulle, de reconstituer leur univers. Tel ntest pas notre ProPos dans cette tude. Nous avons interrog ltordinateur et nous livrons ses rponses. Les travaux sur le vocabulaire politique sont en France assez' rares et procdent de mthodes trs diverses. [l est difficile qu'il en, soit autrment dans un domaine encore peu explor, Cette tude se ressent du manque dtanalyses quantiatives des diffrents discours d'hommes politiques contemporains, comme d'ailleurs de rfrences statistiques sur le reste de ltuvre du gnral de Gaulle, qui nous au' raient permis des comparaisons utiles. Aussi [e but principal du livre est-il de commencer combler cette lacune en fournissant aux cher- cheurs une premire source de renseignements statistiques sur un corPus' ceries limit, mais qui nous a sembl tre une premire tape indis' pensable. Ce sont donc des ttonnements supplmentaires que nous aPPortons dans un secteur de la science policique qui connatra probablement de grands dveloppements dans les annes venir. En attendant les pro' ioog.ur.ot" futurs que cette tude pourrait susciter, nous proposons ici un instrument de travail qui a Pour toute ambition de dcrire une techni' que - l'utilisation d'un ordinateur - aPPlique un vocabulaire 'celui des allocutions radiotlvises du gnral de Gaulle. La mthode de dpouillement consiste mettre sur cartes perfores tous les mots drun texte, pour les emmagasiner dans un ordinateur qui 1. LEBESQUE (Morvan), Camus par lui-mme, Paris, Editions du Seuil, 1964, P.165. ' 2, n laissiant de ct les mots "conjoncturels" comme Algrie. Extrait de la publication donne les rsultats demands grce aux instructions qui lui sont prala- blement fournies sous forme de ptogrammes, La finesse des rsultats obtenus est fonction des programmes labors. De toutes faons la machine ne peut se livrer aucune-inteqprtation.,Les lments qutelle fournit n'en sont pas moins rrs importnrs et abrgent considrable- ment le temps que [e chercheur aurait dt consacrer ces travaux quel- quefois dpou.rvus d'intrt. Il peut mme arriver que la machine permeme d'obtenir des rsultars que la longueur des calculs avaienr fair ngliger et qui donc, en lttat acruel des sciences sociales, sont difficiles interprter: 'c'est le cas par exemple de ltvolution de la longueur de Ia phrase. , une premire lecture des rsultats a permis de classer les allocu- tions radiotlvises: des indices inrernes, comme Ia frquence d'urili- sation des pronoms et des mots, et des indices externes, comme la longueur des discourq onr constitu des critres suffisants pour sparer ce que nous avons appel les discours-appels des discours.blans. Ces regroupemenrs une fois oprs, il a sembl utile de rechercher d'autres lments statistiques. Il a t possible de procder un inven- taire quantitatif du nombre de mors prononcs chaque anne par le gn- ral de Gaulle et de recenser la frquence d'utilisation de chaque mor. ces tableaux statistiques onr t complts par une tude sur l'volution de la longueur de la phrase dans, le temps, et par une analyse de la richesse du vocabulaire des diffrents rexres des allocurions..Ces pre- miers lments de ltanalyse sont rests au niveau des caractres statis- tiques du mot. Les concordances permettent de situer le mot dans son environement et dten ilgager ainsi le sens.'Si nous nous intressons, par exemple, au mot systme, ltordinateur pourra fournir toutes les phrases qui le contiennent. Il suffira alors dtassembler ces phrases pour mettre en valeur ses diffrentes significations.. Un dernier instrument de rravail est consriru par I'index exhaustif de toutes les fotmes des mots coRrenus dans les allocutions du prsi- dent de la Rpublique. Certes il et t possible de consrituer un dic- tionnaire en regroupant les diffrentes formes de ltindex, mais il nous a sembl que les donnes brures, bien que grossires, taient une meil- leure source de renseignements pour le chercheur dsireux d'approfon- dir ses connaissances sur le vocabulaire du gnral de Gaulle. Il tait impensable d'tudier tout le vocabulaire du gnral de Gaulle: 'notre choix srest port sur les seules llocutions radiotlvi- ses, car nous tions en prsence dtun vocabulaire politique trs riche. Il fallait ensuite disposer d'un coqpus ni trop vsre - pour une question de cot -, ni trop rduit - pour la validit des rsultats. Les 62 47L mots prononcs la radio et la tlvision par le gnral de Gaulle Extrait de la publication entre L958 et 1965 constituaient un champ d'investigation acceptable. Tous les textes retenus devaient prsenter une certaine homognit: le vocabulaire des allocutions n'est pas celui des confrences de pres- se, ni celui des mmoires, ni celui des cournes en province. Les textes des ailocutions prsentent des caractres identiques: il.s sont prpars pour tre adresss au moyen de la radio et de la tlvision, directemenr aux Franais. La pratique des causeries au coin du feu, inaugure par le prsident Roosevelt et reprise par le prsident Mends France, se trouve institutionalise avec le gnral de Gaulle; il est vrai que son habimde de la radio date du L8juin 1940 3.,Le dveloppemenr de ce nou- veau moyen de communication entre gouvernants et gouverns semble donc justifier notre choix. ,Nous avons assimil aux allocutions pronon- ces par le gnral de Gaulle aux moments qu'il choisit, et selon les mthodes qui lui sont personnelles, Ies messages du chef de lrEtatla lrJatioq, prws, eux, par la Constitution et que le prsident de la Rpu- blique a eu peu droccasions d'utiliser, sauf pendant les insurrecrions d'Alger. [1 nous a paru aller de soi galement dfy incorporer les trois interviews de la campagne prsidentielle qui n'taient autres ciue des monologues dirigs.,Encor que les statistiques fassent apparatre des diffrences sensibles entre les interviews et les aurres textes, ces variantes ne remettent pas en cause I'homognit des allocutions. Ce travail pourrait, semble-t-il, connatre des prolongements dans deux directions. ' D'abord, Itanalyse des moyens de communication peut faciliter une nouvelle approche des phnomnes politiques.,Toute tude des phno- mnes politiques se fait en premier lieu au niveau des textes constitu- tionnels qui sont plus ou moins appliqus, mais qui sont toujours une indicarion prcieuse sur les iustifications recherches par les gouver- nants les moins soucieux de les appliquer. Une seconde approche est celle de lranalyse du fonctionnement rel dtun systme politique et des phnomnes qu'il implique: rle des partis politiques, des groupes de pression, du mcanisme de dcision, etc. Une troisime approche consis- te apprhender les phnomnes politiques au niveau de leur reprsen- tation dans la conscience des citoyens..A travers les mots se dgagent des images que les gouvernants imposent aux gouverns. Il est certes intressant d'tudier le "domaine rservn du prsident de la Rpubli- que, il est non moins passionnant de savoir quelle image les Franais se font de leur prsident et de ses pouvoirs. Or cette image est fonction des mots, des phrases, des slogans, qui leur sont rpts la radio et la tlvision et qu'ils ne peuvent qutassimiler plus ou moins vite. 3. Pour tre plus prcis, le'prsident Doumergue avait utilis la technique du dis- cours radiodiffus pour la premire fois, le 24 mars 1934, puis le l7 iuillet 1934. Ce qui permettait Lon Blum d'crire dans Le Pofulaite du 18 iuilletl934:ile ie etlemoi dt prsident Doumergue icommencent prendre un peu trop de place'. Extrait de la publication I i ?ar les moyens audio-visuels sttablissent de nouvelles relations entre gouvernants et gouverns, les premiers dirigeant et conditionnant les seconds. Voil pourquoi l'tude de la reprsentation au niveau collec- tif et individuel, travers les moyens de communication, semble tre un champ dtinvestigation plein de promesses. On pourra ainsi connaitre en profondeur ce qui est vital pour les citoyens: ce qu'ils croient. Les phnomnes se situent au point de rencontre d'une conception singulire et dtune image collective: le contenu de la communicarion est le rsul- tat de ce qui est la fois demand et impos. En dplaant l'analyse politique, on atteint le niveau des croyances: mais ntest-ce pas la raIt- t politique profonde si le prcepte de Machiavel est touiours'vrai selon lequel gouverner c'est faire croire ? La seconde voie possible serait un approfondissement de ltunivers du gnral de Gaulle partir de I'analyse des mots. Les premiers rsul- tats statistiques obtenus suggrent dj un grand nombre d'interprta- tions. Il faut se garder d'une trop grande rapidit de jugement. Drabord parce que cette tude ne concerne gue des textes trs particuliers: ils sont probablement symptomatiques dtune pense, mais encore faudrait-ii le vrifier, Ensuite parce que, comme nous I'avons constat, il existe un dcalage assez grand entre les renseignements statistiques que fournit la machine et la comprhension de ces phnomnes. Cela s'ex. plique aisment. Les performances de I'ordinateur permettent d'obtenir des rsultatsque le chercheura quelquefois du mal interprter. La seu- le solution pour rattraper ce retard de I'homme sur la machine consiste former des quipes de chercheurs qr.li en runissant leurs comptences arriveront faire progresser les sciences sociales. L'tude de I'univers du gnral de Gaulle peut constituer un excellent banc d'essai. IO Extrait de la publication PREMIBRE PARTIE LEs cARAcrnrs srATlsrlQUEs DES ALLOCUTIONS | ,Ji, ..T]:{ / " "i j ?-- .!i i.F , :^;. r ,. r';1i+ - t''' 'l iJ \ ' : :l tj '''r ; ,: -'r:l-r','i r'.. V:' _,I li; '.... Extrait de la publication I LA TECHNIQUE DE DEPOUILLE{ENT I. LE TRAITEMENT PAR ORDINATEUR sans entrer dans Ia_lescription dtun ordinateur, disons seulement que crest une machine capable dteffectuer de trs grandes vitesses dee op-rations simples, soit aritmtiques (addition, sousbaciion), soit logiEres (comparaison de deux..terme.s pour dterminer si ltun dtentre eux est rupri-eur, gal-ou inf- rieur I'autre), soit techniques (transfert de renseigr."r"oir, lectur de bandes magntiques, etc.). Ce_s oprations -sont effechres sur des donnes qui sont enregistres au cc,urs du haitement dans diff-rents t).pes de mmoires. Une mmoire-est conpo- se dtun trs grand nombre il'lmenis, en gnral lectries ou magnties, qui peuvent prendre seulement deux tats. Cee deux tats sont I'{at zto ei I'6tat un. Une lettre de I'alphabet est alors reprsente par une suite ile zro et de un. A deux lettres diffrentes correspondent deux suites diffrentes de zro el te an. Un mot de la langue est repreent par un ensemble de zo et de un se rapportant chacune des lettres le composant. Si dans la mmoire de ltordinateur nour avong inhoduit un lexie, savoir si un- mot fait partie de ce lexique revient effectuer une opratio-n logique. En effet, nous allons confronter les suites de zro et d,e un du mot rechlrch et des mots existant dans la mmoire de lrordinateur. Si la iliffrence est positive ou ngative, le mot n'existe pas puisque les suites sont diffrentes. Si la diffrence est nulle, le mot existe puisque deux suites soni identies. Il est clair que, s'il fallait reprsenter la main les lettres et les .otr p"t des z1o et des u7, la transcription serait dmesurment longue, et la lectur peu prs impossible. La transcription est faite automatiemnt par la machine, encore faut-il lui fournir les donnes ncessaires Le passage du texte manuscrit au langage machine a t fait I'aide de cartes perfores. Certes, il existe bien dtautres moyena de fournir des donnes aux ordinateurs; mais crest la technique que nous avons retenue. Une carte mcanographie peut tre considre comme une ligne d'criture de quabe- vingts caractres. Dans le haut de la carte eat souvent imprim en clair le texte correspondant aux pedorations reprsentant ces caractres. Les vrifica- tions sont ainei plus aises. Sur la car.te, chaque lettre se voit affecter une t3 F I colone .forme d'une suite e zrc (iI y a un trou dans la ca$e) ou de un (il nty a pas de trou dans la carte). [,e corpus des quarante-six discouns a t ainsi mis sur eartes perfores. Un tel procd prsente queles inconvnients. Dtune part, la transcrip- tion est longue, et les rises dterreurs ne sont pas-exclusl de nombreuses vrifications ont t effectues pour les liminer. Dtautre part, nous avons rencontr le problme de ltaccentuion. Le clavier qre nous possfrions ren- dait impossible de reprsenter les lettres avec des accents. Ltinconvnient est minur: le traitemnt sur machine est si souple 'il est toujours possible de ltliminer. Ainsi la rencontre du mot pofie Frurtt nous faire hsiter entre pofie et port. Si ce mot se rvle tre intressent, on demandera la machine de restituer les phrases dans leselles ce mot est inclus. Et ainsi, on sera trs vite fix. Ltentre des donnes en ordinateur ne ncessite par consquent aucune connaissance spciale, aucun codage particulier, la seule prcaution dane nore tude ayant consist sparer soipeusement les discours. II . LES PROGRAMMES Lrordinateur peut effectuer des oprations sur des donnes pour obtenir un rsultat: on dit gnralement e ltordinateur traite de l'information. Maie Itordinateur nta aocJo" connaissAnce du monde extrieur, aucune intuition. On doit lui dire, chae moment du travail, elles donnes il doit traiter et quelle Opraiion il dit elfectuer sur ces donnes. Cela fait I'objet de ce e foo .pp"ll" un progremme. Les Progr'mmes sont crits en l"n-gagss situ-s mi-c[min entre le l"og.g" de Ia nachine, pour 'il lui soit facile 4e traduire automatiement ce quilst dit dans Ie progra--e, et le langgge de lthomme, po* 'if soit facile ce demier d'exprimer la machine ce 'iI attend d'elle. Noue allons passer rapidement en revue les principaux Progranunes que nous avons utiliss r. | - Progrcmme d'indexotion Le ,programme baptis lndexa {onqe, par ordre alphabtie, Ies diffrents mo fis;ran"t dans un texte avec ltindication de leur frence et les rfren- c"s i" peuvent tre dsires. Par exenple, aprs_ appl1c_ation d'Ind_exa, arrx qtrar;te-;ix discours, or rencontre pour Ie mot de Gaulle les indications suivantes: 13 - r0. 14. 30. 32. 33. 44.45, qui signifient que le mot de Gaulle apparat treize fois et qu'il frgure dans les discours 10. 14. 30. 32. 33.44. 45. l-Nous avons bniici d'unensemble complet de programme qui avait t rdige, dans un langage trs volu, pour d'autres problmes linguistiques. l4 Une version d'lndera donne les mota non plus par ordre alphabtie, mais par ordre de frqrence dcroissante, le plus frquent dans le texte figurant le premier, puis le mot immdiatement moins frent, etc. Les mots dt.gale frence sont classs entre eux par ordre alphabtie. Le programme lndexa a t notre instrument de Eavail eseentiel. Il attire en effet immdiatement ltattention sur les mots frents ou peu frquents et permet de les retrouver rapidement dans leur texte puistil indique o ces mots figurent. Il permet ventuellement de dcider s'il vaut la peine de s'int- resser un mot donn ou non. Ctest donc un rvlateur et peu importe pour notre tude si dans ce rvlatew poe et port figurent comme une seule entito et si poiles figuie une autre rubrie. Lrordinateur ne peut en aucun cas remplacer le travail du linguiste, mais il lui facilite ses dpouillements d'une faon considrable. Nous avons appliqu le programme Indexa ltensemble des arante-six discours et chae discours en particulier. 2 . Progromme de concordonce Si lton dcide de stintresser un mot, on va chercher ds quel sens exact il est utilis dans le texte. Pour cela, nous avons utilis un nouveau type de progrmme: les programmes de concordance. Le premier programme, appel Concdisk, donne toutes les phrases dtun tex[e o figure un mot donn en indiErant de plus eertains renseignements tels que, pour notre tude, le numro du diecours o le texte est appanr, co-hien de pbrases prcdaient la phrase donne dans ce discours, etc. Une autre version de ce programme de concordance pemet dtlargir le voisinage dms leqrel figure le mot en demandant par exemple, otre la phrase o figure le mot, la phrase prcdente et la phrase suivante, etc. Le, second programme, appel Concmul, pennet de faire desconcordances multiples, ctesi--dire de sortir les phrases dtun texte o figurent plusieurs mots donns. Avec le prograrnme Concmul on pourait par exemple sortir toutes les phrases o figurent les mots les, pailis, de, jadis. Le nombre de mots sp6cifis, donc ltensemble des mots qui doivent figurer dans une phr^ase, en- smble dtermin par Ie chercheur, est fix neuf, au maximumr Pour ltinstant. 3 . Progromme de recherche de mots nouveoux Un autre prograrnme a galement t trs utile notre travail. Ctest le programme de recherche de mots nouveaux. Ce progre--e a pour but dtindier les-mots gui viennent dtapparatre a! cours dtun chapitre, dtun paragraphe, ou de toute entit dsigner, mots qui n'taient pas apparus dans les chapitres, paragraphes ou toute autre entit prcdente. Ce programme existe sous deux versions. t5 Extrait de la publication r Dans une premire version, Itentit est une division naturelle'du texte. Dans notre tude, ctest, par exemple, le discours. En plaant les quarante-six iliscours les uns la suite des autres dans ltordre chronologie on aura, qrre application de ce programme, les mots de chaque discours qui nrteient pas encore apparus dans les discours antrieurs. Si I'on utilise ce programme en classant lee discours dans un ordre inveree ltordre chronologie, le premier devent Ie ilernier, etc., le rsultat de I'application du programme estla liste de mots de chae discours qui ne seront plus jamais utiliss par la suite. Ce procd permet dttudier la naissance puis la disparition drun mot. Dans une deuxime version, le texte est ponsidr comme un tout et divis en tranches gales de x mots, x tant la grandeur de la tranche choieie par le linguiste. Ltordinaieur va dterminer pour chacune des n tranchee ainsi formes quels sont les mots nouvearx de la tranche nouvelle gui nttaient pas appanrs dans Ies tranches prcdentes. Nous avons utilis cette technie pour nrdier la richesse du vocabulaire du gnral de Gaulle. III . DEFENSE ET ILLUSTRATION DU NMOT.FORMEN Si nous avions voulu regrouper en machine toutes les formes possibles d'un mme mot, sparer les homographes, etc., il aurait fallu applier un vritable programme de traduetion automatie du franaie. En ad6sttant run tel programme existe, cela aurait conduit rm traitemenu long et coteux. Pour faciliter le traitement en machine nous avons systmatiement consi- dr eomme mot Iintervalle entre deux blancs. Cette dfinition a I'avantage dttre extrmemen[ simple et suffrsante puise ltordinateur ne nous sert que d'outil pour les bavaux de dgrossissage. Mais, avec elle, les diffrens for- roes flchies dtun mme mot apparaissent comme autant de mots diffrents, et cela notamment ilans les index. Les diffrents homographes appahaiesent sous une seule rubrie, mais on utilise en cas de diffrcult, comme nous ltavons dj vu, des concordances. Les mots composs comme gnral de bigade sont clats: Itexpression gnral, de, brigade donne trois mots. Le prograrnme ds concon:lance multiple permet l encore de pallier cette difficult. Dane I'exem- ple prsent, il suffrt de'demander par ltintermdiaire de ce progrq*-e toutes lea phrases dans leselles frgurent les deux mota gnrd et btigade. Notre dfinition grossire du mot pourrait peut-tre conduire critiquer les rsultats statisties qrre nous prsenterons par la suite. En fait, nous verrons que pour chae tude nous avons Pris des prcauti.ons suffisantes pour que -ltimprcision de la dfinition du mot soit sans consence sur les rsultats que nous dgageons. Dtautre part, nous avons conduit une tude sur les rryports entre le nombre de formes flchies sous leselles se prsentent les diffrents mots et le nombre rel de ces mota. I6 Extrait de la publication En rruici les rsultats: Numro du dlgcours Nombre de fornes Nombro de mols Ropporr I 5 l0 l5 20 25 30 35 40 45 380 232 625 533 5.r7 DT 275 708 360 405 323 210 516 453 476 2sr 230 578 313 339 l,l7 1,20 1,20 1',18 I,23 1, l6 lrl9 I,22 1,15 l,l9 Nous ntavons tudi qurun discours sur cin mais lton est surpris par la remarqrable stabilit du rqport entre le nombre de mots-formes et le nmbre vritable de mo[s. Ce rapport a une valeur moyenne de lrlg et un cart type de fonhg de 0,02 Ainei I'ordinateur nous indique que le gnral de ,Gauile a, dans le coryus tudi, un vocabulaire de 6 195 mots-forms diffrents. cela signifie qre sotr vocabulaire est dtenviron 4000 mots, ce qui est dj appr ciable. L'rse par la suite nous parlerons de vocabulaire, ensemble des mote diffrents d'un texte, il stagira de Itensemble des mots-fomes. n Extrait de la publication t' GRAPHIQUES I YII Sur chacun de ces graphiques ont t por- ts, en abscisse, le numro du discoursl tr or- donne la frquence relative du mot. La frquen- ce poyenne po Itensemble des discours est reprsente par une ligne tirete. On remarque que cette ligne constitue as- sez bien la dmarcation entre les deux types de discours. Extrait de la publication
./ L" l:n ;"t - il- Extrait de la publication Volumes parus, ou a parahre prochai- nement, dans la collection Travaux et recherches de science politique)l : 1. GOGUEL (Frangois) - Modernisation economique et comportement politique, d'apres un echantillon d'un trentieme du C01'pS electoral frangais. 1969, 92 p. 2. SIWEK-POUYDESSEAU Geanne) - Le corps p1'efectoml sous la Troisieme et la Quatrieme Republique. 1969, 184 p. 3. COTTERET Gean-Marie) et MOREAU (Rene) - Recherches sur le vocabulaire du general de Gaulle : analyse statistique des allocutions 1'adiotelevisees (1958. 1965). 1969, 252 p. 4. Hoss Gean-Pierre) - Communes en banlieue : Argenteuil et Bezons. Sous presse. 5. FREYSSINET Gacqueline) - Les 1nanuels d'histoil'e de l'enseignement primaire pri- ve, de la Troisieme a la Quatrieme Republique. En preparation. Un catalogue general des publications de la Fondation nationale des sciences politiques sera envoye, sur simple demande adressee. au : Service des publications de la Fondation nationale des sciences politiques 27, rue Saint-Guillaume - Paris 7" Extrait de la publication