Вы находитесь на странице: 1из 38

Gntique des populations

Florian BLANC
07 Novembre 2011 - Version 1.1
Nothing in Evolution makes sense, except in the light of Population Genetics (M. Lynch)
Cours gnral sur les bases de la gntique des populations et de la biologie de lvolution, en grande partie crit
partir des enseignements de L3 et M1 de lcole Normale Suprieure. La liste des enseignants est indique
dans les rfrences.
Lauteur tient galement remercier ses camarades de la promotion Bio10 de lENS, notamment Mirca SO-
FONEA, pour leur relecture et leurs remarques ayant permis damliorer ce cours. Lobjectif gnral de tout a
tant de valider E1
1
. Tous les liens et renvois prsents dans la version pdf sont cliquables.
2
Introduction
La gntique est ltude de la transmission des variations dune gnration lautre. On tudie ici la trans-
mission des caractres lchelle des populations. La thorie de la gntique des populations est une thorie
presque purement dductive, ce qui est rare en biologie. Elle est en premier lieu fonde sur des prdictions
mises partir de modlisations mathmatiques.
Histoire
1859 : naissance de la biologie contemporaine avec Darwin
1869 : publication des travaux de Mendel
1900 : De Vries, Correns, Tschernak (trois botanistes) redcouvrent les travaux de Mendel.
1906 : naissance de la gntique.
1930 : R. Fischer, J.B.S. Haldane et S. Wright constituent un corpus thorique extrmement cohrent qui
marque la naissance de la gntique des populations moderne.
Au dbut, pour des raisons diverses tenant notamment des conits personnels, la gntique soppose au dar-
winisme. Pour les darwinistes, lvolution est due la slection naturelle. Pour les gnticiens, elle est due
aux mutations. Galton, Pearson, tudient la transmission des caractres quantitatifs (ex : taille). Bateson lui,
invente la gntique. La gntique classique est plutt centre sur ltude des caractres qualitatifs (travaux de
Mendel : lisse/rid vert/jaune). Cest la controverse des Mendeliens contre les Biomtriciens.
Les deux approches sont rconcilies lors de la synthse no-darwinienne : au sein dune population, il faut
une mutation pour quapparaisse un nouveau phnotype, mais il faut de la slection pour quil se rpande. La
conception dominante (ici schmatise) attribue la slection un rle prpondrant dans lvolution. Aujour-
dhui, certains biologistes proposent au contraire des thories trs solides expliquant par exemple lmergence
de la complexit (en termes de topologie des rseaux dinteractions gntiques) des Eucaryotes pluricellulaires
par des processus non-adaptatifs [1], donnant lieu des dbats parfois vigoureux.
1. Surtout aprs le gros carton en G1.
2. Alors faites-vous plaisir ! Mais par contre a marche pas avec la version papier.
1
TABLE DES MATIRES 2
Prcisions concernant le vocabulaire Il y a parfois des divergences de vocabulaire entre gntique de
laboratoire et gntique des populations. Cela tend devenir problmatique compte-tenu du fait que les deux
communauts sont de plus en plus amenes interagir.
Un caractre est dit dtermin par les gnes ou lenvironnement, en fonction de la part de variation attri-
buable des variations gntiques ou environnementales.
Gne : fragment de gnome transcrit.
Gnes homologues : gnes codant pour la mme fonction et tant apparis la miose. Ces gnes sont pla-
cs la mme position sur la carte du chromosome. La relation dhomologie est une relation dquivalence
(rexive, symtrique, transitive). Cela dnit des classes dquivalences. Une classe dquivalence sappelle
un locus. Le locus nest donc pas dni par la position sur le chromosome. Parmi les gnes homologues, cer-
tains sont isoactifs : ils dterminent le mme phnotype. Lisoaction est une relation dquivalence ; la classe
dquivalence correspondante est appele un allle. Deux gnes homologues non isoactifs sont en relation
alllomorphique, et on dit communment quils constituent deux allles du mme gne.
Table des matires
1 Pressions volutives 4
1.1 Effet de la mutation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2 Effet de la slection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.3 Effet de la migration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.4 Effet de la drive . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.5 Lquilibre de Hardy-Weinberg . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.6 Mutation et slection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.6.1 Lquilibre mutation-slection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.6.2 La notion de fardeau gntique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2 Cas des organismes diplodes 10
2.1 Le problme de la structure gnotypique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2 Rgimes de reproduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.2.1 La panmixie et la distribution de Hardy-Weinberg . . . . . . . . . . . . . . . . . . . . . . . . 11
2.2.2 Choix phnotypiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.3 Pressions volutives et diplodie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.3.1 Mutation, migration, drive . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.3.2 Slection en rgime panmictique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
3 Le polymorphisme 12
3.1 quilibre mutation-slection chez les diplodes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
3.1.1 Calcul du fardeau gntique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
3.1.2 Exemple dun allle rcessif ltal, problmes lis lautofcondation . . . . . . . . . . . . . 13
3.2 Polymorphisme vrai . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
TABLE DES MATIRES 3
3.2.1 Super-dominance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.2.2 Slection frquence-dpendante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
3.3 Le paradoxe du fardeau gntique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
4 La thorie neutraliste de lvolution 20
4.1 Prsentation de la thorie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
4.2 La thorie de la coalescence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
4.2.1 Modle de Wright-Fisher . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
4.2.2 Identit par ascendance et temps de coalescence . . . . . . . . . . . . . . . . . . . . . . . . . 21
4.3 Prise en compte de la mutation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
4.4 Neutralistes contre slectionnistes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
4.5 Mettre en vidence la slection dans une population soumise la drive . . . . . . . . . . . . . . . 24
4.5.1 Mthodes bases sur la divergence interspcique . . . . . . . . . . . . . . . . . . . . . . . . 24
4.5.2 Mthodes bases sur le polymorphisme intraspcique . . . . . . . . . . . . . . . . . . . . . 25
4.5.3 Mthodes associant les deux approches . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
4.5.4 Test de Tajima . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
4.6 Fixation dallles soumis la slection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
4.7 Dsquilibre gamtique et auto-stop . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
4.7.1 Dsquilibre gamtique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
4.7.2 Effet Hill-Robertson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
4.7.3 Cration de dsquilibre de liaison . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
5 Consanguinit et F-statistiques 29
5.1 Rgimes de reproduction et consanguinit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
5.1.1 Autofcondation complte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
5.1.2 Autofcondation partielle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
5.2 Consanguinit et drive . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
5.3 Les F-statistiques, indicateurs de proximit gntique . . . . . . . . . . . . . . . . . . . . . . . . . . 32
5.4 Leffet Wahlund . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
5.5 F
ST
et migration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
5.5.1 Modle en les de Wright . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
5.5.2 Gnralisation aux diffrents types dhrdit . . . . . . . . . . . . . . . . . . . . . . . . . . 36
1 PRESSIONS VOLUTIVES 4
1 Pressions volutives
Soit une population haplode de taille N o coexistent deux allles A et a, chacun prsent en effectif n
A
et n
a
.
On travaillera en frquences : on appelle p la frquence de lallle A et q = 1 p la frquence de lallle a. On
supposera que les gnrations sont non chevauchantes pour pouvoir travailler en temps discret. On appelle p

et q

les frquences allliques la gnration suivante. La quantit


i
p = p

p est lesprance de la variation


de la frquence de A due la pression volutive i.
Une fois cela dni, on peut regarder comment agissent les pressions volutives sur la composition gntique
de la population. Il y en a quatre : la mutation, la slection, la migration et la drive.
1.1 Effet de la mutation
On suppose qu chaque gnration une proportion u des allles A mute en allles a (voir dnitions de ces
termes en gntique des populations). Do
u
p = up . On modlise donc la mutation (phnomne intrins-
quement alatoire) de manire dterministe en faisant appel un taux moyen. Le taux moyen de mutation, u,
correspond au nombre de mutations par gnration pour une copie donne dun gne. Il peut varier de 10
12

10
4
et est de lordre de 10
6
en gnral.
On peut galement tenir compte des mutations reverse transformant a en A. Soit v le taux de mutation de a en
A, on a alors :
p

= p up +vq = p(1 u) +v(1 p)


Un quilibre (non-trivial) purement mutationnel est alors possible :
p

= p

(1 u) +v(1 p

)
(u +v)p

= v
p

=
v
u +v
On peut alors modliser la dynamique dapproche de lquilibre par la suite X
t
= p
t
p

. On a
X
t+1
= p
t
(1 u v) +v
v
u +v
X
t+1
= p
t
(1 u v) +
v
u +v
(u +v 1) = (p
t
p

)(1 u v)
et donc :
X
t+1
= X
t
(1 u v)
La dcroissance est gomtrique.
En gnral, on nglige les mutations reverse, improbables.
1 PRESSIONS VOLUTIVES 5
Temps de demi-vie Dans le cas o on nglige les mutations reverse, on a p

= (1 u)p soit p
t
= (1 u)
t
p
0
.
On peut alors calculer le temps de demi-vie t
1/2
, cest--dire le temps ncessaire pour diminuer de moiti la
frquence dun allle par mutation, toutes choses gales par ailleurs. On a :
p
t
1/2
=
1
2
p
0
(1 u)
t
1/2
=
1
2
t
1/2
ln(1 u) = ln2
soit lordre 1 (tant donn que u 1)
t
1/2

ln2
u
7.10
5
gnrations.
Il faut donc plusieurs centaines de milliers de gnrations pour quun allle soit perdu par mutation seule. Pour
lespce humaine, cela reprsente plusieurs dizaines de millions dannes ; pour la drosophile, plusieurs dizaines
de milliers dannes.
La mutation est donc une pression volutive ngligeable du point de vue de la variation des frquences allliques
(sauf cas particuliers) mais joue un rle fondamental dans la cration de variabilit gntique.
1.2 Effet de la slection
A un individu de gnotype A on associe une valeur slective (ou tness) W
A
qui est lesprance du nombre de
descendants laisss par cet individu au cours de sa vie. On dnit de mme W
a
pour les individus a.
Remarque : On a W = sf o s est la probabilit de survie jusqu lge o la reproduction est possible (la
viabilit) et f la fcondit, cest--dire lesprance du nombre de descendants sachant quil y a eu survie.
Daprs la dnition de la tness, on peut crire :
p

=
pW
A
pW
A
+qW
a
La quantit pW
A
+qW
a
est (par associativit de lesprance) lesprance du nombre de descendants dun indi-
vidu tir au hasard dans la population. On lappelle tness moyenne, note

W.
On a donc :
p

=
pW
A

W
et donc :

s
p = p
_
W
A

W
1
_
= p
_
W
A

W
_
= p
_
W
A
pW
A
(1 p)W
a

W
_
= p(1 p)
_
W
A
W
a

W
_

s
p = pq
_
W
A
W
a

W
_
1 PRESSIONS VOLUTIVES 6
On voit que les quantits pertinentes ne sont pas les tness elles-mmes mais plutt les diffrences
de tness entre phnotypes et par rapport la tness moyenne. On voit de plus que la slection ne peut
senvisager que sur une population variable (pas de slection si p ou q sont nuls), ce qui est totalement intuitif.
Evolution dterministe dans un paysage adaptatif
La notion de paysage adaptatif (tness landscape) a t introduite par Wright dans les annes 1930. Un paysage
adaptatif est la reprsentation de la tness moyenne F de la population en fonction de sa composition gnotyp-
ique x. Intuitivement, on comprend que la slection est un processus tendant maximiser la tness, ou encore
slectionner la composition gntique prsentant la tness maximale.
On peut alors voir F comme lanalogue dun potentiel en mcanique classique et dnir une force slective s(x)
comme:
s(x) = F(x)
Wright a t le premier comprendre que le maximum de F navait aucune raison dtre unique. Une popula-
tion peut alors tre pige dans un maximum local et nen sortir quen cas de variation du paysage adaptatif
(traduisant un changement environnemental) et/ou dintervention des autres pressions volutives.
Le thorme fondamental de la slection naturelle, tabli par Fisher en 1930, nonce:
F
t
= s
2
(x(t))
Il sapplique pour une volution dterministe sous linuence de la slection uniquement.
Un cas simple: slection tnesses constantes
Considrons une population bactrienne de taille N dans laquelle coexistent deux gnotypes A et B tels que:
_

_
dN
A
dt
= f
A
N
A
dN
B
dt
= f
B
N
B
Ici la tness de chaque gnotype sidentie simplement avec le taux de croissance de chaque sous-population.
Soit x la proportion de B dans la population.
Alors:
dN
dt
=

fN = f
A
N
A
+f
B
N
B
= N[(1 x)f
A
+xf
B
]
Donc:
dx
dt
=
d
dt
_
N
B
N
_
=
1
N
2
_
N
dN
B
dt
N
B
dN
dt
_
=
1
N
2
_
Nf
B
N
B
N
B

fN

= (f
B


f)x
dx
dt
= (f
B


f)x
On a s = f
B
f
A
. Donc:
dx
dt
= sx(1 x)
On obtient une quation logistique. La variation de x nest proportionnelle qu lcart entre la tness de B et
la tness moyenne. La dynamique de x se dcouple totalement de la dynamique de N. Le paysage adaptatif est
simplement:
F(x) =

f(x) +cst
par intgration. La tness moyenne est bien le potentiel correct.
On a par ailleurs:
dF
dt
=
dF
dx
dx
dt
= s
2
(1 x)x = Var(F)
Que se passe-t-il si la tness nest plus constante? Peut-on toujours dnir un potentiel?
1 PRESSIONS VOLUTIVES 7
1.3 Effet de la migration
Considrons une population subdivise en autochtones et en immigrants. Soit m la probabilit quun individu
pris au hasard soit un immigrant.
Autochtones Immigrants
A p p
I
a q q
I
On a (par exemple par la formule des probabilits totales) :
p

= (1 m)p +mp
I
La frquence p
I
est constante (la population source constitue un thermostat alllique). On peut alors crire :
p

p
I
= (1 m)p +mp
I
p
I
= (1 m)(p p
I
)
En labsence de toute autre pression volutive, la variable p = p p
I
suit une dcroissance gomtrique :
p
t
= (1 m)
t
p
0
; lquilibre, la frquence alllique dans une population soumise limmigration devient celle
de la population source.
Temps de demi-vie Considrons une population dans laquelle un allle A est prsent une frquence p et
recevant un ux immigrant de taux m dune population source dans laquelle lallle A est absent (p
I
= 0). La
formule du temps de demi-vie dans ce cas est la mme que pour la mutation :
t
1/2

ln2
m
Pour un taux de migration de 5%, tout--fait raliste dans le cas des populations humaines par exemple, on
trouve alors : t
1/2
14 gnrations. Un changement notable de frquence alllique se produit ainsi en quelques
dizaines de gnrations, soit quelques sicles pour une population humaine. La migration est une force volutive
rapide et homognisante.
Un cas simple de migration peut tre celui du modle continent-le (gure 1a ), o une population de faible
effectif a colonis une le et est alimente par des migrations provenant du continent voisin.
On peut gnraliser ce modle en utilisant un modle multi-sites (gure 1b ). La gographie peut tre prise en
compte en limitant la migration aux sites immdiatement adjacents ; on parle alors de modle stepping-stone.
1 PRESSIONS VOLUTIVES 8
(a) Modle continent-le (b) Modle multi-sites
FIGURE 1 Modles de migration
La dnition dune migration dpend videmment de celle de la population. En gnral plus une population est
choisie de petite taille et correspondant la notion biologique de population (ensemble dindividus de la mme
espce vivant au mme endroit et se reproduisant entre eux), plus elle est homogne. Les migrations ont
pour effet daugmenter la diversit intra-population, et donc dhomogniser les populations entre
elles. Lhomognit de lespce humaine provient notamment du fait que les changes entre les diffrentes
populations ont toujours t maintenus.
La cration de biodiversit rsulte dun quilibre subtil entre isolement (pour avoir une volution locale diff-
rente selon les populations) et migration (pour ne pas avoir une perte locale trop forte de diversit gntique).
Une des causes de la crise actuelle de la biodiversit, outre les extinctions, est la perturbation de cet quilibre.
1.4 Effet de la drive
Soit maintenant une population prsentant deux allles de mme valeur slective, sans migration ni mutation.
Tenant compte de ce qui prcde, on sattend ce que
global
p soit nul. Or on observe quand mme une variation
des frquences allliques dune gnration sur lautre... cela provient du fait que la modlisation purement
dterministe que nous avons construite fait appel aux esprances des variations allliques. Dans une population
de taille nie, on va ncessairement observer des uctuations dchantillonnage.
On appelle drive gntique (drift) le processus par lequel les frquences allliques changent dans les (petites)
populations cause de biais alatoires dchantillonnage dans la transmission des allles dune gnration
lautre.
Chaque nouvel individu est le rsultat dun tirage dans "lurne des gnotypes". Le nombre n
A
dindividus A la
gnration suivante suit alors une loi binomiale de paramtres N et p :
P(n
A
= k) =
_
N
k
_
p
k
q
Nk
On a alors E(n
A
) = Np (soit E(p) = p) : en moyenne, rien de bien mchant. Cependant, il faut tenir compte de la
dispersion statistique mesure par la variance : V (n
A
) = Npq.
V (p) = V
_
n
A
N
_
=
1
N
2
Npq =
pq
N
1 PRESSIONS VOLUTIVES 9
La dispersion de p

autour de p sera donc de lordre de


drift
=
_
pq
N
. On remarque que la dispersion attendue est
dautant plus importante que la taille de la population est faible. La drive peut galement tre modlise par
une marche alatoire : une particule se dplace sur la droite des frquences allliques, sa position correspondant
la frquence de lun des allles. Les tats 0 et 1 sont absorbants. Si un allle atteint la proportion de 100%
dans la population, on dit quil est x
3
. La probabilit de xation dun allle est gale sa frquence initiale.
Considrons en effet une population deffectif N dans laquelle apparat un allle nouveau chez un individu.
Sa frquence initiale est donc p
0
=
1
N
. On subdivise cette population en k sous-populations deffectif n (donc
kn = N). On laisse voluer ces populations. Au bout dun temps assez long, lallle nouveau est x dans
une proportion x des sous-populations et perdu dans une proportion 1 x des sous-populations. Sa frquence
dans la population totale est donc p = 1
nkx
N
+ 0
(1 x)kn
N
= x. Or la drive laisse la moyenne invariante
donc p = x = p
0
. La probabilit de xation, gale la proportion de sous-populations initialement identiques
ayant nalement x lallle, est gale la frquence initiale de lallle dans la population. On a donc bien
P(fixation) = p
0
=
1
N
.
Limportance de la drive dans le processus global dvolution est encore dbattue, mme si de plus en plus
de chercheurs tendent lui accorder une place fondamentale. Quoi quil en soit, limportance de la drive est
tablie dans toutes les situations o la population est de petite taille : juste aprs la colonisation dune le ou
une catastrophe naturelle par exemple (goulot dtranglement, bottleneck). La composition gntique de la
population issue de ces quelques individus sera (hors mutation, slection et migration) dtermine par celle de
ces derniers : on parle deffet fondateur.
1.5 Lquilibre de Hardy-Weinberg
Dans une population isole sans mutation ni slection et de taille innie, les frquences allliques
sont constantes dune gnration sur lautre.
Cet quilibre, ou loi de Hardy, constitue un cas de rfrence : toute variation de frquence alllique devra
sinterprter laide des diffrentes pressions volutives. Elle joue le mme rle que la premire loi de Newton
en dynamique classique (toute dviation du mouvement rectiligne uniforme doit sinterprter en termes de force
applique au mobile).
1.6 Mutation et slection
1.6.1 Lquilibre mutation-slection
Classiquement, si un allle est dltre, on donne la valeur 1 la tness de lallle non dltre (suppos tre
A) et 1 s lallle dltre (a). s est le dsavantage slectif. La mthode, approximative, consiste considrer
successivement slection puis mutation pour aboutir une formule approche de la variation de frquence
alllique sous leffet conjoint de ces deux pressions.
On considre dabord la slection. La tness moyenne est

W = p +q(1 s) = 1 sq.
On a
p

s
= p
1
1 sq
Puis on envisage la mutation : p

= p

s
(1 u) do
p

= p
1 u
1 sq
3. En pratique, on considrera quun allle est x si sa frquence dpasse une valeur seuil arbitraire, par exemple 99%.
2 CAS DES ORGANISMES DIPLODES 10
Lquilibre mutation-slection est atteint pour u = sq soit q
eq
=
u
s
, ce qui impose s > u pour avoir une possibilit
dquilibre. Si ce nest pas le cas, lallle dltre peut simposer. Tout gne dont la perte ninduit pas une
baisse signicative de la valeur slective est destin tre perdu. Use it or lose it, du moins du point de
vue adaptationniste...
1.6.2 La notion de fardeau gntique
On appelle fardeau gntique L (load) lcart entre la tness du meilleur allle et la tness moyenne de la
population. Avec nos conventions prcdentes, W
max
= 1 et

W = 1 sq donc L = sq. A lquilibre le fardeau
gntique est gal au taux de mutations : L
eq
= u . Le fardeau ne dpend pas de la perte de tness induite par la
prsence de lallle mut ni de sa frquence. Un allle coteux sera rare, un allle moins coteux plus rpandu,
mais le fardeau gntique sera le mme !
2 Cas des organismes diplodes
2.1 Le problme de la structure gnotypique
Chez les diplodes il devient difcle de dnir des frquences allliques. Soit une population diplode de taille
N prsentant les gnotypes suivants :
Gnotype AA Aa aa
Effectif n
1
n
2
n
3
Comme prcdemment, p est la frquence de A et q la frquence de a. On a alors :
_

_
p +q = 1
n
1
+n
2
+n
3
= N
Np = n
1
+
n
2
2
Nq = n
3
+
n
2
2
Ce systme a un seul paramtre (N), quatre quations et cinq inconnues. Il a a priori une innit de solutions.
Il faut faire des hypothses supplmentaires pour obtenir la structure gnotypique de la population.
Le schma de base pour la reproduction est :
Gamtes, gnration t p A q a
Zygotes AA Aa aa
Survie diffrentielle
Adultes AA Aa aa
Fcondit diffrentielle
Gamtes, gnration t + 1 p

A q

a
On suppose les gnrations non chevauchantes et on raisonne sur les gamtes utiles, cest--dire les gamtes
fcondants.
2 CAS DES ORGANISMES DIPLODES 11
2.2 Rgimes de reproduction
2.2.1 La panmixie et la distribution de Hardy-Weinberg
Le degr de libert restant est lev en faisant une hypothse sur le rgime de reproduction. On utilise gn-
ralement un rgime panmictique (on parle de panmixie), dans lequel la formation des couples est totalement
alatoire. Cette panmixie constitue plus un cas de rfrence permettant de caractriser, par comparaison, les
situations relles quun rgime de reproduction effectivement rencontr dans la Nature. La panmixie est une
notion relative au caractre tudi. Sous cette hypothse, on a alors :
q a p A
q a q
2
aa pq Aa
p A pq Aa p
2
AA
La structure gnotypique est donc p
2
, 2pq, q
2
. Cest la structure caractristique de la panmixie, appele distribu-
tion de Hardy-Weinberg. Cette distribution est atteinte ds la deuxime gnration de panmixie chez les diplodes.
Remarque importante : la panmixie nest pas ncessaire la constance des frquences allliques en lab-
sence de toute pression volutive. Lcart la panmixie peut nanmoins causer une variation des frquences
gnotypiques mme si aucune pression nagit. Voir un exemple en 5.1.1.
Cette distribution est notamment incompatible avec le sexe. Dans lespce humaine, il ny a pas panmixie pour
le sexe (raison biologique), pour la couleur de peau (raison sociale et gographique) ou le groupe sanguin (raison
gographique).
Par ailleurs, la dispersion spatiale des descendants dun individu est gnralement faible. Des individus oc-
cupant la mme aire gographique sont frquemment apparents ; cela cre de la consanguinit au sein de la
population. La frquence dhtrozygotes est infrieure 2pq. Voir 5.
2.2.2 Choix phnotypiques
On parle de choix phnotypique (assortative mating) pour dsigner la tendance dun individu reproducteur
choisir comme partenaire sexuel un individu prsentant un phnotype similaire (positive assortative mating) ou
dissimilaire (negative assortative mating) au sien.
Homogamie : tendance choisir des individus du mme phnotype que soi. ex : chez les plantes, la date de
oraison. Lhomogamie diminue lhtrozygotie face 2pq.
Htrogamie : tendance rechercher un partenaire de phnotype diffrent. ex : sexe, y compris les systmes
sexuels de type auto-incompatibilit. Pour une auto-incompatibilit gamtophytique, le taux dhtrozygotie
est de 100%. Il faut au moins 3 allles S diffrents.
Lhomogamie est un phnomne pouvant conduire une spciation sympatrique (cest--dire une spciation sans
isolement gographique).
2.3 Pressions volutives et diplodie
2.3.1 Mutation, migration, drive
Les quations dcrivant mutation et migration ne sont pas modies. Pour la drive, il y a une lgre modica-
tion : on a dsormais
drift
=
_
pq
2N
.
3 LE POLYMORPHISME 12
2.3.2 Slection en rgime panmictique
Soit une population diplode de taille N, panmictique, dans laquelle coexistent pour le locus tudi deux allles,
A et a. On note W
1
la tness des AA, W
2
la tness des Aa et W
3
la tness des aa. La population suit la distribution
de Hardy-Weinberg. On a :
p

=
p
2
W
1
+pqW
2

W
o :

W = p
2
W
1
+ 2pqW
2
+q
2
W
3
Par consquent :

s
p = p

p =
p
2
W
1
+pqW
2
p
2
W
1
+ 2pqW
2
+q
2
W
3

p
_
p
2
W
1
+ 2pqW
2
+q
2
W
3
_
p
2
W
1
+ 2pqW
2
+q
2
W
3
=
p
_
p(1 p)W
1
+ (q 2pq)W
2
q
2
W
3

W
=
pq

W
[pW
1
+ (q p)W
2
qW
3
] =
pq

W
[p(W
1
W
2
) +q(W
2
W
3
)]

s
p =
pq

W
[p(W
1
W
2
) +q(W
2
W
3
)]
3 Le polymorphisme
Comment expliquer que les individus dune population (non-clonale) soient tous diffrents ?
3.1 quilibre mutation-slection chez les diplodes
3.1.1 Calcul du fardeau gntique
On se place dans les mmes conditions. On pose W
1
= 1, W
2
= 1 et W
3
= 1 s. On envisage donc le cas dune
dominance de A sur a.
4
La tness moyenne dans cette population vaut

W = p
2
+ 2pq +q
2
(1 s) = (p +q)
2
sq
2
= 1 sq
2

W = 1 sq
2
On a alors, par le mme calcul que pour les haplodes :
p

= p
1 u
1 sq
2
Do
q
eq
=
_
u
s
4. Dans le cas gnral, la valeur slective dun htrozygote est pose gale W
2
= 1 hs o h est appel coefcient de dominance.
La situation de dominance est donc le cas h = 0 ou h = 1. La co-dominance est le cas h = 0, 5. La super-dominance, envisage plus loin,
correspond h < 0.
3 LE POLYMORPHISME 13
A lquilibre, le fardeau gntique vaut donc L = sq
2
eq
= u. La situation tablie pour les haplodes est encore
valable pour les diplodes. Le fardeau gntique lquilibre est encore gal au taux de mutation. Donc la
diplodie ne protge pas contre les mutations : les allles rcessifs dltres ne peuvent pas tre limins par
slection. Ils sont cachs !
Calcul plus gnral
On envisage cette fois une mutation A a un taux u, une mutation reverse a A un taux v et on utilise le
coefcient de dominance dni la note 4. On suppose la distribution de Hardy-Weinberg ralise.
AA Aa aa
p
2
2pq q
2
1 1 hs 1 s
On a alors :
p

= (1 u)
p
2
+pq(1 hs)
1 2pqhs q
2
s
+v
pq(1 hs) +q
2
(1 s)
1 2pqhs q
2
s
Si les taux de mutation sont ngligeables devant s et hs et si q est ngligeable devant 1, on peut crire
lquilibre :
p = (1 u)
p
2
+pq(1 hs)
1 2pqhs q
2
s
+v
pq(1 hs) +q
2
(1 s)
1 2pqhs q
2
s
(1 u)
p
2
+pq(1 hs)
1 2pqhs q
2
s
1 (1 u)
p +q(1 hs)
1 2pqhs q
2
s
(1 u)
p +q(1 hs)
1 2qhs +q
2
(2h 1)s

h=0
(1 u)
p +q(1 hs)
1 2qhs

hs1
(1 u)
1
1 2qhs

1 u
1 2qhs
Do :
2 qhs u
q
u
2hs
Le cas h = 0 est part et a t trait plus haut.
Cette relation a t obtenue moyennant plusieurs approximations et peut tre trouve sous des formes diff-
rentes (des prfacteurs diffrents) selon les auteurs. Cependant, il faut retenir la forme gnrale q
u
hs
.
3.1.2 Exemple dun allle rcessif ltal, problmes lis lautofcondation
Pour un allle ltal, s = 1. Donc ici q
eq
=

u . Pour u 10
6
on a donc q
eq
10
3
(contre 10
6
dans une
population haplode). Chez les haplodes, la slection puriante est une pression volutive trs importante.
Cest beaucoup moins vrai chez les diplodes.
Si une population diplode passe dun rgime allogame un rgime autogame, on observe en premier lieu une
dpression de consanguinit parce que les allles rcessifs dltres peuvent sexprimer. Ces allles vont alors
3 LE POLYMORPHISME 14
FIGURE 2 Situations possibles en htrozygotie
subir la slection et la population va voluer vers les frquences dquilibre. La consanguinit nest dangereuse
que dans une population qui vient de passer dun rgime allogame un rgime autogame.
Ainsi dans un gnome haplode dindividu diplode, on estime quil y a environ 0,1% dallles ltaux
5
. Pour un
humain a fait donc 40 60 gnes quivalents-ltaux (sur les deux exemplaires du gnome), et 20 30 par
gamte. On espre ainsi que le gamte complmentaire ne portera pas les mmes allles rcessifs dltres.
Do lintrt de ne pas faire des enfants avec sa sur ou sa mre...
Lquilibre mutation slection chez les diplodes explique donc lexistence des maladies gntiques
et de certains autres polymorphismes. Mais cela nexplique pas la totalit du polymorphisme. En
particulier, lquilibre mutation-slection prvoit un allle dominant trs haute frquence et un allle rcessif
basse frquence. On parle de cryptopolymorphisme pour dsigner le maintien de mutations dsavantageuses
une frquence dquilibre de mutation-slection. La plupart des maladies gntiques humaines relvent de
cryptopolymorphisme (exemple : phnylctonurie, voir [2] pour un aspect historique trs instructif.).
3.2 Polymorphisme vrai
3.2.1 Super-dominance
On a vu :

s
p =
pq

W
[p(W
1
W
2
) +q(W
2
W
3
)]
Lquilibre (non-trivial) nest possible que si W
1
W
2
et W
2
W
3
ne sont pas de mme signe. Cela se traduit bio-
logiquement par la super-dominance (over dominance) ou la sous-dominance (under dominance). Voir la gure
2.
La frquence dquilibre est alors :
p
eq
=
W
3
W
2
W
1
+W
3
2W
2
Sous-dominance : lquilibre est instable. Donc cest une situation dfavorisant lhtrozygotie et pouvant
conduire un isolement reproducteur. Cest un phnomne lorigine de spciations. Du point de vue compor-
temental, sil existe un moyen pour lanimal de distinguer les diffrents gnotypes, lisolement reproducteur
sera przygotique. Les AA se reproduisent entre eux, les aa aussi, les Aa sont mis lcart.
5. Dans un gnome humain haplode, il y a entre 20 000 et 30 000 gnes. Il y a donc potentiellement 20 000 30 000 loci biallliques
dont lallle rcessif est ltal. Un individu tir au hasard dans une population lquilibre mutation-slection a, pour un locus donn, une
probabilit q
eq
10
3
dtre porteur de lallle ltal. Le nombre thorique dallles ltaux dans le gnome (haplode) de cet individu est
donc de 20 30.
3 LE POLYMORPHISME 15
Super-dominance : au contraire, en cas de super-dominance, lquilibre est stable et la distribution se main-
tient. Le cas dcole de la super-dominance est celui de la drpanocytose en Afrique.
On a constat, assez tardivement, que les htrozygotes AS
6
pour le gne de la globine taient protgs
du paludisme. En Afrique, cela confre un avantage slectif, dautant que les AS prsentent un phnotype
drpanocytaire attnu. La situation est la suivante :
AA AS SS
W 1 s 1 0
Frquences 0, 7 0, 3 0
On en dduit les frquences allliques : p = 0, 85 et q = 0, 15 . A lquilibre (suppos tabli car les valeurs
mesures sont stables) :
p(W
1
W
2
)+q(W
2
W
3
) = 0
sp +q = 0
Ici : qsp = 0 do s 0, 18.
Mais aux USA, o le paludisme est absent, il y a tout de mme 12% dAS dans la population afro-amricaine.
Comment lexpliquer ?
Hypothses : isolement reproducteur et panmixie pour la population afro-amricaine.
AA AS SS
W 1 1 0
Frquences 0, 88 0, 12 0
(on admet quaux USAles soins mdicaux confrent aux htrozygotes une tness gale celle des homozygotes).
On a :
q
t+1
=
p
t
q
t
p
2
t
+ 2p
t
q
t
=
p
t
q
t
1 q
2
t
=
q
t
1 +q
t
On passe linverse :
1
q
t+1
= 1 +
1
q
t
On reconnat une suite arithmtique de raison 1 dont la forme explicite est :
1
q
t
=
1
q
0
+t
o t est le nombre de gnrations. Soit
q
t
=
q
0
1 +q
0
t
Sans surprise, le modle prvoit la disparition de lallle S au bout dun grand nombre de gnrations. Aux USA,
on a q
t
= 0, 06 et q
0
= 0, 15.
t =
1
q
t

1
q
0
= 10
On trouve 10 gnrations coules depuis la disparition de la pression paludique, soit environ 300 ans en consi-
drant un temps de gnration humain de 30 ans. Cela est globalement cohrent avec les donnes historiques.
6. S pour Sickle Cell Anemia
3 LE POLYMORPHISME 16
Cet exemple illustre la puissance de la notion de super-dominance. Mais part celui-ci, on en connat trs peu...
il est probable que, malgr la beaut du concept, limportance relle de la superdominance dans la nature soit
faible.
3.2.2 Slection frquence-dpendante
On a suppos que la tness dun gnotype donn est constante. Cela peut ne pas tre le cas et la tness peut tre
une fonction de la frquence des gnotypes. On pourra alors avoir de la slection frquence-dpendante. Si
le gnotype rare est favoris, on parle aussi de slection apostatique.
Exemple fondamental : le sex ratio Considrons une population sexue. Si lun des sexes est beaucoup
moins frquent que lautre, chaque membre du sexe le plus rare aura plus de descendants en moyenne que les
membres du sexe le plus frquent.
Dans une population de taille N, on note x la frquence des mles et 1 x la frquence des femelles. Soit
k le nombre moyen de descendants dune femelle ; on a donc W
f
= k. Le nombre denfants produits par une
gnration est donc Nk(1 x). La tness dun mle est le nombre moyen denfants par mle ; soit :
W
m
=
Nk(1 x)
Nx
= k
(1 x)
x
Soit encore :
W
m
W
f
=
1 x
x
A lquilibre, cest--dire lorsquil ny a pas davantage appartenir un sexe ou lautre, on a donc x =
1
2
. Le
systme chromosomique XY est une manire de raliser cet quilibre.
Cependant, il existe des espces (dinsectes par exemple) dans lesquelles le sex ratio lquilibre est fortement
biais.
Exemple fondamental : lauto-incompatibilit gamtophytique (AIG) Pour le mcanisme de lAIG, se
rfrer un cours de biologie vgtale.
Dans lAIG, il y a rejet si lallle S exprim par le grain de pollen (tiquettes prsentes la surface du tube
pollinique qui a commenc sa progression dans le style) est lun des allles S ports par le style. Avec ce systme,
le taux dhtrozygotie est de 100%. Il nest viable que sil existe au moins 3 allles S diffrents.
S1/S2, p S1/S3, q S2/S3, r
S1/S2 0 0, 5 0, 5
S1/S3 0, 5 0 0, 5
S2/S3 0, 5 0, 5 0
Avec p +q +r = 1.
A t + 1 on aura :apostatique
p

=
1
2
q +
1
2
r =
1 p
2
et de mme :
q

=
1 q
2
r

=
1 r
2
3 LE POLYMORPHISME 17
Donc la proportion dun gnotype est dautant plus faible quelle tait leve la gnration prcdente. A
lquilibre :
r
eq
=
1 r
eq
2
, r
eq
= q
eq
= p
eq
=
1
3
On a
p

p
eq
= p

1 p
eq
2
=
1 p
2

1 p
eq
2
=
p
eq
p
2
=
1
2
(p p
eq
)
soit
p
t
=
1
3
+
_

1
2
_
t
_
p
0

1
3
_
(cest la mme dynamique pour les deux autres allles). Dans ce systme, tout allle nouveau se rpand trs vite
mais subit le contrecoup la gnration prcdente (voir la Figure 3).
FIGURE 3 Evolution des frquences allliques dans un systme dAIG trois allles (simulation Matlab)
Dautres exemples Dans une population soumise de la prdation, les prdateurs apprennent reconnatre
les proies les plus frquentes ; les phnotypes les plus rares seront donc favorises.
Au contraire, certains papillons arborent des motifs alaires imitant ceux de papillons toxiques partageant leur
habitat. Les prdateurs associent ces motifs la toxicit et nattaquent pas ces papillons. Un variant rare aura
moins de chances dtre connu des prdateurs et sera plus probablement attaqu.
Enn, la valeur slective peut galement varier comme fonction du temps ou de lespace. Les modles sont beau-
coup plus complexes mettre en oeuvre. Une notion importante est que la tness moyenne nest pas forcment
la moyenne arithmtique des tness en fonction des diffrents sites (dans le cas dune variation spatiale) : les
moyennes pertinentes sont souvent la moyenne gomtrique et la moyenne harmonique, beaucoup plus sen-
sibles ltalement des valeurs.
3 LE POLYMORPHISME 18
Slection frquence-dpendante: lexemple du jeu Hawk and Dove
Supposons ici une population thorique dont les membres sont en comptition pour une ressource rare qui est
le seul dterminant de la tness. Supposons galement que deux comportements (qui seront les phnotypes
possibles) coexistent: le faucon (hawk) et la colombe (dove). Notons x la proportion de faucons et y la proportion
de colombes. Les faucons sont agressifs alors que les colombes ne le sont pas. Lorsquun faucon rencontre une
colombe, il lattaque et la colombe fuit. Cela induit une augmentation G de la tness du faucon et ne modie pas
la tness de la colombe.
Si deux colombes se rencontrent, elles ne combattent pas et lune dentre elle abandonne les ressources
lautre. Une colombe donne gagne en moyenne la moiti des rencontres colombe/colombe et donc toute ren-
contre colombe/colombe induit une augmentation
1
2
G de la tness des colombes.
Si deux faucons se rencontrent, ils se battent. Chacun lemporte en moyenne une fois sur deux. Par ailleurs les
deux faucons se partagent un cot C (blessures) et la tness des faucons augmente donc de
1
2
(GC).
En termes de thorie des jeux, la matrice des gains (faucon, colombe) x (faucon, colombe) est:
_
GC
2
G
0
G
2
_
Le gain de tness moyen dun faucon est:

H
= x
GC
2
+y G
Le gain de tness moyen dune colombe est:

D
= y
G
2
On suppose que seule la possession (ou non) de la ressource dintrt a une inuence sur la tness. Cela veut dire
quen labsence du phnomne de comptition que nous tudions ici, faucons et colombes auraient exactement
la mme tness. Or on sait que la slection agit sur des diffrences de tness et non des tnesses absolues. On
peut donc raisonner en terme de tness et non de gain de tness:
H
est la tness dun faucon et
D
la tness
dune colombe.
La tness moyenne

f de la population est donc:

f = x
H
+y
D
Soit en dveloppant:

f =
G
2

Cx
2
2
La tness moyenne dcrot donc quadratiquement avec la proportion de faucons.
On a comme prcdemment
a
:
_
dx
dt
= (
H


f)x
dy
dt
= (
D


f)y
Pour connatre ltat de la population lquilibre, il faut tudier le cas o
H
=
D
=

f. Le calcul
b
montre
que deux cas sont possibles:
1. Si G > C, le seul quilibre stable est x

= 1. La population est exclusivement faucon.


2. Si G < C, le seul quilibre stable est x

=
G
C
. La tness moyenne est alors:

=
G
2
_
1
G
C
_
or la tness optimale serait

f
max
=
G
2
.
Nous avons donc un cas o la tness moyenne lquilibre nest pas maximale. Autrement dit, la tness moyenne
nest pas ici un potentiel et le thorme de Fisher ne sapplique pas. Cest ce qui se passe en gnral.
a. En thorie des jeux, ces quations sont appeles quations du rplicateur.
b. Il sagit de la mthode classique dtude de stabilit en thorie des systmes dynamiques. Voir par exemple [8] pages 152 155.
3 LE POLYMORPHISME 19
FIGURE 4 Mise en vidence du polymorphisme par lectrophorse de protine
3.3 Le paradoxe du fardeau gntique
On a vu que le fardeau gntique est dni classiquement comme L = W
max


W. On peut crire :
N(t + 1) = N(t)pW
A
+ (1 p)N(t)W
a
= N(t)

W = N(t) [W
max
L] = NW
max
NL
L mesure la perte defcacit reproductive (au niveau populationnel) venant du fait que toute la population nest
pas porteuse du gnotype tness maximale.
Lorsque les mthodes quantitatives de la gntique des populations ont commenc tre appliques sur des cas
concrets, on imaginait que le gnome dune espce tait constitu dune majorit de gnes communs lespce
et quelques allles prsentant un polymorphisme (cryptopolymorphisme, polymorphisme transitoire...). Mais
tudier un polymorphisme, cest compliqu. Chez certaines espces, il est facilement observable car il touche la
morphologie : phalne du bouleau, thym (odeurs), escargots (couleur de la coquille). A part cela, ctait difcile...
En 1966, R. Lewontin et J. Hubby dveloppent une technique pour aller chercher la variabilit directement "
la sortie des gnes". Le squenage ntait pas encore au point, on a donc fait de llectrophorse des protines.
Llectrophorse se faisait sur gel damidon et lon analysait un extrait protique de drosophile (drosophile
crase sur du papier buvard). Certaines enzymes donnent un produit color. Cest elles que lon a pu rvler en
premier (voir gure 4).
La gntique des populations transite alors vers la biochimie et la biologie molculaire
7
. On peut valuer de
manire quantitative les proportions des diffrents allles. On peut donc tester la loi de Hardy-Weinberg.
Exemple Llectrophorse ralise chez la Drosophile a permis didentier deux allles pour lenzyme donnant
le produit bleu, fast (F) et slow (S). Supposons que lon ait la distribution gnotypique suivante :
Gnotype FF FS SS
Effectif 400 150 220 30
Soit p la frquence de F, on a alors p = 0, 65 et q = 0, 35. Pour tester ladquation la loi de Hardy-Weinberg, on
ralise un test du
2
. On a :
7. Ce qui, daprs Lewontin [5], cause un appauvrissement des questions poses par les biologistes de lvolution, qui se restreignent
aux sujets pouvant tre tudis par les analyses molculaires de variabilit.
4 LA THORIE NEUTRALISTE DE LVOLUTION 20

2
=

(obs esp)
2
esp
Ici la distribution de Hardy-Weinberg prvoit :
400p
2
= 169 FF
400 2pq = 182 SF
400q
2
= 49 SS
On ralise un test de conformit et on a estim un paramtre de la loi thorique ; il y a donc un degr de
libert. La distance calcule vaut 17, 44. On compare avec la valeur donne dans les tables : 3, 84. La distribution
phnotypique ne suit donc clairement pas la loi de Hardy-Weinberg (avec un risque derreur de 5%).
Une grande proportion des gnes sont variables : pour la plupart des espces, entre un tiers et la moiti, sauf
chez les populations provenant dun pool initial peu diversi (lapin dAustralie) ou les espces en voie dextinc-
tion (gupard). Chez lHumain, il y a donc environ 10 000 gnes polymorphes. En supposant que chaque gne
polymorphe nadmet que deux allles, il y a donc 2
10000
10
4000
gnomes haplodes possibles... cest de trs trs
trs loin suprieur au nombre datomes dans lUnivers (de lordre de 10
81
, on est donc bien loin du compte...).
Cest pour cela quil est absolument impensable davoir par hasard deux individus absolument identiques. Tout
gnotype existant tait totalement improbable avant dexister.
La conclusion des nombreux travaux qui ont alors analys les populations naturelles est que celles-ci sont trs
polymorphes.
Un tel polymorphisme soulve un paradoxe : lexistence dun polymorphisme suppose a priori lexistence dun
fardeau gntique qui aurait du tre limin par la slection.
4 La thorie neutraliste de lvolution
4.1 Prsentation de la thorie
Plusieurs thoriciens, avec en tte de le le japonais Motoo Kimura, ont propos la solution suivante au paradoxe
du fardeau gntique : il suft que ce polymorphisme ne donne pas prise la slection, cest--dire quil soit
neutre, pour nentraner aucun fardeau gntique. Kimura avance que la majorit du polymorphisme observ
est neutre, donnant naissance la thorie neutraliste de lvolution. Dans cette thorie, qui au dpart
est vue par ses fondateurs comme une vritable alternative au nodarwinisme, mutation et drive sont les
pressions volutives fondamentales et la slection na quun rle nul ou ngligeable. Nat une controverse entre
neutralistes et slectionnistes
8
: les slectionnistes objectent quune telle thorie prvoit justement de ne pas
observer de polymorphisme, ou trs peu, puisque les diffrents allles doivent tre xs. Pour Kimura, la vitesse
de xation est infrieure la vitesse de mutation, ce qui maintient le polymorphisme (gure 5).
On appelle transition lintervalle de temps au cours duquel lallle le plus ancien est remplac par un nouvel
allle le plus ancien. La frquence de mutation et la dure moyenne de xation sont alors les grandeurs im-
portantes. Si les transitions sont rapides et peu frquentes, la population est peu polymorphe. Pour calculer le
temps de xation dun allle, Kimura a initialement utilis une approximation de diffusion [3].
8. Bien rsume dans le livre de S. Samadi et P. David [4].
4 LA THORIE NEUTRALISTE DE LVOLUTION 21
FIGURE 5 Schma de base de la thorie neutraliste : xation ou disparition dallles nouveaux.
4.2 La thorie de la coalescence
Lapproche moderne est plutt de considrer que suivre la drive, cest suivre une gnalogie de gnes. On utilise
la thorie de la coalescence pour calculer le nombre de gnrations ncessaires pour avoir coalescence de deux
lignes, et in ne coalescence de toutes les lignes, ce qui permet de retrouver le temps de xation dun allle
(gure 6). La coalescence est une vision rtrospective de la drive par fusion de lignes au niveau danctres
communs quand on remonte dans le temps.
4.2.1 Modle de Wright-Fisher
On part dune population de N gnes (2N pour une population diplode) la gnration 0. Attention, en coa-
lescence, laxe du temps est invers : la gnration t est celle qui prcde la gnration t 1. La population est
suppose de taille constante au cours du temps, les gnrations non chevauchantes, il ny a pas de slection et
le rgime panmictique sapplique : ce sont les hypothses du modle de Wright-Fisher.
4.2.2 Identit par ascendance et temps de coalescence
Quelle est la probabilit que deux gnes tirs au hasard partagent un mme gne anctre la gnration
prcdente ? Cette probabilit, appele probabilit didentit par ascendance, et note P(T
2
= 1), vaut
1
N
(res-
pectivement
1
2N
pour des diplodes). Le nombre de gnrations quil faut remonter pour avoir coalescence de
deux lignes suit une loi gomtrique :
P(T
2
= n) =
_
1
1
N
_
n1

1
N
4 LA THORIE NEUTRALISTE DE LVOLUTION 22
FIGURE 6 Coalescence. Daprs [4].
Do notamment : E(T
2
) = N. Il faut remonter en moyenne N gnrations pour avoir coalescence de deux lignes
(respectivement 2N gnrations chez des diplodes). On peut maintenant sintresser la coalescence de plus
de deux lignes.
Remarque La probabilit que trois gnes tirs au hasard aient un mme anctre la gnration prcdente
est gale
1
N
2
, valeur qui est ngligeable si N est assez grand, ce que lon suppose. On ngligera donc systma-
tiquement dans la suite les vnements de coalescence multiple.
On note T
k
le nombre de gnrations remonter pour avoir coalescence de deux lignes parmi k prises au hasard
la gnration 0. La probabilit que deux lignes prises au hasard coalescent est
1
N
; le nombre de paires de
lignes parmi k est
_
k
2
_
donc :
P(T
k
= 1) =
_
k
2
_

1
N
=
k(k 1)
2N
Comme prcdemment, on a une loi gomtrique :
P(T
k
= n) =
_
1
k(k 1)
2N
_
n1

k(k 1)
2N
et donc E(T
k
) =
2N
k(k 1)
.
On peut alors valuer le temps de coalescence de lensemble de la population, que lon note T
MRCA
(pour Most
Recent Common Ancestor) :
E(T
MRCA
) =
N

k=2
E(T
k
) =
N

k=2
2N
k(k 1)
4 LA THORIE NEUTRALISTE DE LVOLUTION 23
On ralise une dcomposition en lments simples en cherchant A et B tels que
A
k
+
B
k 1
=
A(k 1) +Bk
k(k 1)
=
(A+B)k A
k(k 1)
=
1
k(k 1)
soit A+B = 0 et A = 1 do
1
k(k 1)
=
1
k 1

1
k
On a donc une somme tlscopique :
N

k=2
1
k(k 1)
=
N1

j=1
1
j

N

k=2
1
k
= 1
1
N
et donc :
E(T
MRCA
) = 2N
_
1
1
N
_
2N
Le temps moyen de coalescence des N lignes est donc de 2N : cela correspond au temps de xation dun allle
dans la population. Un nouvel allle met donc en moyenne 2N gnrations (4N dans le cas diplode) se xer
dans la population.
4.3 Prise en compte de la mutation
On introduit maintenant dans notre modle un taux u de mutation par locus et par gnration. A chaque
gnration apparaissent donc Nu mutations dans la population. La probabilit de xation dun nouvel allle est
1
N
; le taux de substitution (nombre de mutants atteignant la xation par unit de temps) vaut donc Nu
1
N
= u,
il est gal au taux de mutation et ne dpend pas de la taille de la population.
9
Toutes les
1
u
gnrations environ apparat une mutation qui se xera. On peut alors dnir le paramtre mu-
tationnel de la population, not , comme le rapport du temps de xation et du temps dattente dune mutation
qui se xera :
=
T
fixation
T
mutation
= 4Nu (2Nu pour des haplodes)
mesure la diversit gntique de la population : si 1, le temps de xation est plus important que le temps
dattente dune mutation et on observera du polymorphisme. Cest le cas dans les grandes populations. Ceci est
illustr sur la gure 5.
4.4 Neutralistes contre slectionnistes
Kimura distingue les mutations ltales et les mutations neutres. Il nglige les mutations qui ne sont ni ltales
ni neutres, par des arguments statistiques. Kimura lemporte en 1985. Il a prdit que le taux dapparition de
mutations est constant au cours du temps. Or on observe que la vitesse dvolution du gne de lhmoglobine
alpha est constante au cours du temps : le taux de divergence est globalement proportionnel au temps coul
depuis la divergence. Second argument : Kimura a prdit ce quon trouverait le jour o on saurait squencer de
lADN. Il a annonc que, puisque le polymorphisme est essentiellement neutre, le polymorphisme se concentrera
sur les troisimes bases de codons. Largument est dcisif. En effet, la thorie slectionniste prdit un rsultat
9. Dans une petite population apparaissent peu de nouveaux variants allliques, mais ces derniers ont une probabilit leve de se xer ;
dans une grande population, il apparat plus de nouveaux allles mais leur probabilit de xation est comparativement plus faible.
4 LA THORIE NEUTRALISTE DE LVOLUTION 24
inverse : si la slection est le processus principal, ce sont les structures qui ne donnent pas prise la slection
qui doivent tre les moins variables. Le squenage a donn raison Kimura. Toute la base thorique de la
phylogntique molculaire, permettant linterprtation de lvolution des squences gntiques, est la thorie
de Kimura.
Nanmoins, la slection nest pas incompatible avec la thorie neutraliste et aujourdhui la plupart des bio-
logistes de lvolution reconnaissent lexistence de phnomnes slectifs, sans en exagrer limportance. La
prsence de slection sur un allle a pour effet de biaiser la probabilit et le temps de xation. Le modle neutre
fournit alors un cas de rfrence par rapport auquel caractriser la slection sur locus donn. Cest le principe
des tests de dtection de la slection.
4.5 Mettre en vidence la slection dans une population soumise la drive
La slection peut avantager un allle (slection positive) ou dsavantager un allle (slection puriante).
Si un locus est soumis la slection puriante, on attend (par rapport au cas de rfrence neutre) :
Un taux de substitution plus faible
Un polymorphisme plus faible
Des frquences allliques plus faibles (des nouveaux allles)
Si un locus est soumis la slection positive, on attend :
Un taux de substitution plus lev
Un polymorphisme plus faible
Des frquences allliques plus leves
On recherche la slection positive dans les rgions codantes du gnome.
4.5.1 Mthodes bases sur la divergence interspcique
Par exemple, on considre un gne de lHomme et son orthologue chez le Chimpanz, et on mesure les taux de
substitution pour les sites synonymes
10
et les sites non-synonymes. La slection agit (presque) uniquement sur
les sites non-synonymes. On mesure :
d
S
, taux de substitution sur les sites synonymes
d
NS
, taux de substitution sur les sites non-synonymes
On calcule =
d
NS
d
S
.
Si 1, neutralit.
Si < 1, slection puriante.
Si > 1, slection positive.
Cette mthode a permis de montrer que les gnes soumis slection positive sont notamment :
les gnes de limmunit
les gnes impliqus dans lolfaction, la perception sensorielle
les gnes impliqus dans la spermatognse
les gnes impliqus dans linhibition de lapoptose (avantage : assure de ne pas tre le globule polaire qui
dgnre ; dsavantage : instabilit, cancrisation)
Limites de la mthode
Aspects techniques : les diffrents types de mutations ne sont pas quiprobables ; cela ncessite de com-
plexier les modles. Elle ne fonctionne que sur les squences codantes.
10. Mais, avec le biais dusage du code, est-ce que a existe vraiment un site synonyme ?
4 LA THORIE NEUTRALISTE DE LVOLUTION 25
Aspects fondamentaux : il sagit dune mthode statistique au sens o elle est base sur la comparaison
de plusieurs sites. Donc si la slection nagit que sur un seul acide amin, on ne verra rien. Il faut que la
slection ait agi longtemps pour avoir un signal observable.
Cest une mthode spcique (able : elle dtecte uniquement de la slection), mais peu puissante (ne dtecte
pas toujours la slection).
4.5.2 Mthodes bases sur le polymorphisme intraspcique
Dans ces mthodes, lhypothse nulle est le modle de Wright-Fisher (uniquement des mutations neutres et de
la drive). Si on constate un cart au modle, on peut parfois en infrer de la slection.
4.5.3 Mthodes associant les deux approches
Test HKA (Hudson, Kreitman, Aguad - 1987)
Le polymorphisme intraspcique est caractris par le paramtre mutationnel de la population : = 4Nu . La
divergence interspcique peut se quantier par D = 2uT o T est le temps coul depuis la divergence. Sous
lhypothse de neutralit, et D sont corrls :
r =

D
=
2N
T
Cette grandeur doit tre la mme pour tous les loci. Le principe du test est alors de comparer le ratio r du locus
dintrt avec le ratio dun locus que lon sait tre neutre (gure 7).
FIGURE 7 Test HKA pour deux espces A et B
Test de McDonald-Kreitman
Ce test suit le mme principe que le test HKA mais nutilise quun seul locus ; les sites synonymes sont pris
comme rfrence. Sous le modle neutre, on attend :

NS
=
4Nu
S
4Nu
NS
=
2Tu
S
2Tu
NS
=
D
S
D
NS
Si

S

NS

D
S
D
NS
, on est en situation de slection positive, car la slection acclre la xation de mutations non-
synonymes. Si

S

NS

D
S
D
NS
, on est en situation de slection puriante car la slection ralentit la xation des
4 LA THORIE NEUTRALISTE DE LVOLUTION 26
mutations non-synonymes.
4.5.4 Test de Tajima
On peut dnir deux indicateurs pour tudier le polymorphisme dun locus.
Premirement, on peut, disposant de plusieurs squences provenant dindividus diffrents et correctement ali-
gnes, raliser toutes les comparaisons de paire possibles et en dduire le nombre moyen de diffrences par site
entre deux squences. Cet indicateur ne dpend pas du nombre de squences et est not

. Il est peu sensible


la frquence des allles rares.
Deuximement, on peut compter le nombre de sites polymorphes ; il est potentiellement dautant plus grand que
notre chantillon compte de squences. On obtient ainsi un indicateur not
S
. Il est sensible la frquence des
allles rares.
Considrons un chantillon de n squences alignes, de longueur L (en pb).
On note le nombre moyen de nuclotides diffrents par site entre deux squences de lchan-
tillon. tablissons lexpression de . Il y a
_
n
2
_
=
n(n 1)
2
alignements de paires possibles.
On note
ij
le nombre total de diffrences entre la i
` eme
et la j
` eme
squence. On a alors :
=
1
n(n1)
2

1
L

i<j

ij
est appel la diversit nuclotidique. On a

= .
Notons S le nombre total de sites polymorphes (segregating sites). Watterson a montr que E(S) =
La
n
o a
n
=
n1

i=1
1
i
. Donc
S
=
S
La
n
est un estimateur de . [12]
Fumoi Tajima a montr que ces deux indicateurs sont des estimateurs de et quils en donnent une estimation
trs similaire en cas de neutralit. Il a alors dni la statistique D (Tajimas D) comme :
D =

S
_
Var(

S
)
En cas dexcs de variants rares, on aura D < 0. Ce type de situation se produit lorsque le locus considr a
subi un balayage slectif (voir 4.7.3) dans un pass relativement proche, ce qui permet de le mettre en vidence.
Nanmoins, on retrouve le mme type de signature si la population a subi rcemment une phase dexpansion
dmographique. La dynamique de la population peut venir parasiter linterprtation des donnes et conduire
dtecter de la slection l o il ny en a pas. Pour viter cela, il faut se souvenir que la slection naffecte que
certains locus alors que la dmographie touche lensemble du gnome.
De mme, en cas dexcs de variants de frquence intermdiaire, on aura D > 0. Cest le cas si le locus est soumis
la slection balance, ou si la population a subi un bottleneck partiel (laissant plusieurs variants).
4.6 Fixation dallles soumis la slection
En 1962, Kimura a utilis lapproximation de diffusion pour estimer la probabilit de xation dallles prsen-
tant un avantage slectif (algbrique) s. Le dtail des calculs peut tre trouv dans [3]. Le rsultat principal est
4 LA THORIE NEUTRALISTE DE LVOLUTION 27
que la probabilit de xation dun allle en frquence q est :
p
f
(q) =
1 e
4Nsq
1 e
4Ns
La probabilit de xation dun allle nouveau est donc
p
f
(q =
1
2N
) =
1 e
2s
1 e
4Ns
En particulier, si s 0, on montre par dveloppement limit que p
f
=
1
2N
, rsultat dj tabli diffremment au
1.4. Pour Ns 1, et s 0, 1 on a p
f
2s, rsultat connu depuis les annes 1930.
4.7 Dsquilibre gamtique et auto-stop
4.7.1 Dsquilibre gamtique
Parfois, cependant, on trouvait que certains allles taient plus frquents quand il faisait chaud, dautres quand
il faisait froid...
Exemple : on peut constater que F est majoritaire quand il fait chaud, S quand il fait froid. Si on tudie expri-
mentalement en plaant la population dans le froid, on observe que la frquence de S augmente. La conclusion
la plus immdiate est quil y a slection sur cet allle. Mais ce nest pas ncessairement le cas. Il est possible
que cet allle soit statistiquement li (auto-stop, hitch hikking) un allle de rsistance la chaleur.
On appelle haplotype un gnotype haplode pour plus dun locus. On considre des haplotypes 2 loci.
B : p
2
b : q
2
Total
A : p
1
A, B : p
1
p
2
A, b : p
1
q
2
A, B & A, b : f
A
= p
1
(p
2
+q
2
) = p
1
a : q
1
a, B : q
1
p
2
a, b : q
1
q
2
a, B & a, b : f
a
= q
1
(p
2
+q
2
) = q
1
Total a, B & A, B : f
B
= p
2
(q
1
+p
1
) = p
2
A, b & a, b : q
2
(p
1
+q
1
) = q
2
p
1
p
2
+p
1
q
2
+q
1
p
2
+q
1
q
2
= 1
Les frquences des haplotypes calcules sont celles que lon attend si les deux loci sont indpendants. Pour
rendre compte de lcart cette situation idale, on ajoute le terme D appel "dsquilibre gamtique", ou ds-
quilibre de liaison de langlais linkage desequilibrium. Il sagit de lcart entre les frquences observes et les
frquences thoriques.
B : p
2
b : q
2
Total
A : p
1
A, B : p
1
p
2
+D A, b : p
1
q
2
D A, B & A, b : f
A
= p
1
(p
2
+q
2
) = p
1
a : q
1
a, B : q
1
p
2
D a, b : q
1
q
2
+D a, B & a, b : f
a
= q
1
(p
2
+q
2
) = q
1
Total a, B & A, B : f
B
= p
2
(q
1
+p
1
) = p
2
A, b & a, b : q
2
(p
1
+q
1
) = q
2
p
1
p
2
+p
1
q
2
+q
1
p
2
+q
1
q
2
= 1
On remarque que le dsquilibre de liaison est indtectable si on ne sintresse qu des gnotypes (un seul
locus). Sous lhypothse de panmixie :
P(AB) = p
1
p
2
+D
Or
P

(AB) = P(obtenir AB sans recombinaison) +P(obtenir AB avec recombinaison)


Comme on a panmixie, on peut crire :
P(obtenir AB sans recombinaison) = (1 r)P(AB)
4 LA THORIE NEUTRALISTE DE LVOLUTION 28
o r
_
0;
1
2

est le taux de recombinaison


11
; par ailleurs la recombinaison brise la liaison physique entre les
deux loci, qui se comportent alors comme sils taient indpendants :
P(obtenir AB avec recombinaison) = rp
1
p
2
Do
P

(AB) = (1 r)P(AB) +rp


1
p
2
On a alors :
P

(AB) = p
1
p
2
+D

= (1 r) [p
1
p
2
+D] +rp
1
p
2
= p
1
p
2
+ (1 r)D
Do
D

= (1 r)D
et donc
D
t
= (1 r)
t
D
0
La recombinaison tend faire disparatre le dsquilibre gamtique au cours des gnrations.
4.7.2 Effet Hill-Robertson
On appelle effet Hill-Robertson ([6]) la rduction globale de lefcacit de la slection lorsque celle-ci sap-
plique sur plus dun locus. Considrons une population diplode et intressons nous deux loci sur le mme
chromosome, nots et . Initialement, toute la population prsente les mmes allles ces loci ; nous noterons
respectivement a et b ces allles. Supposons quapparaisse, par mutation, un allle A au locus confrant un
avantage slectif son porteur. Cet allle doit augmenter en frquence jusqu se xer. Supposons maintenant
quapparaisse chez un autre individu un allle B confrant son porteur un avantage slectif comparable
celui apport par A. Il va alors y avoir comptition entre les deux allles pour la xation : il y a interfrence
de Hill-Robertson entre les deux allles, et on peut montrer que cela a pour consquence daugmenter le temps
moyen de xation.
Dans le mme ordre dide, des allles neutres ou lgrement dltres peuvent voir leur frquence augmenter
par dsquilibre de liaison avec un allle positivement slectionn.
De manire gnrale, leffet Hill-Robertson dcrit comment lexistence dun dsquilibre gamtique
entre des sites soumis la slection va rduire lefcacit globale de la slection dans une popula-
tion de taille nie.
La recombinaison (et donc par extension la sexualit) permet dviter linterfrence de Hill-Robertson
en brisant la liaison entre les loci.
Raisonnons maintenant sur 3 loci. Il y a 2
3
= 8 haplotypes possibles et
_
3
2
_
= 3 dsquilibres dordre 1
possibles. Mais apparait galement une ventuelle interaction entre les 3 loci, que nous appellerons dsquilibre
de liaison dordre 2 (ddl 2).
11. Considrons un ensemble de n cellules germinales, une seule paire de chromosomes, entrant en prophase I de miose.
Il y a donc en tout 2n chromosomes et donc n vnements de recombinaison au maximum (dans chaque cellule, 0 ou 1 recom-
binaison possible). Les n cellules germinales donnent 4n gamtes parmi lesquels jusqu 2n portent un chromosome recombin ;
r =
Nombre de gamtes recombins
Nombre total de gamtes

2n
4n
=
1
2
: r [0; 0, 5].
5 CONSANGUINIT ET F-STATISTIQUES 29
Loci biallliques Haplotypes Somme Proportions p
i
ddl 1 ddl 2 ... ddl n 1
1 2 1 1 0 0 ... 0
2 4 1 2 1 0 ... 0
3 8 1 3 3 1 ... 0
... ... 1 ... ... ... ... 0
n 2
n
1 n
_
n
2
_ _
n
3
_
...
_
n
n 1
_
Les interactions dordre lev sinterprtent comme autant de degrs de libert inaccessibles par la simple
connaissance des haplotypes. Linformation disponible est trop faible et cest une des limites de la gntique des
populations.
4.7.3 Cration de dsquilibre de liaison
Du dsquilibre de liaison peut apparatre lors dun balayage slectif (selective sweep) ; il sagit dune limina-
tion du polymorphisme (coup de balai) proximit dun locus soumis la slection positive ; ceci est illustr la
gure 8.
FIGURE 8 Balayage slectif
La drive peut galement crer du dsquilibre, par exemple si la population passe par un goulot dtranglement
dmographique rduisant la variabilit et ne conservant, de manire purement alatoire, quune association
alllique parmi plusieurs existant avant la baisse deffectif.
5 Consanguinit et F-statistiques
Un individu est dit consanguin sil est issu de la reproduction de deux individus apparents. A cause de la taille
nie des populations naturelles, il existe une consanguinit diffuse, puisque tous les individus dune espce sont
apparents. Pour illustrer cela, calculons le nombre danctres thorique dun humain du XX sicle :
Un humain a deux anctres de premire gnration, ses parents ; quatre anctres de seconde gnration, ses
grands-parents ; et donc thoriquement 2
n
anctres de n-ime gnration. Une gnration humaine dure de
lordre de 30 ans. Quel est le nombre danctres de notre ami lpoque de Charlemagnes, cest--dire vers 800 ?
5 CONSANGUINIT ET F-STATISTIQUES 30
1200 ans correspondent environ 40 gnrations, donc on sattend trouver 2
40
anctres cette poque, soit
environ 10
12
personnes (ce qui est dj prs de 100 1000 fois plus que la population humaine actuelle). La
population humaine lpoque tait de quelques millions dindividus. Ceci dmontre que chaque humain est
consanguin; on parle de consanguinit diffuse.
5.1 Rgimes de reproduction et consanguinit
Une population diplode panmictique lquilibre de Hardy-Weinberg nest pas consanguine. La consanguinit
provient de la taille nie des populations (voir le calcul du nombre danctres, celui-ci augmentant exponentiel-
lement mesure que lon remonte les gnrations) et de la ralisation de rgimes de reproduction favorisant la
reproduction entre apparents.
5.1.1 Autofcondation complte
On considre une espce de plantes se reproduisant par autofcondation. Pour un locus bialllique donn, pr-
sentant les variants A et a, on appelle D(t) la proportion dhomozygotes AA la gnration t, H(t) la proportion
dhtrozygotes et R(t) la proportion dhomozygotes aa. On a bien sr D(t) +H(t) +R(t) = 1.
Lautofcondation complte conduit :
_

_
D(t + 1) = D(t) +
1
4
H(t)
H(t + 1) =
1
2
H(t)
R(t + 1) = R(t) +
1
4
H(t)
Ce systme conduit donc une disparition des htrozygotes ; D tend vers p, la frquence de A dans la popula-
tion, et R vers q, frquence de a.
5.1.2 Autofcondation partielle
Supposons maintenant que lespce tudie se reproduise par autofcondation avec un taux s et par allofcon-
dation panmictique avec un taux 1 s .
Lautofcondation va avoir pour consquence un dcit en htrozygotes (par rapport ce qui est attendu sous la
distribution de Hardy-Weinberg). On pose :
H
obs
= 2pq(1 F
IS
) et H
expected
= H
e
= 2pq
o p est la frquence de lallle A et q la frquence de a. On modie les quations prcdentes en ajoutant les
termes correspondant lallofcondation panmictique :
_

_
D(t + 1) = sD(t) +
1
4
sH(t) + (1 s)p
2
(t)
H(t + 1) =
1
2
sH(t) + 2pq(1 s)
R(t + 1) = sR(t) +
1
4
sH(t) + (1 s)q
2
(t)
Quelle est la relation entre F
IS
et s ?
A lquilibre on a :
H
obs
=
s
2
H
obs
+ 2pq(1 s)
5 CONSANGUINIT ET F-STATISTIQUES 31
H
obs
_
1
s
2
_
= 2pq(1 s)
Do
H
obs
= 2pq
1 s
1
s
2
2pq [1 F
IS
]
Do on tire aprs quelques calculs
F
IS
=
s
2 s
Si s = 0, on a F
IS
= 0 et on est en panmixie ; si s = 1 alors F
IS
= 1 et on a autofcondation complte. F
IS
mesure
lcart la panmixie de la population : plus il est proche de 1 plus la population est consanguine.
5.2 Consanguinit et drive
La drive peut sinterprter en termes de consanguinit. Reprenons le modle de Wright-Fisher : on a un pool
alllique de 2N gnes.
Soit f
t
le coefcient de consanguinit moyen. f
t
est la probabilit que deux gnes tirs au hasard la gnration
t soient des copies dun mme gne anctre. La probabilit que deux gnes tirs au hasard soient des copies
du mme gne la gnration prcdente est p =
1
2N
comme nous lavons vu au 4.2.2. La probabilit que deux
gnes qui se sont pas des copies du mme gne de la gnration prcdente soient nanmoins des copies du
mme gne anctre est, par dnition, f
t1
. La probabilit de tirer au hasard deux gnes qui ne sont pas des
copies du mme gne la gnration prcdente est 1 p = 1
1
2N
ce qui permet dcrire :
f
t
=
1
2N
+
_
1
1
2N
_
f
t1
Lanalyse de cette relation de rcurrence se fait plus aisment si on considre la probabilit complmentaire
H
t
= 1 f
t
. En effet :
f
t
=
1
2N
+
_
1
1
2N
_
f
t1
=
1
2N
+f
t1

1
2N
f
t1
= f
t1
+
1
2N
[1 f
t1
] = 1 1 +f
t1
+
1
2N
[1 f
t1
]
f
t
1 = f
t1
1
1
2N
[f
t1
1] =
_
1
1
2N
_
(f
t1
1)
Soit :
H
t
= 1 f
t
=
_
1
1
2N
_
(1 f
t1
)
H
t
est la probabilit que deux gnes tirs au hasard la gnration t ne soient pas copies dun mme gne
anctre ; cest donc la probabilit de tirer un individu htrozygote. H
t
sidentie lhtrozygotie de la
population. On a :
H
t
=
_
1
1
2N
_
t
H
0
= H
0
e
tln[1
1
2N
]
H
0
e

t
2N
La drive conduit une dcroissance exponentielle de lhtrozygotie. La taille nie dune popu-
lation implique la consanguinit. La drive entrane une homognisation intra-population et une
diffrenciation inter-population.
5 CONSANGUINIT ET F-STATISTIQUES 32
Prise en compte de la mutation
On suppose maintenant qu chaque gnration une proportion u des allles mute en un nouvel allle
12
. Pour
que deux gnes tirs au hasard soient des copies du mme gne anctre, il faut alors en plus quaucun des deux
naie mut ; on corrige alors f
t
comme suit :
f
t
= (1 u)
2

_
1
2N
+
_
1
1
2N
_
f
t1
_
On peut alors caractriser lquilibre mutation-drive :
A lquilibre :

f = (1 u)
2

_
1
2N
+
_
1
1
2N
_

f
_
=
(1 u)
2
2N
+ (1 u)
2

f
(1 u)
2
2N

f
_
1 (1 u)
2
+
(1 u)
2
2N
_
=
(1 u)
2
2N
On fait alors les approximations suivantes : (1 u)
2
1 2u et
u
N
0, ce qui se justie car on considre u trs
faible et N trs grand. On a donc :

f
_
2u +
1
2N
_

1
2N
soit

f
1
2N
2u +
1
2N
ce qui se rcrit :

f
1
4Nu + 1

1
+ 1
On retrouve le paramtre mutationnel dni au 5.2. On voit que si est lev,

f est proche de 0 : la population
est gntiquement htrogne.
Lhtrozygotie lquilibre est alors :

H

1 +
Les mutations sopposent leffet homognisant intra-population de la drive gntique. Lorsque
lon tudie la drive sous langle de la consanguinit, le paramtre = 4Nu apparat naturellement
comme mesure de lhtrognit de la population.
5.3 Les F-statistiques, indicateurs de proximit gntique
La grandeur F
IS
introduite prcdemment est un exemple de F-statistique ([7]). Les F-statistiques sont des
indicateurs proposs par Wright pour mesurer lhtrognit gntique intra - et/ou inter - populations.
On considre une mtapopulation compose de plusieurs sous-populations, indices par i, de la mme espce.
On sintresse un locus bialllique prsentant les variants A et a. On note p
i
(respectivement q
i
) la frquence
de lallle A (respectivement a) dans la sous-population i . On note p (respectivement q) la frquence de A
(respectivement a) dans la mtapopulation. On appelle :
12. Cela suppose implicitement une innit de mutations possibles ; cest ce quon appelle un modle innit de sites.
5 CONSANGUINIT ET F-STATISTIQUES 33
FIGURE 9 Mlange de deux sous-populations
H
I
lhtrozygotie moyenne observe au sein dune sous-population (note H
obs
dans nos prcdents calculs).
H
S
lhtrozygotie moyenne attendue au sein dune sous-population si celle-ci est panmictique (note H
exp
dans nos prcdents calculs). On a H
S
= 2p
i
q
i
.
H
T
lhtrozygotie moyenne attendue dans la mtapopulation : H
T
= 2 p q
On peut alors dnir trois F-statistiques hirarchiques :
1. F
IS
=
H
S
H
I
H
S
= 1
H
I
H
S
mesure lhtrognit gntique (ou lcart la panmixie, donc la consangui-
nit) entre deux individus au sein dune sous-population.
2. F
ST
=
H
T
H
S
H
T
= 1
H
S
H
T
mesure la diffrence gntique entre une sous-population et la mtapopulation,
donc le degr de diffrenciation entre les diffrentes sous-populations dune mtapopulation.
3. F
IT
=
H
T
H
I
H
T
= 1
H
I
H
T
mesure lhtrognit gntique entre deux individus de la mtapopulation.
Les trois indicateurs sont relis par la formule (1 F
IT
) = (1 F
IS
) (1 F
ST
) .
5.4 Leffet Wahlund
Supposons que deux populations de taille N prsentant les gnotypes A et a en frquences respectives (p
1
, q
1
) et
(p
2
, q
2
) se mlangent (gure 9).
Supposons que chaque population suive la distribution de Hardy-Weinberg. On a alors :
_
_
_
H
I,1
= H
S,1
= H
1
= 2p
1
q
1
H
I,2
= H
S,2
= H
2
= 2p
2
q
2
Aprs mlange des deux sous-populations :
H
S
=
H
1
+H
2
2
Et, par dnition :
H
T
= 2 p q = 2 p(1 p)
On a H = 2p(1 p) = 2p 2p
2
: la courbe reprsentative est une parabole concave. Cela a ncessairement pour
consquence que H
S
< H
T
(illustr sur la gure 10 ). Cest ce que lon appelle leffet Wahlund.
Leffet Wahlund est une rduction de lhtrozygotie de la mtapopulation cause par sa structura-
tion en sous-populations, mme si ces dernires suivent la distribution de Hardy-Weinberg.
On a donc
F
ST
= 1
H
S
H
T
> 0
5 CONSANGUINIT ET F-STATISTIQUES 34
FIGURE 10 Leffet Wahlund
Nous avons suppos la panmixie dans les deux sous-populations avant mlange. Cette hypothse permet duti-
liser largument de la parabole concave pour mettre en vidence leffet Wahlund, cependant leffet Wahlund est
possible mme si les sous-populations avant mlange ne sont pas panmictiques.
5.5 F
ST
et migration
5.5.1 Modle en les de Wright
Pour tudier les effets de la migration sur la diffrenciation gntique entre sous-populations, plaons-nous
dans le modle en les de Wright. Les hypothses en sont les suivantes :
n les, chacune abritant une sous-population de taille N, la mtapopulation a donc pour effectif Nn.
Chacune des sous-populations est panmictique.
Les migrations sont alatoires ; les migrants forment un pool dont la composition gntique est gale la
composition gntique moyenne de la mtapopulation (Figure 11).
Le taux de migration par gnration est m, le taux de mutation par gnration est u.
Par panmixie dans une sous-population, H
I
= H
S
= H. On va de plus faire lhypothse dun nombre inni
de sous-populations (n +). Par consquent la probabilit de tirer un homozygote dans la mtapopulation
devient nulle : H
T
= 1. On value maintenant la consanguinit au sein dune sous-population. On reprend en
fait le mme raisonnement quau 5.2 : pour tirer deux gnes identiques, il faut dune part quaucun des deux
naie mut, dautre part quaucun des deux ne soit issu de limmigration. Do :
1 H

= f

= (1 u)
2
(1 m)
2
_
1
2N
+
_
1
1
2N
_
f
_
f

(1 2u)(1 2m)
_
1
2N
+
_
1
1
2N
_
f
_
On nglige tous les termes en u
2
, m
2
, um,
u
N
,
m
N
. On en tire :
f


1
2N
+
_
1 2u 2m
1
2N
_
f
5 CONSANGUINIT ET F-STATISTIQUES 35
FIGURE 11 Modle en les de Wright (schma daprs F. Austerlitz)
A lquilibre :

f
1
2N
2u + 2m+
1
2N
=
1
4Nm+ 4Nu + 1
Par ailleurs, on a
F
ST
= 1
H
S
H
T
= 1

H par hypothse.
F
ST

1
4Nm+ 4Nu + 1
En gnral, on a u m et donc :
F
ST

1
4Nm+ 1
Cette formule tablie par Wright permet, par mesure de F
ST
, de dterminer Nm (et donc de remonter au taux
de migration si on dispose de la taille de la population).
Supposons que seul un individu migre par gnration (Nm = 1). On aura alors F
ST
= 0, 2 ; un faible taux de
migrants est sufsant pour empcher la diffrenciation des populations (qui correspondrait F
ST
= 1) : la
migration est une force volutive homognisante, comme on lavait envisag au 1.4.
F
ST
diminue avec N ; les populations de petites tailles tendent se diffrencier sous leffet de la drive gntique.
La formule doit cependant tre considre avec prcautions, cause des hypothses assez fortes du modle. En
particulier, ce modle ne tient aucun compte de la gographie, ce qui nest pas du tout raliste. Il existe dautres
modles prenant en compte une gographie simplie (comme les modles stepping-stone) mais leur analyse est
plus complexe.
5 CONSANGUINIT ET F-STATISTIQUES 36
5.5.2 Gnralisation aux diffrents types dhrdit
Le mode de transmission dun gne est diffrent selon quil est port par un autosome, un chromosome sexuel
ou un chromosome dorganite (mitochondrie ou chloroplaste).
A titre dexemple, on a :
F
(ADNmt)
ST

1
2N
f
m
f
+ 1
et
F
(Y )
ST

1
2N
m
m
m
+ 1
Dans lespce humaine, on trouve gnralement, au sein dune mme population, un F
ST
plus fort pour le chro-
mosome Y que lADN mitochondrial, indiquant un taux de migration des femmes plus important. Cela est reli
au fait que la patrilocalit est gnralement la rgle en cas de mariage entre sous-populations (patrilocalit : la
femme rejoint le foyer de son nouveau mari).
Cas des plantes Chez les plantes il y a deux possibilits de migration, par les graines (taux m
S
) et par le
pollen (taux m
P
). On a alors :
Gne nuclaire : F
(n)
ST
=
1
4N(m
S
+
m
P
2
)
Gne cytoplasmique hrdit maternelle : F
(m)
ST
=
1
1 + 2Nm
S
Gne cytoplasmique hrdit paternelle : F
(f)
ST
=
1
1 + 2N(m
S
+m
P
)
La mesure des F
ST
permet ainsi de calculer le ratio de migration pollen/graine.
Conclusion
La gntique des populations a un statut part au sein de la biologie car il sagit dune discipline reposant sur
un formalisme mathmatique plus dvelopp que la majorit des autres domaines des sciences de la Vie. Elle
fournit le cadre thorique ncessaire une formalisation de la thorie de lvolution et une interprtation des
donnes de la gntique quantitative. Nous avons vu comment dcrire les diffrentes pressions volutives, et es-
quiss les raisonnements la base des approches modernes de la drive gntique. Par dnition, linuence de
la drive sur la composition gntique dune population est dautant plus faible que cette dernire est grande. La
grande taille des populations naturelles peut donc laisser penser que la drive est une force volutive dintensit
ngligeable ds lors que lon considre par exemple des espces entires.
On peut nanmoins remarquer que, du point de vue volutif, les seuls individus dont il faut tenir compte sont
ceux qui se reproduisent effectivement. La grandeur dmographique sur laquelle raisonner devrait donc plutt
tre le nombre dindividus qui se reproduisent (breeding population size). Cependant, ce nombre ne prend pas
forcment en compte tous les facteurs pouvant inuencer la composition de la population la gnration sui-
vante (par exemple, le sex-ratio au sein de la population reproductrice). Cest pour cela que les biologistes de
lvolution ont labor le concept de taille efcace de population (effective population size).
On appelle taille de population efcace N
e
dune population de taille totale N leffectif dune population idalise
(i.e. suivant le modle de Wright-Fisher) qui prsenterait la mme quantit de drive, ce qui peut admettre
plusieurs dnitions : mme coefcient de consanguinit, mme variance des frquences allliques...
5 CONSANGUINIT ET F-STATISTIQUES 37
Cela revient, de manire gnrale, dnir la taille de population efcace comme linverse de la probabilit que
deux individus pris au hasard dans la population soient issus du mme anctre la gnration prcdente. Cette
probabilit vaut
1
2N
dans une population diplode suivant le modle de Wright-Fisher.
Selon les facteurs pris en compte, lexpression servant dterminer N
e
change. Nous en donnerons deux
exemples.
Taille de population efcace et sex-ratio
Considrons une population de taille totale N subdivise en N
m
mles et N
f
femelles. Etablissons lexpression
de la taille de population efcace. Si deux allles tirs au hasard proviennent du mme anctre la gnration
prcdente, ils proviennent soit du mme mle, soit de la mme femelle. Do :
1
N
e
=
1
2

1
2

1
N
2
m
N
m
+
1
2

1
2

1
N
2
f
N
f
1
N
e
=
1
4N
m
+
1
4N
f
=
4N
m
N
f
N
f
+N
m
On remarque alors quun sex-ratio fortement loign de 1 fait chuter la taille de population efcace. Pour le cas
extrme dun seul mle au sein de la population
13
, la taille efcace ne peut pas dpasser 4 quel que soit leffectif
rel.
Variations dmographiques
Pour tudier linuence de variations dmographiques, adoptons une dnition de la taille efcace en termes de
perte dhtrozygotie (lhtrozygotie est dnie au 5.2) : la taille efcace de la population est leffectif dune po-
pulation idale de taille constante suivant le modle de Wright-Fisher subissant la mme perte dhtrozygotie
en t gnrations. Notons N
i
leffectif rel la i-me gnration. On a alors, pour N
i
1 i :
H
t
H
0
=
t1

i=0
_
1
1
2N
i
_

_
1
1
2N
e
_
t
1
1
2N
e
=
t1

i=0
_
1
1
2N
i
_1
t

t1

i=0
_
1
1
2N
i
t
_
1
t1

i=0
1
2N
i
t
1
2N
e

1
t
t1

i=0
1
2N
i
La grandeur pertinente est donc la moyenne harmonique des effectifs au cours du temps. Donc si la population
passe par une phase de rduction deffectif (un bottleneck), aprs une pidmie par exemple, ou la colonisation
dun nouvel habitat par un petit groupe dindividus, la taille efcace de population sera faible. On estime que
la taille efcace de la population humaine est de lordre de 10 000 individus, bien loin des 7 milliards dtres
humains peuplant (tout juste !) la Terre la date o nous crivons.
13. Par exemple si je fais fconder toutes mes vaches par le mme taureau.
RFRENCES 38
La notion de taille de population efcace montre que la drive peut avoir un impact signicatif
sur la variation de la composition gntique de grandes populations. En effet, des allles lgre-
ment dltres peuvent alors prsenter une probabilit de xation trs voisine de celle dun allle
neutre (on parle de neutralit effective). Selon certains auteurs, de tels phnomnes seraient alors
lorigine de la complexit des rseaux gntiques observs chez les Eucaryotes ([1], [13]).
Rfrences
[1] The Origins of Genome Architecture, Michael Lynch, 2007, Sinauer Associates.
[2] Phenylketonuria - a problem in eugenics, Roger Penrose, 1946, Ann. Hum. Genet.
[3] On the Probability of Fixation of Mutant Genes in a Population, Motoo Kimura, 1962, Genetics.
[4] La Thorie de lvolution, une Logique pour la Biologie, Patrice David et Sarah Samadi, 2006
(seconde dition), ditions Flammarion - Collection Champs Universit.
[5] La Triple Hlice, Richard C. Lewontin, 2000, ditions Seuil - Collection Science Ouverte.
[6] The HillRobertson effect : evolutionary consequences of weak selection and linkage in nite popu-
lations, J.M. Comeron, A. Williford & R.M. Kliman, 2008, Heredity.
[7] Un document en ligne sur les F-statistics : http ://www.library.auckland.ac.nz/subject-
guides/bio/pdfs/733Pop-g-stats2.pdf
[8] Modlisation Mathmatique en cologie, P. Auger, C. Lett, J.C. Poggiale, 2010, Dunod / IRD di-
tions.
[9] Genetics of Populations, P.W. Hedrick, 2011, Jones & Bartlett Learning.
[10] Population Genetics, a concise guide, J.H. Gillespie, 1998, The Johns Hopkins University Press.
[11] Gntique statistique, S. Morgenthaler, 2008, Springer.
[12] Computational Molecular Evolution, Z. Yang, 2006, Oxford Series in Ecology and Evolution.
[13] Non-adaptive Origins Of Interactome Complexity, A. Fernandez & M. Lynch, 2011, Nature.
Enseignants
Le prsent cours est bas sur les interventions des enseignants suivants que nous remercions chaleureusement :
F. Austerlitz E. Baudry
R. Chaix F. Depaulis
C. Dillmann J. Fivet
P.H. Gouyon E. Heyer
M. Lssig D. Manicacci
L. Schibler D. de Vienne
Toute erreur, imprcision ou autre serait bien entendu de notre fait exclusif...
Ce matin (23/10/11, date de sortie de la premire version) le XV de France nest pas pass loin dune victoire face aux All Blacks en nale
de la Coupe du Monde de Rugby. Cest triste. Je tenais le prciser.

Вам также может понравиться