Вы находитесь на странице: 1из 20

Cristallographie

des macromolécules biologiques

par Jean CAVARELLI


Professeur de Biologie structurale, université Louis-Pasteur, Strasbourg

1. Présentation générale............................................................................. P 1 090 - 2


2. Purification de la macromolécule ....................................................... — 3
3. Cristallisation............................................................................................ — 4
4. Enregistrement des données de diffraction ..................................... — 5
4.1 Source de rayons X ..................................................................................... — 5
4.2 Détecteur ...................................................................................................... — 6
4.3 Méthodes d’enregistrement ....................................................................... — 7
4.4 Cryocristallographie .................................................................................... — 9
5. Méthode de la série isomorphe............................................................ — 9
5.1 Détermination des phases. Cas idéal......................................................... — 9
5.2 Détermination des phases. Cas réel........................................................... — 10
5.3 Obtention des dérivés lourds ..................................................................... — 11
5.4 Détermination de la position des atomes lourds...................................... — 11
6. Utilisation de la diffusion anomale .................................................... — 11
6.1 Travail à une seule longueur d’onde.......................................................... — 12
6.2 Travail à plusieurs longueurs d’ondes....................................................... — 12
6.3 Incorporation des diffuseurs anomaux...................................................... — 13
6.4 Perspectives ................................................................................................. — 13
7. Remplacement moléculaire................................................................... — 14
8. Cartes de densité électronique ............................................................ — 15
8.1 Amélioration par des méthodes de modification de densité................... — 15
8.2 Extension des phases.................................................................................. — 16
8.3 Construction de la structure ....................................................................... — 17
9. Affinement d’une structure cristallographique............................... — 17
9.1 Méthodes de moindres carrés.................................................................... — 18
9.2 Méthodes de la dynamique moléculaire ................................................... — 18
9.3 Maximum de vraisemblance ...................................................................... — 19
9.4 Cartes de densité électronique ................................................................... — 19
9.5 Particularités des macromolécules biologiques ....................................... — 19
10. Base de données PDB ............................................................................ — 20
11. Perspectives .............................................................................................. — 20
Pour en savoir plus ........................................................................................... Doc. P 1 090

es molécules biologiques responsables de toute vie cellulaire sont des hété-


L ropolymères de très grande taille appartenant à deux familles : les protéines
et les acides nucléiques. Les processus biologiques compliqués sont les résul-
tats d’interactions dynamiques soit de macromolécules biologiques entre elles,
soit de macromolécules avec de petits substrats cellulaires. La compréhension

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Analyse et Caractérisation P 1 090 − 1
CRISTALLOGRAPHIE DES MACROMOLÉCULES BIOLOGIQUES ___________________________________________________________________________________

de ces mécanismes nécessite en premier lieu la connaissance des structures tri-


dimensionnelles de ces macromolécules soit seules, soit engagées dans des
complexes spécifiques. La connaissance de ces structures est l’un des piliers
actuels de la biologie moléculaire et représente une source de progrès qui
génère des retombées non seulement en recherche fondamentale mais aussi en
recherche appliquée (médicale, agroalimentaire). Cela justifie les investisse-
ments importants réalisés depuis plusieurs années dans les secteurs publics et
privés. La diffraction des rayons X par des monocristaux est la méthode par
excellence pour l’étude des macromolécules biologiques. La cristallographie a
permis la détermination des structures tridimensionnelles de plusieurs milliers
de macromolécules biologiques dans des gammes de taille et de complexité très
variées : petites protéines, oligonucléotides, acides ribonucléiques de transfert,
immunoglobulines complexes multienzymatiques, complexes nucléoproté-
iques, virus d’insectes, de plantes ou de mammifères. Les propriétés physico-
chimiques intrinsèques des macromolécules biologiques donnent naissance à
des cristaux avec de grands paramètres de maille cristalline et un pouvoir de dif-
fraction en général limité en comparaison du standard actuel des petites molé-
cules organiques. Cela impose des méthodes et des techniques adaptées tout au
long du processus cristallographique. Cette méthodologie propre aux macromo-
lécules biologiques va être présentée dans cet article. L’explosion actuelle de
cette méthode est due aux progrès réalisés tant au niveau de la technologie (bio-
logie moléculaire, sources de rayons X, détecteurs de rayons X, supercalcula-
teurs puissants) qu’au niveau des logiciels de traitement des données de
diffraction (collecte, phasage, affinement). Cela se traduit par un raccourcisse-
ment extraordinaire du délai séparant l’obtention d’un premier cristal et la déter-
mination de la structure cristalline. Une étude cristallographique peut
maintenant être conduite en quelques mois après l’obtention des premiers cris-
taux.

La lecture de cet article suppose une bonne connaissance de la cristallographie géométrique


et une première initiation à la théorie de la diffraction des rayons X par des monocristaux. Le
lecteur pourra se référer aux articles de A. Authier « Cristallographie géométrique » dans le
traité de Sciences Fondamentales [1] et de Y. Jeannin « Résolution d’une structure cristalline par
rayons X » dans ce traité Analyse et Caractérisation [3].

1. Présentation générale Deux méthodes sont actuellement utilisées pour déterminer les
structures tridimensionnelles des macromolécules biologiques : la
diffraction des rayons X et la résonance magnétique nucléaire
(RMN). Plus de 80 % des structures connues à ce jour ont été déter-
Les acides nucléiques sont des polynucléotides qui utilisent un minées (on dit résolues) par diffraction des rayons X. Contrairement
alphabet de 4 bases, dont l’unité monomérique contient un sucre à la RMN, la cristallographie ne souffre pas de limitations en taille
furanose, un groupement phosphate et une base hétérocyclique de la macromolécule étudiée et ne présente qu’une seule barrière :
[soit purique (2 possibilités) soit pyrimidique (2 possibilités)]. On être capable d’obtenir des cristaux de la macromolécule étudiée. La
distingue deux grandes familles d’acide nucléique, celle de l’ADN diffraction des rayons X par un cristal permet de calculer la densité
(acide désoxyribonucléique) et celle de l’ARN (acide ribonucléique). électronique ρ (x, y, z ) en un point de coordonnées relatives (x, y, z )
Dans un ADN, le sucre est un 2’-désoxy-β-D ribose et les deux bases de la maille cristalline par la relation :
puriques sont l’adénine (A), la guanine (G), alors que les deux bases
pyrimidiques sont la thymine (T) et la cytosine (C). Dans les ARN, le
+∞ +∞ +∞
sucre est un β-D ribose et la thymine est remplacée par l’uracile. Les 1
protéines sont des polymères construits avec une bibliothèque de ρ ( x , y , z ) = ----
V
∑ ∑ ∑ F hkl exp [ – 2iπ ( hx + ky + lz ) ] (1)
20 acides aminés qui ont chacun des propriétés physico-chimiques h = –∞ k = –∞ l = –∞
originales. La vie d’une cellule est le résultat d’associations dynami-
ques entre ces macromolécules biologiques, et la fonction biologi- avec Fhkl facteur de structure pour la réflexion hkl
que d’une macromolécule donnée ne dépend que de sa structure (h, k, l indices de Miller),
dans l’espace (structure tridimensionnelle). La connaissance des
structures tridimensionnelles est dont une condition nécessaire à V volume de la maille cristalline.
une compréhension de leurs fonctions. Connaître une structure, ce
n’est pas uniquement la décrire mais c’est essayer de répondre à Le facteur de structure, nombre complexe, s’écrit :
certaines questions de manière à expliquer et à prévoir :
— expliquer, c’est pouvoir décrire le fonctionnement d’une molé- F hkl = F hkl exp ( i φ hkl ) (2)
cule, les rapports entre la structure et la fonction, les mécanismes
par lesquels elle interagit avec d’autres partenaires ;
— prévoir, c’est prédire l’affinité d’une molécule pour une autre où F hkl est le module et φhkl la phase du facteur de structure pour
ou prédire l’effet possible de mutations de la séquence. la réflexion hkl.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
P 1 090 − 2 © Techniques de l’Ingénieur, traité Analyse et Caractérisation
___________________________________________________________________________________ CRISTALLOGRAPHIE DES MACROMOLÉCULES BIOLOGIQUES

Le facteur de structure est relié à la nature et à la position des


N atomes présents dans la maille par la relation : Biologie moléculaire
Clonage, expression
de la macromolécule Interprétation
N biologique
sin 2 θ
F hkl = ∑ qj fjhkl exp – B j -------------- exp [ 2iπ ( hx j + ky j + lz j ) ]
λ2
(3)
j=1

avec f jhkl facteur de diffusion de l’atome j de coordonnées


relatives (xj , yj , zj), Purification

qj facteur d’occupation,

Bj facteur d’agitation thermique (isotrope). Structure atomique

Les facteurs qj , Bj traduisent le désordre de chaque atome (voir


paragraphe 9). La structure cristallographique va correspondre à Cristallisation
une double moyennation dans le temps et dans l’espace, la struc-
ture trouvée correspondant à la moyenne des structures présente Sources de rayons X Affinement cristallographique
dans la maille cristalline pendant le temps de l’expérience. Détecteurs Modification de densité
Collecte et intégration
des données
La détermination de la phase φhkl de chaque réflexion constitue
l’une des difficultés majeures de la cristallographie, car les ondes Données de diffraction
diffractées par un cristal ne peuvent être refocalisées et les phases Limite de résolution Carte de densité
des données électronique
sont perdues. Seules les amplitudes des ondes diffusées sont acces- Phasage des réflexions
sibles à l’expérience, un détecteur ne mesurant pour une réflexion Méthodes MIR, MAD
Remplacement moléculaire
donnée que l’intensité Ihkl de l’onde diffractée. Celle-ci est propor-
tionnelle au carré du module du facteur de structure : Figure 1 – Résolution de la structure d’une macromolécule
biologique par diffraction des rayons X. Vue schématique
I hkl ∝ ( F hkl ) 2 = F hkl F hkl
* (4) des différentes étapes

*
avec F hkl complexe conjugué de Fhkl .

Pour résoudre ce problème, les méthodes directes utilisées en 2. Purification


cristallographie de petites molécules (seulement quelques centai-
nes d’atomes) ne sont pas applicables. Ces méthodes directes utili-
de la macromolécule
sent des relations de contraintes entre facteurs de structure
(équation de Sayre, formule de la tangente) dont l’application
nécessite des données de diffraction à très haute résolution (de L’obtention de cristaux nécessite de disposer de plusieurs milli-
l’ordre de 1 Å, 1 Å = 10−10 m). La cristallographie biologique utilise grammes d’une macromolécule à l’état soluble et avec une très
trois grandes techniques pour déterminer les phases : le remplace- grande pureté. Les premières structures tridimensionnelles de
ment isomorphe, la diffusion anomale, le remplacement molécu- macromolécules correspondaient à des molécules qui pouvaient
laire. Les phases connues, il est alors possible de calculer une carte facilement être obtenues en grande quantité et qui cristallisaient
de densité électronique (équation (1))qui permet, selon la limite de relativement facilement. Aujourd’hui, on aborde une étude cristallo-
diffraction des données et l’exactitude des phases, de déterminer graphique d’une macromolécule pour résoudre un problème biolo-
une première structure de la molécule qui sera ensuite affinée. gique donné. La macromolécule cible peut être disponible en faible
quantité, voire être pratiquement insoluble. Néanmoins, la crois-
Nota : bien que l’angström ne soit plus une unité normalisée, il reste toujours très utilisé sance importante du nombre de structures tridimensionnelles réso-
en radiocristallographie : 1 angström (Å) = 0,1 nanomètre. lues vient de l’utilisation des techniques de la biologie moléculaire.
Dès que le gène correspondant à la protéine étudiée a pu être iden-
Dans cet article, nous allons décrire les étapes nécessaires à la tifié, il peut être cloné dans un vecteur d’expression et exprimé dans
détermination de la structure tridimensionnelle d’une macromolé- une cellule hôte procaryotique ou eucaryotique. Les systèmes de
cule biologique. On peut schématiquement décrire ce processus en surexpression les plus utilisés pour les études structurales sont la
six étapes : purification de la macromolécule, cristallisation, col- bactéries Escherichia coli, les cellules d’insectes associées à un vec-
lecte de données de diffraction, phasage, construction du modèle teur baculovirus, des cellules de mammifères et la levure. Le sys-
par interprétation des cartes de densité électronique, et finalement tème bactérien est le plus facile d’utilisation et permet dans de
affinement de la structure. La figure 1 présente une vue globale du nombreux cas un niveau élevé de surexpression. Néanmoins, ce
processus cristallographique. système présente deux inconvénients majeurs :
Pour le problème des phases, nous présenterons trois méthodes. — de nombreuses protéines eucaryotiques ne se replient pas cor-
Deux méthodes, le remplacement isomorphe multiple et la diffusion rectement et précipitent sous forme d’amas insolubles de protéines
anomale, ne font aucune hypothèse sur la structure tridimension- appelés corps d’inclusion ;
nelle recherchée. Une autre méthode, le remplacement moléculaire, — de nombreuses modifications post-traductionnelles spécifi-
suppose la connaissance d’une structure parente de la molécule ques aux systèmes d’origine eucaryotique ne sont pas effectuées.
étudiée. De par sa fonction et son but, la cristallographie des macro-
molécules biologiques se situe à l’interface de plusieurs domaines Dans de nombreux vecteurs d’expression, la protéine est fusion-
complémentaires comme la biologie, la chimie, la physique, et née soit avec une autre protéine particulière soit avec une queue
nécessite de bonnes connaissances de l’outil informatique et des peptidique, ce qui permet une première étape de purification par
mathématiques. Nous nous contenterons de présenter quelques colonne d’affinité. Par exemple, l’addition d’une queue polyhistidine
notions de base qui devraient permettre une compréhension des permet une première purification de la protéine sur une colonne
problèmes posés et la manière de les résoudre actuellement. d’affinité en présence d’ions nickel que chélate la séquence polyhis-

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Analyse et Caractérisation P 1 090 − 3
CRISTALLOGRAPHIE DES MACROMOLÉCULES BIOLOGIQUES ___________________________________________________________________________________

tidine. Un site de clivage à une protéase donnée permet ensuite Les techniques de la chimie analytique fine (diffusion de lumière,
l’obtention de la protéine seule. spectroscopie de masse, dichroïsme circulaire) sont maintenant
Les techniques de génie génétique permettent aussi d’apporter appliquées aux macromolécules pour contrôler leur état en solution
des modifications ponctuelles de la séquence de la protéine pou- (agrégation, hétérogénéité de population en masse ou en charge,
vant modifier à bon escient son comportement physicochimique. structures non repliées). Une modification des étapes de purifica-
De telles modifications sont parfois cruciales pour le succès du pro- tion, voire de clonage et de surexpression, est souvent nécessaire
jet. On peut classer ces modifications en plusieurs catégories en pour obtenir des cristaux de qualité suffisante pour une étude struc-
fonction du but recherché : turale.
— Amélioration de la solubilité de la protéine : une modification La plupart des méthodes de cristallisation utilisent un agent pré-
de certains acides aminés peut complètement modifier la solubilité cipitant pour diminuer la solubilité de la macromolécule. Les para-
et permettre ainsi l’étude structurale. Dans certains cas, une seule mètres que l’on va faire varier pour obtenir la formation d’un cristal
mutation ponctuelle peut changer de façon radicale la solubilité de sont nombreux et une telle étude est très gourmande en quantité de
la macromolécule. macromolécules. On peut citer, par exemple : le pH, la nature et la
— Renforcement des contacts cristallins : les contacts entre molé- concentration du tampon, la force ionique, la température, la con-
cules dans un cristal se font par des interactions entre acides aminés centration en macromolécule, la nature et la concentration de
exposés à la surface des protéines. La mutation d’acides aminés l’agent précipitant, la présence d’additifs. Quatre grandes catégo-
susceptibles d’être exposés en surface peut permettre de renforcer ries d’agents précipitants sont généralement utilisés :
les contacts cristallins et d’améliorer radicalement la qualité de dif- — les sels : parmi ceux-ci, le sulfate d’ammonium est incontesta-
fraction. blement le plus utilisé, pour sa grande efficacité à précipiter les pro-
— Détermination des phases : la mutagénèse dirigée permet téines et sa forte solubilité dans l’eau (3,9 M à 0 °C, 4,1 M à 25 °C) ;
aussi d’introduire si nécessaire des acides aminés susceptibles de — les polymères à longue chaîne et les polymères de bas poids
réagir avec des composés d’atomes lourds nécessaires pour le pro- moléculaires : le polyéthylène glycol (PEG) est le plus utilisé. Le PEG
cessus de détermination des phases. L’introduction de sélénium est un polymère que l’on peut trouver en différents poids moléculai-
dans les protéines, réalisée en remplaçant une méthionine par une res, habituellement de 400 à 20 000 ;
sélénométhionine permet d’utiliser la méthode de la diffusion ano- — les solvants organiques et les composés organiques non
male à plusieurs longueurs d’onde (méthode MAD, voir volatils : pour les protéines, à l’exception du méthyl-2,4-pentanediol
paragraphe 6.2). (MPD), les solvants organiques sont plutôt utilisés comme additifs à
De nombreuses protéines de grandes tailles sont composées de un autre agent précipitant. Les plus utilisés sont l’éthanol, l’acétone,
plusieurs domaines fonctionnels, chacun des domaines pouvant et les butanols. Ils doivent parfois être utilisés avec précaution en
avoir une structure et une fonction propres et indépendantes. Les raison de leurs capacités dénaturantes. Par contre, les solvants
techniques de la biologie moléculaire permettent alors de cloner un organiques ont été utilisés avec succès pour la cristallisation des
domaine spécifique afin d’étudier une fonction donnée. acides nucléiques (ARN de transfert, oligonucléotides). Ceci est dû,
d’une part, à la plus grande tolérance des polynucléotides pour ces
composés organiques, et, d’autre part, à leurs surfaces polyanioni-
ques qui sont plus sensibles que les protéines aux variations de
constante diélectrique.
3. Cristallisation Deux techniques de cristallisation sont principalement utilisées
en cristallographie biologique :
Bien que plusieurs centaines de macromolécules biologiques — la diffusion de vapeur : elle peut se faire par évaporation de
aient déjà été cristallisées, permettant ainsi de connaître leurs struc- solvant ou échange de solvant contre un réservoir plus concentré,
tures, la plupart des facteurs responsables de la cristallisation sont ou échange de solutés volatils ;
mal maîtrisés et il n’existe pas de règles directement applicables à — la diffusion de liquide : celle-ci est réalisée soit directement par
une nouvelle macromolécule. Pourtant, la cristallisation des macro- une interface liquide-liquide, soit à l’aide d’une membrane à dialyse
molécules biologiques est régie par les mêmes lois thermodynami- ou de gels.
ques que celles qui gouvernent la cristallisation des petites Nous ne présenterons que la méthode par diffusion de vapeur.
molécules organiques. L’obtention d’un cristal peut se décomposer Dans celle-ci, la sursaturation est atteinte par évaporation d’espèces
en quatre étapes successives ou simultanées : formation d’un état volatiles. Dans une enceinte fermée, on place sans les mettre en
de sursaturation, nucléation, croissance cristalline et cessation de contact, deux solutions :
croissance. Néanmoins, les macromolécules biologiques présen-
— une solution de faible volume (goutte de 5 µL à 25 µL) conte-
tent de nombreuses sources potentielles d’hétérogénéités qui peu-
nant la macromolécule, un agent précipitant et un tampon ;
vent nuire fortement à leur capacité de cristalliser. On peut citer par
exemple la présence : — une solution (de 0,5 mL à 2,5 mL de volume) contenant un
agent déhydratant. Ce compartiment se comporte alors comme un
— de molécules contaminantes, macromolécules ou petites réservoir au sens thermodynamique du terme. On l’appelera le
molécules étrangères qui n’ont pu être éliminées par les étapes de puits.
purification ;
— de microhétérogénéités de séquences ; Le rôle de l’agent précipitant est de diminuer la solubilité de la
macromolécule dans le petit volume (goutte). L’augmentation de la
— de variations génétiques et de dégradations telles que protéo-
concentration de la macromolécule et/ou de l’agent précipitant
lyse, modifications post-traductionnelles partielles ou hétérogènes
pourra conduire à la sursaturation de la macromolécule qui est
(glycosylation, phosphorylation, méthylation) ;
nécessaire à la nucléation et à la croissance cristalline. Une manière
— de microhétérogénéités conformationnelles : régions flexibles, d’augmenter la concentration de la macromolécule et/ou de l’agent
équilibres entre différentes formes oligomériques, agrégation, précipitant est de déhydrater la goutte. Le rôle de l’agent déhydra-
dénaturation. tant est de réduire la pression de vapeur d’eau au-dessus du réser-
De plus, les macromolécules peuvent subir des changements de voir. De même, l’agent cristallisant, le tampon (et la macromolécule)
conformation ou de charge en fonction de la température, du pH ou réduisent la pression de vapeur d’eau au-dessus de la goutte. Les
de l’état de solvatation. Elles sont très sensibles à l’environnement deux solutions ayant des pressions partielles différentes, les espè-
et peuvent facilement se dégrader ou se dénaturer. Il est donc ces volatiles (eau, alcool...) vont diffuser jusqu’à l’équilibre thermo-
nécessaire de maintenir un état d’hydratation, des conditions de pH dynamique. Si la pression de vapeur d’eau au-dessus du réservoir
et de température physiologiques. est initialement inférieure à celle au-dessus de la goutte, il y aura

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
P 1 090 − 4 © Techniques de l’Ingénieur, traité Analyse et Caractérisation
___________________________________________________________________________________ CRISTALLOGRAPHIE DES MACROMOLÉCULES BIOLOGIQUES

transfert d’eau de la goutte vers le réservoir jusqu’à ce que les deux


pressions de vapeurs deviennent identiques. En conséquence, tous 4. Enregistrement
les composants de la goutte vont se concentrer (macromolécule,
agent précipitant, impuretés).
des données de diffraction
Un montage souvent employé utilise la même espèce chimique
pour agent déhydratant et agent cristallisant. Le réservoir est pré- La collecte des données de diffraction des macromolécules biolo-
paré à une concentration donnée en agent déhydratant. La goutte giques doit résoudre plusieurs problèmes :
est préparée en ajoutant x mL d’une solution stock de macromolé- — un nombre important de mesures à enregistrer et à traiter : le
cule à y mL de solution de réservoir. Deux dispositifs expérimentaux nombre de réflexions à mesurer est directement proportionnel au
sont utilisés pour cette technique, l’un appelé goutte suspendue volume de la maille directe (et varie avec l’inverse du cube de la
(figure 2), l’autre goutte assise. En plus de l’aspect thermodynami- limite de diffraction des cristaux) ;
que, la sursaturation et la formation des cristaux dépendent de la — une intensité relativement faible des ondes diffractées : l’inten-
cinétique de transfert des échanges de vapeur. Comme tout proces- sité mesurée de chaque onde diffractée est proportionnelle au
sus d’évaporation, cette technique dépend de nombreux volume du cristal illuminé, à l’intensité du faisceau incident et varie
paramètres : nature et concentration initiales des constituants, tem- comme l’inverse du carré du volume de la maille cristalline.
pérature, taille et forme de la goutte, distance goutte-réservoir. Le Dans le cas de la collecte par la méthode d’oscillation, qui est la
lecteur se reportera à la bibliographie pour une étude plus détaillée méthode de référence actuelle pour les cristaux de macromolécules
de ces phénomènes. biologiques (voir paragraphe 4.3.1), l’énergie diffractée Ehkl pour
chaque réflexion hkl est reliée au module du facteur de structure
Les cristaux de macromolécules biologiques présentent des pro-
F hkl par la relation de Darwin (hypothèse d’un cristal de parfaite
priétés particulières qui les distinguent fortement des autres
mosaïcité (*) en rotation avec une vitesse angulaire constante) :
cristaux :
— ils contiennent une forte proportion de solvant (de 20 % à Vc
E hkl = C I 0 ------ λ 3 A hkl L hkl P hkl F hkl 2 (5)
90 %). Les canaux de solvant permettent d’accommoder des varia- V2
tions de l’ordre cristallin ;
avec C facteur constant,
— les forces impliquées dans l’empilement cristallin sont faibles,
le nombre de contacts (liaisons hydrogène, ponts salins, interac- Ahkl facteur d’absorption ; prend en compte l’absorption
tions hydrophobes) entre entités voisines est limité (en proportion de chaque faisceau diffracté à travers le cristal,
de leur masse par rapport aux petites molécules), la cohésion du Lhkl facteur de Lorentz ; rend compte de la vitesse à
réseau est donc plus faible. Les cristaux sont alors en général diffici- laquelle un « point » du réseau réciproque traverse
les à obtenir et ils sont fragiles, de taille limitée (quelques centaines la sphère d’Ewald,
de µm) dans les cas les plus favorables ; Phkl facteur de polarisation ; rend compte de la
— les macromolécules sont sensibles, une perte de la structure polarisation des rayons X diffractés qui peut être
native étant possible. On doit donc se limiter à certains domaines de introduite par le faisceau de rayons X incident, le
pH, de température, de force ionique. Il est aussi nécessaire de monochromateur et le cristal,
maintenir un état d’hydratation autour des cristaux ; V volume de la maille cristalline directe,
— les macromolécules sont flexibles et présentent une dynami- Vc volume du cristal,
que interne qui provoque des variations locales de la chaîne
λ longueur d’onde du faisceau incident d’intensité I0 .
polypeptidique ;
On a donc cherché à compenser les défauts mentionnés ci-dessus
— la qualité de diffraction, conséquence directe de tous ces en jouant sur trois éléments essentiels pour l’enregistrement des
désordres, est limitée. données de diffraction : la source de rayons X, le détecteur de
Pour que la structure résolue ait un intérêt au niveau biologique, rayons X qui enregistre les intensités des réflexions diffractées, et la
il est primordial que la macromolécule soit cristallisée dans des con- méthode d’enregistrement.
ditions physico-chimiques (température, pH, pression, etc.) où elle (*) Dans un cristal réel, la périodicité cristalline n’est jamais parfaite. Des défauts ponc-
tuels (dislocations, défauts d’empilement, grains et joints de grains, macles) affectent
garde son activité biologique. De nombreux exemples de cristaux l’ordre cristallin à courte distance. Un cristal est en fait constitué d’agrégats de petits cris-
d’enzyme (protéines avec une activité catalytique) ont montré que taux ou grains reliés entre eux par des surfaces de raccordement appelées joints de grains.
Les dislocations des grains et de leurs frontières caractérisent la mosaïcité du cristal. Celle-
l’activité était conservée dans l’état cristallin. ci se traduit par un élargissement des pics de diffraction.

Lamelle de verre
4.1 Source de rayons X

Les sources de rayons X utilisées en cristallographie biologique


sont soit une source classique soit le rayonnement synchrotron.
Dans une source classique, une cible de métal pur (anticathode) est
Goutte : soumise à un bombardement d’électrons accélérés à une énergie
x mL protéine + y mL puits
suffisante ; le spectre d’émission associé présente des raies caracté-
ristiques du métal qui la compose. Deux systèmes sont utilisés : le
tube scellé et l’anticathode tournante. Ils impliquent un travail en
lumière monochromatique et présentent des limitations en puis-
Puits : sance. Avec le développement du rayonnement synchrotron, les
agents précipitants + tampon + additifs sources classiques sont surtout utilisées pour des recherches préli-
minaires au laboratoire.
L’utilisation du rayonnement synchrotron pour les études structu-
Figure 2 – Méthodes de cristallisation par diffusion de vapeur. rales en biologie est l’une des révolutions qui s’est produite dans ce
Technique de la goutte suspendue domaine. Un électron (ou un positron) ultrarelativiste émet un

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Analyse et Caractérisation P 1 090 − 5
CRISTALLOGRAPHIE DES MACROMOLÉCULES BIOLOGIQUES ___________________________________________________________________________________

rayonnement électromagnétique, appelé rayonnement synchro- d’onde pour minimiser le problème de l’absorption et pour réduire
tron, lorsqu’il est défléchi par un champ magnétique. Au départ, ce la dégradation due aux rayonnements. Un développement fonda-
rayonnement constituait une simple curiosité et une nuisance pour mental concerne l’optimisation de l’utilisation de la diffusion ano-
les physiciens des hautes énergies qui travaillaient sur les anneaux male par la méthode MAD (voir paragraphe 6) qui permet d’obtenir
de collision. En effet, dans les synchrotrons à électrons ou dans les des phases expérimentales de très bonne qualité. Ce rayonnement
anneaux de stockage utilisés pour la physique des particules élé- blanc intense a aussi permis le renouveau de la méthode de Laue, et
mentaires, l’émission synchrotron est un sous-produit inévitable de le développement des méthodes de cristallographie résolue dans le
la circulation des particules, qui provoque une importante perte temps.
d’énergie. Initialement phénomène nuisible, le rayonnement syn-
chrotron possède des caractéristiques si exceptionnelles qu’il est Le lecteur intéressé pourra consulter la référence [6] de ce traité,
devenu un outil majeur dans une multitude de disciplines dont la traitant du rayonnement synchrotron et de ses applications.
cristallographie. Les principales caractéristiques de ce rayonnement
sont les suivantes :
— un rayonnement blanc très intense : en raison de la focalisa-
tion naturelle dans le plan de l’orbite, la brillance spectrale du fais- 4.2 Détecteur
ceau est très élevée, de plusieurs ordres de grandeur supérieure à
celle d’un tube à rayons X classique ;
— une émission très directionnelle et de structure temporelle Le choix d’un détecteur de rayons X dépend de ses caractéris-
pulsée : dans le plan de l’orbite, la divergence du faisceau dépend tiques selon plusieurs critères : coefficient d’absorption pour les
des fentes ou de l’optique utilisée : elle est de l’ordre de quelques rayons X, dynamique, résolution spatiale, uniformité spatiale et
milliradians. Dans le plan vertical, le rayonnement est presque aussi temporelle de la réponse, linéarité de la réponse avec le rayonne-
bien focalisé que l’émission laser (de l’ordre de quelques dixièmes ment reçu, bruit de fond. De plus, pour les cristaux de macromolé-
de milliradian). En cristallographie classique des protéines, la focali- cules biologiques, il faut tenir compte de leur fragilité importante
sation et la monochromatisation du faisceau incident sont réalisées lors de l’exposition aux rayons X qui limite la durée de vie d’un cris-
par un monochromateur à cristal courbé et/ou des doubles miroirs tal sous irradiation, de leur faible pouvoir diffractant qui implique
focalisants. La direction des photons incidents est fortement corré- des temps importants d’exposition aux rayons X, et du nombre
lée avec leur énergie ce qui induit une divergence du faisceau forte- important de données à enregistrer. On verra aussi ci-dessous que
ment asymétrique. Ce phénomène ne se produit pas pour les les conditions d’enregistrement optimales pour la méthode
sources conventionnelles sauf en présence de doubles miroirs foca- d’oscillation consistent à utiliser un angle d’oscillation minimal avec
lisants. La structure temporelle pulsée est transparente pour de une distance cristal-détecteur maximale. Ceci impose deux limita-
nombreuses expériences. Néanmoins, une utilisation est envisagea- tions qui sont directement liées à la technologie des détecteurs : un
ble pour la cristallographie résolue dans le temps ; grand nombre de données doivent être lues et stockées
— un rayonnement polarisé : le rayonnement synchrotron émis rapidement ; le détecteur doit avoir une taille la plus grande pos-
par une particule est polarisé linéairement dans le plan de l’orbite. sible.
La première génération de machines a utilisé le rayonnement
Les progrès réalisés ces dernières années concernant la technolo-
émis dans les aimants de courbure des anneaux de collisions con-
gie des détecteurs ont été un facteur essentiel de la révolution cris-
çus pour les physiciens des hautes énergies. On assiste maintenant
tallographique. Pour des cristaux à grandes mailles cristallines
à l’utilisation de machines qui ont été construites et optimisées pour
( > 20nm ) , le film photographique a été pendant de nombreuses
l’utilisation du rayonnement synchrotron et qui permettent d’obte-
années le détecteur le mieux adapté à ces critères avec cependant
nir des sources de plusieurs ordres de grandeur plus intenses. Ces
trois principaux inconvénients : la nécessité d’une étape de numéri-
gains sont dus à une utilisation plus efficace du rayonnement par
sation pour les traitements ultérieurs, une détection des photons
l’ajout d’éléments magnétiques d’insertion de grandes dimensions
spatiale et non temporelle, et un bruit de fond chimique intrinsèque.
(wigglers multipôles ou onduleurs). Ces aimants permettent une
extension de la distribution spectrale vers les basses longueurs Depuis le début des années 90, le film a été remplacé d’abord par
d’onde et une augmentation de l’intensité disponible. Une vingtaine des détecteurs bidimensionnels puis par des détecteurs connus
de synchrotrons existent actuellement dans le monde et possèdent sous le nom de « plaque image ». Ces détecteurs marient une
des lignes entièrement dédiées à la biologie structurale. L’une des grande résolution spatiale, un très faible bruit de fond, un haut coef-
sources les plus puissantes (synchrotron dit de 3e génération) est ficient d’absorption, une grande dynamique et une très bonne linéa-
installée à l’ESRF (European Synchrotron Radiation Facility) à Gre- rité. Ils sont de plus réutilisables. Une « plaque image » comprend
noble. En cristallographie des protéines, le rayonnement synchro- une couche sensible (≈ 150 µm d’épaisseur) constituée de centres
tron, utilisé avec une optique de focalisation et/ou de colorés (ions BaF Br dopé avec Eu2+). Lors de l’absorption d’un
monochromatisation performante, a permis des progrès considéra- photon X, certains centres colorés passent à un état d’énergie plus
bles. On peut citer par exemple : élevé métastable ce qui permet de créer une image latente du spec-
— une réduction des temps d’exposition de plusieurs ordres de tre de diffraction sur la plaque. On stimule alors la désexcitation de
grandeur, qui se traduit par une augmentation du nombre de ces états par un faisceau laser hélium-néon, et on mesure la fluores-
réflexions que l’on peut enregistrer par cristal avant qu’il ne soit cence engendrée par le laser. Ce type de détecteurs a réellement
détruit par suite de l’action du rayonnement. L’augmentation de constitué une révolution dans le domaine. Ils permettent d’enregis-
l’intensité du faisceau est particulièrement importante pour les cris- trer directement sur le disque d’un ordinateur les données du cliché
taux de petite taille et/ou avec de grandes mailles. On peut utiliser de diffraction. Avec l’amélioration des performances des logiciels,
maintenant des cristaux de plus en plus petits (de l’ordre de quel- on peut alors analyser et traiter complètement les images de diffrac-
ques dizaines de micromètres) que l’on ne sait pas faire grossir ; tion au fur et à mesure de leur enregistrement. L’un des seuls
— une meilleure résolution spatiale des taches de diffraction. Des défauts de ces plaques images est qu’elles nécessitent un temps de
structures macromoléculaires de plus en plus complexes, corres- lecture de quelques minutes. Les premières plaques images avaient
pondant à des mailles cristallines de plus en plus grandes (plus de un diamètre de 180 mm et nécessitaient un temps de lecture de
1 000 Å dans le cas du virus de la langue bleue) peuvent être l’ordre de trois minutes. Les plaques les plus performantes ont
résolues ; actuellement un diamètre de 350 mm et un temps de lecture de
— un gain en résolution dû à une amélioration du rapport signal l’ordre de la minute. Avec les sources de rayonnement synchrotron
sur bruit ; actuelles où les temps d’exposition sont de l’ordre de quelques
— une utilisation du rayonnement blanc qui permet le choix de la dizaines de secondes, le temps de lecture des plaques images
longueur d’onde. Il est possible de travailler à courte longueur devient un facteur limitant.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
P 1 090 − 6 © Techniques de l’Ingénieur, traité Analyse et Caractérisation
___________________________________________________________________________________ CRISTALLOGRAPHIE DES MACROMOLÉCULES BIOLOGIQUES

L’utilisation de détecteurs CCD (Charge Coupled Device) a permis


de réduire le temps de lecture (qui devient inférieur à 30 s). Dans un
détecteur CCD, les photons incidents sont convertis en photons visi-
bles par un scintillateur déposé à la surface d’une fibre optique, cou-
plé par d’autres composants optiques et électroniques à un tube
cible en silicium. Ces détecteurs sont néanmoins de taille limitée
(diamètre de l’ordre de 55 mm) ce qui constitue un handicap pour
les cristaux à grande maille cristalline. En effet, plus le détecteur est
petit, plus il faut le rapprocher du cristal pour ne pas perdre les
ondes diffractées à haute résolution. Plus le détecteur est proche du
cristal, plus les taches de diffraction seront voisines sur la surface du
détecteur. Pour les grandes mailles cristallines, on aura alors des
superpositions de taches de diffraction qui rendront le cliché inutili-
sable. Pour les détecteurs CCD, on peut remédier à ce problème en
maintenant plusieurs CCD côte à côte.
De nos jours, tous les grands laboratoires de cristallographie bio-
logique sont équipés de plaques images, les CCD étant essentielle-
ment limités aux sites synchrotron en raison de leur coût actuel
relativement élevé. Les recherches se poursuivent afin de limiter les
défauts respectifs de chaque système (temps de lecture pour les pla-
ques images et taille pour les CCD).

4.3 Méthodes d’enregistrement

Lorsqu’un cristal est soumis à un faisceau de rayons X, les condi-


tions de diffraction (diffusion cohérente dans certaines directions
privilégiées de l’espace) peuvent s’exprimer simplement par la loi Figure 3 – Cliché d’oscillation. Exemple d’un cristal de virus
de Bragg. Celle-ci montre que la famille de plans réticulaires Nudaurelia Capensis
d’indice de Miller [hkl ] donne lieu à un faisceau diffracté si et seule-
ment si :
rayons X. Un espace complet de diffraction est alors obtenu en
2 dhkl sinθ = nλ (6) enregistrant une série d’oscillations permettant de balayer l’espace
avec dhkl distance interréticulaire de la famille de plans réciproque indépendant (tableau 1). Un cliché de diffraction est
[hkl ], constitué d’une série caractéristique de lunes dont les limites repré-
sentent les projections, sur le détecteur, des plans du réseau réci-
θ angle entre la direction du faisceau incident de proque lors de leur traversée de la sphère d’Ewald entre le début et
longueur d’onde λ et la famille de plans. la fin de l’oscillation.
La loi de Bragg n’exprime donc que le lieu géométrique des ondes
La figure 3 montre un exemple de cliché d’oscillation d’un cristal
diffractées. Un enregistrement d’un espace complet de diffraction
de virus Nudaurelia Capensis ω. La limite de résolution des données
nécessite de mesurer l’intensité de toutes les ondes diffractées, il
est 2,7 Å. Ce cliché a été enregistré avec la source de synchrotron de
faut donc amener toutes les familles de plans en position de diffrac-
Brookhaven (USA) dans les conditions expérimentales suivantes :
tion. D’après la loi de Bragg, il y a donc deux possibilités :
λ = 1,22 Å, distance cristal-film = 120 mm. Les paramètres de la
— un travail en lumière monochromatique, où λ est constant ce maille cristalline sont :
qui nécessite de faire varier θ. On impose alors au cristal un mouve-
ment de rotation ; a = 414,0 Å , b = 410,7 Å , c = 420,1 Å , α = 59,1° , β = 58,9° , γ = 64°.
— un travail en lumière polychromatique (le faisceau contient
toutes les longueurs d’onde) où θ est constant (le cristal est immo-
bile). Tableau 1 – Méthode d’oscillation : domaine angulaire
à enregistrer pour chaque système cristallin (1)

4.3.1 Collecte en lumière monochromatique Système


Groupe
Standard Diffusion anomale
du point

Les méthodes d’enregistrement sont le reflet des progrès et des Triclinique 1 180° 360°
limites des techniques et des logiciels capables d’indexer et de Monoclinique 2 180° (b*), 90° (a*, c*) 180° (a*, b*, c*)
mesurer les réflexions diffractées par un cristal. L’étude des cristaux
Orthorhombique 222 90° (a*, b*, c*) 90° (a*, b*, c*)
à grande maille cristalline, qui correspondent à des réseaux récipro-
ques fortement peuplés, ferme la porte à l’utilisation du diffractomè- Quadratique 4 90° (a*, b*, c*) 90° (c*), 180° (a*, b*)
422 45° (c*), 90° (a*, b*) 45° (c*), 90° (a*, b*)
tre automatique qui mesure l’intensité d’une seule réflexion à la
fois. La nécessité d’enregistrer un maximum de données avec un Cubique 23 environ 60° environ 70°
minimum de cristaux condamne les méthodes d’enregistrement 432 environ 35° environ 45°
dites « avec écran » telles que la méthode de précession et la cham- Rhomboédrique 3 60° (c*), 90° (a*, b*) 120° (c*), 180° (a*, b*)
bre de Weissenberg, et a abouti à l’apogée de la méthode d’oscilla- 321 30° (c*), 90° (a*, b*) 60° (c*), 180° (a*, b*)
312 30° (c*), 90° (a*, b*) 60° (c*), 180° (a*, b*)
tion. Cette méthode est la plus utilisée aujourd’hui. Son principe
consiste à donner au cristal un mouvement de rotation de faible Hexagonal 6 60° (c*), 90° (a*, b*) 60° (c*), 180° (a*, b*)
amplitude (de l’ordre de 0,2° à 1°) autour d’un axe perpendiculaire 622 30° (c*), 90° (a*, b*) 30° (c*), 90° (a*, b*)
aux rayons X incidents. On recueille les intensités des réflexions dif- (1) (a *), (b *), (c *) représente l’axe réciproque du cristal qui est parallèle
fractées sur un détecteur placé perpendiculairement à l’axe des à l’axe de rotation.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Analyse et Caractérisation P 1 090 − 7
CRISTALLOGRAPHIE DES MACROMOLÉCULES BIOLOGIQUES ___________________________________________________________________________________

L’angle d’oscillation est de 0,3°. Un total de 15 245 réflexions ont


été mesurées sur ce cliché. Dans ce groupe d’espace triclinique, un
domaine angulaire de 180° est nécessaire pour obtenir un espace de
diffraction complet, ce qui correspond à 600 clichés de ce type.
L’angle d’oscillation maximal possible qui évite la superposition,
sur le détecteur, de deux points du réseau réciproque, dépend des
paramètres d’orientation du cristal, de la résolution obtenue et du
domaine de réflexion du cristal (mosaïcité et divergence de l’opti-
que). La portion de l’espace réciproque à enregistrer dépend du
groupe de symétrie de Laue du cristal. Le tableau 1 donne pour cha-
que groupe de Laue et en fonction de l’orientation du cristal, le
domaine angulaire à enregistrer pour obtenir un espace complet de
diffraction. En cas de diffusion anomale (voir paragraphe 6), il est
nécessaire de mesurer les réflexions hkl et les réflexions hkl . Le
choix de l’axe de rotation et de l’angle d’oscillation est un compro-
mis qui est fait de façon à :
— enregistrer un nombre de clichés minimal, ce qui pour un
domaine de rotation donné, implique un angle d’oscillation maxi-
mal par cliché ;
— minimiser les superpositions de réflexions sur le cliché de dif-
fraction, ce qui restreint l’angle d’oscillation ;
— maximiser le rapport signal sur bruit sur le cliché de diffrac-
tion, ce qui correspond à une oscillation la plus petite possible.
Les conditions optimales d’enregistrement sont obtenues en utili-
sant une oscillation la plus faible possible et à une distance cristal-
détecteur la plus grande possible. Cela induit un temps d’enregistre-
ment plus long, une augmentation considérable des données à stoc-
ker et à manipuler, ce qui n’est pas réellement un problème avec les
moyens informatiques actuels. Néanmoins, sur un site synchrotron, Figure 4 – Cliché de Laue de l’aspartyl-ARNt synthétase de Thermus
le temps alloué (par des commissions d’experts) est limité pour une thermophilus
expérience donnée ; il faut donc encore faire différents compromis
(amplitude de l’angle d’oscillation, temps d’exposition) pour enre-
gistrer un espace de diffraction complet de qualité. provoquer un changement de conformation des molécules dans le
cristal. Les seuls changements structuraux autorisés sont bien évi-
demment ceux qui sont compatibles avec la cohésion du réseau
4.3.2 Collecte en lumière polychromatique cristallin. Les autres changements provoquent la rupture de la
symétrie ou de la périodicité du cristal et ne peuvent pas donner lieu
La méthode de Laue est une technique très ancienne. Elle con- à une étude par diffractions des rayons X. L’objectif premier de la
siste à irradier le cristal étudié par un rayonnement polychromati- résolution de la structure tridimensionnelle d’une macromolécule
que. Le premier cliché de diffraction de rayons X, obtenu en 1912 est de connaître la structure pour comprendre la fonction. Dans le
par Friedrich, Knipping et von Laue était de ce type. Cette méthode cas d’une enzyme par exemple, la connaissance complète et fine du
était tombée en désuétude, du moins pour les études structurales, mécanisme moléculaire nécessiterait de connaître la structure de la
jusqu’à ces dernières années, en raison de la faible intensité des protéine seule et de tous les intermédiaires de la réaction. Ceci est
sources de rayons X conventionnelles, de leur largeur spectrale peu un obstacle majeur pour la cristallographie conventionnelle dans le
étendue et des difficultés à déchiffrer les clichés de diffraction obte- cas d’une réaction à cinétique rapide, car elle ne permet pas de
nus. Un exemple de cliché de Laue d’une macromolécule biologique visualiser les intermédiaires de réaction à courte durée de vie qui
est donné à la figure 4. sont importants pour la compréhension du mécanisme. Il est possi-
Il s’agit d’un cliché de Laue de l’aspartyl-ARNt synthétase de Ther- ble d’étudier une réaction dans un cristal sous réserve de disposer
mus thermophilus. Ce film a été enregistré avec la source de rayon- d’une méthode d’enregistrement des données de diffraction qui soit
nement synchrotron de Daresbury (Angleterre), dans les conditions synchronisée avec la durée du phénomène à observer. Les métho-
expérimentales suivantes : λ = 0,45 Å - 0,95 Å, distance cristal-film des de diffraction des rayons X monochromatiques permettent diffi-
= 180 mm, temps d’exposition = 20 s. Les paramètres de la maille cilement d’étudier des phénomènes dont la durée de vie est
cristalline sont : a = 61,4 Å, b = 156,1 Å, c = 177,3 Å, α = β = γ = 90°. inférieure à une heure. C’est le défi qui a été relevé par la méthode
L’utilisation du rayonnement synchrotron en cristallographie bio- de Laue.
logique est à l’origine du renouveau de cette méthode. Elle permet :
Cependant, malgré plusieurs exemples de belles réussites corres-
— une utilisation optimale du rayonnement ; pondant à de réelles prouesses technologiques et méthodologiques
— une réduction des temps d’exposition ; [10], de nombreux problèmes intrinsèques incomplètement résolus
— l’enregistrement simultané de plusieurs milliers de réflexions. limitent fortement son utilisation. Le problème majeur est celui de la
Selon la symétrie du groupe d’espace du cristal, rarement plus de mosaïcité. Le fait que le cristal reste immobile durant toute l’expé-
trois clichés de diffraction sont nécessaires en théorie pour obtenir rience rend la méthode de Laue très sensible à tout défaut qui pour-
un espace complet de diffraction ; rait être présent dans le cristal (macles, forte mosaïcité). Un cristal
— une obtention directe des intensités intégrées, l’intégration qui donne des clichés de diffraction de très bonne qualité avec un
étant faite sur le domaine de longueur d’onde, par opposition aux rayonnement monochromatique peut très bien avoir un comporte-
domaines angulaires pour les expériences monochromatiques. Ceci ment médiocre dans le faisceau polychromatique. De plus, ce com-
est très important pour l’étude des réactions très rapides. portement peut varier d’un cristal à l’autre pour le même type de
De nombreuses études ont montré que certaines molécules con- cristaux. Cela a été observé dans plusieurs exemples et c’est finale-
servent leur activité dans le cristal et que la fixation d’un ligand peut ment aujourd’hui le problème majeur de cette technique.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
P 1 090 − 8 © Techniques de l’Ingénieur, traité Analyse et Caractérisation
___________________________________________________________________________________ CRISTALLOGRAPHIE DES MACROMOLÉCULES BIOLOGIQUES

4.4 Cryocristallographie
Cercle natif

Un autre développement majeur pour l’enregistrement des don-


nées de diffraction consiste à collecter les données de diffraction en W Cercle B
congelant le cristal à très basse température (entre 100 K et 140 K).
On parle alors de cryocristallographie. L’intérêt majeur de l’enregis-
trement de données à très basse température est l’augmentation lFP l
considérable de la durée de vie du cristal, car à ces températures, la lFP+B l
progression des radicaux libres provoqués par les photons X dans --FB V
le cristal est bloquée, ce qui limite de façon importante les domma-
O
ges dus à l’irradiation en fonction du temps. Cela provoque de plus lFP+D l
une réduction des désordres d’ordre dynamique présents dans le --FD
cristal. Dans ces conditions, un espace de diffraction complet peut
être enregistré, dans la plupart des cas, à partir d’un seul cristal. De U
plus, la qualité initiale de diffraction est conservée pendant tout N
l’enregistrement. On obtient alors des données plus complètes et de
meilleure qualité au maximum de diffraction du cristal.

Le refroidissement du cristal sans l’endommager reste le pro-


blème majeur de cette méthode. La technique utilisée implique la M
congélation instantanée du cristal à environ 140 K dans un flux
d’azote gazeux ou dans du propane liquide. Les cristaux de macro-
molécules biologiques contenant une grande proportion de solvant, Cercle D
il faut éviter la formation de glace cristalline qui détruirait le cristal.
Pour cela, on refroidit le cristal en présence d’une solution cryopro- Figure 5 – Méthode MIR. Détermination de la phase du facteur
de structure FP pour une réflexion d’indice hkl donné (cas idéal
tectrice appropriée dont le choix dépend de la macromolécule et des
sans défauts d’isomorphisme et sans erreurs)
conditions de cristallisation. Un bon cryoprotectant doit, d’une part,
favoriser la formation de glace amorphe lorsqu’il est refroidi instan-
tanément et, d’autre part, préserver le pouvoir diffractant du cristal.
Les cryoprotectants les plus utilisés sont le glycérol, l’éthylènegly- 5.1 Détermination des phases. Cas idéal
col, le 2-méthylpentanediol (MPD). On peut soit les ajouter directe-
ment dans le milieu de cristallisation, soit effectuer des transferts
successifs d’un cristal dans une solution appropriée de plus en plus Notons P la structure tridimensionnelle d’une macromolécule et
concentrée en cryoprotectant. La recherche du mélange cryoprotec- supposons que l’on ajoute à la structure P un nombre d’atomes sup-
tant idéal et des conditions physico-chimiques adéquates constitue plémentaires correspondant à une structure notée D. On appellera P
l’étape la plus fastidieuse de la méthode car on ne peut agir que par la structure native et (P + D) la structure dérivée. On supposera aussi
essais et erreurs. Par contre, les cristaux congelés peuvent être con- que le cristal natif et le cristal dérivé sont isomorphes, c’est-à-dire
servés et stockés indéfiniment à très basse température dans l’azote que :
liquide, dans l’attente d’une utilisation ultérieure. On peut même — la symétrie cristallographique et les paramètres cristallins sont
assez souvent les réutiliser après une première exposition aux conservés ;
rayons X, ce qui permet par exemple de sélectionner préalablement — la molécule n’a subi ni rotation ni translation dans la maille.
les meilleurs cristaux par des tests de diffraction au laboratoire
avant d’effectuer les mesures sur un site synchrotron. Les changements dans la densité électronique de la molécule
native consistent alors uniquement en une addition de densité élec-
La cryocristallographie est aussi souvent indispensable lors de tronique pour les positions de l’espace occupées par les atomes
mesures effectuées avec des sources synchrotron dont le faisceau supplémentaires introduits. Pour chaque réflexion hkl, on peut alors
très brillant détruit rapidement les cristaux à température ambiante. écrire :
Pratiquement tous les enregistrements s’effectuent maintenant FP + D = FP + FD (7)
dans ces conditions de très basses températures. On peut aussi uti-
liser cette technique pour piéger des états de transitions de certaines avec FP facteur de structure du cristal natif (module  Fp
réactions pas trop rapides et ainsi réaliser ces enregistrements en et phase φP ),
lumière monochromatique en évitant les problèmes inhérents à la
FP + D facteur de structure du cristal dérivé (module
méthode de Laue. Pour plus de détails pratiques sur les conditions
 FP + D et phase φP + D ),
expérimentales de cryocristallisation, le lecteur pourra se référer à
l’ouvrage [7] cité en [Doc. P 1 090]. FD facteur de structure dû aux atomes D seuls
(module  FD et phase φD ).
La figure 5 permet de voir que si l’on connaît la nature et la posi-
tion des atomes supplémentaires D dans la maille (on peut alors cal-
culer  FD, φD ), et si l’on dispose des intensités diffractées ( FP + D2,
5. Méthode de la série  FP2), l’indétermination sur les phases est ramenée à deux valeurs
isomorphe possibles pour chaque réflexion. La construction de la figure 5
(triangle OUW) dans le plan complexe est fondée sur la relation :
FP = FP + D + (− FD ) (a )
C’est la méthode la plus utilisée en cristallographie des protéines Cette relation est vérifiée pour les points W et M qui sont à l’inter-
pour résoudre le problème des phases. Depuis son introduction par section du cercle natif (centré en O et de rayon  FP) et du cercle D
Perutz en 1954, elle a permis de déterminer la grande majorité des (centré en U et de rayon  FP + D). L’utilisation d’un deuxième dérivé
structures connues à ce jour. (P + B ) (atomes supplémentaires introduits B ) permettra donc de

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Analyse et Caractérisation P 1 090 − 9
CRISTALLOGRAPHIE DES MACROMOLÉCULES BIOLOGIQUES ___________________________________________________________________________________

lever complètement l’indétermination et d’obtenir la phase de cha- — erreurs sur le modèle des atomes lourds additionnels (posi-
que réflexion. En effet, dans le cas de B seul, la relation : tions, occupations, facteurs d’agitation thermique) ;
— les modifications structurales (défauts d’isomorphisme) intro-
FP = FP + B + (− FB ) (b ) duites par la présence des atomes lourds.
(figure 5, triangle OVW) est vérifiée pour les points W et N qui sont Il est important d’essayer de séparer, dans les différences d’inten-
à l’intersection du cercle natif et du cercle B (centré en V et de rayon sité entre une native et un dérivé, la contribution due à la présence
FP + B). Le point W qui est à l’intersection des trois cercles vérifient des atomes lourds et la contribution due au non-isomorphisme. Une
les deux relations (a) et (b) et permet de calculer la phase de la des manifestations les plus simples d’un non-isomorphisme con-
réflexion. cerne la variation des paramètres de maille qu’il convient donc de
mesurer de la manière la plus précise. Toutefois, des défauts d’iso-
La résolution de la structure complexe P est donc ramenée à la morphisme peuvent ne pas se manifester par des différences sur les
détermination de la position des atomes des structures D et B. Cel- paramètres de maille.
les-ci étant composées en général de quelques atomes, on sait les
résoudre par des techniques appropriées (fonction de Patterson, Dans ces conditions, les trois cercles (natif, D et B ) de la figure 5
méthodes directes) qui n’utilisent que des modules de facteurs de ne se coupent pas en un point ou ne se coupent pas du tout. Dans ce
structures. On verra au paragraphe 6 que si le dérivé possède une cas, pour chaque dérivé j , pour chaque réflexion et pour toutes les
contribution anomale significative à la longueur d’onde de travail, valeurs possibles de la phase, on définit une densité de probabilité
un seul dérivé sera alors nécessaire pour obtenir en théorie l’infor- p j ( φ P ) . Cette densité de probabilité est calculée à partir des infor-
mation de phases. mations suivantes :
—  FP, σ (FP ) où σ (FP ) est l’incertitude sur la mesure de  FP ;
<∆ F iso >
Le pouvoir de phasage d’un dérivé est lié au rapport ---------------------- où —  F P + Dj  , σ ( F P + Dj ) où σ ( F P + Dj ) est l’incertitude sur la
< FP >
mesure de  F P + Dj  ;
∆ F iso = F P + D − F P et où < x > représente la variation quadra- — un modèle des atomes lourds q ij , x ij , y ij , z ij , B ij (i = 1, m j ) où
tique moyenne de la variable x. Ce rapport correspond à la variation
mj est le nombre d’atomes lourds pour le dérivé j. Cela permet de
statistique moyenne du module du facteur de structure provoquée
par l’addition de ND atomes de facteur de diffusion fD à NP atomes calculer F Dj et φ Dj ;
de facteur de diffusion fP et est donné par la relation suivante : — un modèle des erreurs et du non-isomorphisme.
La connaissance de cette distribution de probabilité de phase per-
<∆ F iso > γ N D f D mettra de trouver FP optimal (module et phase) qui soit en accord
- ≈ --- -------- -----
--------------------- (8)
< FP > 2 NP fP avec toutes les amplitudes mesurées et qui permette d’optimiser les
paramètres des atomes lourds et les phases.
avec γ = 2 pour les réflexions centriques et γ = 2 pour les L’utilisation de plusieurs dérivés lourds permet de calculer une
réflexions non centriques. distribution totale de probabilité totale (pour chaque réflexion) :
Dans la méthode de la série isomorphe, on introduit des atomes
supplémentaires qui ont un nombre d’électrons élevé (on parle
p ( φP ) = ∏ pj ( φP ) (9)
j
alors d’atomes lourds). La relation (8) montre que l’on peut obtenir
des différences  ∆Fiso très significatives en jouant sur la taille et le Cette distribution n’est généralement pas unimodale. Le maxi-
nombre d’atomes introduits quelle que soit la taille de la macromo- mum de cette distribution est appelé la phase « la plus probable » et
lécule étudiée. L’exemple extrême à ce jour concerne l’étude cristal- le centroïde de la distribution est appelé la phase « la meilleure »,
lographique de sous-unités de ribosomes de différentes espèces. notée φbest . Il a été montré que l’utilisation de φbest dans le calcul des
Un ribosome est un gros complexe nucléoprotéique (plusieurs mil- cartes de densités électroniques permet d’obtenir une carte où
lions de daltons ; 1 Da = 1 u = masse 12C/12) qui est le siège de la l’erreur quadratique moyenne est la plus faible. La qualité de l’infor-
synthèse protéique. Le phasage par la méthode MIR (Multiple Iso- mation sur la phase est mesurée par un nombre m, appelé figure de
morphous Replacement : méthode de la série isomorphe avec plu- mérite qui est le reflet de l’étroitesse de la distribution de probabi-
sieurs dérivés lourds) a nécessité la mise au point de cluster (*) lité, m tendant vers la valeur 1 pour une distribution très étroite et
d’atomes lourds à base de tungstène ((AsW9O33)2(PhSn)4) ou de vers la valeur 0 pour une distribution très aplatie. La figure de mérite
2+ . Ces travaux sont en passe d’aboutir dans le cas
thallium Ta 6 Br 12 est calculée par l’expression :
de la sous-unité 50S du ribosome d’Haloarcula marismortui. Les 2π
structures de nombreux virus ayant un poids moléculaire encore
plus élevé ont été déterminées à haute résolution par cristallogra- ∫ 0
p ( φ ) exp ( i φ ) dφ
m = ------------------------------------------------------ (10)
phie. Néanmoins, ces virus sont des molécules symétriques (symé- 2π
trie hélicoïdale ou symétrie icosaédrique) et leurs cristaux
appartiennent à un groupe d’espace à symétrie élevée et/ou possè-
dent un degré de symétrie non cristallographique élevé, ce qui faci-
∫ 0
p ( φ ) dφ

lite grandement le processus de phasage (voir le paragraphe 8). Malheureusement, elle n’est pas un bon indicateur de la justesse
des phases mais simplement de la précision du calcul. En première
(*) Cluster : nombre important d’atomes lourds liés entre eux dans un
approximation, pour une réflexion donnée, la figure de mérite
composé chimique donné.
représente la valeur moyenne du cosinus de l’erreur sur la phase
calculée.
La carte de densité électronique qui sera calculée et que l’on va
5.2 Détermination des phases. Cas réel chercher à interpréter pour construire la structure de la molécule
sera alors :

En fait, le cas idéal n’existe pas en raison des erreurs sur les ρ ( x, y, z ) =
+∞ +∞ +∞
(11)
mesures des facteurs de structure. Ces erreurs ont trois origines 1  
principales : ----  ∑ ∑ ∑ m hkl  F hkl  exp [ i φ best ] exp [ – 2iπ ( hx + ky + lz ) ]
V   hkl
— erreurs sur la mesure des intensités ; h =− ∞ k =− ∞ l =− ∞

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
P 1 090 − 10 © Techniques de l’Ingénieur, traité Analyse et Caractérisation
___________________________________________________________________________________ CRISTALLOGRAPHIE DES MACROMOLÉCULES BIOLOGIQUES

5.3 Obtention des dérivés lourds approximations sont en général utilisées de manière satisfaisante :
( FP + D −  FP )2 ou bien ( FP + D2 −  FP 2 ). Si le dérivé lourd pos-
sède une contribution anomale significative (voir paragraphe 6), la
C’est l’étape limitante de ce processus car elle consiste, en géné-
meilleure approximation de  F D2  est (  F P+ + D  –  F P− + D  ) 2 où
ral, en une recherche par essais et erreurs qui peut s’avérer infruc-
tueuse. C’est souvent un processus lent et fastidieux. Deux  F P+ + D  représente le module du facteur de structure du dérivé
méthodes principales sont utilisées pour introduire l’atome lourd et
permettre sa fixation sur la macromolécule soit de façon covalente, (P + D) pour la réflexion hkl et  F P− + D  pour la réflexion hkl .
soit par des liaisons électrostatiques en un ou plusieurs sites. Pour
les petites molécules, un atome « léger » est substitué par un autre
élément plus lourd. Pour les macromolécules, cette substitution chi-
mique n’est généralement pas réalisable, sauf dans le cas des
métalloprotéines, où l’on peut essayer d’enlever le métal de façon 6. Utilisation de la diffusion
non dénaturante et de le remplacer par un métal plus lourd. Pour les
acides nucléiques, on peut substituer une base par une autre base
anomale
modifiée : par exemple, remplacer une thymine par un 5-iodouri-
dine. Pour les cristaux de macromolécules biologiques, on tire profit
de leur forte proportion de solvant (de 20 % à 90 %) et de la pré- L’interaction des rayons X avec un atome donné j est modélisée
sence de canaux de solvant pour permettre une diffusion de sel par un facteur de diffusion fj qui caractérise la diffusion de l’atome
d’atome lourd (méthode de trempage). L’atome lourd prend alors la en prenant comme unité celle d’un électron libre. Dans les condi-
place de molécules désordonnées de solvant, qui ne contribuent tions dites « normales », fj est un nombre réel c’est-à-dire qu’il n’y a
que faiblement au pouvoir de diffraction de la macromolécule sauf pas de différence de phase entre l’onde diffusée par l’atome et celle
à basse résolution. Le trempage se fait en diffusant lentement une diffusée par un électron libre (diffusion Thompson). Dans la réalité,
solution du composé souhaité dans la goutte de cristallisation. En les électrons d’un atome ne sont pas libres, ils sont répartis en orbi-
pratique, après formation du cristal, le milieu de cristallisation (on tales d’énergies données et l’atome présente des discontinuités
dit la liqueur mère) est échangé petit à petit par la solution conte- d’absorption correspondant à l’excitation de couches électroniques
nant l’élément lourd. Le composé que l’on veut diffuser dans le cris- profondes. Les approximations de la théorie classique ne sont plus
tal doit être soluble dans la liqueur mère, ne pas donner de réactions justifiées si l’énergie des rayons X incidents est proche d’un seuil
secondaires nuisibles avec les ions présents dans le milieu et il doit d’absorption de l’atome. Il se produit un phénomène de résonance
avoir une certaine affinité pour la macromolécule étudiée. À titre qui se traduit par un changement de longueur d’onde de l’onde dif-
d’exemple, les sels de dérivés mercuriels interagissent entre autres fusée (par rapport à un électron libre). Ce changement de phase
avec des acides aminés tels que cystéine et histidine. À l’heure dépend de la nature de l’atome et de la longueur d’onde incidente λ.
actuelle, il n’existe aucune méthode permettant d’obtenir avec suc- Le facteur de diffusion atomique s’exprime alors par un nombre
cès un dérivé lourd isomorphe. De nombreux essais faisant varier la complexe et s’écrit sous la forme :
nature et la concentration de l’atome lourd (1 mM-50 mM), les con- 0 λ 0 λ λ
ditions de trempage (de quelques minutes à plusieurs jours) peu- f = f+ δ = f+ f′+i f ″ (12)
vent être nécessaires pour obtenir un cristal dérivé isomorphe
0f
où représente la diffusion dite « normale », et λf ′ λf ″
deux termes
acceptable. Dans certains cas, il n’a pas été possible de trouver de
tels dérivés lourds. Les défauts d’isomorphisme, toujours présents correctifs fonction de la longueur d’onde λ. Dans la gamme d’éner-
sauf exceptions, les dégâts provoqués par la diffusion des atomes gie utilisée en cristallographie [6 keV (λ = 2 Å) à 40 keV (λ = 0,3 Å)],
lourds, réduisent souvent la qualité de diffraction des cristaux et ne pour la plupart des atomes présents dans les macromolécules, la
permettent d’obtenir des phases qu’à des résolutions limitées correction est négligeable et on n’en tient pas compte (diffusion dite
(3,5 Å-4,5 Å). « normale »). Néanmoins, en raison de la potentialité énorme de
cette méthode pour la détermination des phases (voir ci-dessous),
De très bons dérivés lourds de protéines peuvent aussi être obte- on va en fait introduire des diffuseurs anomaux dans les macromo-
nus par l’utilisation de gaz rares (xénon ou krypton) sous pression lécules biologiques.
(8-20 bar) qui se fixent par des interactions faibles de van der Waals
dans des cavités hydrophobes accessibles. Cette méthode a permis Une conséquence importante de la présence d’un diffuseur ano-
dans plusieurs cas de résoudre la structure de protéines réfractaires mal est que la loi de Friedel [2] n’est plus vérifiée, c’est-à-dire que
aux sels d’atomes lourds classiques. Fhkl et F hkl ne sont plus des nombres complexes conjugués, ce qui
se traduit par I hkl ≠ I . Cette propriété sera mise à profit pour obte-
hkl
nir une information expérimentale des phases. On peut schémati-
5.4 Détermination de la position quement considérer deux cas :
des atomes lourds — travail à une seule longueur d’onde : la contribution anomale
permet de lever partiellement l’ambiguïté de phase ;
La connaissance de la position des atomes lourds dans la maille — travail à plusieurs longueurs d’onde : on utilisera la variation
cristalline est nécessaire pour le calcul de la phase de chaque du facteur de structure d’une réflexion à plusieurs longueurs d’onde
réflexion. Comme les atomes lourds sont en nombre limité dans la pour lever complètement l’indétermination de phase et obtenir des
maille cristalline, leurs positions seront calculées par des méthodes phases expérimentales de très bonne qualité.
classiques (fonction de Patterson, méthodes directes) n’utilisant que Pour cette méthode, les différences de module de facteurs de
les modules de facteurs de structures. Pour utiliser ces méthodes, il λ λ
est nécessaire de déterminer, pour chaque réflexion,  F D2  qui structure ∆F ± hkl = Fhkl – Fhkl et ∆F∆ λ = iF – iF
sont en moyenne faibles (de l’ordre de quelques pour-cent), ce qui
représente le module du facteur de structure dû à la contribution nécessite des mesures de très bonne qualité où les sources
des atomes lourds seuls. Une fonction de Patterson calculée avec d’erreurs expérimentales sont minimisées. De telles mesures sont
ces modules  F D2  permettra alors de trouver les positions des ato- maintenant classiquement obtenues en cristallographie des macro-
mes lourds dans la maille pour le dérivé D. On ne peut estimer exac- molécules biologiques grâce aux progrès technologiques (synchro-
trons, détecteurs, cryocristallographie) et à l’amélioration des
tement  F D2  que dans certains cas particuliers mais plusieurs logiciels de traitement de données de diffraction.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Analyse et Caractérisation P 1 090 − 11
CRISTALLOGRAPHIE DES MACROMOLÉCULES BIOLOGIQUES ___________________________________________________________________________________

6.1 Travail à une seule longueur d’onde

On considère le cas d’une structure native P et d’un dérivé lourd +


F 'D
(P + D) où D sont des atomes diffuseurs anomaux à la longueur 0F + +
d’onde de travail. On peut alors écrire : D F ''D
+
F P +D
FP + D ( H ) = FP ( H ) + FD ( H )
+
FP
(13) --
= F P ( H ) + FD ( H ) + F D′ ( H ) + F D″ ( H )
0 F P
--
F P +D
0F –
où H représente la réflexion d’indice hkl, et où 0FD (H) inclut la con- --
F ''D
D

tribution dite « normale » des atomes D. F 'D


--

Dans le cas particulier, qui est le cas rencontré dans la pratique,


où les diffuseurs anomaux D sont de même nature (un seul type de
diffuseur anomal), F ″ ( H ) est en avance de phase de + π/2 par rap-
D
port à F D′ ( H ) . Pour simplifier l’écriture, on notera F + le facteur de a loi de Friedel non respectée
structure pour la réflexion hkl, F − le facteur de structure pour la
réflexion hkl et F * le complexe conjugué de F. La figure 6 montre
que :

— la loi de Friedel n’est plus vérifiée ( F P+ + D ≠ F P− + D ) . En effet :


F P− = ( F P+ )* , 0F D− = ( 0F D+ )* , F D′ − = ( F D′ + )* mais F D″ − = – ( F D″ + )* ;
FP –+D FP
— la connaissance des modules des facteurs de structures F Phkl ,
F P+ + D , F P− + D permet de déterminer la phase de la réflexion hkl
+
--FD– Cercle (D )
sous réserve de connaître les positions des atomes D.
O
La construction de cette figure dans le plan complexe est fondée +
FP +D
sur les relations : F P+ + D = F P+ + (– F D+ ) et F P− + D = F P− + (– F D− ). --FD+
--
Cercle (D )
Comme F P− = F P+ = F P , le cercle natif (centré en O et de
rayon F P ), le cercle (D +) (centré en l’extrémité de – F D+ et de rayon

F P+ + D ) et le cercle (D −) (centré en l’extrémité de – F D− et de rayon


F P− + D se coupent en un seul point, ce qui permet de trouver la Cercle natif

phase φhkl .
La méthode est connue sous le sigle anglo-saxon SIRAS pour
Single Isomorphous Replacement and Anomalous Scattering. La
méthode MIR classique nécessite trois espaces complets de diffrac-
tion (un espace natif et deux dérivés), l’utilisation d’un dérivé ano-
b détermination des phases
mal permet donc d’éviter le processus fastidieux de recherche de
dérivés supplémentaires. F D+ et F D− sont calculés à partir des Figure 6 – Phasage par la méthode SIRAS
positions atomiques des atomes D. Celles-ci sont déterminées à
partir de fonctions de Patterson (avec des coefficients
(  F P+ + D  –  F P− + D  ) 2 où par des méthodes directes. < ∆ F ± hkl >
---------------------------- , où ∆ F ± hkl = F P + D ( hkl ) – F P + D ( hkl ) et où < x >
< FP >
Dans la pratique, compte tenu des différentes sources d’erreurs, représente la variation quadratique moyenne de la variable x . Une
en particulier le défaut d’isomorphisme, les cercles de la figure 6 ne estimation de ce rapport est donnée par la relation :
se coupent pas en un point, on ne peut pas calculer de manière sim-
ple la phase de chaque réflexion. On définit alors pour chaque
< ∆ F ± hkl > 1 N D 2 f D″
réflexion une densité de probabilité de phase anomale p ano . Cette ---------------------------- ≈ --- -------- --------- (14)
< FP > 2 NP fP
distribution est une fonction de F P + D ( hkl ) , F P + D ( hkl ) ,
F P ( hkl ) , des erreurs associées et du défaut d’isomorphisme. Elle
pourra alors être combinée à d’autres informations de phases pour
permettre d’obtenir une distribution totale de phase. Comme dans
6.2 Travail à plusieurs longueurs d’ondes
le cas de la méthode MIR, on nommera deux valeurs particulières de
cette distribution : son centroïde et son maximum.
La méthode est connue sous le sigle anglo-saxon MAD pour
À une longueur d’onde donnée, le pouvoir de phasage de cette Multiwavelength Anomalous Diffraction. C’est l’utilisation du rayon-
méthode, supposant un isomorphisme parfait, est lié au rapport nement synchrotron qui a rendu possible cette avancée méthodolo-

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
P 1 090 − 12 © Techniques de l’Ingénieur, traité Analyse et Caractérisation
___________________________________________________________________________________ CRISTALLOGRAPHIE DES MACROMOLÉCULES BIOLOGIQUES

gique. Considérons un cristal composé d’un nombre NA de avec au moins trois longueurs d’onde différentes afin d’optimiser le
diffuseurs anomaux A parmi un nombre NN de diffuseurs dits signal et d’augmenter la surdétermination du rapport nombre
« normaux » N. Pour une longueur d’onde donnée λ, on peut écrire d’observations sur nombre de paramètres. Les courbes de variation
le facteur de structure en le décomposant en deux termes : l’un de f ′ et de f ″ en fonction de la longueur d’onde sont déterminées
indépendant de la longueur d’onde et l’autre fonction de la longueur juste avant la collecte des données MAD par l’enregistrement du
d’onde λ : spectre de fluorescence X de l’échantillon. Les longueurs d’onde
λF (H ) sont choisies pour optimiser le signal : l’une correspond au maxi-
= 0FN (H ) + λFA(H ) (15) mum de f ″, l’autre au minimum de f ′ et on choisit encore une ou
où H représente la réflexion d’indice hkl . plusieurs autres longueurs d’onde.
On peut écrire cette relation sous la forme : Le pouvoir de phasage de cette méthode est lié à la variation du
facteur de structure de chaque réflexion entre deux longueurs
λ d’onde λ1 et λ2 et s’exprime par la relation :
F ( H ) = FN ( H ) + FA ( H ) + F A′ ( H ) + F A″ ( H )
λ 0 0 λ
(16)
λ
= FT ( H ) + F A′ ( H ) + F A″ ( H )
0 λ < λ 1F – λ 2F > 1 N
λ1
f ′ – f ″
λ2
-------------------------------------- ≈ --- -------A- ------------------------------------- (20)
< F > 2 NN fN
où 0FT (H ) inclut la contribution dite « normale » de tous les atomes
N et A. Dans le cas particulier, qui est le cas rencontré dans la prati-
< λ 1F + λ 2F >
que, où les NA diffuseurs anomaux sont de même nature (un seul où < F > = --------------------------------------
type de diffuseur anomal), on peut alors écrire : 2

λ  λf ′  0  λf ″  0 La détermination des phases 0φT nécessite de déterminer les posi-


F A′ =  -------  FA et F A″ =  --------  FA .
λ
tions des diffuseurs anomaux (on peut alors calculer 0φA et détermi-
 f
0
 0f  ner 0φT = ∆φ − 0φA). Pour cela on utilise des fonctions de Patterson
ou des méthodes directes à partir des  0FA.
L’équation (16) s’écrit alors :
λ λ
λ 0  f′ f ″0 6.3 Incorporation des diffuseurs anomaux
F ( H ) = FT ( H ) +  ------- + i --------  FA ( H ) (17)
 0f 0
f 
Pour introduire des diffuseurs anomaux, on peut utiliser la
En utilisant cette relation, on peut calculer le module du facteur de
méthode de trempage. Néanmoins, le succès de la méthode MAD
structure  λF (H ) pour la réflexion H et le module du facteur de vient de l’utilisation de sélénométhionine. Les protéines contenant
structure  λF (−H ) pour la réflexion – H = hkl . En appelant 0φT et en moyenne 2 % de méthionine, une sélénométhionine est obtenue
0φ les phases respectives de 0F et 0F , et en posant ∆φ = 0φ − 0φ , par la substitution de l’atome de soufre par un atome de sélénium
A T A T A (le seuil d’absorption K correspond à λ = 0,979 3 Å). Cette substitu-
on obtient alors : tion est réalisée par des techniques de génie génétique qui permet-
tent de bloquer la biosynthèse des méthionines dans les cellules et
 λF (H ) 2 =  0FT 2 + a (λ) 0FA 2 + b (λ) 0FT  0FA cos∆φ
de fournir de la sélénométhionine en remplacement dans le milieu
+ c (λ) 0FT  0FA sin∆φ (18) de culture. Les protéines mutantes ainsi obtenues sont fonctionnel-
les et ne présentent pas de changement de conformation par rap-
et port aux protéines naturelles.
 λF (− H ) 2 =  0FT 2 + a (λ) 0FA 2 + b (λ) 0FT  0FA cos∆φ Pour les acides nucléiques, un marquage analogue peut être réa-
lisé en utilisant des bases bromées (le seuil d’absorption K du
− c (λ) 0FT  0FA sin∆φ (19)
brome correspond à λ = 0,92 Å) comme par exemple la 5-bromouri-
dine qui est un analogue structural de la thymidine.
λ ′2 λ ″2 λ ′2 λ ″2
f + f f f
avec a ( λ ) = --------------------------- , b ( λ ) = 2 ---------- , et c ( λ ) = 2 ----------- .
0 0 0
f f f
6.4 Perspectives
Les relations (18) et (19) constituent un système linéaire avec une
contrainte non linéaire (cos2∆φ + sin2∆φ = 1). 0f, λf ′, λf ″ étant connus, Les équations (18) (19) n’impliquent aucune approximation et la
les coefficients a (λ), b (λ), c (λ) sont donc des constantes à une lon- justesse des phases MAD ne dépend que de la qualité des données
gueur d’onde donnée. Le système ci-dessus possède alors quatre de diffraction. Il est donc possible d’obtenir des phases expérimen-
inconnues  0FT 2,  0FA 2, ( 0FT  0FA cos∆φ), ( 0FT  0FA sin∆φ), tales à haute résolution, ce qui n’est généralement pas le cas de la
qui ne dépendent pas de la longueur d’onde de travail. Les observa- méthode MIR où les problèmes de défauts d’isomorphisme devien-
nent prépondérants à haute résolution. De plus, avec les techniques
tions expérimentales sont  λF (H ) 2 et  λF (− H ) 2. Un travail à une
de cryocristallographie, il est souvent possible d’effectuer l’ensem-
longueur d’onde aboutit donc à un système d’équations avec quatre
ble des mesures sur un seul cristal. Les cartes de densité électroni-
inconnues et deux équations. En enregistrant un espace complet de
que qu’elle permet d’obtenir sont en général d’une très grande
diffraction à deux longueurs d’onde différentes λ1 et λ2, on aura
qualité. Les limitations de cette méthode sont de deux ordres :
alors quatre équations donnant :
— l’accès à une source de rayonnement synchrotron est
λ1 2 λ1 2 λ2 2 λ2 2 nécessaire ;
F (H ) , F (– H ) , F (H ) , F (– H ) — la détermination des positions des diffuseurs anomaux pose
et toujours quatre inconnues : problème si le nombre de diffuseur anomaux est trop grand dans
l’unité asymétrique ( > 50 avec les logiciels actuels).
0 2 0 2 0 0 0 0
FT , FA , FT FA cos ∆φ , FT FA sin ∆φ De nombreuses structures ont maintenant été résolues par cette
méthode, et il est certain qu’elle va s’imposer comme la méthode de
Le système d’équations linéaires pourra donc être résolu mathé- phasage de référence en cristallographie des macromolécules bio-
matiquement. En général, on effectuera néanmoins les mesures logiques.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Analyse et Caractérisation P 1 090 − 13
CRISTALLOGRAPHIE DES MACROMOLÉCULES BIOLOGIQUES ___________________________________________________________________________________

7. Remplacement moléculaire métrique contient N molécules, il y a donc 6N paramètres à détermi-


ner. Bien qu’une telle recherche dans un espace de dimension 6 (cas
d’une seule molécule) ne soit pas hors de portée, dans certains cas,
des supercalculateurs actuels, les remarques ci-dessus concernant
Le terme de remplacement moléculaire représente une famille de les vecteurs intramoléculaires et les vecteurs intermoléculaires
techniques dont l’objet est d’utiliser la présence d’une macromolé- montrent que l’on peut décomposer ce problème en deux étapes
cule, d’une sous-unité de macromolécule, ou d’un fragment de successives : rotation, translation. L’étape de rotation (fonction de
macromolécule, dans différents environnements cristallographi- rotation) déterminera l’orientation des molécules dans l’unité asy-
ques, pour déterminer ou améliorer des phases initiales. C’est la métrique, et l’étape de translation (fonction de translation) détermi-
méthode de choix lorsque la macromolécule à étudier est parente à nera les positions des molécules correctement orientées.
une autre, dont la structure tridimensionnelle est connue. Ce qui est
important ici est la parenté structurale, c’est-à-dire la similitude du ■ Fonction de rotation
repliement tridimensionnel. Cette similarité structurale est en géné-
ral mise en évidence par des méthodes d’analyse des séquences. La L’idée de base ici est que si l’on donne à la molécule M une orien-
méthode du remplacement moléculaire n’utilise que les modules tation similaire à la molécule X dans le cristal, alors la fonction de
des facteurs de structures de la protéine native sans nécessiter Patterson calculée PM sera analogue à la fonction de Patterson
l’ajout d’atomes lourds supplémentaires. Pour utiliser cette observée pour la molécule X . Pour déterminer l’orientation incon-
méthode, on doit disposer : nue de X , il suffit donc, pour toutes les orientations possibles de M ,
de retenir celle pour laquelle PM et PX seront similaires. Pratique-
— d’un espace complet de diffraction pour la molécule X dont on ment, il s’agit de trouver la (ou les) rotation(s) (définie par une
cherche à déterminer la structure tridimensionnelle ; matrice C ) permettant de « superposer » la fonction de Patterson PX
— de la structure d’une molécule M que l’on suppose être de la molécule inconnue et la fonction de Patterson calculée à partir
parente à X, c’est-à-dire que les deux molécules sont supposées de la molécule PM . Le degré de similitude entre les deux fonctions
avoir un repliement tridimensionnel commun (partiellement ou de Patterson est exprimé par une fonction de corrélation calculée
complètement). sur un volume U, généralement une sphère centrée à l’origine. Ce
La méthode du remplacement moléculaire utilise les propriétés volume est choisi de façon à éliminer les vecteurs intermoléculaires
de la fonction de Patterson qui est le produit de convolution de la entre molécules appartenant à des mailles voisines. Mathématique-
densité électronique par son image obtenue par un centre de symé- ment on exprimera ceci par un coefficient de corrélation entre les
trie par rapport à l’origine : deux fonctions de Patterson :


P ( u ) = V ρ ( r ) ρ ( r + u ) dr = Vρ ( r ) ✳ ρ (– r ) (21) Corr ( θ 1 , θ 2 , θ 3 ) =
∫P
U
X ( r ) P M ( Cr ) dV (22)

avec ρ(r ) densité électronique en un point M de la maille où PX (r ) représente la valeur de la fonction de Patterson du cristal X
repéré par le vecteur r, en r, PM (Cr ) représente la valeur de la fonction de Patterson du
cristal M en Cr, C étant la matrice de rotation construite sur trois
V volume de la maille cristalline. angles (θ1, θ2, θ3) qui définissent une rotation quelconque dans
On peut montrer que les maxima de la fonction de Patterson cor- l’espace. Les maxima de la fonction de corrélation Corr correspon-
respondent aux vecteurs interatomiques. Ces vecteurs peuvent être dent aux meilleures superpositions de PX avec PM .
schématiquement divisés en deux classes : Cette fonction de rotation peut être calculée soit dans l’espace
— les vecteurs intramoléculaires, reliant deux atomes de la direct (opérations sur les fonctions de Patterson), soit dans l’espace
même molécule (ou d’une même sous-unité). Ces vecteurs ne réciproque en exprimant les fonctions de Patterson en terme de fac-
dépendent que de l’orientation de la molécule par rapport aux axes teurs de structure. Dans tous les cas, en raison de la taille des
de symétrie de la maille. Une rotation de la molécule dans la maille macromolécules, les calculs sont longs et coûteux en temps, même
impliquera la même rotation des vecteurs intramoléculaires. Une pour les supercalculateurs les plus puissants. De nombreux algo-
translation de la molécule dans la maille n’affectera pas la distribu- rithmes ont été développés pour remédier à cela ; ils diffèrent par
tion de ces vecteurs intramoléculaires ; les approximations numériques qu’ils utilisent pour effectuer les
— les vecteurs intermoléculaires reliant des atomes de deux calculs et par certains critères de pondération et de sélection.
molécules différentes. Ces vecteurs dépendent de l’orientation et de
la position des molécules dans la maille cristalline. ■ Fonction de translation
Il n’est pas possible de séparer ces deux types de vecteurs intera- Le terme fonction de translation se rapporte ici à toute technique
tomiques sans connaître la structure de la molécule et, de plus, ces permettant de trouver la position d’une molécule correctement
deux classes ne sont pas disjointes. Toutefois, les vecteurs intramo- orientée dans une maille cristalline. Ceci comprend des méthodes
léculaires sont en moyenne plus courts que les vecteurs intermolé- travaillant dans l’espace réciproque et des méthodes de calcul dans
culaires et se trouveront plus proches de l’origine de la fonction de l’espace direct. Elles nécessitent toutes d’avoir trouvé la ou les solu-
Patterson. On séparera donc ces deux classes par un critère de lon- tions exactes de la fonction de rotation. Plusieurs méthodes sont uti-
gueur. lisées. Il s’agit de trouver les maxima de la fonction T (t ) définie par :
La fonction de Patterson d’une macromolécule, ou d’une sous-
unité de macromolécule, a donc une distribution caractéristique de
densité qui reflète son ensemble de vecteurs interatomiques. La
« comparaison » de la fonction de Patterson observée (pour une
T (t ) =
∫P
V
X ( u ) P c ( u , t ) du (23)

molécule dont la structure est inconnue et que l’on cherche à déter-


miner) avec la fonction de Patterson calculée à partir de la structure avec P X (u ) fonction de Patterson observée en un point
d’une molécule parente connue, permettra de déterminer la posi- repéré par le vecteur u pour la molécule
tion et l’orientation de la molécule parente dans la maille cristalline, étudiée X,
et donc de déterminer des phases initiales pour les facteurs de P c (u , t ) fonction de Patterson calculée pour la molécule
structure de la molécule inconnue. modèle M correctement orientée dans la maille
Chaque molécule dans l’unité asymétrique est caractérisée par et positionnée en un point repéré par le vecteur t,
son orientation et sa position, soit par 6 paramètres. Si l’unité asy- V volume de la maille.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
P 1 090 − 14 © Techniques de l’Ingénieur, traité Analyse et Caractérisation
___________________________________________________________________________________ CRISTALLOGRAPHIE DES MACROMOLÉCULES BIOLOGIQUES

La fonction T (t ) présente un maximum pour le vecteur tsol corres-


pondant à un vecteur intermoléculaire reliant deux molécules Erreur sur
les phases
modèles (donc reliées entre elles par un élément de symétrie cristal-
lographique) correctement positionnées dans la maille cristalline. Erreur sur
DF les modules
■ Remarques F
u

Le point central de cette méthode est le choix de la molécule IF I


modèle. Si dans certains cas ce choix est relativement simple, il peut F
v

être très délicat dans d’autres. Le choix de la molécule parente peut


être fait selon deux critères :
— à partir d’analyses de séquence : si deux macromolécules ont
une forte homologie de séquence, elles adopteront certainement le
même repliement tridimensionnel ; Cercle natif
— à partir d’analyses fonctionnelles : si deux protéines ont la
même fonction biologique, elles peuvent avoir la même structure
dans l’espace; L'erreur dans la carte de densité électronique est proportionnelle à DF.
L'erreur sur le module des facteurs de structure est faible alors que
Si la molécule modèle est trop différente (localement ou globale- l'erreur sur les phases peut être importante.
ment) de la molécule inconnue, alors la méthode du remplacement
moléculaire risque d’échouer ou même de donner une solution Figure 7 – Effets des erreurs sur le calcul de la densité électronique
fausse. Il faudra donc toujours suivre avec précaution une solution
issue du remplacement moléculaire et s’assurer de son bon com-
portement au cours de l’affinement cristallographique (diminution
du facteur de désaccord cristallographique R libre , voir para- l’information la plus importante est contenue dans les phases. En
utilisant le théorème de Parseval, on peut montrer que si F hkl v est le
graphe 9). Le grand avantage de cette méthode est qu’elle ne néces- u
site qu’un seul espace de diffraction. En cas de succès, elle peut facteur de structure réel et si F hkl est le facteur de structure utilisé,
donc permettre d’aboutir rapidement à la structure tridimension- l’erreur quadratique moyenne commise sur la densité est alors don-
nelle. Dans certains cas, elle peut mener à une impasse totale. Il fau- née par la relation :
dra alors revenir aux méthodes de phasages MIR (ou MAD)
+∞ +∞ +∞
présentées aux paragraphes précédents (§ 5 et 6). 1
< ( ∆ ρ ) 2 > = -------
V2
∑ ∑ ∑ v –Fu
F hkl hkl (25)
■ Détermination des phases h = –∞ k = –∞ l = –∞
Lorsque l’on dispose d’une molécule homologue modèle et que
les problèmes de la rotation et de la translation ont été résolus, le La figure 7 montre que les erreurs sur les phases sont l’effet
v –Fu .
dominant de F hkl
calcul d’un premier jeu de phases est alors possible et permet, avec hkl
les modules des facteurs de structure observés, le calcul d’une carte
de densité électronique, qui permettra une première construction de
la molécule inconnue.
8.1 Amélioration par des méthodes
de modification de densité

8. Cartes de densité Pour améliorer les cartes de densité électronique, c’est-à-dire les
électronique rendre interprétables, il faut donc diminuer l’erreur commise sur
chaque phase. Cela est réalisé par des méthodes de modification de
densité qui utilisent des contraintes physico-chimiques que la den-
sité électronique doit respecter. Les connaissances utilisées con-
Le calcul des phases de chaque réflexion étant résolu par l’une cerne la présence de solvant, l’atomicité et la positivité de la densité
des méthodes précédentes, il est possible de calculer une première électronique, les histogrammes de densité, la symétrie non cristallo-
carte de densité électronique, en pondérant chaque réflexion par la graphique. Ces propriétés introduisent des relations entre certains
qualité estimée de l’information de phase (figure de mérite). La den- facteurs de structures (modules et phases) qui se traduisent par des
sité électronique ρ(x, y, z ) en un point de coordonnées relatives contraintes sur la densité électronique ; leur incorporation permet-
(x, y, z ) dans la maille cristalline s’écrit : tra donc d’améliorer les cartes de densité électronique. L’utilisation
de ces contraintes sur la densité est réalisée par un processus cycli-
ρ (x, y, z) = que qui alterne des calculs dans l’espace direct (opération sur les
+∞ +∞ +∞ cartes de densités) et dans l’espace réciproque (opérations sur les
1
----
V ∑ ∑ ∑ m hkl F hkl exp [ i φ hkl ] exp [2iπ ( hx + ky + lz )] (24) facteurs de structure) et comprend typiquement les étapes suivan-
h = –∞ k = –∞ l = –∞ tes (figure 8).

avec  Fhkl et φhkl respectivement module du facteur de 1. Calcul d’une carte de densité électronique avec des phases ini-
structure et phase pour la réflexion hkl, tiales et les facteurs de structures observés  Fobs, φini , chaque
terme étant pondéré par une figure de mérite mini ;
mhkl figure de mérite,
2. Modification de la densité électronique, compte tenu d’une ou
V volume de la maille cristalline. de plusieurs contrainte que l’on détaillera ci-dessous ;
Dans la plupart des cas, ces cartes sont difficilement interpréta-
3. Calcul du facteur de structure ( Fcalc, φcalc ) pour chaque
bles c’est-à-dire que l’on n’arrive pas à localiser des éléments struc-
réflexion par transformation de Fourier inverse, à partir de la densité
turaux caractéristiques des macromolécules biologiques
électronique modifiée ;
permettant d’initier la construction de la structure. Ceci est dû à
l’erreur commise sur les phases qui est souvent de l’ordre de 50° à 4. Combinaisons des facteurs de structure observés avec les fac-
60°, alors que l’erreur commise sur le module des facteurs de struc- teurs de structure calculés pour aboutir à un nouveau jeu de coeffi-
ture n’est que de quelques pour-cent. Comme toute série de Fourier, cients  Fnouv, φnouv , mnouv ;

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Analyse et Caractérisation P 1 090 − 15
CRISTALLOGRAPHIE DES MACROMOLÉCULES BIOLOGIQUES ___________________________________________________________________________________

biologiques à moyenne résolution (2,5 Å), les contraintes imposées


mini, Fobs, f ini par l’atomicité sont approximativement valables et elle est surtout
employée conjointement à d’autres techniques de modification de
densité pour améliorer les cartes de densité électronique.
mnouv, Fnouv, fnouv Combinaisons
phases et amplitudes
■ Histogrammes des densités
Cycle 0 Cycles 1 à n Cette technique repose sur l’observation que l’histogramme de
répartition de la densité électronique (fraction de la maille cristalline
Fcalc ,f calc qui a une densité située entre deux valeurs t et t + δt ), calculé pour
Transformation
de nombreuses protéines avec les phases exactes (hors solvant), est
de Fourier très similaire pour des cartes calculées à une résolution donnée.
N cycles L’histogramme de répartition représente alors une probabilité de
distribution de la densité électronique, indépendante de la macro-
Transformation molécule étudiée et ne dépendant que de la résolution à laquelle la
de Fourier inverse densité électronique est calculée. La contrainte s’applique en calcu-
lant une fonction correctrice qui cherche à calquer l’histogramme de
la densité observée à celui d’une densité idéale. Cette fonction est
alors appliquée à la densité électronique.
r Modification r mod
de densité
■ Symétrie non cristallographique
Fin Dans de nombreux cas de cristaux de macromolécules biologi-
ques, l’unité asymétrique contient plusieurs macromolécules identi-
ques (un dimère, un trimère ou un tétramère, voir plus). Il existe
Interprétation de la carte alors une symétrie locale (rotation, translation) reliant les macromo-
de densité électronique
lécules équivalentes. Cette symétrie supplémentaire est appelée
symétrie non cristallographique car elle est respectée uniquement à
Figure 8 – Amélioration des phases par la technique de modification l’intérieur d’un volume (on dit une enveloppe) qui est inclu dans
de densité électronique l’unité asymétrique. Cette enveloppe ne peut pas remplir complète-
ment l’unité asymétrique. De plus, le réseau cristallin n’est pas con-
servé par cette symétrie.
5. Retour à l’étape 1, avec les coefficients  Fnouv, φnouv , mnouv . En Cette symétrie non cristallographique est mise en évidence dans
général on prendra  Fnouv =  Fobs sauf pour quelques réflexions la fonction de Patterson car elle induit des caractéristiques particu-
qui pourraient ne pas avoir pu être enregistrées. lières de celle-ci. On peut alors déterminer la nature, l’orientation et
Ce processus cyclique est répété jusqu’à ce que la convergence la position des éléments de symétrie dans l’unité asymétrique à par-
soit atteinte selon des critères prédéfinis par l’utilisateur. Selon la tir de la fonction de Patterson de la macromolécule native. La symé-
validité et le type de contraintes appliquées, ces méthodes appor- trie non cristallographique introduit une redondance dans le jeu
tent des améliorations souvent spectaculaires des cartes de densité d’intensités diffractées qui induit des contraintes entre les facteurs
électronique. de structures (donc entre les phases). En fait, c’est l’expression de
ces contraintes dans l’espace direct qui est à la base du formidable
■ Nivellement de solvant succès de cette méthode en tant que processus d’amélioration et
Les cristaux de macromolécules contiennent souvent une forte d’extension des phases. La technique de modification de densité
proportion de solvant (de 20 % à 90 %). On s’attend donc à priori à consiste alors à imposer cette symétrie en remplaçant la densité de
visualiser dans les cartes de densité électronique une zone conte- chaque point à l’intérieur de l’enveloppe par la moyenne entre sa
nant la macromolécule et une zone de solvant. Cette distinction densité et celle de ces n points équivalents (n étant l’ordre de la
entre le volume contenant la macromolécule (on dira un masque) et symétrie non cristallographique). La présence de cette symétrie non
le volume de solvant est souvent suffisamment définie, même pour cristallographique est un facteur puissant pour l’amélioration des
des cartes calculées avec des phases initiales relativement fausses. phases.
Cette méthode exploite le fait que dans des cartes à moyenne réso-
lution, les zones de solvant présentent une densité faible et relative-
ment plate avec très peu de fluctuations. Ceci est dû au désordre des
molécules de solvant non liées. La contrainte de nivellement de sol-
8.2 Extension des phases
vant s’applique en définissant au préalable les limites entre la
macromolécule et le solvant (définition d’un masque moléculaire) et
Dans la pratique, les méthodes de phasage ne permettent d’obte-
en remplaçant la densité dans la zone de solvant par une densité
nir des phases que jusqu’à une résolution limitée, qui est souvent
uniforme. Ceci est maintenant réalisé par des méthodes automati-
inférieure à la résolution pour laquelle on a pu enregistrer les modu-
ques. Plus la proportion de solvant est importante, plus les contrain-
les des facteurs de structure. On peut par exemple disposer d’un
tes imposées sont fortes et productives.
espace complet de diffraction jusqu’à 2 Å de résolution et ne dispo-
ser de phases expérimentales que jusqu’à 3,5 Å de résolution. Cela
■ Atomicité peut être typiquement le cas qui se produit dans la méthode du rem-
L’atomicité utilise l’équation de Sayre bien connue en cristallogra- placement isomorphe multiple où les défauts d’isomorphisme peu-
phie des petites molécules qui contraint la forme locale de la densité vent sévèrement affecter le pouvoir de phasage. Les méthodes de
électronique dans le cas d’atomes identiques et biens séparés les modification de densité permettent aussi de calculer, à partir de
uns des autres (résolution atomique). Pour les petites molécules phases connues à basse résolution, les phases des réflexions de
(moins de 200 atomes), ces contraintes sont suffisantes pour résou- plus haute résolution. On parlera alors d’extension de phases. Ceci
dre la structure ab initio, c’est-à-dire avec les modules des facteurs se réalise simplement dans le processus décrit par la figure 8 où
de structure de la protéine native seule. Ceci est possible car ces l’étape de transformation de Fourier inverse peut se faire à une réso-
cristaux diffractent jusqu’à très haute résolution ( < 1 Å ). C’est rare- lution légèrement supérieure à celle utilisée pour calculer la carte
ment le cas des macromolécules biologiques qui, de plus, compor- dans l’étape 1. Cette extension des phases doit être réalisée de
tent un nombre trop important d’atomes. Pour les macromolécules manière progressive et son apport est d’autant plus important que

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
P 1 090 − 16 © Techniques de l’Ingénieur, traité Analyse et Caractérisation
___________________________________________________________________________________ CRISTALLOGRAPHIE DES MACROMOLÉCULES BIOLOGIQUES

les contraintes imposées sont fortes. Les cas extrêmes et typiques Bj facteur d’agitation thermique (isotrope),
concernent les cristaux de virus à symétrie icosaédrique qui possè- N nombre d’atomes de la maille,
dent souvent une symétrie non cristallographique très élevée (ordre
15, 30 voir 60) ce qui permet de déterminer les structures cristallines K facteur d’échelle.
à résolution atomique à partir de phases initiales à basse résolution. Les paramètres que l’on va affiner au cours du processus d’opti-
misation sont :
— le facteur d’échelle K ;
— les coordonnées atomiques (xj , yj , zj ( j = 1, N )) ;
8.3 Construction de la structure — les facteurs de température (Bj ( j = 1, N )) ;
— les facteurs d’occupation (qj ( j = 1, N )), généralement fixés à 1.
Construire la structure consiste à placer les atomes de la macro- Les facteurs qj et Bj traduisent respectivement le désordre stati-
molécule dans la carte de densité électronique. Ce travail est que et dynamique de chaque atome.
d’autant plus facile que la résolution est élevée et que les phases uti- Le désordre dynamique traduit la vibration d’un atome autour de
lisées pour calculer la carte sont proches des valeurs exactes. De sa position d’équilibre, l’amplitude de ce mouvement dépendant de
nombreux logiciels d’aide à la construction sont disponibles et faci- la température. Les périodes de vibrations atomiques sont grandes
litent grandement le travail. Cette construction utilise des stations vis-à-vis du temps que mettent les rayons X à traverser le cristal. À
graphiques permettant de manipuler en temps réel les cartes de un instant donné, le spectre de diffraction du cristal correspond à
densité électronique et les macromolécules biologiques. C’est sûre- celui d’un cristal figé où les atomes sont disposés aléatoirement lors
ment l’étape la plus vivifiante du processus cristallographique car de leurs positions d’équilibre. Les données finales vont correspon-
elle permet de dévoiler la structure atomique de la macromolécule dre à la moyenne, pendant le temps de l’expérience, de différents
étudiée. Les cartes de densité électronique sont représentées par clichés instantanés. Le facteur d’agitation thermique B est lié au
des surfaces d’isodensité. La première étape d’analyse d’une carte
de densité électronique consiste d’abord à repérer le squelette de la déplacement quadratique moyen U j2 de l’atome autour de sa posi-
macromolécule biologique avant de pouvoir positionner les détails
plus fins. Dans de nombreux cas où la qualité des phases est limitée, tion d’équilibre par la relation : B = 8 π 2 U j2 . Un modèle plus
la première interprétation est délicate et suppose une très bonne sophistiqué, nécessaire à très haute résolution, consiste à décrire
expertise. Grâce aux outils informatiques puissants (machines et chaque atome comme un oscillateur harmonique anisotrope. Le fac-
logiciels) sans cesse améliorés, le nombre d’heures nécessaires à la teur d’agitation thermique est alors décrit par six paramètres.
construction du premier modèle est de plus en plus petit. Cette Le désordre statique est caractérisé par un atome ou un groupe
étape, qui nécessitait plusieurs mois de travail il y a encore quelques d’atomes qui n’occupe(nt) pas la même position dans chaque
années, peut généralement se faire en moins d’un mois pour un maille, chaque unité asymétrique ou à l’intérieur des molécules de
chercheur confirmé. La construction du modèle dépend fortement l’unité asymétrique.
de la limite de résolution des données de diffraction. Des données
jusqu’à 3 Å sont nécessaires pour construire une structure détaillée L’affinement cristallographique est un processus d’optimisation
de la macromolécule biologique. Pour visualiser les molécules de non linéaire pour lequel plusieurs méthodes ont été développées.
solvants ou d’ions, qui sont très importantes pour les réactions bio- Deux types d’algorithmes sont utilisés :
logiques, il est nécessaire d’avoir une limite de résolution des don- — les méthodes de moindres carrés et les méthodes de minimi-
nées de diffraction d’au moins 2,7 Å à 2,5 Å. La validité de sation d’énergie associées ;
l’information biologique qui pourra être déduite de la structure est — les algorithmes de dynamique moléculaire utilisant une mini-
fortement contrainte par la qualité des données de diffraction et par misation par la méthode de recuit simulé.
la limite de résolution des cristaux. L’affinement cristallographique des macromolécules biologiques
L’obtention d’un premier modèle permet de calculer des phases est une étape difficile principalement pour quatre raisons :
qui pourront être combinées aux phases expérimentales, et d’initier — le nombre de données expérimentales mesurées (modules des
un nouveau processus de modification de densité. Des phases plus facteurs de structure) est souvent relativement faible par rapport au
exactes pourront alors être obtenues qui donneront des cartes de nombre de paramètres à optimiser. À des résolutions inférieures à
densité électronique plus interprétables. Le modèle sera alors amé- 2,5 Å, le nombre d’observations dépasse rarement le nombre de
lioré. paramètres ;
— le modèle initial de la structure est souvent de qualité médio-
cre en raison des erreurs des phases expérimentales, ce qui se tra-
duit par un désaccord entre la structure construite et la structure
9. Affinement d’une structure présente dans le cristal. Un modèle peut être imparfait (régions mal
construites) et/ou incomplet (régions non encore construites car
cristallographique non interprétables) ;
— la fonction à minimiser possède plusieurs minima secondaires
en plus du minimum absolu. L’obtention du modèle le mieux adapté
Cette étape du processus cristallographique consiste à optimiser aux données de diffraction va donc dépendre du rayon de conver-
le modèle issu de l’interprétation des cartes de densité électronique gence de la méthode de minimisation utilisée. Plus le modèle initial
par un procédé mathématique qui minimise l’écart entre les modu- sera éloigné de la solution correcte, plus une méthode de minimisa-
les des facteurs de structure observés et les modules des facteurs de tion à faible rayon de convergence aura tendance à aboutir au mini-
structure calculés. Le facteur de structure est calculé à partir de la mum local le plus proche ;
nature et de la position des atomes dans la maille par la relation : — les cartes de densité électronique calculées avec des phases
issues du modèle présentent des biais qui ont tendance à mettre en
N valeur la densité électronique du modèle introduit, même s’il est
sin 2 θ
calc = K
F hkl ∑ qj f jhkl exp – B j -------------- exp [ 2iπ ( hx j + ky j + lz j ) ] (26)
λ2
localement inexact, et à détruire la densité électronique de régions
j=1 du modèle qui n’auraient pas encore été construites car non inter-
prétables. Différents schémas de combinaisons de phases et
avec f jhkl facteur de diffusion de l’atome j de coordonnées d’amplitudes ont été introduits pour réduire ces biais.
relative xj , yj , zj ,
Dans la pratique l’affinement cristallographique est un processus
qj facteur d’occupation, cyclique à deux étapes :

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Analyse et Caractérisation P 1 090 − 17
CRISTALLOGRAPHIE DES MACROMOLÉCULES BIOLOGIQUES ___________________________________________________________________________________

— une étape d’optimisation du modèle par calculs automatiques. — augmenter le nombre d’observations : on incorpore dans la
On obtient alors de nouveaux paramètres pour décrire la structure fonction à minimiser des informations stéréochimiques connues à
cristalline ; priori : géométrie des acides aminés (longueurs et angles de
— une étape de reconstruction manuelle où l’on interprète les valence), symétrie non cristallographique, corrélations entre ato-
cartes de densité électronique calculées à partir des nouveaux para- mes liés. On parlera alors d’affinement restreint. La fonction à mini-
mètres. Les nouvelles phases permettent de construire un nouveau miser comporte alors des termes interdisant à la structure de ne pas
modèle qui sera soumis au processus d’optimisation automatique. trop s’écarter d’une stéréochimie idéale. Les caractéristiques de
cette stéréochimie sont définies à partir d’un ensemble de structu-
Ces deux étapes sont très gourmandes en temps de travail res affinées à très haute résolution. Ces restrictions seront introdui-
humain et en temps de calculs. De nombreux efforts ont été réalisés tes soit sous forme de restrictions stéréochimiques simples, soit en
ces dernières années par l’écriture de nouveaux algorithmes et par les incorporant dans une énergie potentielle totale de la macromo-
l’utilisation de calculateurs de plus en plus puissants. lécule que l’on cherchera à minimiser (voir paragraphe 9.2) ;
Le déroulement de l’affinement cristallographique est contrôlé — diminuer le nombre de paramètres : on réduit le nombre de
par l’évolution d’un facteur de désaccord cristallographique Rcrist : paramètres à affiner en contraignant les autres à des valeurs fixes.
On parle alors d’affinement avec contraintes. On peut ainsi fixer les
∑ hkl – K ′ F hkl
F obs calc
longueurs de liaisons et les angles de valence et n’affiner que les
angles de torsion.
h, k, l
R crist = ------------------------------------------------------------------- (27)
∑ F obs hkl L’introduction de contraintes et(ou) de restrictions permet d’aug-
menter le rayon de convergence de la méthode d’optimisation et de
h, k, l
diminuer le risque de suraffinement.
Classiquement, un premier modèle peut avoir un facteur de
désaccord cristallographique Rcrist ≈ 0,4 à 0,5 en début du processus
et Rcrist ≈ 0,15 à 0,2 en fin d’affinement. Malheureusement, ce fac-
teur Rcrist n’est pas le reflet de l’exactitude du modèle car il est le 9.2 Méthodes de la dynamique
fruit d’une procédure d’optimisation qui ne tend qu’à réduire le moléculaire
désaccord entre les modules des facteurs de structure observés et
calculés. Un modèle avec de nombreuses erreurs, c’est-à-dire qui ne
traduit pas la structure présente dans le cristal, peut avoir un très
La dynamique moléculaire étudie le comportement dynamique
bon Rcrist . Pour remédier à cela, il faudrait une méthode d’optimisa-
d’un système d’atomes dans un champ de forces moléculaires.
tion qui prendrait explicitement en compte les erreurs sur les pha-
Dans un calcul de dynamique moléculaire, chaque atome de masse
ses. L’approche actuelle consiste à évaluer la justesse d’un modèle
mi et de coordonnées ri est soumis à une force Fi donnée par la loi
par la valeur d’un facteur de désaccord cristallographique particulier
de Newton :
appelé Rlibre . Celui-ci est calculé à partir de réflexions qui, dès le
début du processus d’affinement, sont mises de côté et ne sont pas
δ 2 ri δ E tot F i ( r i )
utilisées dans l’optimisation du modèle. Typiquement, de 5 % à m i ---------- = – ------------- = -------------- (29)
10 % des réflexions sont utilisées pour le calcul de Rlibre . Il a été δ t2 δ ri mi
montré, par l’étude de structures tests, que la valeur de Rlibre est for-
tement corrélée avec l’erreur commise sur les phases d’un modèle. où Etot est l’énergie du système.
C’est donc un bon critère pour suivre l’évolution d’un affinement.
Le système d’équations défini par la relation (29) peut être résolu
Une différence trop importante ( > 0, 10 ) entre R libre et Rcrist traduit
numériquement à partir d’une géométrie de départ et de vitesses
un processus dit de suraffinement où la baisse artificielle de Rcrist ne
atomiques initiales.
correspond pas à une amélioration du modèle. L’introduction
d’algorithmes d’optimisation fondés sur des méthodes de maxi- La physique statistique relie le paramètre macroscopique qui défi-
mum de vraisemblance et sur une vision bayésienne des distribu- nit l’agitation thermique moyenne à la température. On peut alors
tions statistiques des facteurs de structure permet d’éviter de attribuer une vitesse initiale aléatoire à chaque atome à partir d’une
tomber dans un certain nombre de problèmes présentés ci-dessous. distribution de Maxwell à la température désirée. Connaissant les
vitesses et les positions initiales de chaque atome, le système
d’équations (29) peut être intégré sur un temps très court (≈ 1 à 2 fs ;
1 fs = 10−15 s) (algorithme de Verlet) et permet d’obtenir les déplace-
9.1 Méthodes de moindres carrés ments à appliquer à chaque atome. On peut alors recommencer le
calcul pour un deuxième pas d’intégration. Si le nombre de cycles
est suffisant (≈ 103 à 104), on peut alors atteindre le minimum absolu
Ces techniques cherchent le minimum de la fonction : de l’énergie totale E tot.
L’idée de base de la dynamique moléculaire est de porter le sys-
ψ = ∑ w hkl ( F obs
hkl – K ′ F calc
hkl )2 (28)
tème à une température initiale suffisamment haute pour franchir
h, k, l
des barrières énergétiques et explorer une grande gamme de con-
avec hkl
F obs hkl
et F calc respectivement le module du facteur formations. Le système est alors ramené lentement à température
de structure observé et calculé pour la ambiante en diminuant progressivement l’énergie cinétique des
réflexion d’indice hkl, atomes (technique dite de recuit simulé). Cela permet à l’affinement
d’éviter de rester piégé dans de faux minima et éventuellement
K′ facteur d’échelle, d’atteindre le minimum absolu de la fonction énergétique. Pour
whkl poids affecté à chaque réflexion. l’affinement des structures cristallographiques, on définit une fonc-
tion énergie totale de la macromolécule E tot, qui se décompose en
Pour l’affinement des structures biologiques, on doit malheureu- deux termes :
sement faire face à un nombre d’observations insuffisant en raison
de la limite de diffraction des cristaux (rarement mieux que 1,5 Å). E tot = E pot + wEcrist (30)
Dans ces conditions, les méthodes de minimisation par moindres
carrés ne sont pas stables. Pour augmenter le rapport nombre où Epot représente une fonction énergie potentielle de la macromo-
d’observations sur nombre de paramètres, deux méthodologies lécule, Ecrist une pseudoénergie cristallographique et w un facteur
sont utilisées : d’échelle.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
P 1 090 − 18 © Techniques de l’Ingénieur, traité Analyse et Caractérisation
___________________________________________________________________________________ CRISTALLOGRAPHIE DES MACROMOLÉCULES BIOLOGIQUES

Epot dépend de la géométrie induite par les interactions covalen- général incomplet (certains atomes sont manquants) et/ou imparfait
tes et des interactions non-covalentes (Van der Waals, liaisons (certains atomes sont mal positionnés). La reconstruction du
hydrogène, interactions électrostatiques). Elle permet d’introduire modèle s’effectue dans des cartes de densité électronique calculées
les contraintes et les restrictions introduites au paragraphe 9.1. Ecrist avec des coefficients qui essayent de mettre en valeur ces défauts et
est défini par : de proposer des solutions nouvelles. Il est déconseillé d’utiliser
comme coefficient les amplitudes  Fobs et les phases φcalc (calcu-
E crist = ∑ w hkl ( F obs
hkl – K ′ F calc
hkl )2 (31) lées à partir du modèle). En effet, la prédominance des phases dans
h, k, l les séries de Fourier donnerait une carte résultante identique au
modèle introduit (on parle alors de biais). De nombreux travaux ont
où whkl est un poids attribué à chaque réflexion. été réalisés dans ce domaine pour réduire ce biais. Deux types de
La méthode de recuit simulé permet une augmentation du rayon cartes sont utilisés dans la pratique :
de convergence de l’affinement ce qui permet de réduire les étapes — des cartes dites de « Fourier différences » qui sont des cartes
de reconstruction manuelle. En contrepartie, elle nécessite des calculées avec des amplitudes du type (um  Fobs − vD  Fcalc) et des
moyens informatiques relativement puissants pour rester dans des phases φcalc . Dans cette expression, u et v sont des entiers, m et D
temps de calculs raisonnables. Malheureusement, cette méthode deux coefficients permettant d’estimer la fraction exacte de chaque
augmente fortement le danger de suraffinement, car elle est capable facteur de structure Fcalc . Ils sont calculés à partir d’une distribution
de bouleverser fortement certaines régions de la structure sans que conditionnelle de probabilité p ( F obs , F calc ) qui doit prendre en
cela corresponde à un modèle plus exact. C’est pour remédier à ce compte toutes les erreurs. Les coefficients les plus couramment uti-
problème que la notion de R libre a été introduite en cristallographie ; lisés pour le couple (u, v ) sont (3, 2) ou (2, 1) ou (1, 1). On parle alors
l’amélioration d’un modèle doit se traduire par une diminution con- de carte (3Fobs − 2Fcalc), (2Fobs − Fcalc), (Fobs − Fcalc) ;
jointe de Rcrist et de R libre. — des cartes de type « OMIT MAP » : l’idée de base est d’enlever
Il faut ici noter que pour des structures déterminées à partir de certaines zones du modèle pour le calcul des phases (et de l’affine-
données de diffraction à très haute résolution, le terme Ecrist seul ment). Bien que ces atomes n’interviennent pas dans le calcul de
suffit à gouverner l’affinement. C’est d’ailleurs en grande partie à cartes de densité électronique, on peut montrer qu’on devrait quand
partir des structures à très haute résolution que les paramètres sté- même les voir, à leur position correcte, grâce à l’information appor-
réochimiques utilisés pour la définition de Epot sont calculés. tée par les modules des facteurs de structure  Fobs.
La reconstruction s’effectue en général en travaillant sur plusieurs
types de cartes simultanément. En effet, comme il est impossible de
supprimer complètement le biais introduit par le modèle, toutes les
9.3 Maximum de vraisemblance cartes ne sont pas de même qualité et elles apportent des informa-
tions souvent complémentaires. On considère que l’affinement cris-
tallographique est terminé lorsqu’il n’y a plus d’évolution de R libre
Pour remédier aux difficultés de l’affinement d’une macromolé- et que les cartes de densité électronique ne permettent plus de
cule biologique, il est nécessaire d’introduire dans la fonction cris- modifications du modèle.
tallographique que l’on cherche à optimiser un terme qui permette
de prendre en compte l’erreur sur les phases. La minimisation d’un
terme cristallographique donné par la relation (28) conduit à des
suraffinements car elle cherche à obtenir un accord entre modules 9.5 Particularités des macromolécules
de facteurs de structure et considère les phases comme constantes biologiques
(c’est-à-dire sans erreurs). Ce type de minimisation est parfaitement
justifié dans le cas de petites molécules où le rapport nombre
d’observations sur nombre de paramètres est énorme, ce qui per-
En fin d’affinement, on obtient classiquement un facteur de
met d’obtenir un traitement mathématique stable et une estimation
désaccord cristallographique Rcrist de l’ordre de 0,15 à 0,20 avec un
correcte des erreurs.
facteur de désaccord cristallographique libre R libre de l’ordre de
Pour les macromolécules biologiques, il est important de prendre 0,15 à 0,30. C’est en général à ce niveau qu’on estime que le travail
en compte les erreurs sur les phases dues à des modèles incomplets est acceptable pour publication et que les coordonnées sont dépo-
(certains atomes manquants) et/ou à des modèles imparfaits (cer- sées dans une base de données (voir paragraphe 10). Les facteurs
tains atomes mal positionnés). Les fondements mathématiques de Rcrist et R libre obtenus pour les macromolécules biologiques sont
ce travail ont été initiés il y a de nombreuses années et ont conduit relativement élevés par rapport au standard des petites molécules.
depuis peu à l’utilisation de logiciels appropriés par la communauté Pour les cristaux de petites molécules (moins de 200 atomes), le fac-
internationale. Ces méthodes font appel aux méthodes de maxi- teur Rcrist est de l’ordre de quelques pour-cent en fin d’affinement.
mum de vraisemblance et à l’application appropriée des statistiques Les valeurs élevées de Rcrist sont dues à plusieurs facteurs spécifi-
bayesiennes à la cristallographie des macromolécules biologiques. ques des cristaux de macromolécules biologiques qui sont peu ou
Le but de ces méthodes est de définir la probabilité p ( F obs , F calc ) mal pris en compte dans les paramètres décrivant la structure :
de mesurer les modules des facteurs de structure observés, étant — le comportement dynamique des macromolécules biologi-
donné le modèle et les estimations des différentes erreurs. Le ques. Elles présentent une flexibilité intrinsèque dans les cristaux,
meilleur modèle correspond au maximum de cette probabilité. Le certaines zones pouvant par exemple simultanément adopter plu-
traitement mathématique de cet aspect dépasse le cadre de cet arti- sieurs conformations qu’il serait alors nécessaire d’introduire ;
cle, le lecteur désirant approfondir la question pourra se référer à la — la proportion importante de solvant (de 20 % à 90 %) présent
bibliographie donnée en [Doc. P 1 090]. Dans la pratique, on mini- dans les cristaux ;
mise l’inverse de ln ( p ( F obs , F calc ) ) , ce qui permet d’utiliser ce
— la limite de diffraction en général modeste des cristaux (2 Å à
terme comme une énergie cristallographique Ecrist .
3 Å).
Dans les cristaux, les macromolécules sont entourées d’une cou-
che de molécules d’eau ordonnées plongées dans un volume
9.4 Cartes de densité électronique occupé par des molécules d’eau désordonnées. Cela est très avanta-
geux car l’environnement de la macromolécule dans le cristal est
proche de l’environnement in vivo, et il est de plus possible de faire
Après l’étape d’optimisation mathématique du modèle, on calcule diffuser des substrats dans les canaux de solvant. Dans le cas
de nouvelles cartes de densité électronique. Tout modèle est en d’enzymes, on a pu voir, sur de nombreux exemples, que la macro-

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Analyse et Caractérisation P 1 090 − 19
CRISTALLOGRAPHIE DES MACROMOLÉCULES BIOLOGIQUES ___________________________________________________________________________________

molécule conservait son activité biologique dans les cristaux. La Chaque macromolécule est répertoriée dans la PDB par un nom
présence de solvant est aussi très fortement mise à profit dans le de code arbitraire et peut être accédée via une interface graphique
processus d’amélioration des phases. Ses avantages se paient au simple et performante. De nombreux liens vers d’autres bases de
niveau de la limite de diffraction souvent modeste des cristaux et au données spécialisées permettent de rassembler un maximum de
niveau de l’affinement cristallographique. En effet, on ne sait pas connaissances sur une macromolécule donnée. Chaque entrée de la
correctement modéliser ces molécules de solvant désordonnées. PDB contient des informations techniques simples et concises sur la
Elles sont le plus souvent approximées par un modèle de solvant méthode de détermination de la structure ainsi qu’un certain nom-
avec une densité constante qui n’est satisfaisant qu’à basse résolu- bre de critères de validation.
tion.
Le dépôt de coordonnées est une pratique moins courante dans le
La prise en compte du désordre statique et dynamique des
monde industriel où au contraire on ne souhaite pas communiquer
macromolécules biologiques introduit des paramètres supplémen-
aux compétiteurs les données si précieuses que constituent les
taires dans l’affinement cristallographique. En général, ces paramè-
coordonnées atomiques d’une structure. Il n’est pas inhabituel que
tres ne peuvent pas être pris en compte en raison de la limite de
plusieurs sociétés pharmaceutiques déterminent en parallèle la
diffraction souvent limitée des données. Il faut noter que cette flexi-
même structure et ne rendent pas ces coordonnées accessibles. La
bilité intrinsèque n’est pas éliminée par les techniques de cryocris-
PDB ne contient donc pas toutes les structures résolues. Il est aussi
tallographie. Néanmoins, des données à très haute résolution
possible pour une équipe de recherche de déposer les coordonnées
(mieux que 1,2 Å) ont pu être collectées pour plusieurs structures de
d’une macromolécule à la PDB sans qu’elles soient accessibles au
macromolécules biologiques et ont permis d’obtenir des structures
public (durée maximum un an actuellement).
finales avec des valeurs de Rcrist et de R libre de l’ordre de 10 %, ce
qui se rapproche du standard des petites molécules.
De plus, il faut aussi noter que la fonction énergétique définie par
la relation (30) peut posséder, pour une macromolécule biologique,
non pas un minimum absolu, mais plusieurs minima d’énergies voi- 11. Perspectives
sines.

La cristallographie des macromolécules biologiques occupe une


place centrale dans la biologie moderne. La structure tridimension-
10. Base de données PDB nelle d’une macromolécule permet d’apporter un éclairage neuf et
original qui est essentiel pour comprendre sa fonction biologique.
Au cours de la décennie précédente, des avancées technologiques
Les structures tridimensionnelles sont déposées dans une base majeures ont été réalisées qui permettent aux cristallographes
de données spécialisée, appelée Protein Data Bank (PDB), située d’attaquer des problèmes de plus en plus complexes. La purification
actuellement à Brookaven aux États-Unis. Cette base de données est de la macromolécule et sa cristallisation sont les deux étapes limi-
d’accès libre et gratuit et permet à la communauté internationale tantes d’un projet structural. De plus, la résolution du problème des
d’avoir accès aux coordonnées des structures résolues (via la phases est encore dans certains cas un processus long et fastidieux.
réseau Internet, voir adresse en [Doc. P 1 090]). Le dépôt des coor- Ceci est particulièrement vrai pour les projets concernant de gros
données d’une macromolécule est devenue une condition préalable édifices macromoléculaires. Les challenges d’aujourd’hui concer-
à la publication des travaux de recherche dans une revue internatio- nent en premier lieu des complexes de haut poids moléculaire,
nale de haut niveau. Il faut se rappeler que les publications sont le généralement sans symétrie interne, composés d’assemblage de
critère premier de jugement du travail scientifique d’un chercheur protéines et/ou d’acides nucléiques. Ces travaux nécessitent un
du secteur public. En conséquence, la PDB a subi une croissance investissement lourds et coûteux (hommes et matériel). La cristallo-
importante ces dernières années. En septembre 1998, elle contenait graphie va aussi avoir à satisfaire le secteur de la biologie structu-
8 270 structures et, en septembre 1999, 10 714, dont 82 % de structu- rale génomique. Le séquençage complet de plusieurs génomes
res cristallographiques. En 1997, 1 857 structures nouvelles ont été produit une quantité importante de gènes dont la fonction est incon-
déposées, soit en moyenne plus de cinq structures par jour. Au nue. Si l’on connaît la structure de la protéine correspondante, on
cours des quatre premiers mois de 1998, 1 226 structures ont déjà pourra alors peut-être, en comparaison avec la base de données
été déposées. actuelles, assigner une fonction à chaque gène.

Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
P 1 090 − 20 © Techniques de l’Ingénieur, traité Analyse et Caractérisation

Вам также может понравиться