Вы находитесь на странице: 1из 194

MODELISATION

MOLECULAIRE

DR ILHAM KANDOUSSI
MODELISATION MOLECULAIRE
La modélisation moléculaire est un ensemble
de techniques pour modéliser ou simuler le
comportement de molécules.
Elle est utilisée pour reconstruire la structure
tridimensionnelle de molécules, en particulier
en biologie structurale, à partir de données
expérimentales comme la cristallographie aux
rayons X.
Elle permet aussi de simuler le comportement
dynamique des molécules et leur mouvements
internes. On l'utilise enfin pour concevoir de
nouveaux médicaments
MEDICAMENT : DÉFINITION (OMS)
Un médicament est toute substance ou
composition présentée comme possédant des
propriétés curatives ou préventives à l'égard des
maladies humaines ou animales.
DÉVELOPPEMENT DU MÉDICAMENT
Le développement du médicament = ensemble
des études faisant suite à sa découverte ou sa
conception et aboutissant à la demande d’une
AMM.
DÉVELOPPEMENT DU MÉDICAMENT
Plus de 12 années et plus d’un milliard d’euros en
moyenne aux activités de recherche et de
développement avant qu’un nouveau médicament
ne soit disponible pour les patients.
La majorité des substances (près de
98 %) développées ne sont pas mises sur le
marché comme nouveaux médicaments.
la comparaison des bénéfices et
des risques (effets indésirables) identifiés durant
la phase de développement avec ceux de
médicaments déjà disponibles pour les patients
n’est pas favorable au nouveau médicament
potentiel.
DÉVELOPPEMENT DU MÉDICAMENT
IDENTIFICATION DES MOLÉCULES
QU'EST-CE QU'UNE CIBLE THÉRAPEUTIQUE ?

Les maladies se développent lorsque les fonctions


de l'organisme sont altérées ou ne répondent pas
correctement.
Pour développer un médicament, il est important
de comprendre en détail (au niveau moléculaire)
ce qui ne va pas.
La cible thérapeutique peut être : une molécule
qui a été produite en trop grandes quantité et qui
perturbe de ce fait le fonctionnement normal de
l'organisme ou trop petites quantités, ou dont la
structure est anormale.
IMPORTANCE DE LA SÉLECTION DE LA
CIBLE
Dans bon nombre de situations, il est impossible de
déterminer avec précision ce qui n'a pas bien
fonctionné.
Souvent, on observe dans une maladie plusieurs
anomalies, ou cibles, mais les chercheurs ne peuvent
pas identifier précisément la cible responsable de la
maladie.
Il est également possible que ces anomalies n'aient
aucun lien avec la maladie, et essayer de les corriger
ne permettra donc pas de traiter cette maladie.
Dans ce cas, le projet de développement peut se
tromper de cible et en définitive échouer. En d'autres
termes, il est crucial de déterminer la meilleure cible
à étudier dans le cadre d'un projet.
DÉFINITION DE LA CIBLE
THÉRAPEUTIQUE
Une cible thérapeutique est un élément
quelconque d'un organisme auquel se fixe
prioritairement une entité modifiant son
comportement, tel qu'un ligand endogène,
un médicament ou une drogue. Un exemple de
cible thérapeutique courante sont les protéines et
les acides nucléiques.
IDENTIFICATION D’UNE CIBLE
L’identification d’une cible ayant un grand
potentiel pour le développement d’un médicament
Elément clé à une approche rationnelle de la
découverte de médicaments basée sur le
mécanisme de la maladie
IDENTIFICATION D’UNE CIBLE
La cible peut provenir
1. – du mécanisme d’action de médicaments déjà
connue ou de ligands naturels.
2. – de la compréhension des processus
cellulaires et physiologiques et/ou du
mécanisme de la maladie
3. – de mutations dans les gènes impliqués
spécifiquement pour la maladie
4. – de façon aléatoire
IDENTIFICATION D’UNE CIBLE

L’objectif est d’identifier les cibles et les


molécules qui ont un potentiel de se lier
ensemble
Basé sur l’hypothèse de la reconnaissance
moléculaire
la reconnaissance moléculaire : Processus
d’association sélective par complémentarité entre
deux entités moléculaires complexes
IDENTIFICATION D’UNE CIBLE
Types de cibles biologiques
1. Protéines
• Transports
• Structurales
• Récepteurs cellulaires
• Enzymes
2. Polysaccharides
• Carbohydrates sur surfaces cellulaires
• Antigènes
3. Lipides
• Membranes cellulaires
4. Acide nucléiques
• ADN
• ARN
IDENTIFICATION D’UNE CIBLE
IDENTIFICATION D’UNE CIBLE
Types de cibles: Quelques exemples

Récepteurs
Enzymes
Canaux ioniques
ADN ARN
SOURCES DES LEADS (MOLECULES
CHIMIQUES CANDIDATS)
Plantes (fleurs, arbres, arbustes)
Micro-organismes (bacteria, fungi)
Animaux (grenouille, serpent,
A) Naturelle scorpion)
Marin (coraux, bacteria, poisson, etc)
Biochimiques (Neurotransmitteurs,
hormones)

Synthèse chimique (traditionnelle)


B) Synthétique
Synthèse Combinatoire

Rationnelle: Conception de
C) Virtuelle
Médicaments Assistée par
Ordinateur (Docking, vHTS, etc)
CRIBLAGE VIRTUEL IN SILICO
IN SILICO DRUG DESIGN
Dr ILHAM KANDOUSSI
I. INTRODUCTION
Le processus de découverte de médicaments est
une question cruciale dans l’industrie
pharmaceutique
très coûteux en temps et en argent
Deux méthodes différentes utilisées dans
l’industrie pharmaceutique pour trouver des
résultats positifs: le criblage à haut débit et le
criblage virtuel.
Criblage à haut débit (HTS): les composés
chimiques sont synthétisés et criblés par des
dosages à base de protéines ou à base de cellules.
Ce processus est couramment utilisé dans toutes
les principales industries pharmaceutiques.
Compte tenu des problèmes liés à la recherche de
nouveaux médicaments par HTS; procédures de
contrôle virtuel rentables et fiables sont en
pratique.
Les approches dites in silico, qui utilisent des
environnements informatiques comme
laboratoires expérimentaux .
II. DRUG DISCOVERY
Les médicaments sont des produits chimiques qui préviennent les maladies ou
aident à rétablir la santé des personnes malades.
La chimie médicinale: branche de la science qui fournit ces médicaments par
découverte ou par conception.
Les drogues classiques de l'Antiquité : découvertes par l'observation de
substances présentes naturellement dans l'environnement.
Au cours des deux derniers siècles : préparation par modification chimique de
substances naturelles.
Au cours du siècle dernier : découverte par synthèse chimique.
Au troisième millénaire : toutes ces techniques sont encore utilisées et un
chercheur en conception et développement de médicaments doit en apprécier la
valeur relative.
compréhension plus approfondie de la biologie cellulaire et de la génétique .
Le processus de développement de médicaments vise à identifier les composés
présentant un intérêt pharmacologique afin de contribuer au traitement des
maladies et, en définitive, d’améliorer la qualité de la vie.
Les composés utilisés en pharmacologie sont principalement de petites
molécules organiques (ligands) qui interagissent avec des biomolécules
(récepteurs) spécifiques .
2.1 LIMITES DE LA DÉCOUVERTE
TRADITIONNELLES DE MÉDICAMENTS
Dans un passé concevoir un nouveau médicament en
modifiant la structure moléculaire d'un médicament
existant était un processus lent d'essais et d'erreurs.
Un ordinateur peut
afficher la structure moléculaire de tout médicament à partir
d’une liste de milliers de molécules dans une base de données.
Très légers changements moléculaires, le médicament
d'origine peut être modifié de différentes manières qui
influencent l'absorption, le métabolisme, la demi-vie, les effets
thérapeutiques ou les effets secondaires.
identifier les produits chimiques qui ne réussiraient
probablement pas à traiter une maladie particulière avant que
le temps et l'argent ne soient investis.
manipuler des produits chimiques au niveau moléculaire et
concevoir de nouveaux médicaments basé sur la
pharmacologie moléculaire, l’étude des structures chimiques
des médicaments et leurs interactions au niveau moléculaire
dans une cellule et même dans l’ADN du noyau.
PROBLÈME DUR
Le génome humain contient environ 35 000
cadres de lecture ouverts, ce qui génère environ
500 000 protéines dans le protéome humain.
Environ 10 000 de ces protéines ont été
caractérisées par cristallographie.
En termes simples, cela signifie qu’il ya environ
490 000 inconnus qui pourraient potentiellement
faire échec à tout effort scientifique. Donc la
conception d'un médicament est une tâche très
difficile.
2.2 DRUG DESIGN
La conception des médicaments, est le processus
inventif consistant à rechercher de nouveaux
médicaments sur la base de la connaissance de cibles
biologiques ; peut être divisée en deux catégories:
développement de petites molécules possédant les
propriétés souhaitées vis-à-vis des cibles,
biomolécules (protéines ou acides nucléiques), dont les
rôles fonctionnels dans les processus cellulaires et les
informations structurelles 3D sont connus.
le développement de petites molécules ayant des
propriétés prédéfinies vis-à-vis des cibles, dont les
fonctions cellulaires et leurs informations
structurelles peuvent être connues ou inconnues .
2.2 DRUG DESIGN
la conception d'un médicament implique la
conception de petites molécules dont la forme et
la charge sont complémentaires à la cible
biomoléculaire avec laquelle elles interagissent et
qui, par conséquent, s'y lient.
L’identification d’une cible médicamenteuse
potentielle est précieuse et significative pour la
recherche et le développement de molécules
médicamenteuses à un stade précoce.
limitation du débit, de la précision et du coût, les
techniques expérimentales →le développement
d’algorithmes d’identification de cible in silico,
III. IN SILICO DRUG DESIGN
3.1 IN SILICO DRUG DESIGN
In silico est un terme qui signifie «assisté par
ordinateur» ; signifie une conception rationnelle
selon laquelle les médicaments sont conçus /
découverts à l'aide de méthodes informatiques.
La tendance actuelle : découverte de
médicaments est passée de la découverte à la
conception, ce qui nécessite de comprendre la
biochimie de la maladie, ses voies, d'identifier les
protéines responsables de la maladie, puis de
concevoir des composés capables de moduler le
rôle de ces protéines
V. STRATÉGIES DE CONCEPTION IN
SILICO
La conception de médicaments in silico peut être
appliquée selon de la connaissance de la cible, de
la présence de la séquence primaire et de la
structure 3D, d’une part et du ligand de l’autre
part
POSSIBILITIES OF IN SILICO DRUG
DESIGN
5.1 CONCEPTION DE MÉDICAMENTS BASÉE
SUR LA STRUCTURE (SBDD)

Aussi appelé conception directe de médicaments


qui repose sur la connaissance du structure
tridimensionnelle de la cible biologique obtenue
par des méthodes telles que la cristallographie
aux rayons X ou la spectroscopie RMN.
Si un structure expérimentale d'une cible n'est
pas disponible, il peut être possible pour créer un
modèle d'homologie de la cible sur la base de
l'expérimentation structure d'une protéine
apparentée = modélisation par homologie
5.1 CONCEPTION DE MÉDICAMENTS BASÉE
SUR LA STRUCTURE (SBDD)

Lorsque la structure du récepteur est connue.


Les méthodes envisagées ont des objectifs
spécifiques:
identifier l'emplacement du site actif du
ligand et de la géométrie du ligand dans le
site actif.

sélectionner un certain nombre de points de


contact en termes d'affinité ou de l'évaluation
de l'énergie libre de liaison.
STRUCTURE-BASED DRUG DESIGN (SBDD)
STRUCTURE-BASED DRUG DESIGN (SBDD)
La conception de médicaments peut être divisée
en deux catégories.
1) "trouver" des ligands pour un récepteur donné
en utilisant la recherche dans la base de données
,un grand nombre de molécules ligand
potentielles sont examinées pour trouver ceux qui
correspondent à la poche de liaison du
récepteur→ docking
L'avantage clé de la recherche dans la base de
données, c'est qu'elle économise l'effort de
synthèse pour obtenir une nouvelle avance
composés.
MOLECULAR DOCKING
La Docking est un algorithme informatique
automatisé qui détermine comment un composé
se liera au site actif d'une protéine. Cela
comprend la détermination de l’orientation du
composé, de sa géométrie conformationnelle
il existe deux composants clés du docking
moléculaire :
Prédiction précise de la pose ou conformation de
liaison du ligand à l'intérieur du site de liaison de
la protéine cible.
Précision précise de l’énergie libre qui est
utilisée par la suite pour classer l’ordre des poses
du docking.
STRUCTURE-BASED DRUG DESIGN (SBDD)
2) construction des ligands " Les molécules de
ligand sont construites dans les limites de la
liaison poche en assemblant de petits morceaux
d'une manière pas à pas. Celles-ci les pièces
peuvent être des atomes individuels ou des
fragments moléculaires. L'avantage clé d'une
telle méthode est que les nouvelles structures,
non contenu dans une base de données, peuvent
être suggéré
STRUCTURE-BASED DRUG DESIGN (SBDD)
5.2 LIGAND BASED DRUG DESIGN
LIGAND-BASED DRUG DESIGN (LBDD)
Conception de médicaments basée sur le ligand
Conception indirecte de médicaments qui repose
sur la connaissance d'autres molécules qui se
lient à la cible biologique d'intérêt.
utilisées pour dériver un modèle pharmacophore
qui définit le minimum caractéristiques
structurelles nécessaires que une molécule doit
posséder afin de se lier à la cible.
.
LIGAND-BASED DRUG DESIGN (LBDD)
un modèle de la cible biologique (site actif ) peut
être construit basé sur la connaissance de ce qui
le lie, et ce modèle peut être à son tour utilisé
pour concevoir de nouvelles entités moléculaires
qui interagissent avec la cible
En effet, une relation quantitative structure-
activité (QSAR), dans laquelle une corrélation
entre les propriétés calculées de molécules et leur
activité biologique déterminée
expérimentalement, peut être dérivée.
Ces relations QSAR peuvent à leur tour être
utilisés pour prédire l'activité de nouveaux
analogues.
LIGAND-BASED DRUG DESIGN (LBDD)
VIRTUAL SCREENING
TAILLE ET COMPLEXITÉ DES PRODUITS
BIOLOGIQUES EN COMPARAISON AVEC LES
PETITES MOLÉCULES
LA FONCTION PROTÉIQUE DÉPEND DE LA
CONFIGURATION FINALE
PROTÉINES

DR ILHAM KANDOUSSI
INTRODUCTION
Les protéines sont des biomolécules de première
importance :
- par leur présence universelle dans le monde
vivant
- par leur abondance cellulaire : c'est le premier
constituant après l'eau (10 fois plus que des
glucides)
- par leur extrême diversité : elles assurent des
fonctions vitales tant structurales que
dynamiques et de plus elles sont le support de la
spécificité des "espèces".
ORIGINE
SYNTHÈSE
LES ACIDE AMINÉS
LES ACIDE AMINÉS
Les acides aminées ou aminoacides sont des
molécules chimiques, qui possèdent deux
fonctions:
Une fonction acide carboxyliqueCOOH;
Une fonction amine primaire NH2;
LES ACIDE AMINÉS

Ces deux fonctions sont portés par un même


atome de carbone (noté α)
Les Aa différent par la nature de la chaîne
latérale R.
STRUCTURE D’UN ACIDE AMINÉ
DIFFÉRENTS ACIDES AMINÉS
Les Aa naturels: 20 Aa qui sont incorporés dans les
protéines lors de la traduction (Aa standards) + 1
Aa.
RÔLE DES ACIDES AMINÉS

Le rôle des acides aminés est multiple:


Structurale : monomères des protéines.
Energétique : substrats énergétiques.
Métabolique : précurseurs de molécules d’intérêt
biologique ou intermédiaires métaboliques.
CLASSIFICATION DES ACIDES AMINÉS
NATURELS

Neutre: un groupe amino, un groupe


carboxyle et une chainelatérale:
Aliphatique
Hydroxylée
Souffrée
À noyau aromatique
Cyclique

Acide: un groupe aminé, un groupe


carboxylé et une chaine latérale carboxylée
Basique: un groupe aminé, un groupe
carboxylé et chaine latérale basique
CLASSIFICATION DES ACIDES AMINÉS
NATURELS
CLASSIFICATION DES ACIDES AMINÉS
NATURELS
CLASSIFICATION DES ACIDES AMINÉS
NATURELS
CLASSIFICATION DES ACIDES AMINÉS
NATURELS
CLASSIFICATION DES ACIDES AMINÉS
NATURELS
CLASSIFICATION DES ACIDES AMINÉS
NATURELS
CLASSIFICATION DES ACIDES AMINÉS SELON LA
POLARITÉ DE LA CHAINE LATÉRALE R À PH
NEUTRE

1) Polaires
Non ionisables: Non chargées à pH neutre
•Sérine, thréonine, asparagine, glutamine, cystéine et
tyrosine.
Ionisables:
•Chargées négativement à pH neutre
•Acide aspartique, acide glutamique,
•Chargées positivement à pH neutre
•Lysine, arginine et histidine
2) Non polaire : Non chargées à pH neutre (apolaire ou
hydrophobe)
•Glycolle, alanine, valine, leucine, isoleucine, méthionine,
phénylalanine, tryptophane et proline
NOMENCLATURE DES ACIDES AMINÉS
CODAGE DES AA.
LES PEPTIDES
DÉFINITION DE LA LIAISON PEPTIDIQUE,
GÉNÉRALITÉS:
La réaction du groupe carboxylique d’un acide aminé avec le
groupement aminé d’un acide aminé suivant, permet de former un
amide secondaire avec élimination d’une molécule d’eau.
Cette liaison, s’appelle liaison peptidique, permettant la formation
d’un dipeptide, etc…
Un peptide: molécule comprenant au moins deux résidus d‘Aa
MODE DE REPRÉSENTATION D’UNE
SÉQUENCE PEPTIDIQUE:
La chaîne qui comprend les liaisons amide est
appelée la chaîne principale, alors que les
substituants, R, constituent les chaînes latérales.
Les peptides ont toujours une extrémité amine libre
ou extrémité N-terminale, et une extrémité carboxyle
libre ou extrémité C-terminale.
PEPTIDES

Glucagon: 29 AA. Hormone pancréatique: Chaine


monocaténaire.
PEPTIDES
LES PROTEINES
LES PROTEINES

Définition
•Caractéristiques des protéines
•Structure tridimensionnelle des protéines
• Structure primaire
• Structure secondaire Hélice α
• Feuillet plissé β
• Coude β
Structure tertiaire
Structure quaternaire
•Les différents types de liaisons ou forces
impliquées dans la structuration des
protéines
STRUCTURE TRIDIMENSIONNELLE DES
PROTÉINES
La structure primaire est la structure chimique
(covalente): quels acides aminés et dans quel
ordre.
La structure secondaire correspond aux
structures spatiales régulières (hélices α,
feuillets β etc…).
La structure tertiaire concerne l’arrangement
dans l’espace de ces structures secondaires,
c’est à dire la position dans l’espace de chaque
atome.
La structure quaternaire est une association de
structures tertiaires : certaines protéines
existent sous forme de complexes comportant
alors plusieurs sous-unités (exemple:
l’hémoglobine).
STRUCTURE TRIDIMENSIONNELLE DES
PROTÉINES
STRUCTURE PRIMAIRE
Décrit la séquence ou l’ordre d’enchaînement
des acides aminés qui constituent la protéine.
Cette séquence est fixée et traduit l’information
contenue dans le gène qui code cette protéine.
Les AA sont numérotés en allant du N-terminal
vers le C-terminal.
La structure primaire s’écrit en utilisant le code
à 1 lettre ou le code à 3 lettres.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
MVHLTPEEKSAVTAL…
Met Val His Leu Thr Pro Glu Glu Lys Ser Ala Val
Thr Ala Leu …
STRUCTURE PRIMAIRE
STRUCTURE SECONDAIRE :

1er stade de l’organisation dans l’espace


d’une chaîne peptidique.
Une chaine d’AA possède au niveau des
liaisons peptidique de nombreux
groupements –CO-et –NH-ceux-ci peuvent
établir en eux dans l’espace des liaisons
hydrogène et former une structure
secondaire.
Les structures secondaires (stables) les plus
fréquentes sont l’hélice α, le feuillet plissé β
et les coudes β.
L’HÉLICE Α
L’HÉLICE Α

•La chaîne principale s’enroule en spirale,


vers la droite.
•Structure stabilisée par des liaisons
hydrogènes (intramoléculaires) entre les
résidus n et n+4.
•L'hélice α s'élève de 0,54nm à chaque tour.
•Elle compte 3,6 résidus par tour. .
•Les plans des liaisons peptidiques sont
parallèles à l’axe de l’hélice.
•Les chaînes latérales R et liaisons C-H
pointent vers l’extérieur.
L’HÉLICE Α
L’HÉLICE Α
L’HÉLICE Α
La kératine de nos cheveux est une protéine
en hélice α qui forme une fibre allongée.
FEUILLET PLISSÉ Β
FEUILLET PLISSÉ Β
La chaine peptidique se trouve sous forme
en zigzag.
La chaîne principale est étirée et deux
segments de la protéine se placent côte à
côte, unis par des liaisons hydrogènes entre
les groupements C=O et NH.
Si les segments sont orientés dans le même
sens, on parle de feuillets parallèles.
Si les segments sont orientés dans le sens
contraire, on parle de feuillets
antiparalléles.
Les chaînes latérales, R, se dressent au
sommet des arêtes.
FEUILLET PLISSÉ Β
FEUILLET PLISSÉ Β
La fibroïne est une protéine sécrétée par le
ver à soie qui donnera le fil de soie . Cette
protéine est constituée essentiellement de
feuillets plissés β.

feuillets plissés β
LE COUDE Β
Le coude ou tour β est un coude serré
impliquant 4 résidus et qui permet à la chaîne
de changer de direction.
•La chaîne principale de la protéine fait un
tour en U; retrouvé souvent à la jonction de
deux segments de la chaîne formant un feuillet
β antiparallèle.
•Ces coudes contiennent en général une glycine
ou une proline.
LE REPLIEMENT DES PROTÉINES
LE REPLIEMENT DES PROTÉINES
la chaîne principale contient trois liaisons covalentes
par acide aminé.
la liaison peptidique étant une liaison plane, il reste
deux liaisons simples autour desquelles la rotation est
possible.
On peut donc déterminer la conformation du
squelette d’un acide aminé à partir de deux angles
dièdres, Φ et Ψ
L’angle dièdre Φ est défini par les quatre atomes
successifs du squelette : CO-NH-Cα-CO le premier
carbonyle étant celui du résidu précédent.
L’angle dièdre Ψ est défini par les quatre atomes
successifs du squelette : NH-Cα-CO-NH, le second
amide étant celui du résidu suivant.
DIAGRAMME DE RAMACHANDRAN
Toutes les valeurs des angles Φ et Ψ ne sont pas
possibles car certaines conduisent à des contacts
trop proches entre atomes qui sont très
défavorables sur le plan énergétique.
Une étude systématique des combinaisons
admissibles d’angles Φ et Ψ a été réalisée par
Ramachandran et al. (1963). La représentation
dans l’espace (Φ ,Ψ) des résultats obtenus,
nommé diagramme de Ramachandran, montre
trois principales zones énergétiquement
favorables (représentées par des contours
colorés).
DIAGRAMME DE RAMACHANDRAN
DIAGRAMME DE RAMACHANDRAN
Lorsqu’on analyse une structure de protéine, c’est à dire
lorsque l’on inscrit dans le diagramme les acides aminés
présents dans la protéines à leurs coordonnées (Φ, Ψ)
(signalées par des points rouges), on observe qu’ils
s’inscrivent majoritairement à l’intérieur de ces zones.
Les deux principales régions correspondent aux structures
secondaires régulières c’est à dire aux hélices α et aux
feuillets β.
En effet, ces structures, du fait du grand nombre de
liaisons hydrogène qui les constituent et donc de leur
grande stabilité, sont largement favorisées dans les
structures protéiques .
En moyenne, la moitié des acides aminés d’une protéine
sont impliqués dans une structure secondaire régulière.
L’autre moitié des acides aminés se trouve impliquée dans
des structures variables nommées boucles qui relient entre
elles les portions de chaînes de structure régulière.
STRUCTURE TERTIAIRE
La structure tertiaire consiste en une
organisation des structures secondaires entre
elles.
Cela implique l’apparition de liaisons
hydrogène, ioniques, de forces hydrophobes et
parfois de ponts disulfure.
La structure tertiaire correspond à la structure
tridimensionnelle de la protéine.
Une structure tertiaire n’est pas une structure
figée : elle peut se modifier (se tordre, se
déformer) sous l’effet de la fixation d’une
molécule (ligand) ou sous l’effet de la variation
d’un paramètre physico-chimique (pH,
température).
STRUCTURE TERTIAIRE
Une protéine soluble(qui sera au contact de
l’eau) va se replier de façon à ce que les résidus
les plus polaires soient au contact du solvant.
Les résidus apolaires, eux, seront au coeur de la
protéine de façon à ne pas interagir avec l’eau.
Une protéine hydrophobe(qui sera insérée dans
des lipides) va se replier de façon à ce que les
résidus les plus hydrophobes soient au contact
des lipides qui l’entourent.
Les résidus polaires, eux, seront au coeur de la
protéine de façon à ne pas interagir avec ces
lipides.
LIAISONS HYDROPHOBES
EXEMPLE DE STRUCTURE TERTIAIRE

Myoglobine
Carboxypeptidase
STRUCTURE QUATERNAIRE:
C’est l’association de plusieurs chaînes
peptidiques pour donner un complexe stable et
actif.
Plusieurs sous-unités tridimensionnelles
(structures tertiaires) s’assemblent pour former
des unités fonctionnelles beaucoup plus
grandes(enzymes, ribosomes et des fibres
protéiques).
Les chaînes qui constituent ce complexe sont
des protomères ou sous-unités, chacune ayant
une structure tertiaire définie.
L’association des différentes chaînes se fait via
des liaisons faibles et parfois aussi via des ponts
disulfures.
STRUCTURE QUATERNAIRE:
Exemple: L’hémoglobine
Un transporteur d’oxygène,
Possède une structure quaternaire,
Formée de quatre sous-unités (2 et 2).
LES DIFFÉRENTS TYPES DE LIAISONS
OU FORCES IMPLIQUÉES DANS LA
STRUCTURATION DES PROTÉINES
Structure primaire: liaisons peptidiques (covalentes), les
ponts disulfure
Structures II, III et IVaires: liaisons faibles éventuellement
covalentes
Les liaisons hydrogène,
Les liaisons ioniques,
Les forces hydrophobes
Les ponts disulfure
LES LIAISONS HYDROGÈNE
Une liaison hydrogène se forme
lorsqu'un atome d'hydrogène déjà lié
par covalence à un autre atome
électronégatif subit l'attraction d'un
autre atome électronégatif.
Dans les cellules, les atomes
électronégatifs qui participent à des
liaisons hydrogène sont le plus
souvent l'oxygène et l'azote.
Les liaisons hydrogène sont environ
vingt fois plus faibles que les liaisons
covalentes.
Les liaisons faibles permettent de
brefs contacts entre les molécules; les
molécules s'associent, réagissent l'une
à l'autre, puis se séparent.
LES LIAISONS HYDROGÈNE
LIAISON IONIQUE
Un atome cède un ou plusieurs
électrons pour former un ion chargé
positivement (cation). Un autre atome
capte ces électrons pour former un ion
chargé négativement (anion).
Il y a donc transfert d'électrons entre
les atomes. (oxydation : l'atome perd
des électrons et réduction : l'atome
gagne des électrons).
Les cations et les anions s'attirent l'un
l'autre dans une liaison ionique (En
raison de leurs charges opposées) .
Par exemple, le chlorure de sodium
(NaCl) ou sel de cuisine.
FORCES HYDROPHOBES
Comme les molécules
non polaires ne
peuvent pas réagir
avec l'eau.
Elles tendent à créer
entre elles des
liaisons de type
interactions
hydrophobes
LES PONTS DISULFURES
LES FORCES DE VAN DER WAALS
Il s’agit d’une liaison de type intermoléculaire qui
s’exerce entre les molécules d’une substance
(contrairement aux liaisons de covalence qui sont des
liaisons intramoléculaires car elles s’établissent entre
les atomes d’une même molécule).
Cette liaison est plus précisément une interaction
électrique de faible intensité qui s’exerce entre les
molécules présentant un moment dipolaires.
Par définition ces molécules sont globalement neutres
mais présentent un pôle positif (centre des charges
partielles positives localisées sur les atomes les moins
électronégatifs) et un pôle négatif (centre des charges
partielles négatives). Il s’exerce une force électrique
globalement attractive entre les pôles de signes
opposés des différentes molécules
LES DIFFÉRENTS TYPES DE LIAISONS
OU FORCES IMPLIQUÉES DANS LA
STRUCTURATION DES PROTÉINES
MODÉLISATION
PAR HOMOLOGIE
(ALIGNEMENT)

DR ILHAM KANDOUSSI
INTRODUCTION
Dans les organismes vivants, les protéines sont
responsables de la majorité des fonctions liées à
l'organisation de la cellule, la réplication de
l'ADN, la protection immunitaire. . .
L'analyse des protéines et de leurs fonctions
dépend fortement de la connaissance du
repliement de la protéine, c'est à dire de
l'agencement de cette molécule dans l'espace.
Or la détermination expérimentale de cette
structure tridimensionnelle est très lente, très
coûteuse, et peut s'avérer parfois impossible à
réaliser.
INTRODUCTION
Une approche bioinformatique du problème
semble alors plus appropriée que l'approche
biochimique.
Cette analyse des structures, dite in silico
(utilisant les ordinateurs comme outils
expérimentaux, par analogie avec les méthodes
in vivo ou in vitro) va consister à développer des
techniques de prédiction de structures
tridimensionnelles essentiellement basées sur la
séquence en acides aminés de la protéine.
INTRODUCTION
Certains segments des séquences d'acides aminés
sont caractéristiques d'une structure, c'est à dire
qu'ils se retrouvent dans toutes les
protéines partageant ce même repliement.
L'idée est de discerner dans une séquence, dont
on ne connait pas la structure, des segments de
séquence caractéristiques d'une structure connue
: des signatures de structures.
la topologie des protéines (c'est à dire aux
relations de voisinage entre les acides aminés
d'une séquence, à la connectivité des structures
secondaires, . . . ), et au lien entre les topologies
et les repliements.
ANALYSE ET CLASSIFICATION DES
STRUCTURES CONNUES

recherches de similarités entre séquences et


entre structures
définir cette similarité avant de présenter les
modes de comparaisons de structure.
REPRÉSENTATION DES STRUCTURES À
DIFFÉRENTS NIVEAUX

Ces connaissances de la protéine vont être


nécessaires pour déduire la fonction, notamment
grâce aux regroupements en familles
structurelles (ensembles de protéines ayant des
structures proches) suivant des indices de
ressemblances à ces différents niveaux de la
protéine.
.
RECHERCHES D'HOMOLOGIES ENTRE
SÉQUENCES

les séquences de gènes (donc les protéines) évoluent


par petites actions sur la séquence (insertion ou
suppression d'éléments de la séquence, ou autres
modification plus complexes) appelée mutations. Il en
résulte des gènes descendants (gènes modifiés).
L'hypothèse de base de la recherche d'homologie est la
suivante : deux protéines homologues (i.e. qui ont des
ancêtres communs) ont des séquences similaires, des
fonctions voisines et une structure bien conservée.
La similarité entre deux séquences est définie par la
conservation des acides aminés entre ces deux
séquences. Cette relation d'homologie est à la base de
toutes les méthodes de prédiction de structure.
SCOP - STRUCTURAL CLASSIFICATION OF
PROTEINS
classer les protéines dans un cadre évolutif cohérent, basé
sur la conservation de la séquence et de la structure
organisation hiérarchique avec 6 niveau:
1- Species = au niveau de l’espèce
2- Protein = groupe de protéines avec la même fonction dans
différentes espèces ou des protéines isoformes dans le
même organisme.
3 -Family = séquences homologues, mais fonction différente
4 -Superfamily = groupe de familles avec une propriété
fonctionnelle ou structurale commune
5 -Folds = superfamilles qui sont similaires au niveau de la
structure
6- Classes = composition en structure secondaire
classification fait manuellement => bonne référence, mais en
retard par rapport à la PDB.
CATH - CLASS, ARCHITECTURE,
TOPOLOGY, HOMOLOGY
classement automatique avec vérification manuelle
organisation hiérarchique avec 4 niveau:
1- Homologous superfamily (H-level) = similitude au
niveau séquence, structure ou fonction
2- Topology (T-level) = topologie et arrangement
similaire des structures secondaires
3- Architecture (A-level) = arrangement similaire des
structures secondaires, indépendamment de la
connectivité
4 -Class (C-level) = composition en structure secondaire
A-level: spécifique à CATH, les trois autres niveaux
ont un niveau équivalent en SCOP.
CATH - CLASS, ARCHITECTURE,
TOPOLOGY, HOMOLOGY
RECHERCHES D'HOMOLOGIES ENTRE
SÉQUENCES

Les techniques de recherches de séquences


homologues vont donc chercher à retrouver des
séquences similaires, en les alignant (c'est-à-dire
en alignant les acides aminés de chaque
séquence).
RECHERCHES D'HOMOLOGIES ENTRE
SÉQUENCES

Deux raisons principales pour aligner des


séquences de protéine:
1 Modélisation moléculaire par homologie
2 Identifier la fonction d’une nouvelle protéine
RECHERCHES D'HOMOLOGIES ENTRE
SÉQUENCES
POURQUOI ANALYSER DES SÉQUENCES?
Une séquence contient les informations sur le
rôle biologique d’une macromolécule:- fonction,
relation avec les autres molécules …
Une séquence reflète les contraintes physico-
chimiques imposées par la fonction,
l’environnement (aqueux, lipidiques, intra- ou
extracellulaire), l’évolution moléculaire
Objectif: Prédire des informations pertinentes sur
la fonction d’une macromolécule à partir
seulement de sa séquence.
POURQUOI RECHERCHER DES SÉQUENCES
DANS LES BANQUES?

● Identifier des protéines homologues:


●Orthologue: organisme différents
●Paralogue: organisme identiques
●Déterminer si des séquences ont une fonction
similaire ou proche.
●Déterminer des familles des protéines ayant un
domaine conservé.
●Établir des relations entre les séquences
QU'EST CE QU'UNE SÉQUENCE
QU'EST CE QU'UN ALIGNEMENT
HOMOLOGIES DE SÉQUENCES =
HOMOLOGIES FONCTIONNELLES ?
Les séquences de deux protéines de fonctions
apparentées vont en général présenter des
ressemblances
Réciproquement, deux protéines dont les
séquences présentent des ressemblances ont
probablement des fonctions apparentées.
HOMOLOGUE ≠ SIMILAIRE
Similaire (%) = Présence d'un ensemble de
position identiques et conservatives dans deux
séquences
Homologues = fait référence à une parenté
évolutive entre séquences
HOMOLOGUE ≠ SIMILAIRE
RECHERCHES D'HOMOLOGIES ENTRE
SÉQUENCES

Les algorithmes optimaux utilisés pour effectuer


ces alignements, basés sur la programmation
dynamique, sont les suivants:
l'algorithme de Needleman&Wunsch est
l'algorithme utilisé pour obtenir l'alignement
global (c'est à dire que la totalité des séquences
sont alignées) optimal de deux séquences
l'algorithme de Smith&Waterman est utilisé
pour trouver une région locale de similarité de
deux séquences. Il est donc utilisé pour
l'alignement local.
ALIGNEMENT GLOBAL VS ALIGNEMENT
LOCAL
ALIGNEMENT GLOBAL VS ALIGNEMENT
LOCAL
ALIGNEMENT DE DEUX SÉQUENCES VS
ALIGNEMENT MULTIPLE
PRINCIPES POUR L’ALIGNEMENT DES
SÉQUENCES
Trouver des évidences que deux séquences ont
divergées à partir d’un ancêtre commun => séquences
homologues.
Divergence: Processus de mutation et sélection
Trois types de mutation:
1 substitution
2 insertion
3 délétion
Insertion/Délétion => gaps / trous
Sélection naturelle favorise certaines mutations
Score d’alignement = somme de termes pour chaque
pair de résidus alignés + somme de termes pour
chaque gap
PRINCIPES POUR L’ALIGNEMENT DES
SÉQUENCES
DÉFINITIONS
Identité: Proportion de paires de résidus identiques entre 2
séquences. Dépend de l’alignement. Unité: %id
Similitude: Proportion de paires de résidus similaires entre
2 séquences. Une matrice de substitution permet de décrire
qui est similaire à qui (score > 0). Unité: %similarity
Homologie: Deux séquences similaires peuvent être
homologues si elles ont un ancêtre commun. Deux
séquences avec peu de similarité peuvent aussi être
homologues. Unité: Oui ou Non !
IL N’Y A PAS DE POURCENTAGE D’HOMOLOGIE : les
séquences sont homologues ou elles ne le sont pas.
Des séquences homologues ont souvent mais pas toujours
la même fonction. . . . Elles ne sont pas forcément non plus
très similaires : la structure est conservée plus que la
séquence
ALIGNEMENTS PAR PAIRES
COMMENT CALCULER LE SCORE BRUT D'UN
ALIGNEMENT ?
COMMENT CALCULER LE SCORE BRUT
D'UN ALIGNEMENT
SCORES DÉRIVÉS D'UN ALIGNEMENT PAR
PAIRES
PROCÉDURE DE LA RECHERCHE
MODÉLISATION /
PRÉDICTION D’UNE
STRUCTURE 3D DE
PROTÉINE
ILHAM KANDOUSSI
INTRODUCTION
La modélisation moléculaire créée un lien entre
le monde expérimental et le monde structural en
produisant des modèles tridimensionnels, en les
analysant et en les exploitant dans le cadre de
leurs fonctions biologiques
Les structures tridimensionnelles permettent de
développer de manière rationnelle les expériences
nécessaires à l’étude efficace d’une protéine
INTRODUCTION
Nous allons présenté la technique de
modélisation par homologie, une technique clée
au sein de la modélisation moléculaire.
DÉFINITION
C’est la prédiction la structure 3D inconnue d'une
protéine en utilisant comme modèle, une
structure 3D connue d'une autre protéine
homologue.
Lorsque deux protéines possèdent une forte
homologie de séquences en acides aminés elles
possèdent aussi une bonne homologie structurale.
Les coordonnées des atomes d’une protéine dont
la structure a été résolue par cristallographie dite
« Template » serviront pour reconstituer la
structure tridimensionnelle de la protéine étudiée
« Target».
PRINCIPE
Il existe une procédure standard pour la modélisation par
homologie. Elle consiste à :
1. Utiliser la séquence inconnue en entrée pour la recherche
de structures connues de protéines.
2. Produire le meilleur alignement global possible de la
séquence inconnue et d'une (des) séquences de références.
3. Positionner les carbones Cα, en prenant les coordonnées
de ceux de la protéine de référence comme modèle.
4. Dans les régions comportant des brèches, soit dans la
cible, soit dans la référence, utiliser une procédure pour
modéliser les boucles, pour substituer les segments de
longueur appropriée.
5. Ajouter les chaînes latérales au modèle du squelette.
6. Optimiser la position des chaînes latérales
(stœchiométrie).
7. Optimiser la structure avec une minimisation d'énergie.
Séquence → Protéine
• Comment une protéine fait autant?
• Les protéines se replient spontanément
• Prennent une forme 3D spécifique
• La forme dépend notamment des séquences en
AA
• La forme confère une fonction spécifique
LE REPLIEMENT DES PROTÉINES
Ce que nous savons:
●Repliement des protéines est rapide!
● Généralement, un couple de secondes
●Le pliage est cohérent!!
●Appel à des forces faibles - Non-covalent
● Liaison hydrogène, van der Waals, ponts
salins
●Très peu d'intermédiaires
●Il est donc difficile d'étudier
LE REPLIEMENT DES PROTÉINES
Quelles sont les propriétés physiques qui
stabilisent les repliements :
1) La rigidité des backbones ( Hélice α ; Feuillet β)
2)Les interactions entre acide aminées
• Interactions électrostatiques
• Forces de Van der Waals
• Ponts Hydrogène et disulfure
3) Les interactions des acides aminées avec l'Eau
LE REPLIEMENT DES PROTÉINES
DIAGRAMME DE RAMACHANDRAN :
UTILISATION

Le diagramme de Ramachandran est l'un des


indicateurs utilisés pour contrôler la qualité des
structures de protéines déterminées
par cristallographie ou RMN. Dans les structures
de haute qualité, plus de 90 % des résidus d'acide
aminé (hors glycines) sont situés à l'intérieur des
zones les plus favorables.
Plus la résolution est élevée et plus le nombre
d'acides aminés en dehors des zones privilégiées
est faible.
RÉSUMÉ
●Les protéines sont au cœur de tous les êtres
vivants
●Critique pour toutes les études biologiques
●Le processus du repliement est largement inconnu
●Détermination de la structure protéique est
expérimentalement difficile
●La fonction des protéines reste inconnue....
Prédiction des structures 3D en se basant sur des
données connues.
PRÉDICTION DES STRUCTURES 3D DES
PROTÉINES DIAGRAMME GÉNÉRAL
PRÉDICTION DES STRUCTURES 3D DES
PROTÉINES
MODÉLISATION PAR HOMOLOGIE
La méthode se base sur le fait que la structure de la
protéine est plus conservé que sa séquence càd si les
séquences sont similaires alors leurs structures le
sont aussi.
Protein Data Bank
(http://www.rcsb.org/pdb/home/home.do) est la
base de données qui regroupe toutes les structures
des protéines connues (X-ray, crystallography, NMR).
La modélisation par homologie est basée sur des
données réelles :
• Les résultats ont typiquement une bonne résolution
• La qualité des résultats s'amérliore avec la quantité
des protéines résolues dans PBD
LES ÉTAPES POUR LA MODÉLISATION DES
STRUCTURES EN SE BASANT SUR
L'HOMOLOGIE

● Utiliser la séquence inconnue en entrée pour la recherche


de structures connues de protéines
● Produire le meilleur alignement global possible de la
séquence inconnue et d'une (des) séquences de références
● Positionner les carbones Cα, en prenant les coordonnées de
ceux de la protéine de référence comme modèle.
● Dans les régions comportant des brèches, soit dans la cible,
soit dans la référence, utiliser une procédure pour
modéliser les boucles, pour substituer les segments de
longueur appropriée.
● Ajouter les chaînes latérales au modèle du squelette
● Optimiser la position des chaînes latérales (stoechiométrie)
● Optimiser la structure avec une minimisation d'énergie
PRÉDICTION BASÉE SUR L'HOMOLOGIE DES
SÉQUENCES
ÉTAPE 1A : RECHERCHE DE MODÈLE
HOMOLOGUE

1) Recherche de similarité de séquence (BLAST) dans


les bases de données de structure de protéines.
- Protein Data Bank (PDB) : http://www.pdb.org/
- Structural Classification Of Protein (SCOP) :
http://scop.mrc-lmb.cam.ac.uk/scop/
- Protein StructureClassification (CATH) :
http://www.cathdb.info/
2) Raffiner l'alignement de séquence avec PSI-BLAST
pour détecter les faibles homologie de séquences.
3) S'il y a moins de 25% d'identité, la modélisation des
reconnaissance des coude est favorisée.
ÉTAPE 1B : COMMENT SÉLECTIONNER LE
MODÈLE

1) Sélectionner le modèle avec le meilleur


pourcentage d'identité
2) Sélectionner plusieurs fragments de modèles
3) Tenir compte de la résolution de la structure du
modèle
4) Tenir compte de la fonction de la protéine
ÉTAPE 2A : ALIGNEMENT DE LA SÉQUENCE AVEC LE
MODÈLE
ÉTAPE 2B : VÉRIFICATION DU BON CHOIX

Alignement en paire (Smith-Waterman,


CLUSTAL)
Étape 2B : Vérification du bon choix
Typiquement les méthodes d'alignement tend à
maximiser la similarité des séquences (score),
alors que la modélisation par homologie tend à
maximiser la similarité des structures.
L'alignement peut être approuvé par d'autres
informations comme la prédiction des structures
secondaires.
ÉTAPE 2A : ALIGNEMENT DE LA SÉQUENCE
AVEC LE MODÈLE
ÉTAPE 2B : VÉRIFICATION DU BON CHOIX
ÉTAPE 3 : ALIGNEMENT DE LA SÉQUENCE
AVEC LE MODÈLE

Construire la structure de la protéine inconnu


avec les données de la protéine modèle
Exemples de méthodes :
• Modeling by rigid body assembly : COMPSER,
SWISS-MODEL
• Modeling by segment matching or coordinate
reconstruction :SEGMOD
• Modeling by satisfaction of spatial constraints :
MODELLER
ÉTAPE 4 : ÉVALUATION ET RAFFINAGE DE
LA STRUCTURE
Evaluer la stochiometry et d'autres propriétés
structurales :
● Longueur des liaisons, les angles dihedral, les
positions des chaînes latérales.
Exemples de méthodes :
●PROCHECK (http://www.ebi.ac.uk/thornton-
srv/software/PROCHECK/ )
●WHATCHECK
(http://swift.cmbi.ru.nl/servers/html/index.html)
●PSVS (http://psvs-1_4-dev.nesg.org/)
●Eval123D
(http://bioserv.cbs.cnrs.fr/HTML_BIO/frame_valid.ht
ml)
●JCSG Structure Validation Central
(http://www.jcsg.org/prod/scripts/validation/sv2.cgi )
LIMITES DE LA MODÉLISATION PAR
HOMOLOGIE
1. Structure unique de protéine ne peut pas être
prédite
2. Limitation avec performances des algorithmes
d'alignement utilisées
3. Mauvaise gestion de positionnement des chaînes
latérales
4. Difficulté de modéliser les régions des noeuds
5.Si le choix du modèle n'est pas le meilleur
DOCKING MOLECUALIRE
Dr ILHAM KANDOUSSI
INTRODUCTION
La reconnaissance moléculaire est la capacité des
biomolécules à reconnaître d'autres biomolécules et à
interagir de manière sélective avec elles afin de
promouvoir des événements biologiques
fondamentaux tels que la transcription, la traduction,
la transduction du signal, le transport, la régulation,
la catalyse enzymatique, les infections virales et
bactériennes et la réponse immunitaire.
L'amarrage moléculaire est le processus qui consiste à
placer des molécules dans des configurations
appropriées pour interagir avec un récepteur.
L'amarrage moléculaire est un processus naturel qui
se produit en quelques secondes dans une cellule.
Dans la modélisation moléculaire, le terme «amarrage
moléculaire» désigne l'étude de la manière dont deux
ou plusieurs structures moléculaires s'emboîtent
COMPRENDRE LA RECONNAISSANCE
MOLÉCULAIRE

Comprendre les principes de la reconnaissance


moléculaire au niveau moléculaire est essentiel à
une bonne compréhension de fonction moléculaire
et processus biologique
La connaissance des caractéristiques mécaniques
d'un signal biologique peut être utilisée pour
concevoir de nouveaux agents thérapeutiques
PRINCIPES THÉORIQUES
Le Docking moléculaire vise à prédire la structure d’un
complexe moléculaire à partir des molécules isolées pour
étudier les modes d’interaction entre deux molécules.
Les logiciels de docking sont donc des outils très utiles en
biologie, pharmacie et médecine, car la plupart des
principes actifs sont de petites molécules (ligand) qui
interagissent avec une cible biologique d’intérêt
thérapeutique.
Le récepteur macromoléculaire étant le plus souvent une
protéine, le terme Docking seul est couramment employé
pour désigner un « docking protéine-ligand »
Le docking moléculaire a pour but de déterminer le mode
d’interaction d’un complexe formé de deux ou plusieurs
molécules, en cherchant des orientations dans l’espace et
des conformations favorables pour la fixation d’un ligand à
un récepteur .
Une simulation de docking comprend essentiellement deux
étapes : le docking proprement dit et le scoring.
PRINCIPES THÉORIQUES
Une simulation de docking comprend
essentiellement deux étapes :
Le Docking (la première étape) est l’étape de
sélection, consistant à placer le ligand dans le
site actif de la protéine et à échantillonner les
conformations, positions et orientations (poses)
possibles, en ne retenant que celles qui
représentent les modes d’interactions les plus
favorables.
PRINCIPES THÉORIQUES
Le Scoring (la deuxième) est l’étape de
classement, qui consiste à évaluer l’affinité entre
le ligand et la protéine et de donner un score aux
poses obtenues lors de la phase de docking. Ce
score permettra de retenir la meilleure pose
parmi toutes celles proposées
ALGORITHMES DE DOCKING
Les algorithmes de docking peuvent être séparés
en deux grandes classes :
ceux qui ne tiennent pas compte de la flexibilité
de la protéine, en traitant celle-ci comme un
corps rigide
ceux qui sont capables de prendre en compte,
partiellement la flexibilité du récepteur
ALGORITHMES DE DOCKING
Dans la plupart des cas, l’utilisation
d’algorithmes considérant la protéine comme un
corps rigide mène à de bons résultats,
principalement quand la protéine a une flexibilité
limitée.
En effet, dans de tels cas, la structure
cristallographique peut être considérée comme
plus représentative de l’état de la protéine dans
son environnement naturel, ce qui augmente les
chances de simuler correctement la complexation
des ligands .
ALGORITHMES DE DOCKING
Certaines protéines présentent naturellement des
régions de grande flexibilité, subissant des
réarrangements considérables en présence d’un
ligand.
Dans ce cas, négliger la flexibilité de la protéine peut
mettre en péril la fiabilité des résultats de docking, et
rend nécessaire l’utilisation d’approches capables de
tenir compte de la flexibilité du système entier
Des méthodes indirectes ou directes, où la flexibilité
de la protéine est partiellement ou totalement prise
en compte, sont décrites dans la littérature.
Néanmoins, ces méthodes ne sont pas souvent
utilisées car le gain en précision par rapport aux
algorithmes traditionnels est généralement trop petit
par rapport à l’augmentation du temps de simulation
FONCTIONS DE SCORE
La procédure de docking permet de générer une liste de
complexes représentant les modes d’association favorables
entre le ligand et le récepteur macromoléculaire.
L’étape suivante consiste à évaluer ces complexes, afin de
trouver celui ou ceux les plus susceptibles de reproduire au
mieux le mode d’association réel. L’association entre
protéines et ligands est gouvernée par plusieurs
paramètres thermodynamiques :

les interactions hydrophobes,


les interactions électrostatiques,
les liaisons hydrogène
les effets de solvatation et les effets d’entropie.

Théoriquement, le complexe est favorable si la variation


d’énergie libre globale de complexation est négative
FONCTIONS DE SCORE
En pratique, l’évaluation de l’énergie libre des
complexes est une tâche souvent coûteuse d’un point
de vue informatique, ce qui limite son utilisation en
routine .
De ce fait, des méthodes approximatives ont été
développées pour distinguer (évaluer et classifier) les
meilleurs complexes parmi ceux générés par une
procédure de docking : les fonctions de score.
Selon les principes utilisés dans leur conception, les
fonctions de score sont classées en : fonctions de score
basées sur des champs de force, fonctions de score
knowledge-based et fonctions de score empiriques.
Ces fonctions de score sont construites à partir de
règles fondées sur une analyse statistique des
complexes protéine-ligand résolus
expérimentalement.
FONCTIONS DE SCORE
Un grand nombre de programmes (commerciaux
ou non) de docking moléculaire sont disponibles.
Parmi ceux-ci, nous citerons par exemple
AUTODOCK , FLEXX , GOLD , DOCK ,
SURFLEX , MOLEGRO VIRTUAL DOCKER ,
UCSF CHIMERA et Schrödinger (Glide) etc. Ils
diffèrent les uns des autres sur la manière de
représenter le système moléculaire et la manière
de déterminer le score de docking (fonction de
score).
CALCUL DES ÉNERGIES DE LIAISON

L'énergie de liaison ∆Gbinding est l'énergie


nécessaire pour séparer un complexe en
différentes parties (protéine et ligand). Elle est
définie comme la différence entre l'énergie de la
forme associée (liée) (Ecomplex) et celle des
molécules séparées (non liées) (Eprotéine et
Eligand).

Un complexe a une énergie potentielle inférieure


à ses composants. C'est ce qui les maintient
ensemble.
ETAPES DE DOCKING MOLÉCULAIRE
Deux approches sont principalement employées
pour la modélisation du système protéine-ligand.
ETAPES DE DOCKING MOLÉCULAIRE
La première étape
consiste au téléchargement des structures chimiques des
cibles à traiter (Enzyme dans notre cas), pour cela il est
nécessaire d’aller directement à la Bank PDB
(http://www.pdb.org) et déterminer où sont déposées les
structures de ces cibles.
En suite, la PDB contient plusieurs milliers de structures
protéiques obtenues soit par cristallographie (rayons X),
soit par RMN.
Si la cible n’est pas encore déposée au niveau de la Bank, et
cette dernière contient une protéine avec des séquences
similaires, la modélisation par homologie intervient afin de
construire la structure 3D de la cible souhaitée.
Après le téléchargement de la cible (PDB), nous utilisons
un logiciel de visualisation pour voir avec quels ligands
l’enzyme est Co-cristallisé (eau, ligands, ion,…).
ETAPES DE DOCKING MOLÉCULAIRE

La deuxième étape
concerne les structures du (ou des) ligand(s) utilisé(s)
lors du docking moléculaire.
Il y a deux grandes bases de données de structures
chimiques des ligands.
La première représente ces structures par les
programmes d’informatique de modélisation
moléculaire, où les différentes structures sont
générées par optimisation de géométrie. Ces
structures sont gouvernées par les lois de la chimie
quantique.
Dans le deuxième cas, elles sont obtenues à partir des
bases de données comme Pub Chem Project ou autres
bases de données des structures. Ces dernières ont
différentes extensions comme PDB (Protein Data
Bank), SDF, …ect.
ETAPES DE DOCKING MOLÉCULAIRE
PROTOCOLE GÉNÉRALE DE DOCKING
Les approches utilisées actuellement sont exclusivement calculatoires
et évaluées par des outils de visualisation. Ces approches peuvent
être décomposées en quatre à cinq phases successives :
 Choix du mode de représentation des protéines (tout atome, pseudo-
atome, grille, etc.),
 Exploration conformationelle (corps-rigide position/orientation du
ligand et/ou flexible position/orientation/forme du ligand),
 Minimisation de la fonction d’évaluation de l’énergie d’interaction
(ou fonction de score) des conformations issues de l’exploration,
 Regroupement par ressemblances et classification par évaluation
plus fine du score, accompagnée d’une étape non automatique
d’évaluation visuelle des résultats lorsque le score ne permet pas de
discriminer la conformation native des différentes conformations
générées.
 Une étape optionnelle d’affinement des complexes sélectionnés par
minimisation ou dynamique moléculaire.
 Un algorithme de recherche pour explorer les possibilités de modes
de liaison, un mécanisme pour placer le ligand dans le site de liaison
et une fonction de score pour classer les différents modes de liaison.
PROTOCOLE GÉNÉRALE DE DOCKING

Вам также может понравиться