Rapporteur, ensc, Montpellier








télécharger 0.86 Mb.
titreRapporteur, ensc, Montpellier
page2/22
date de publication22.04.2017
taille0.86 Mb.
typeRapport
c.21-bal.com > comptabilité > Rapport
1   2   3   4   5   6   7   8   9   ...   22

Chapitre 1.L’importance des Chimiothèques dans la découverte de médicaments



I.Introduction


Les tests de criblages, virtuels et réels, jouent un rôle important dans la découverte de nouveaux principes actifs. Une étape du processus de criblage a fait l’objet d’une attention particulière ces dernières années : le choix des composés à cribler. C’est en effet une étape importante qui évite de tester inutilement des molécules.

On essaye donc de sélectionner de manière pertinente les ensembles de molécules à cribler, principalement en supprimant les doublons, mais aussi en sélectionnant les molécules les plus diverses, dans le but de couvrir au maximum l’espace chimique. De plus, des filtres sont souvent appliqués pour que les molécules choisies valident un certain nombre de propriétés. On pourra classer ces filtres en trois grandes catégories :

  • Ceux destinés à éliminer les molécules avec de mauvaises propriétés ADME-Tox (Absorption, Distribution, Métabolisation, Elimination - Toxicité).

  • Ceux destinés à éliminer les molécules pouvant engendrer des faux-positifs lors des tests biochimiques.

  • Ceux destinés à réduire l’espace chimique étudié, souvent en se basant sur l’espace chimique des ligands d’origine.

Il existe des bases « prêtes à l’emploi ». Pour le criblage réel, certains fournisseurs proposent leur base optimisée pour le criblage, qui est souvent un ensemble de molécules « drug-like » sélectionné par diversité parmi toutes les molécules du fournisseur en question. Pour le criblage virtuel, il existe par exemple le projet Zinc [4], qui fourni gratuitement des bases destinées au docking.

Utiliser une base prétraitée présente cependant des inconvénients. Tout d’abord, la sélection des composés dépend du projet. Il n’est donc pas évident que la présélection réalisée par un fournisseur soit adaptée à tous les projets. De plus, l’originalité des molécules testées est également un critère important dans un projet de conception de médicament. En utilisant un ensemble déjà sélectionné et susceptible d’être utilisé par d’autres équipes de recherches, comme cela est le cas avec les bases diverses des fournisseurs ou bien Zinc, les chances de trouver des touches originales sont plus restreintes. Il est donc préférable de faire ses propres sélections de composés, adaptées aux projets traités.

Nous allons présenter dans ce chapitre les notions relatives aux chimiothèques. Après une présentation des notions d’espaces chimiques, nous nous attarderons sur la notion de diversité, puis nous étudierons les méthodes de filtration in silico des composés. Les notions présentées ici seront utilisées dans les chapitres suivants.

II.Notion d’espaces chimiques

A.Définitions


Hann et Oprea ont défini quatre types d’espaces chimiques (Figure 2) [5] :

  • Virtuel : l’espace chimique virtuel regroupe tous les composés qu’il serait possible de synthétiser. Ce nombre est grossièrement estimé à 1060 [6].

  • Tangible : l’espace tangible contient toutes les molécules qui peuvent être facilement synthétisées. Une publication récente estime que ce nombre de composés est compris entre 1020 et 1024 [7]. Ces chiffres ont été obtenus en analysant la base interne de composés commerciaux de Novartis en termes de substituants de moins de 13 atomes lourds. Un substituant a été défini comme étant n’importe quel groupe d’atomes connecté au reste de la molécule par une liaison simple « cassable » et qui ne fait pas partie d’un cycle. A partir de cette étude les nombres de molécules de type R1-X-R2 et R1-X(-R2)-R3 (avec R1, R2, R3 des substituants, et X des scaffolds avec respectivement 2 et 3 point d’ancrages) ont été calculés, pour conduire au résultat cité précédemment.

  • Global : l’espace global regroupe tous les composés synthétisés. Il est impossible de connaître exactement le nombre de molécules synthétisées dans le monde, car beaucoup de molécules sont synthétisées pour la recherche industrielle et donc confidentielles. On estime très approximativement ce nombre à 80 millions.

  • Réel : l’espace réel correspond à tous les composés possédés par un organisme. Le nombre de composés maximum que possède une société est estimé à 10 millions [8]. Notre laboratoire, l’ICOA, en possède de l’ordre de 10 000.



Figure 2. Définitions des quatre grands espaces chimiques.

B.Naviguer dans les différents espaces chimiques

1.Chimiothèques dans l’espace réel et l’espace global


Pour les molécules déjà synthétisées (à savoir celles des espaces chimiques réel et global), il faut obtenir soit les structures pour les tests virtuels, soit les composés sous leur forme physique pour les tests réels.

Les fournisseurs de produits chimiques proposent généralement leurs catalogues gratuitement au format SDF. On retrouve dans ces catalogues des composés issus de la synthèse classique et de la chimie combinatoire. Les fournisseurs peuvent se contenter de revendre des produits collectés dans de multiples laboratoires, et/ou synthétiser des composés en interne [Error: Reference source not found]. La plupart des librairies disponibles ont une bonne diversité, et proposent des composés sélectionnés pour leurs propriétés « drug-like ». Certains fournisseurs proposent des librairies focalisées sur certaines familles de cibles biologiques (GPCR, CDK…).

Comme nous l’avons déjà vu en introduction de ce chapitre, il existe des collections regroupant les composés de différents fournisseurs. La plus grande base de données de structures chimiques est le CAS, avec 29 millions d’entrées [9]. Cependant, il n’est pas possible de faire du criblage virtuel sur la base CAS, ni d’acheter directement des composés. La plus grande base de composés commerciaux est la base iResearch de ChemNavigator, qui contient 15 millions de structures uniques provenant de 179 fournisseurs [10]. Il existe également des bases destinées au criblage virtuel et disponibles gratuitement. Nous avons déjà cité l’exemple de la base Zinc. D’autres bases de molécules sont disponibles gratuitement, tels que ChemDB [11], ChemBank [12] et PubMed [13]. Un comparatif de ces bases est disponible sur le site internet de ChemDB [14].

2.Chimiothèques dans l’espace tangible et l’espace virtuel


Par définition les molécules de l’espace tangible et de l’espace virtuel n’existent pas toutes physiquement. Il faut donc générer in silico la structure de ces composés, qui devront par la suite être synthétisés (de manière réelle). La taille de ces espaces chimiques étant gigantesque, la génération doit faire entrer en jeu une méthode de focalisation plus ou moins forte pour limiter le nombre de produits possibles. Nous distinguerons deux techniques. La première est la conception de chimiothèques virtuelles focalisées. La deuxième est la conception d’un ligand correspondant au mieux aux critères établis pour une activité biologique donnée. Cette méthode est appelée conception de novo.
a.Conception de chimiothèques virtuelles focalisées

La création de chimiothèques par chimie combinatoire virtuelle peut être réalisée avec plusieurs outils [15], parmi lesquels figurent le module CombiLibMaker de Sybyl [16], Analog_Builder inclus dans Cerius2 [17], et QuaSAR-CombiGen inclus dans MOE [18].

Il existe, en plus des filtres « drug-like » souvent utilisés, différentes méthodes pour focaliser une chimiothèque virtuelle. Nous avons fait le choix de regrouper ces méthodes en deux grandes familles.

La première famille englobe les méthodes qui consistent à sélectionner un sous ensemble de composés parmi tous les produits synthétisables avec les fragments de départ.

Une des solutions est de générer un ensemble de composés divers. Le logiciel « ilib diverse », basé sur CombiGen, permet par exemple de générer une chimiothèque diverse en combinant les fragments par un algorithme de Monte Carlo [19].

Une autre solution très employée est de sélectionner les composés ayant potentiellement les meilleures activités biologiques. Pour cela, le docking s’avère être une méthode de choix. Krier [20] a par exemple généré un ensemble de 320 molécules focalisée pour l’inhibition de la phosphodiesterase 4, puis synthétisé les neuf composés ayant les meilleurs scores prédits par FlexX. Ce travail a permis d’isoler un composé ayant un IC50 près de 900 fois supérieur à la zardaverine, l’inhibiteur de référence. Une autre application récente a consisté à créer une base de composés focalisés pour l’inhibition de la formation de PrPSc, dans le but de traiter notamment la maladie du prion [21]. Un criblage virtuel avec le logiciel GOLD a permis de réduire grandement le nombre de composés à synthétiser. Les auteurs ont finalement découvert 19 composés se liant à huPrPC.

En toute logique, la combinaison de la diversité et de l’affinité est aussi utilisée. Chen et son équipe ont ainsi développé un logiciel permettant de générer une chimiothèque virtuelle grâce à un algorithme génétique optimisant trois critères : l’aspect « drug-like », la diversité, et l’affinité [22]. Les propriétés « drug-like » des molécules sont évaluées en utilisant une extension de la « règle des 5 ». L’estimation de la diversité est réalisée par le calcul de distance euclidiennes à partir de 39 descripteurs présentés dans une autre publication comme étant « les meilleurs » pour calculer la diversité moléculaire [23]. Le score d’affinité est obtenu quant à lui grâce à DOCK 4.0. Les auteurs ont utilisé leur logiciel pour générer des bases focalisées pour COX-2 et PPAR-.

La deuxième famille regroupe les méthodes qui cherchent à évaluer la pertinence des substituants plutôt que des produits. Cela permet de réduire grandement le nombre de combinaisons possibles. Généralement, ces méthodes se basent sur le docking, en cherchant d’abord à positionner les structures centrales des molécules dans le site actif. Un exemple de méthodologie disponible est PRO_SELECT, qui permet de générer un ensemble de produits à partir de réactifs choisis et de la partie centrale des produits placée à l’intérieur du site actif [24]. La méthode se base sur une liste de réactions possibles en chimie combinatoire, et sur le docking des substituants. CombiDOCK, basé sur DOCK 4.0, détermine les orientations de chaque partie centrale dans le site actif, puis place les substituants pour calculer un score pour chaque produit [25]. OptiDock fonctionne suivant un principe similaire en utilisant le logiciel FlexX [26]. DREAM++, plus ancien, utilise un principe similaire [27].
b.Conception de novo

La conception de novo s’appuie sur les mêmes principes que la conception de chimiothèques virtuelles focalisées, mais avec pour objectif d’obtenir non pas une chimiothèque, mais la structure qui sera identifiée par l’algorithme comme étant la plus active. Le principe est de construire un ligand le mieux adapté à un site actif. De manière générale, on dispose d’une base de fragments, conçue par des spécialistes, ou d’après des algorithmes de rétrosynthèse. Une molécule de départ est alors choisie, ou générée de manière aléatoire. L’algorithme d’optimisation (généralement un algorithme génétique ou un recuit simulé) prend en charge la modification de la molécule afin d’améliorer le critère choisi (similarité à un composé actif déjà existant, score de docking…). L’espace chimique parcouru ainsi est donc très important.

Il existe de nombreux outils de conception de novo. Les plus anciens sont LEGEND [28], LUDI [29], SPROUT [30] et HOOK [31]. Le Tableau 1 présente un échantillon de méthodes de conception de novo.

Méthode / logiciel

Algorithme d’optimisation

Scoring

TOPAS [32]

Algorithmes génétiques

Fingerprints CATS

LeapFrog [33]

Algorithmes génétiques

A partir de la structure du récepteur ou d’un model COMFA

ADAPT [34]

Algorithmes génétiques

DOCK

LigBuilder [35]

Algorithmes génétiques

Affinité de liaison et biodisponibilité

PRO-LIGAND [36]

Algorithmes génétiques

Champs moléculaires et pharmacophores

CONCERTS [37]

Dynamique moléculaire

Energie potentielle totale du système

GrowMol [38]

Distribution de Boltzman

Energie potentielle totale du système

LEA3D [39]

Algorithmes génétiques

FlexX

Tableau 1. Exemple de méthodes de conception de novo.

Un exemple d’application récente de conception de novo est LEA3D. Cette méthodologie utilise le docking pour donner un score aux molécules virtuelles générées. Les fragments utilisés pour cette méthode proviennent de la base Comprehensive Medicinal Chemistry [40] et de la base LIGAND de KEGG [41]. Ils ont été générés en séparant les parties cycliques et acycliques des molécules. Les résultats du programme de docking FlexX ainsi que différentes propriétés moléculaires (masse moléculaire, nombre d’atomes…) sont combinés pour donner un score à chaque molécule. Le programme a été appliqué à la génération de substrats naturels de la thymidine monophosphate kinase Mycobacterium tuberculosis, permettant la découverte de 17 inhibiteurs ayant une activité de l’ordre du micromolaire.

C.Visualiser les espaces chimiques


Deux possibilités s’offrent au chemoinformaticien pour visualiser les espaces chimiques. La première est de choisir de représenter les molécules en fonction de deux ou trois descripteurs. La deuxième est de représenter les molécules en fonction de plus de trois descripteurs, en utilisant une méthode pour combiner ces descripteurs en deux ou trois axes significatifs. Plusieurs méthodes de combinaisons de descripteurs sont disponibles. Nous ne nous attarderons ici que sur les deux techniques les plus populaires en chemoinformatique, à savoir l’analyse en composantes principales et les cartes de Kohonen. Bien que ces deux techniques soient les plus utilisées, d’autres techniques, tels que les GTM (Generative Topograpic Map), les HGTM (Hierarchical Generative Topograpic Map) [42], et l’algorithme Stochasitc Proximity Embedding [43] peuvent donner de meilleurs résultats.

1.Analyse en Composantes Principales (ACP)


L’ACP est une méthode statistique qui permet de trouver, par une transformation linéaire, les axes qui représentent au mieux les données dans l’espace. En d’autres termes, cette méthode va permettre de trouver les axes qui expliquent au mieux la dispersion du nuage de points. Si les données sont représentées en fonction de n descripteurs, l’ACP va donc permettre de trouver au maximum n axes classés en fonction de la variance qu’ils représentent.

L’ACP se révèle être très utile pour la visualisation de données, car elle permet d’obtenir deux ou trois axes qui représentent au mieux la variance globale des données. C’est une méthode très employée pour la visualisation d’espaces chimiques [44, 45, 46, 47].

On notera que l’ACP est aussi très employée pour traiter les descripteurs lors de la mise au point de modèles QSAR ou d’études de similarité. Cette méthode permet en effet de décorréler les variables, réduire leur nombre, et supprimer le bruit [48, 49, 50].

2.Cartes de Kohonen (ou SOM)


Les cartes de Kohonen (aussi appelées Self-Organizing Maps ou SOM), sont des réseaux de neurones non supervisés [51]. Dans le cas d’une représentation d’un espace chimique, la couche d’entrée compte autant de neurones que de descripteurs. Classiquement, la couche de sortie est composée de neurones disposés en carré, qui correspondent à une représentation en 2D de l’espace chimique.

SOM est une méthode d’apprentissage très populaire, notamment dans le domaine de la reconnaissance d’images. Elles trouvent également de nombreuses applications en chemoinformatique [52], en ce qui concerne la prédiction d’activités / propriétés et la visualisation d’espaces chimiques [53]. Gasteiger et son équipe sont d’importants contributeurs du développement de SOM en chemoinformatique, principalement pour la prédiction d’activité par l’analyse de surfaces moléculaires [54, 55, 56]. Cette méthode a été utilisée dans de nombreuses autres applications tels que la prédiction de toxicité [57], la classification de protéines [58, 59] ou bien la création de jeux de données pour les modèles QSAR (jeu d’apprentissage, de cross-validation, et de test) [60].
1   2   3   4   5   6   7   8   9   ...   22

similaire:

Rapporteur, ensc, Montpellier iconDe la franc maconnerie a montpellier
Écrit à son ami Pierre Jacques Astruc, conseiller maître en la cour des comptes, aides et finances de Montpellier

Rapporteur, ensc, Montpellier iconEconomies d’eau : Réutilisation des eaux de pluie
«Eaux» de l’Afssa 15 cnrs- umr 5119-Université Montpellier 2- montpellier 16 ehesp- rennes 17 Laboratoire de Santé publique et Environnement-Faculté...

Rapporteur, ensc, Montpellier iconÉconomies d’eau : Réutilisation des eaux de pluie
«Eaux» de l’Afssa 15 cnrs- umr 5119-Université Montpellier 2- montpellier 16 ehesp- rennes 17 Laboratoire de Santé publique et Environnement-Faculté...

Rapporteur, ensc, Montpellier iconRapporteur

Rapporteur, ensc, Montpellier iconRapporteur : Saddek Aouadi, Professeur, Université d’Annaba

Rapporteur, ensc, Montpellier iconRapporteur trigonométrique circulaire pour série générale et technologique...

Rapporteur, ensc, Montpellier iconCmi montpellier informatique

Rapporteur, ensc, Montpellier iconSociete regionale de medecine et d’hygiene du travail de montpellier

Rapporteur, ensc, Montpellier iconRapporteur : Philippe Cléris Le Grand Paris et l’Eure. Ou un début...

Rapporteur, ensc, Montpellier iconL ycee agricole prive
«blanco», équerre, compas, rapporteur, taille-crayon, crayon à papier, double décimètre, stylos noir, bleu, vert, rouge et crayons...








Tous droits réservés. Copyright © 2016
contacts
c.21-bal.com