Rapporteur, ensc, Montpellier








télécharger 0.86 Mb.
titreRapporteur, ensc, Montpellier
page8/22
date de publication22.04.2017
taille0.86 Mb.
typeRapport
c.21-bal.com > comptabilité > Rapport
1   ...   4   5   6   7   8   9   10   11   ...   22

2.Qu’est-ce qu’un doublon ?


Si certaines notions utilisées dans ce document sont difficiles à définir, comme celle des composés « drug-like » ou la diversité, ce n’est à priori pas le cas du terme de doublons : un doublon est une molécule qui, dans l’ensemble de composés considéré, a une structure identique à une autre molécule de cet ensemble. Dans la pratique cependant, il est nécessaire d’apporter des précisions à cette définition.

La notion de doublon est donc absolue d’un point de vue structural, mais elle est relative pour les biologistes, ainsi que pour certains chimistes. Deux molécules pourront être considérées comme des doublons absolus si elles ont les mêmes atomes, les mêmes liaisons entre atomes, et la même stéréochimie. Pour identifier les doublons dans une base de donnée il faut donc une méthode permettant de caractériser de manière unique une molécule. Nous présenterons plus loin le logiciel que nous avons choisi pour effectuer cette tâche.

La notion de doublon peut être complexifié par la prise en compte de différents facteurs :

  • Les sels : la prise en compte ou non des contre-ions dans les sels pour la caractérisation des doublons peut être sujet à débat. Dans le cas d’un criblage virtuel de type de docking, les contre-ions ne sont pas pris en compte. Le contre-ion peut cependant avoir une influence indirecte sur l’activité biologique. Nous avons fait le choix, après discussion avec des chimistes, de ne pas prendre en compte les contres-ions pour l’identification des doublons. Donc, dans une chimiothèque, deux sels différents de la même molécule seront considérés comme des doublons.

  • L’état de protonation : le fait que deux molécules identiques soient représentées avec des états de protonations différents peut faire qu’elles ne soient pas reconnues par les logiciels comme étant des doublons. Il faut donc procéder à une standardisation des états de protonations avant la génération d’un code unique pour la molécule. Nous avons défini les états de protonations à pH physiologique avec JOELib.

  • Les tautomères : les formes tautomères correspondent à des représentations limites de la même molécule. Mais, si la même molécule apparaît dans la base sous deux formes différentes, beaucoup de logiciels ne les considèrent pas, à tort, comme des doublons. Deux solutions existent pour gérer ce cas particulier : générer tous les tautomères de chaque structure et les prendre en compte pour la recherche de doublons, ou bien utiliser un code unique qui est capable de prendre en compte les formes tautomères. Nous avons utilisé cette dernière solution.

  • La stéréochimie : la stéréochimie doit évidement être prise en compte. Comme nous le verrons par la suite, elle est plus ou moins bien gérée en fonction des logiciels qui génèrent un code unique. Un autre problème lié à la stéréochimie est sa représentation : les logiciels ne prennent en compte de manière fiable que la stéréochimie explicite (c.-à-d. qui utilise la représentation liaisons avant / arrière). Il est fréquent de trouver dans les chimiothèques des structures avec des stéréochimies non définies ou mal définies, ce qui fausse la détection des doublons. De plus les glucides sont souvent représentés avec une stéréochimie implicite. Il faut faire un choix pour le traitement des centres asymétriques dont la stéréochimie n’est pas définie : un carbone dont la stéréochimie n’est pas définie est-il identique ou bien différent des carbones R ou S. Certains logiciels permettent de définir comment traiter ce type de carbones. Nous avons fait le choix de considérer que les carbones R, S et indéfinis sont trois types de carbones bien différents.

  • Les isotopes : les isotopes sont également à prendre en compte lors de la recherche des doublons, et le code unique utilisé doit donc gérer cette propriété. Deux molécules ne se différenciant que par l’état isotopique d’un atome seront donc considérées comme étant des structures différentes par notre système.

  • La mauvaise représentation des molécules : des erreurs peuvent se produire au moment de la représentation de la structure par le chimiste. En plus des erreurs de stéréochimie dont nous avons parlé, d’autres erreurs plus grossières sont fréquemment rencontrées dans les chimiothèques (oubli ou rajout d’une liaison, erreur sur l’ordre d’une liaison…) : cela pose un réel problème lors de l’identification des doublons.

La recherche de doublons repose donc sur l’utilisation d’un code unique efficace. Nous allons présenter le code unique que nous avons choisi d’utiliser dans notre système, et le comparer à d’autres logiciels.
1   ...   4   5   6   7   8   9   10   11   ...   22

similaire:

Rapporteur, ensc, Montpellier iconDe la franc maconnerie a montpellier
Écrit à son ami Pierre Jacques Astruc, conseiller maître en la cour des comptes, aides et finances de Montpellier

Rapporteur, ensc, Montpellier iconEconomies d’eau : Réutilisation des eaux de pluie
«Eaux» de l’Afssa 15 cnrs- umr 5119-Université Montpellier 2- montpellier 16 ehesp- rennes 17 Laboratoire de Santé publique et Environnement-Faculté...

Rapporteur, ensc, Montpellier iconÉconomies d’eau : Réutilisation des eaux de pluie
«Eaux» de l’Afssa 15 cnrs- umr 5119-Université Montpellier 2- montpellier 16 ehesp- rennes 17 Laboratoire de Santé publique et Environnement-Faculté...

Rapporteur, ensc, Montpellier iconRapporteur

Rapporteur, ensc, Montpellier iconRapporteur : Saddek Aouadi, Professeur, Université d’Annaba

Rapporteur, ensc, Montpellier iconRapporteur trigonométrique circulaire pour série générale et technologique...

Rapporteur, ensc, Montpellier iconCmi montpellier informatique

Rapporteur, ensc, Montpellier iconSociete regionale de medecine et d’hygiene du travail de montpellier

Rapporteur, ensc, Montpellier iconRapporteur : Philippe Cléris Le Grand Paris et l’Eure. Ou un début...

Rapporteur, ensc, Montpellier iconL ycee agricole prive
«blanco», équerre, compas, rapporteur, taille-crayon, crayon à papier, double décimètre, stylos noir, bleu, vert, rouge et crayons...








Tous droits réservés. Copyright © 2016
contacts
c.21-bal.com