GENATLAS, une base pour l'intégration des données de la biologie et de la médecine à la cartographie.

Lien vers GENATLAS
Statistiques connexions à GENATLAS

 

Participants

-         Martine Le Merrer, DR2 INSERM pour la génétique médicale

-         Claude Mugnier, ingénieur à l’université René Descartes pour la partie informatique

-         Pierre Kamoun, PU-PH pour la biologie

-         Marie-liesse Chauvet, médecin, annotatrice

-         Stéphanie Dumesnil, DESS, annotatrice

-         Catherine Turleau, DR INSERM, annotatrice

-         Nadine Poizot, technicienne, saisie et correction des données

 

Contexte scientifique

 

Cette base a pour objet d’enregistrer et d’intégrer les résultats  des travaux  sur la localisation et l’identification des gènes et des maladies.  Cet outil met à la disposition de la communauté scientifique et médicale  internationale  les informations incluant  la structure, l’expression, la fonction  des  gènes et  les  interactions  de  leurs produits, mais également les mutations et leurs  conséquences pour les maladies. Il est utile aux chercheurs biologistes et généticiens engagés dans la recherche d’un gène et de sa fonction  et aux médecins pour l’aide à l’identification des maladies, le conseil génétique et le diagnostic prénatal.

GENATLAS repose sur une architecture informatique,  conçue à partir du système Oracle et du langage PHP. Elle  permet une interrogation facile de trois bases intriquées : gene database (plus de 18 500 entrées), phenotype database ( 3300 entrées dont 1900 clonées) et une base de références bibliographiques  (+ de 55000 références ). Le système de consultation autorise des interrogations sur critères uniques ou multiples, ouvrant des possibilités nouvelles jusqu’alors  non offertes sur les autres bases. GENATLAS est actuellement interrogée au plan international sur la base de 234.000 visites en 2004, pour  2.300.000 pages.

 

 L’accroissement du volume des connaissances  a permis d’envisager des développements nouveaux de la banque  telles que la description des mécanismes physiopathologiques à l’origine des maladies génétiques et la grande variabilité d’expression phénotypique des mutations. Cette analyse est rendue possible grâce à la compilation des données, sur la fonction des produits des gènes, sur leurs localisations cellulaires et sub-cellulaires, les interactions entre ces produits, la structure de la protéine (motifs et domaines), l’appartenance à des familles de protéines et leurs interactions possibles mais aussi par une description des phénotypes illustrée par une approche multimédia (radios photos … etc).

 

 

Projet 1 : Description des phénotypes

 

L’intégration des données biologiques et cliniques est originale et n’existe pas dans les autres banques. Or une étude détaillée des statistiques fait ressortir un déficit d’utilisation de la part des généticiens cliniciens. En effet GENATLAS n’est pas une base d’aide au diagnostic et  la description précise des phénotypes est encore insuffisante. C’est pourquoi nous sommes en cours d’élaboration et de tests d’un thésaurus permettant la description plus fine des maladies. L’objectif est d’avoir un outil non pas d’aide au diagnostic, mais d’aide à la réflexion pour devant un symptôme, orienter  le médecin, vers une démarche diagnostique moléculaire, soit en situation de diagnostic connu et facile, soit  en situation de diagnostic incertain. Cette aide peut également être d’une grande efficacité pour le chercheur  en vue de l’identification moléculaire de nouveaux phénotypes. Pour cela un thésaurus hiérarchisé mais simple a été établi pour la description des maladies et de leurs formes cliniques, accompagné de menu déroulant pour l’interrogation. Ce thésaurus est compatible avec les thésaurus utilisés par les systèmes d’aide au diagnostic les plus répandus. (Possum, LDDB).

Il y est également associé  l’enregistrement des mutations les plus fréquentes et leurs conséquences sur le produit du gène et ses conséquences phénotypiques. Pour cela une refonte de la fiche de saisie est en cours incluant aussi  des informations précise sur le mode de transmission , le type de pathologie  et la fonction anormale ,

La structure de la base de données GENATLAS permet  aussi d’associer à chaque phénotype une iconographie illustrant des caractéristiques remarquables. Il peut s’agir de radiographies, d’IRM, de courbes, de données quantifiées ou de photographies. Ce travail est actuellement en cours pour les maladies osseuses pour lesquelles nous disposons d’une collection reconnue. Pour les photographies de visages, utiles à la reconnaissance des syndromes polymalformatifs, se posent des difficultés éthiques qui nécessitent une réflexion particulière même si l’on dispose d’autorisation parentale.

 

Projet 2 : Systèmes d’aide à la recherche de gènes

 

La mise en place d’un système d’aide à la recherche de gènes de maladies est également en cours. Les objets issus du séquençage complet du génome humain (NT_ et NC_) sont difficilement manipulables par les chercheurs, car pouvant atteindre plusieurs dizaines de millions de paires de bases. C’est pourquoi, il a semblé nécessaire de lier plus étroitement GENATLAS à ces nouvelles données : l’exploitation systématique des données du génome humain permet de corriger ou de préciser la localisation cytogénétique de nombre de gènes. La structure génomique des gènes est proposée à la consultation avec les séquences génomiques et introniques nécessaires au choix des primers, utiles au clonage positionnel de maladies monogéniques et à l’étude des régions régulatrices situées en amont des gènes avec possibilité d’afficher la région sur une longueur de n bases et soumission directe à des serveurs de prédiction pour cette région (recherche de promoteurs, de facteurs de transcription, d’ilôts CpG). Les objets de type protéique (gènes décrits ou gènes prédits) font  aussi l’objet d’études complémentaires, soit localement, soit par soumissions aux serveurs spécialisés ( Mitoprot, sortp, signalp, pfam, prodom, etc……) .