| GENATLAS, une base pour l'intégration des données de la biologie et de la médecine à la cartographie.
Lien vers GENATLAS
| Statistiques connexions à GENATLAS
| |
|---|
Participants
-
Martine Le Merrer, DR2 INSERM pour la génétique
médicale
-
Claude Mugnier, ingénieur à l’université René
Descartes pour la partie informatique
-
Pierre Kamoun, PU-PH pour la biologie
-
Marie-liesse Chauvet, médecin, annotatrice
-
Stéphanie Dumesnil, DESS, annotatrice
-
Catherine Turleau, DR INSERM, annotatrice
-
Nadine Poizot, technicienne, saisie et correction des
données
Contexte scientifique
Cette base a pour objet
d’enregistrer et d’intégrer les résultats
des travaux sur la localisation
et l’identification des gènes et des maladies.
Cet outil met à la disposition de la communauté scientifique et
médicale internationale les informations incluant la structure, l’expression, la fonction des
gènes et les interactions
de leurs produits, mais également
les mutations et leurs conséquences pour
les maladies. Il est utile aux chercheurs biologistes et généticiens engagés
dans la recherche d’un gène et de sa fonction
et aux médecins pour l’aide à l’identification des maladies, le conseil
génétique et le diagnostic prénatal.
GENATLAS repose sur une
architecture informatique, conçue à
partir du système Oracle et du langage PHP. Elle permet une interrogation facile de trois
bases intriquées : gene database (plus de 18 500 entrées), phenotype
database ( 3300 entrées dont 1900 clonées) et une base de références
bibliographiques (+ de 55000
références ). Le système de consultation autorise des interrogations sur
critères uniques ou multiples, ouvrant des possibilités nouvelles
jusqu’alors non offertes sur les autres
bases. GENATLAS est actuellement interrogée au plan international sur la base
de 234.000 visites en
2004, pour 2.300.000 pages.
L’accroissement du volume des connaissances a permis d’envisager des développements
nouveaux de la banque telles que la description des mécanismes
physiopathologiques à l’origine des maladies génétiques et la grande
variabilité d’expression phénotypique des mutations. Cette analyse est rendue
possible grâce à la compilation des données, sur la fonction des produits des
gènes, sur leurs localisations cellulaires et sub-cellulaires, les interactions
entre ces produits, la structure de la
protéine (motifs et domaines), l’appartenance
à des familles de protéines et leurs interactions possibles mais aussi
par une description des phénotypes illustrée par une approche multimédia
(radios photos … etc).
Projet 1 : Description des phénotypes
L’intégration
des données biologiques et cliniques est originale et n’existe pas dans les
autres banques. Or une étude détaillée des statistiques fait ressortir un
déficit d’utilisation de la part des généticiens cliniciens. En effet GENATLAS
n’est pas une base d’aide au diagnostic et
la description précise des phénotypes est encore insuffisante. C’est
pourquoi nous sommes en cours d’élaboration et de tests d’un thésaurus permettant
la description plus fine des maladies. L’objectif est d’avoir un outil non pas d’aide au diagnostic,
mais d’aide à la réflexion pour devant un symptôme, orienter le médecin, vers une démarche diagnostique
moléculaire, soit en situation de diagnostic connu et facile, soit en situation de diagnostic incertain. Cette
aide peut également être d’une grande efficacité pour le chercheur en vue de l’identification moléculaire de
nouveaux phénotypes. Pour cela un thésaurus hiérarchisé mais simple a été établi
pour la description des maladies et de leurs formes cliniques, accompagné de
menu déroulant pour l’interrogation. Ce thésaurus est compatible avec les
thésaurus utilisés par les systèmes d’aide au diagnostic les plus répandus.
(Possum, LDDB).
Il
y est également associé l’enregistrement
des mutations les plus fréquentes et leurs conséquences sur le produit du gène
et ses conséquences phénotypiques. Pour cela une refonte de la fiche de saisie
est en cours incluant aussi des
informations précise sur le mode de transmission , le type de pathologie et la fonction anormale ,
La
structure de la base de données GENATLAS permet
aussi d’associer à chaque phénotype une iconographie illustrant des
caractéristiques remarquables. Il peut s’agir de radiographies, d’IRM, de
courbes, de données quantifiées ou de photographies. Ce travail est
actuellement en cours pour les maladies osseuses pour lesquelles nous disposons
d’une collection reconnue. Pour les photographies de visages, utiles à la
reconnaissance des syndromes polymalformatifs, se posent des difficultés
éthiques qui nécessitent une réflexion particulière même si l’on dispose
d’autorisation parentale.
Projet 2 : Systèmes d’aide à la recherche de gènes
La
mise en place d’un système d’aide à la recherche de gènes de maladies est
également en cours. Les objets issus du séquençage complet du génome humain
(NT_ et NC_) sont difficilement manipulables par les chercheurs, car pouvant
atteindre plusieurs dizaines de millions de paires de bases. C’est pourquoi, il
a semblé nécessaire de lier plus étroitement GENATLAS à ces nouvelles
données : l’exploitation systématique des données du génome humain permet
de corriger ou de préciser la localisation cytogénétique de nombre de gènes. La
structure génomique des gènes est proposée à la consultation avec les séquences
génomiques et introniques nécessaires au choix des primers, utiles au clonage
positionnel de maladies monogéniques et à l’étude des régions régulatrices
situées en amont des gènes avec possibilité d’afficher la région sur une
longueur de n bases et soumission directe à des serveurs de prédiction pour
cette région (recherche de promoteurs, de facteurs de transcription, d’ilôts
CpG). Les objets de type
protéique (gènes décrits ou gènes prédits) font
aussi l’objet d’études complémentaires, soit localement, soit par
soumissions aux serveurs spécialisés ( Mitoprot, sortp, signalp, pfam, prodom,
etc……) .