barre de nav. TECFA F.Lo Ma page d'ccueilPublications F.LoRessources F.LoProjets F.LoPlanning F.LoDivers liensActivités Calvin de F.LoActivités CPTIC de F.LoActivités LME de F.LoTECFA Welcome Swiss-Prot Logo



Concepts : Ce qu'il est indispensable de comprendre pour aborder les banques de données

L'explosion des données en biologie

Les nouvelles techniques de biologie moléculaires (PCR, séquençage, structure 3D des protéines, microarrays,...) génèrent des quantités énormes de données qu'il est nécessaire de gérer et stocker. Et une fois stockées, il faut pouvoir y accéder.

Les résultats des recherches d'un laboratoire pouvaient jusqu'à récemment être publiées dans une revue scientifique et tout le monde pouvait y avoir accès dans les bibliothèques. Plus récemment grâce à la banque de données des publications appelée Medline, il est très facile d'avoir accès à ces données "on-line".

Maintenant, si un laboratoire séquence un génome, il n'y a plus systématiquement de publication: les données de séquence sont directement soumises aux banques de données.

Les banques de données sont donc devenus des outils indispensables pour les biologistes au même titre que les publications scientifiques.

Principales banques de données en biologie

Il existe plus d'un millier de banques de données dans le domaine des sciences de la vie. Une dizaine d'entre elles sont réellement très importantes pour les biologistes. Afin d'y voir plus clair, ces banques de données sont classées en catégories :
Celles qui contiennent des

Remarques importantes

Comment accéder aux banques de données ?

On peut accéder aux données présentes dans ces banques de plusieurs façon:

- On utilise des "super outils" spécialisés dans la recherche dans les banques de données (moteur de recherche) comme "Entrez" (http://www.ncbi.nlm.nih.gov/Database/index.html) pour les banques localisée aux USA (NCBI) ou UniProt pour les banques localisées en Europe. UniProt est plus intuitif (google-like) mais Mapviewer du NCBi permet une aproche depuis un caryotype virtuel .

- On utilise des moteur de recherche très "user friendly", qui à partir d'une requête (nom de gène ou de maladie) vous envoient vers les banques de données qui contiennent des informations pertinentes. Exemple: Mapviewer, Gene and disease. Contrairement à Entrez ou SRS, vous n'avez pas le choix des banques dans lesquelles vous allez aller chercher l'information

- On connaît l'addresse WEB de la banque (grâce à Google par exemple) et on utilise l'outil de recherche mis à notre disposition par la banque (portail)

- On est dans une banque donnée et on utilise les liens (links, cross-links) mis à notre disposition vers les autres banques

Remarque: Des outils comme Blast donnent comme résultats une liste d'entrées dérivées des différentes banques de séquences. On peut donc aussi considérer ces outils comme des "moteurs de recherche"

 

Séquence "saine" ou "malade"

  NM_000513 Homo sapiens opsin 1 (cone pigments), medium-wave-sensitive (color blindness, deutan) (OPN1MW)

C'est pourtant la séquence saine, qui est référencée...

 

counter

Retour à BIST | Swiss-Prot| M.C. Blatter | Projets Home de F. Lo