Scénario 1bis : Balade dans les banques de données.

Exemple avec l'insuline

Objectifs :

A partir de la position du gène (Insuline INS ), localiser le gène sur les chromosomes humains, trouver la séquence en acides nucléiques et acides aminés .

Pour une version simplifiée voir BIST-ABC

On peut également effectuer la démache inverse : scénario 1 : du nom de protéine à la séquence

Cet exemple a été réalisé avec l'EPO mais il peut être réalisé avec l'insuline ou d'autres : liste d'exemples de protéines.

1° Des Chromosomes au gène de l'insuline : Mapviewer -> EntrezGene

La démarche inverse présente aussi un intérêt : partir des chromosomes pour aller vers le gène, puis la protéine.

Mapviewer est un "outil" proposé par le NCBI, très adapté pour une approche qui part depuis l'espèce puis les chromosomes et aide à situer les séquences dans leur contexte.

Trouver Mapviewer http://www.ncbi.nlm.nih.gov/mapview/ ( solution )
Choisir l'espèce humaine (Homo sapiens) ( Solution )
Dans le champ "Search for" : taper "INS human" (si on tape insulin on obtient une liste excessive), puis cliquer "Find" solution

On trouve quelques autres loci de gènes en rapport avec le mot "insulin" sur les différents chromosomes humains (insulin receptor , insulin induced gene ...). le gène de l'insuline est nommé INS et est sur le 11

Cliquer sur le chromosome 11

Alternativement activer le "Quick Filter" à droite avec l'option gene cela n'affiche que certaines séquences ->, on y repère plus facilement ("insulin" tout court) le gène de l'insuline humaine sur le chr 11.

Choisir Reference (Génome humain complet, vérifié)

On visualise un agrandissement de la région du chromosome 11 codant pour l'insuline :

cf ci-contre : cliquer pour agrandir .

Les lignes verticales sont des séquences pour différentes espèces Notre séqeunce humaine est la plus à gauche. Avec le gène INS au milieu

Cliquer X en haut pour supprimer l'affichage des colonnes (autres sp.) non désirées ( Solution )

On peut cliquer la séquence verticale à gauch et zoomer plus près du gène pour mieux visualiser le gène et les espaces non codants Solution

Notez bien que le nom officiel du gène de l'insuline est INS

En plus du nom du gène "INS" se trouve une série de liens que pour le moment nous ignorerons.
Cliquer sur INS , mène sur une page Entrez Gene pour le gène 3630 avec la fiche pour l'insuline Solution

Lien direct sur l'insuline dans Mapviewer http://doiop.com/mapview-ins

Un peu plus bas dans cette page sous Summary Entrez Gene donne de précieuses informations sur l'insuline (structure de la protéine, fonction...)

Sous Genomic context on voit un schéma des séquences genomiques et du snees de lecture

3° Trouver la séquence nucléotidique et protéique.

Le numéro d'accession commence par NP (cf glossaire ) On en déduit que c'est une protéine (numéro d'accession de la banque de données "RefSeq" spécifique pour une protéine), qu'elle se nomme proinsulin precursor et que c'est chez Homo sapiens

Scénario 1bis : Balade dans les banques de données.

Exemple avec l'insuline

Objectifs :

1° Des Chromosomes au gène de l'insuline : Mapviewer -> EntrezGene

3° Trouver la séquence nucléotidique et protéique.

3 Autres exemples:

Liens :