barre de nav. TECFA F.Lo Ma page d'ccueilPublications F.LoRessources F.LoProjets F.LoPlanning F.LoDivers liensActivités Calvin de F.LoActivités CPTIC de F.LoActivités LME de F.LoTECFA Welcome Swiss-Prot Logo



Scénario 1bis : Balade dans les banques de données.

Exemple avec l'insuline

Objectifs :

A partir de la position du gène (Insuline INS ), localiser le gène sur les chromosomes humains, trouver la séquence en acides nucléiques et acides aminés .

Pour une version simplifiée voir BIST-ABC

On peut également effectuer la démache inverse : scénario 1 : du nom de protéine à la séquence

Cet exemple a été réalisé avec l'EPO mais il peut être réalisé avec l'insuline ou d'autres : liste d'exemples de protéines.


1° Des Chromosomes au gène de l'insuline : Mapviewer -> EntrezGene

La démarche inverse présente aussi un intérêt : partir des chromosomes pour aller vers le gène, puis la protéine.

Mapviewer est un "outil" proposé par le NCBI, très adapté pour une approche qui part depuis l'espèce puis les chromosomes et aide à situer les séquences dans leur contexte.

On trouve quelques autres loci de gènes en rapport avec le mot "insulin" sur les différents chromosomes humains (insulin receptor , insulin induced gene ...). le gène de l'insuline est nommé INS et est sur le 11

Alternativement activer le "Quick Filter" à droite avec l'option gene cela n'affiche que certaines séquences ->, on y repère plus facilement ("insulin" tout court) le gène de l'insuline humaine sur le chr 11.

Choisir Reference (Génome humain complet, vérifié)

On visualise un agrandissement de la région du chromosome 11 codant pour l'insuline :

cf ci-contre : cliquer pour agrandir .

Les lignes verticales sont des séquences pour différentes espèces Notre séqeunce humaine est la plus à gauche. Avec le gène INS au milieu

Cliquer X en haut pour supprimer l'affichage des colonnes (autres sp.) non désirées ( Solution )

On peut cliquer la séquence verticale à gauch et zoomer plus près du gène pour mieux visualiser le gène et les espaces non codants Solution

Notez bien que le nom officiel du gène de l'insuline est INS

  • En plus du nom du gène "INS" se trouve une série de liens que pour le moment nous ignorerons.
  • Cliquer sur INS , mène sur une page Entrez Gene pour le gène 3630 avec la fiche pour l'insuline Solution
Lien direct sur l'insuline dans Mapviewer http://doiop.com/mapview-ins
Un peu plus bas dans cette page sous Summary Entrez Gene donne de précieuses informations sur l'insuline (structure de la protéine, fonction...)

Sous Genomic context on voit un schéma des séquences genomiques et du snees de lecture

Encore plus bas sous additional links on trouve UCSC qui mène à une page ou choisir UCSC Genes et qui conduit à Solution

3° Trouver la séquence nucléotidique et protéique.

La séquence est nommée NP_000198

Le numéro d'accession commence par NP (cf glossaire ) On en déduit que c'est une protéine (numéro d'accession de la banque de données "RefSeq" spécifique pour une protéine), qu'elle se nomme proinsulin precursor et que c'est chez Homo sapiens

Cette séquence est au format fasta .cf glossaire

>gi|4557671|ref|NP_000198.1| proinsulin precursor [Homo sapiens]
MALWMRLLPLLALLALWGPDPAAAFVNQHLCGSHLVEALYLVCGERGFFYTPKTRREAEDLQVGQVELGG
GPGAGSLQPLALEGSLQKRGIVEQCCTSICSLYQLENYCN


3 Autres exemples:

->Liste d'exemples de protéines avec


Liens :

counter

Retour à BIST | Swiss-Prot | M.C. Blatter | Projets Home de F. Lo