barre de nav. TECFA F.Lo

Scénario 5 : Une même protéine chez différentes espèces : perspective évolutive.

Objectif : Trouver des séquences homologues de l'insuline humaine, les comparer, établir leur similitude et former un arbre, perspective évolutive.

Programme simplifié : Philophylo Documentation (Merci SwissProt) Raccourci http://doiop.com/phylo

Discussion de l'universalité d'une protéine

N. B. : En principe on utilise les séquences protéiques : elles sont plus pertinentes du point de vue évolutif (phénotype)

1° Trouver les entrées pour insuline de plusieurs espèces dans la banque de données UniProt

N. B. : Ici nous travaillons avec l'insuline, mais d'autres protéines peuvent être employées (cf liste d'exemples)

Aller sur UniProt dans Query taper insuline. L'outil propose "Did you mean: insulin ": cliquer le terme en anglais.

UniProt contient toutes les protéines répertoriées à partir des données publiques (~8 millions ). Les pseudogènes ne sont donc pas répertoriés (ne produisent pas de protéine), ni les protéines qui n'ont pas été étudiées ou qui sont sous brevet.

Il va chercher toutes les entrées dans lesquelles on trouve le terme insulin solution : la liste est énorme.

Cliquer Restrict term "insulin" to ....Protein name et cliquer "Show only reviewed" (filter by dans la nouvelle version) solution,

N.B. Le nom de la protéine (cf liste d'exemples) diffère souvent du nom du gène. Il faut parfois chercher par le nom du gène pour retrouver le nom de la protéine, ou l'inverse. Mais UniProt est une base de protéines la suite du traitement se fait sur les séquences protéiques.

En haut de la liste : l'entrée pour l'insuline humaine INS_HUMAN : P01308 Solution.

->Une variante pour les avancés est de chercher les protéines homologues sur la base de leur similarité de séquence (Blast)

2° Afficher les données pertinentes

Cliquer "Customize display" et sélectionner les données dont on souhaite l'affichage : p. ex. Organism, Protein Names, Gene Names, Sequence.

3° Sélectionner la même protéine chez plusieurs organismes :

Sélectionner (cocher) dans cette liste les insulines des espèces qui vous intéressent. Un minimum de 5 est nécessaire si l'on veut ensuite former un arbre raisonnable.

Les séquences apparaissent dans le bandeau vert en bas, sur la gauche.

(N.B: si on avait sélectionné d'autres séquences avant : il faut cliquer Clear dans ce bandeau pour éviter qu'elles restent sélectionnnées.)

4° Produire un alignement

Cliquer le bouton Align à droite du bandeau vert en bas de l'écran.

cocher la case "Similarity" dans la colonne de droite

les séquences alignées sont affichées et on voit bien que certaines zones sont plus conservées.

Une étoile signifie identité ( dans la colonne) pour toutes les séquences alignées, : signifie acides aminées qui ont des propriétés physico-chimiques très similaires, "." signifie acides aminées qui ont des propriétés physico-chimiques similaires, un "-" signifie que le le programme d'alignement a introduit un espace ("gap") pour aligner avec des séquences plus longues

Les propriétés chimiques des différents a.a. sont décrites ici Un tableau des codes à 3 lettres et à1 lettre et codons.

Pour pouvoir retrouver les noms d'espèce (comme dans l'image ci-dessus où on a édité les données avant d'aligner) on peut imprimer ou copier-coller le tableau - plus haut dans la même page - donnant les noms des espèces en rapport avec le numéro d'accession.

Les abréviations des noms d'espèces en code à 5-lettres ici

5° Récupérer les séquences de protéine sélectionnées en vue de construire un arbre :

Revenir à la page de sélection de séquences (bouton Retour du browser 2x)

Cliquer le bouton "Retrieve" à droite du bandeau vert en bas de l'écran.

Dans la case FASTA cliquer "Open" (solution), cela ouvre une page web avec les données brutes des séquence sélectionnées. (non éditable)

Tout sélectionner le contenu et copier .

6° Produire un arbre
A partir des séquences sélectionnées, former un arbre

Aller sur le site Phylogeny.fr :

Cliquer sur le second onglet en haut à gauche: choisir dans le menu 'Phylogeny analysis' - 'One click' (Solution)
Copier / Coller les séquences en format FASTA
Ici on peut éditer le texte : Notamment réduire la première ligne au nom d'espèce
Cliquer "Submit" pour lancer les opérations : le programme va effectuer les différentes étapes en direct (alignement et construction de l'arbre).
Récupérer ensuite (et/ou éditer) l'arbre dans différents formats.
Exemple de solution possible ici

Compléments

On peut aussi faire cette procédure avec d'autres protéines :

->Liste d'exemples de protéines avec
- -> Un exemple détaillé, les récepteurs à phéromones
Autres
- -> Analyse plus complexe pour avancés
- ->Trouver les protéines homologues par leur similarité de séquence (BLAST)
Usages pédagogiques
- Un exercice d'alignement à faire sur papier et l'alignement 2 à 2 correspondant
- Contre-exemple ancien et donc imparfait du Scénario5 réalisé en classe ici Notez que le choix de comparer la séquence de nucléotides est peu judicieux.
- Taxonomy Common TreeProduit un arbre taxonomique pour un groupe d'organismes déterminé.
Références
- Antonis Rokas GENOMICS: Lining Up to Avoid Bias Algorithms that align DNA sequences can introduce bias and uncertainty into evolutionary analyses. Science 25 January 2008: 416-417.PDF
- Wong,Karen M., Suchard,Marc A., Huelsenbeck John P. (200x) Alignment Uncertainty and Genomic Analysis
- Levasseur, A., Orlando, L., Bailly, X., Milinkovitch, M. C., Danchin, E. G. J., & Pontarotti, P. (2007). Conceptual bases for quantifying the role of the environment on gene evolution: the participation of positive selection and neutral evolution. Biological Reviews, 82(4), 551-572. http://dx.doi.org/10.1111/j.1469-185X.2007.00024.x | intranet.pdf
- Wilson, D. S. (2005). Evolution for Everyone: How to Increase Acceptance of, Interest in, and Knowledge about Evolution. PLoS Biol, 3(12), e364.
- Sélection de liens BIST
- Sélection de liens évolution
- Bio-tic evolution @inrp
- L'arbre de la vie perd une branche @campus
- Statistiques de répartition d'une sélection de protéines orthologues à travers le vivant
- Serveurs réalisant des alignements multiples de séquences
- Relations de parenté entre les êtres vivants @inrp Synthèses
- Initiez-vous à la construction d'arbres phylogénétiques sur Philophylo | documentation Merci SwissProt
- Scénario similiare @ BioQuest Myoglobin as a Probe for Understanding Molecular Evolution
- François Rechenmann, (2007), Séquences génétiques en face à face, La Recherche, Juin 2007, intranet.pdf (intranet 1.jpg et 2.jpg)
- François Rechenmann, (2008), Retracer l'histoire évolutive, La Recherche, Janvier 2008 (intranet 1 et 2)
- Présentation de B.Boeckmann dans le master spécialisé Protéomique et bioinformatique : La phylogénétique
- TP du cours de Phyologénétique donnée par SwissProt
Retour à BIST | Swiss-Prot| M.C. Blatter | Projets Home de F. Lo