Pour les passionnés: http://www.ncbi.nlm.nih.gov/BLAST/blast_FAQs.shtml
Outil informatique très efficace, (en fait un algorithme permettant de quantifier la similitude entre 2 séquences) permettant de faire des recherche de similarité à partir d'une séquence (protéine ou nucléique) sur toutes les séquences (ou un sous-ensemble de séquences) existantes dans une base de données.
Selon le type de séquence à analyser on a le choix entre : Nucleotide-nucleotide BLAST (blastn) Protein-protein BLAST (blastp) Translated query vs. protein database (blastx) Protein query vs. translated database (tblastn) Translated query vs. translated database (tblastx)
De nombreux serveurs donnent accès à cet outil, comme :
ExPASy (BLASTp uniquement) : http://www.expasy.org/tools/blast/
NCBI (tous les BLASTs): http://www.ncbi.nlm.nih.gov/BLAST/
En général, il vaut mieux ne pas Blaster contre le génome directement, mais contre les séquences nucléotidiques (human genomic + transcipts (G + T)).
Remarque : de façon générale, les séquences soumises doivent être au format Fasta.
De façon générale, il vaut toujours mieux utiliser les paramètres par défaut, surtout si on n'est pas expert dans le domaine.
On a le choix
a) des banques de données contre lesquelles on veut « blaster » notre séquence (exemple : toutes, une sélection, un organisme donné?)
b) Expect value : valeur pour laquelle on considère que le match = appariement n'est pas dû au hasard. Si on travaille avec des séquences très courtes, on peut se permettre d'augmenter cette valeur, afin que le programme nous donne quand-même des résultats qu'il aurait ignorés si on n'avait pas modifié cette valeur.
Les résultats d'un Blast sont en 4 parties :
Retour à BIST | Swiss-Prot| M.C. Blatter | Projets Home de F. Lo