Question:
Quand BLAST échoue-t-il à aligner 2 séquences d'ADN?
ablmf
2011-12-17 01:07:09 UTC
view on stackexchange narkive permalink

C'est une mission qui me déroutait depuis longtemps. Je pense donc que vous qui étudiez la biologie computationnelle pourraient être intéressés. La question initiale est:

Trouvez les deux séquences d'ADN les plus similaires de longueur 20 que Blast en utilisant une longueur de mot de 5 ne parviendra pas à s'aligner.

Deux réponses:
#1
+14
user59
2011-12-17 01:56:42 UTC
view on stackexchange narkive permalink

BLAST fonctionne en trouvant une correspondance parfaite entre des séquences d'une longueur égale à cette "longueur de mot", puis en l'agrandissant de manière standard - mais il n'y aura pas d'alignement sans ce mot parfaitement adapté.

Donc dans votre cas, vous devez rechercher deux séquences de 20 pb sans sous-séquence commune de 5 pb; par exemple:

  AAAAAAAAAAAAAAAAAAAA  

et

  AAAACAAAACAAAACAAAAC  
Ouais, c'est la réponse standard. Mais notez que BLAST fonctionne différemment avec Protein. C'est pourquoi cela m'a dérouté pendant un moment.
La "longueur du mot" est-elle == k-tuple?
@StudentT Précisément k dans k-tuple.
#2
-1
user1503
2012-10-08 02:18:06 UTC
view on stackexchange narkive permalink

Je ne suis pas sûr de bien comprendre BLAST.

Lorsque vous utilisez BLAST dans l'ADN et les protéines, ils sont différents. Il existe un seuil T dans l'étape "d'ensemencement" des protéines, ce qui signifie que la séquence d'ensemencement n'est pas parfaitement adaptée. Cependant, il semble qu'il n'y ait pas de T dans l'étape d'ensemencement et nous recherchons une correspondance parfaite et les étendons à la séquence voisine.

Donc, s'il n'y a pas de correspondance exacte de longueur de mot 5 entre ces 2 séquences, BLAST échouera.

J'ai peur de ne pas comprendre ce que vous essayez de dire ici. Pourriez-vous clarifier?


Ce Q&R a été automatiquement traduit de la langue anglaise.Le contenu original est disponible sur stackexchange, que nous remercions pour la licence cc by-sa 3.0 sous laquelle il est distribué.
Loading...