Question:
Codes génétiques alternatifs dans les organismes nouvellement séquencés
Daniel Standage
2011-12-22 11:35:08 UTC
view on stackexchange narkive permalink

Les variations du code génétique standard sont assez rares, mais comme le coût du séquençage du génome à haut débit continue de baisser, il y a une plus grande possibilité de découvrir des exceptions supplémentaires. Cela étant dit, les projets génomiques mettent clairement l'accent sur le séquençage des nucléotides (génome et transcriptome), avec beaucoup moins d'efforts (voire aucun) dans le travail de protéomique (corrigez-moi si je me trompe).

Supposons que nous séquençons le génome d'un nouvel organisme et que nous nous concentrons entièrement sur le séquençage du génome et du transcriptome - pas de protéomique. Supposons également que cet organisme présente de légères variations par rapport au code génétique standard. Serait-il possible d'annoter ce génome (pour les gènes codant pour les protéines) de manière complètement incorrecte puisque le logiciel de prédiction de gènes ne prend pas en compte ces variations, ou serait-ce assez évident? À quoi vous attendez-vous dans ce cas?

Votre question est très vague. Pouvez-vous être plus précis et / ou plus concret? Il existe une dizaine de technologies de séquençage et encore plus de variations du code génétique.
Peut-être que le flou vient du fait que je ne sais pas à quoi m'attendre si j'essayais d'annoter le génome d'un organisme qui utilise un autre code génétique. Ma question fondamentale est: est-ce que je pourrais même le dire? N'est-ce pas clair d'après la question initiale?
Je pense que c'est une question claire.
Trois réponses:
#1
+6
chkuo
2012-01-06 00:34:08 UTC
view on stackexchange narkive permalink

Si l'organisme utilise un code alternatif, les séquences protéiques prédites incluraient toujours le même type d'erreurs de substitution d'acides aminés. Ce modèle devrait devenir apparent lorsque vous comparez les protéines à d'autres organismes.En réalité, le code alternatif le plus courant utilise UGA pour le tryptophane au lieu de l'arrêt habituel. Si vous faites l'erreur d'utiliser le code standard pour ces génomes, les gènes prédits deviendraient très fragmentés, il est donc presque impossible de ne pas le remarquer.

#2
+3
KAM
2011-12-22 19:45:44 UTC
view on stackexchange narkive permalink

Vous avez raison d'être un peu préoccupé, en particulier avec les génomes mitochondriaux (où les codes génétiques non standard sont plus répandus). En plus de l'utilisation de codes non standard, vous devez également envisager l'édition de l'ARN (codons modifiés ou nucléotides supprimés / insérés pour déplacer les cadres de lecture) et les acides aminés spéciaux (par exemple, sélénocystéine). Dans l'ensemble, l'accent mis sur la séquence d'ADN pour déduire la structure des protéines est sûr dans la plupart des cas, mais ne soyez pas surpris par les différences (pour des gènes particuliers ou pour des organismes entiers).

#3
+2
Thomas Ingalls
2011-12-22 13:09:47 UTC
view on stackexchange narkive permalink

La réponse courte est oui, vous pourriez vous retrouver avec de nombreuses erreurs. Voir ici pour plus de détails:

NCBI: "The Genetic Codes"



Ce Q&R a été automatiquement traduit de la langue anglaise.Le contenu original est disponible sur stackexchange, que nous remercions pour la licence cc by-sa 3.0 sous laquelle il est distribué.
Loading...