Question:
Quels sont les facteurs limitants de la longueur des gènes et du nombre d'exons?
Daniel Standage
2011-12-15 04:11:58 UTC
view on stackexchange narkive permalink

J'ai récemment téléchargé des annotations de gènes pour Homo sapiens d'Ensembl pour une analyse bioinformatique. La grande majorité des annotations de gènes ont 20 exons ou moins, bien que certains en aient jusqu'à 250. J'en connais suffisamment sur l'annotation de gènes pour prendre ces prédictions avec un grain de sel, mais cela m'a fait réfléchir ... les facteurs biologiquement pertinents qui pourraient limiter la longueur, le nombre d'exons, etc. d'un gène? Y a-t-il une réelle possibilité pour un gène d'avoir 50 exons? 100 exons? 250 exons? D'un point de vue biologique, où est tracée la ligne et pourquoi?

Comment avez-vous récupéré les annotations de gènes / exons? BioMart ou API EnsEMBL?
J'ai obtenu les fichiers GTF compressés (gzip) directement à partir du site FTP avec wget.
L'API EnsEMBL Perl est un moyen sympa de récupérer les données précises dont vous avez besoin - http://www.ensembl.org/info/docs/api/index.html
Trois réponses:
#1
+10
user49
2011-12-15 04:43:37 UTC
view on stackexchange narkive permalink

Cette question s'inscrit fermement dans le giron de l'évolution moléculaire et des contraintes imposées aux gènes par les forces de mutation, de sélection, de dérive et de recombinaison.

Il existe de nombreuses situations, notamment la duplication de gènes, peut aboutir à un gène exempt des contraintes sélectives de son parent, dont beaucoup accumuleront tellement de mutations délétères à la suite de processus stochastiques qu'ils deviendront non fonctionnels, par exemple psuedogenes. Certains peuvent être modifiés et réarrangés, accumulant des exons et des introns, et s'ils en déduisent un avantage de remise en forme sur l'organisme, peuvent être déplacés vers la fixation au sein d'une population.

L'évolution est un processus génétique de la population, et il y en a beaucoup variables qui peuvent influer sur le résultat, notamment la différence de taille des populations. Les génomes de populations plus importantes (comme ceux des bactéries) semblent avoir des génomes beaucoup plus petits, et bien sûr pas d'introns (du moins pas splicéosomaux), peut-être en raison d'une meilleure aptitude due à la diminution du temps de génération d'un organisme avec un plus génome élancé. Ce serait une bonne idée de lire Les origines de l'architecture du génome de Michael Lynch, car je pense qu'il répond à vos questions, mieux que moi.

De nombreux gènes que vous récupérez d'EnsEMBL auront bien sûr des preuves expérimentales pour les soutenir. Les gènes prédits dans le pipeline peuvent être examinés avec moins de confiance, mais vous pouvez bien sûr regarder les alignements avec des espèces étroitement apparentées pour voir si vous pensez que les introns / exons sont effectivement viables. Un exemple de gène avec 79 exons est le gène de la dystrophine (DMD), le plus long gène annoté à 2 217 347 pb (voir Roberts et al, 1993 et Nishio et al, 1994) ).

#2
+3
user59
2011-12-15 04:49:47 UTC
view on stackexchange narkive permalink

Je doute qu'il y ait vraiment une limitation directe; le meilleur test serait de vérifier si la taille correspond, c'est-à-dire que le gène de 1 kbp avec 100 exons devrait plutôt avoir des introns bien trop courts.

Une recherche rapide sur les gènes NCBI montre même un gène 317-exon, bien que tous ces cas marginaux semblent être des frères et sœurs peu clairs de titine qui est tout simplement énorme en soi.

En parlant de contrôle de la qualité des annotations, il faut réfléchir aux contraintes moléculaires sur la taille d'un exon, ou intron d'ailleurs. La longueur minimale (théorique) d'un exon devrait être de 1 pb, bien qu'il faille également penser à la liaison de la machinerie moléculaire impliquée dans la reconnaissance des limites exon-intron et l'épissage des exons adjacents. Je devrais penser que les exons de moins de 6 pb ne seraient probablement pas considérés comme fonctionnels? Voir http://www.jbc.org/content/270/6/2411.full et http://mbe.oxfordjournals.org/content/23/12/2392.full
#3
+3
shigeta
2011-12-15 05:11:02 UTC
view on stackexchange narkive permalink

D'accord avec mbq - le titan est le gène le plus long que je connaisse et il contient bien plus de 100 exons. Titin et dystrophine sont bien caractérisés génétiquement et non des prédictions. titin est le champion exoner avec 363 exons.

Ses seuls exemples comme celui-ci peuvent permettre aux prédicteurs de gènes de fonctionner aussi longtemps qu'ils le font je pense, car les prédictions sont coupées de manière heuristique pour ressembler aux structures / longueurs / jonctions génétiques connues, etc.

La dystrophine est le gène le plus long, mais ne code pas le produit le plus long, qui est bien sûr Titin. 363 exons, c'est un enfer de nombre! Lol :)


Ce Q&R a été automatiquement traduit de la langue anglaise.Le contenu original est disponible sur stackexchange, que nous remercions pour la licence cc by-sa 3.0 sous laquelle il est distribué.
Loading...