Question:
Pourquoi y a-t-il exactement quatre nucléobases dans l'ADN?
tunnuz
2012-07-12 06:59:05 UTC
view on stackexchange narkive permalink

Est-ce que quelqu'un sait pourquoi l'ADN est composé de quatre nucléobases? En particulier, y a-t-il une explication pour le nombre? Pourquoi quatre et pas deux ou huit?

ceci juste en - deux nouvelles bases ajoutées à E coli (X et Y) se reproduisent. http://www.wired.com/2014/05/synthetic-dna-cells/ pas clair sur le degré d'adaptation nécessaire pour que X et Y fonctionnent pour coder des gènes.
Sept réponses:
Jack Aidley
2013-01-23 22:08:40 UTC
view on stackexchange narkive permalink

Une réponse maintenant supprimée attribue cela à un argument basé sur le codage des acides aminés dans les codons mais, comme l'a souligné Konrad Rudolph dans un commentaire, les arguments basés sur les codons ne peuvent pas être corrects car le système à 4 bases est probablement antérieur l'évolution de la traduction des protéines.

Alors pourquoi quatre?

Je suggère que cela vient d'une combinaison de facteurs qui en font un «parfait» pour les réplicateurs à base d'ARN: plus serait mauvais, et moins serait également mauvais. Les quatre bases sont capables de copier avec une grande fiabilité car deux caractéristiques se combinent pour exclure les mauvais appariements: il existe deux classes de taille - ce qui signifie que tout appariement purine-purine ou pyrimidine-pyrimidine entraîne une séparation incorrecte entre les brins, à l'exclusion des liaisons A-G et C-U; et il existe deux classes basées sur le nombre de liaisons OH - ce qui limite le potentiel des liaisons A-C et G-U. Plus de bases doivent, inévitablement, affaiblir la force de ces approches d'exclusion et augmenter le nombre de mésappariements. Les réplicateurs du monde ARN n'auront pas été dotés des mécanismes sophistiqués de réparation et de vérification des erreurs des formes de vie modernes, de sorte que cette augmentation des erreurs d'appariement ne sera probablement pas corrigée.

Bien sûr, un système à deux bases serait encore plus capable de réduire les erreurs. Je suggère que l'avantage du système à quatre bases est qu'il permet à une structure tridimensionnelle beaucoup plus complexe de se former dans l'ARN et permet ainsi une plus large gamme de capacités catalytiques. Je n'ai considéré que les nombres pairs parce que seuls les systèmes pairs pourraient utiliser le style Watson-Crick d'appariement de base.

Je suggère également de lire le article 2003 d'Eörs Szathmáry à ce sujet très question.

Addendum

Un groupe en Californie vient de publier un article dans lequel ils ont réussi à ajouter une troisième paire de bases de manière stable dans l'ADN. Je pense que cela pourrait vous éclairer sur la raison de quatre - vous pouvez en savoir plus ici ou obtenir le document complet ici (Nature, alors payez en mur).

shigeta
2013-01-25 10:28:30 UTC
view on stackexchange narkive permalink

Il y a aussi une dimension chimique à cette question.

Si vous regardez les paires de base Watson-Crick, vous pouvez voir qu'il n'y a pas beaucoup de marge de manœuvre:

Watson Crick Base Pairs

Les bases nucléotidiques ont 2 ou 3 liaisons hydrogène. Ce n'est probablement pas stériquement raisonnable d'en avoir 4.

Cela signifie qu'il n'y a qu'un nombre limité de façons dont les combinaisons de base peuvent être complémentaires et aussi spécifiques car elles forment la double hélice. Étant donné que les motifs de liaison hydrogène A-> T et T-> A prennent les deux combinaisons donneur-récepteur, il existe une paire de liaisons 2 H possible.

Il y a 2 façons de configurer les trois bases de liaison hydrogène, je pense, donc peut-être six sont possibles, mais je suppose que si vous étendez le répertoire d'appariement de bases, on pourrait commencer à perdre de la spécificité. Dans l'état actuel des choses, si vous jouez suffisamment avec des nucléotides, vous pouvez créer des paires de bases non Watson-Crick et perdre probablement une partie de la confiance que vous avez des correspondances exactes 1: 1 entre des paires de bases complémentaires. Il est déjà possible de démontrer que les paires de bases oscillantes dans l'ARN et les appariements de bases Hoogsteen autorisent les triples hélices et les hélices ARN de correspondance non parfaite.

non W-C base pairings

Blank
2013-05-12 10:08:08 UTC
view on stackexchange narkive permalink

Voici une réponse possible donnée par cet article:

http://www.ncbi.nlm.nih.gov/pubmed/16794952
ou http://www.math.unl.edu/~bdeng1/Papers/DengDNAreplication.pdf

Il donne une explication darwinienne à la question. Il aborde le problème à partir de la théorie de la communication de Claude Shannon. Il traite la réplication de l'ADN conceptuellement et mathématiquement de la même manière qu'une transmission de données. Il conclut que le système de quatre bases, pas deux, pas six, reproduit la plupart des informations génétiques dans les plus brefs délais.

L'analogie communicationnelle va comme ceci. Si vous avez deux systèmes de transmission de données, l'un peut transmettre, disons, 1 Mo par seconde, et l'autre peut faire 2 Mo par seconde mais coûter moins du double. La réponse est évidente: vous achèterez le deuxième service à un tarif plus élevé par coût. En tant que service de données, peu importe les informations que vous consommez - il peut s'agir de spam, vidéo, audio, etc. Tout ce qui compte, c'est le taux de transmission. Quant à la réplication de l'ADN, c'est comme un canal de transmission de données lorsqu'une base est répliquée à un moment le long de la matrice d'ADN mère. Il ne se soucie pas non plus de savoir si le processus concerne un génome de bactérie, une plante ou un génome animal. Le gain est dans l'information et le coût est dans le temps. Contrairement à vos variétés de communication abiotiques, le temps est à la fois l'expéditeur et le récepteur de tous les messages de vie, et différentes formes de vie ou espèces ne sont que des téléphones portables du temps. Donc, si un système peut reproduire plus d'informations en une unité de temps qu'un autre, le plus rapide remportera la course aux armements évolutive. Une proie fonctionnant sur un système de réplication lente ne pourra ni concurrencer ni s'adapter à un prédateur opérant sur un système rapide.

Maintenant que la paire A-T n'a que deux liaisons hydrogène faibles mais que la paire C-G en a trois, A et T mettent moins de temps à se dupliquer que les C et G. Bien que le temps de réplication soit court en une fraction de nano seconde, mais le temps s'additionne rapidement pour les génomes dont les paires de bases se chiffrent en milliards. Donc, avoir la paire C-G peut ralentir la réplication, mais le gain est dans l'information. Une paire de bases vous donne 1 bit par information de base. Deux paires vous donnent 2 bits par information de base. Mais, avoir plus de paires de bases peut éventuellement entraîner un rendement diminué du taux de réplication des informations si les nouvelles bases prennent trop de temps à se répliquer. D'où la prise en compte du taux optimal de réplication mesuré en bits d'information par base et par temps. Sans information, il n'y aurait pas de diversité, pas de complexité. Sans réplication des informations, il n'y aurait pas de vie.

En utilisant un simple calcul de taux de transmission / réplication par Shannon, vous pouvez calculer le débit moyen pour le système AT, le système CG, le système ATCG et pour certains systèmes hypothétiques à 6 bases, 2n bases dont les nouvelles bases prennent progressivement plus de temps à se répliquer. L'analyse montre que le système ATCG a le taux de réplication optimal si les bases CG prennent 1,65 à 3 fois plus de temps à se répliquer que les bases AT. Autrement dit, un système de base 2 réplique ses bases plus rapidement mais ne transporte pas plus d'informations pour avoir un débit binaire plus élevé. De même, un système de base 6 a une plus grande information par base mais se réplique plus lentement en moyenne pour aboutir à un débit binaire sous-optimal.

DNA Replication Rate

D'après une comparaison tirée de l'article, le système de base 4 est environ 40% plus rapide que le système A – T uniquement et 133% plus rapide que le système G – C uniquement. Supposons que la vie sur Terre ait commencé il y a environ 4 milliards d'années, alors le seul système A-T retarderait l'évolution d'un milliard d'années, le système G – C le ferait de 2,3 milliards d'années. Pour un système hypothétique de base 6, il le ferait d'ici 80 millions d'années. En d'autres termes, la vie est là où elle devrait être, car le système de base 4 est capable de transmettre des informations à travers le goulot d'étranglement au débit optimal.

En conclusion, la vie est de reproduire le plus d'informations avec le temps le plus court, et le système de base 4 le fait le mieux. S'il y avait jamais eu d'autres systèmes, ils auraient perdu la concurrence informatique au profit du système de base 4 dès le départ. Le principe de Darwin fonctionne au niveau le plus élémentaire et le plus important de la vie.

Il y a d'autres explications, toutes non darwiniennes. La plupart sont basés sur les structures moléculaires de la base. Mais ces types d'explications frisent l'argument circulaire - utilisant des observations pour s'expliquer. Ils sont également confrontés à ce problème catch-22 car il n'y a aucun moyen d'épuiser toutes les bases possibles pour la réplication. Cependant, de telles pistes d'exploration sont néanmoins fructueuses car plus de connaissances sont meilleures. Mais sans prendre en compte l'information et sa réplication, il est difficile d'imaginer une réponse sensée à la question.

Bienvenue chez Biology SE. Ce serait formidable si vous pouviez élargir votre réponse pour inclure un résumé des principaux points. Nous ne pouvons pas compter sur le lien pour toujours.
vous pouvez modifier votre réponse. (voir le lien sous votre message.)
Explication cool.
"et pour certains systèmes hypothétiques à 6 bases, 2n bases dont les nouvelles bases prennent progressivement plus de temps à se répliquer." - Cette hypothèse semble difficile à justifier.
719016
2013-01-24 14:23:38 UTC
view on stackexchange narkive permalink

Le système d'ADN à 4 bases avec des liaisons AT et des liaisons CG est celui qui a évolué pour être utilisé par la plupart des créatures vivantes sur Terre, comme mentionné dans d'autres réponses, car il peut coder une table de triplets de bases pour tous les acides aminés utilisés, permettant à certains acides aminés d'avoir plus d'un code triplet. Il existe cependant de légères variations du système: même si les liaisons A-T et C-G ne changent pas, les nucléotides peuvent être modifiés pour marquer des zones du génome dans ce qui fait partie du code épigénétique. La modification la plus courante consiste à ajouter des molécules de méthyle et de 5-hydroxyméthyle aux bases, bien que d'autres modifications soient encore en cours de découverte.

SPYROU Kosta
2017-10-24 02:24:41 UTC
view on stackexchange narkive permalink

Théoriquement à partir de pyrimidines et de purines ensemble, ils sont 6 paires de bases = 12 bases possibles ...

SI les nucléobases sont issues uniquement de pyrimidines et NON de purines ALORS ce ne sont que 2 paires de bases = 4 bases de pyrimidines possibles !!! ... 4 purines and 12 purines+pyrimidines

Tim Campion
2020-08-18 23:23:57 UTC
view on stackexchange narkive permalink

Avertissement: je ne suis ni biologiste, ni chimiste, ni théoricien de l’information. Je veux juste lancer une perspective que j'ai en quelque sorte reconstituée à partir des différentes réponses ici, mais que je ne vois pas vraiment exprimée dans une seule réponse.

À savoir, je pense que c'est facile à imaginez que 4 paires de bases est le résultat d'un compromis entre avoir plusieurs paires de bases et avoir peu de paires de bases. Autrement dit, c'est essentiellement le résultat d'un problème d'optimisation. Il y a certains avantages à avoir plus de paires de bases, et certains avantages à avoir moins de paires de bases, et 4 est tout simplement le meilleur compromis entre elles. Comme pour tout problème d'optimisation, le résultat est probablement assez sensible à la manière exacte dont nous formulons la question - exactement dans quel environnement le système à 4 paires de bases a évolué, quel rôle l'ARN a joué dans la vie à ce moment-là, comment nous quantifions exactement les avantages. et les inconvénients de divers systèmes de paires de bases, etc. Et peut-être le système à 4 paires de bases a-t-il d'abord évolué dans un environnement, tout en s'élevant plus tard pour dominer d'autres systèmes concurrents dans un environnement tout à fait différent - auquel cas la question est encore plus compliquée.

Il est probable que bon nombre de ces questions de modélisation sont suffisamment incertaines à l'heure actuelle pour qu'il soit impossible de "gérer le problème d'optimisation" en toute confiance et de faire confiance au résultat. Mais probablement la première étape serait d'essayer d'énumérer autant que possible des facteurs concurrents en jeu. Permettez-moi d'essayer cela, avec l'aide des réponses précédentes ici:

Raisons pour préférer moins de paires de bases

  • Moins de paires de bases signifie moins de voies possibles de "mauvais appariement", potentiellement un taux de mutation décroissant

  • Moins de paires de bases signifie également que seules les "meilleures paires" doivent être utilisées, ce qui réduit potentiellement le taux de mutation.

  • Moins de paires de bases simplifie le processus d'acquisition ou de synthèse des paires de bases en premier lieu.

  • Peut affecter la vitesse de transcription.

Raisons de préférer plus de paires de bases

  • Plus d'informations stockées par unité de masse / volume.

  • Augmente potentiellement la gamme de structures qui peuvent être construites directement à partir du matériel génétique.

  • Peut affecter la vitesse de transcription.

Je suis sûr qu'il y a de nombreux autres facteurs à considérer.

Je ne sais pas si quelque chose de quantitatif peut être dit à propos de ces forces opposées avec suffisamment de confiance pour vraiment "diriger l'optimisation" et faire confiance à la réponse.

Et bien sûr, il y a probablement beaucoup plus à dire sur l'espace sur lequel nous optimisons - exactement quelles "paires de bases" pourraient être utilisées en premier lieu, comme d'autres personnes plus qualifiées l'ont déjà abordé.

user43012
2017-12-23 21:41:45 UTC
view on stackexchange narkive permalink

Parce que quatre est le nombre minimum possible. S'il n'y a pas de pression pour rendre un système plus complexe, il ne s'assemblera jamais.

On pourrait alors soutenir qu'un système similaire aurait pu être construit en utilisant seulement deux bases.

Très bien.

Essayez-le.

Vous échouerez lamentablement. Bien sûr, vous pouvez créer un brin d'ADN contenant uniquement de l'adénine et de la thymine. Mais qui empêcherait la guanine et la cytosine de se former et de se joindre au désoxyribose alors? Comment géreriez-vous alors le stockage, la préservation et le transfert des informations?

L'appariement de base - aussi complexe puisse-t-il paraître - est le moyen le plus simple de stocker en toute sécurité des informations au niveau moléculaire afin qu'elles puissent être traitées pour le transfert et traduction ailleurs. Les combinaisons spatiales de liaisons hydrogène qui peuvent être établies entre la pyrimidine et les dérivés de purine ne sont que deux.

Pour la réplication, vous avez besoin d'une autre rupture de symétrie, ce qui vous laisse avec deux bases, une sur chaque brin d'un ADN double hélice.

Deux fois deux font quatre.

PS: Au fait, qui sur Terre vous a dit qu'il y avait exactement quatre nucléobases dans l'ADN? Dites-leur qu'ils ont probablement oublié la méthylcytosine! Le terme «méthylation» n'est qu'une excuse pour éviter d'admettre que l'ADN utilise cinq bases au lieu de quatre. Ouvrez votre esprit.



Ce Q&R a été automatiquement traduit de la langue anglaise.Le contenu original est disponible sur stackexchange, que nous remercions pour la licence cc by-sa 3.0 sous laquelle il est distribué.
Loading...