Question:
Qu'est-ce qui détermine une expression protéique réussie dans E. coli?
Gergana Vandova
2011-12-17 01:54:43 UTC
view on stackexchange narkive permalink

Certaines protéines s'expriment bien dans un hôte hétérologue; d'autres ne le font pas. Quelques exigences sont connues pour déterminer l'expression de la protéine, comme un promoteur fort (comme T7) pour la transcription et un site de liaison au ribosome fort pour la traduction. Je travaille avec une protéine composée de 2 sous-unités - alpha et bêta. Les deux sont sur un plasmide avec le promoteur T7 devant la sous-unité bêta (c'est-à-dire que la construction est le promoteur T7, CDS pour la sous-unité bêta, CDS pour la sous-unité alpha). La sous-unité bêta s'exprime bien, mais pas l'alpha. Pensez-vous que cela a quelque chose à voir avec l'environnement local (promoteurs, RBS, etc.) et dans quelle mesure cela dépend-il de cela? Comment puis-je augmenter l'expression des protéines?

Certains aspects ne sont pas tout à fait clairs pour moi. Les deux sous-unités sont exprimées sur des plasmides séparés, ou? Et tout dans les plasmides est le même, sauf pour la séquence protéique réelle?
Les deux sous-unités sont sur le même plasmide. La séquence plasmidique commence par le promoteur T7, RBS1, sous-unité bêta, RBS2, sous-unité alpha. Les séquences RBS sont un peu différentes, donc je pensais les rendre identiques, mais cela ne devrait pas avoir un grand effet sur l'expression des protéines. (ils sont très proches de la séquence consensus).
Quatre réponses:
#1
+9
Mad Scientist
2011-12-17 02:31:16 UTC
view on stackexchange narkive permalink

Un aspect important lors de l'expression d'une protéine d'un organisme différent dans E. coli est que l'utilisation des codons de l'organisme d'origine est probablement différente de l'utilisation des codons de E. coli utilisée pour l'expression ( biais d'utilisation des codons).

Bien que le code génétique soit dégénéré, tous les codons ne sont pas égaux. Ils pourraient coder pour le même acide aminé, mais les organismes ont tendance à favoriser des codons spécifiques par rapport à d'autres et les ARNt pour ces codons ont tendance à être présents à des concentrations différentes. Lorsque vous avez maintenant beaucoup de codons dans votre séquence qui sont très rares chez E. coli, l'expression en souffrira car l'ARNt de ces codons n'est pas présent à des concentrations suffisamment élevées pour soutenir la traduction.

Là Il existe deux façons de compenser cela, soit vous faites en sorte que votre E. coli produise davantage d'ARNt rares, soit vous optimisez votre séquence pour utiliser différents codons. Pour la première solution, vous pouvez acheter certaines souches d'E. Coli qui contiennent des plasmides codant pour les ARNt qui sont rares dans E. coli, l'une de ces souches est par ex. la souche Rosetta BL21.

Pour optimiser l'utilisation des codons, plusieurs sociétés proposent de synthétiser des séquences optimisées. Il existe également des outils disponibles en ligne, mais je n'ai aucune expérience directe avec ceux-ci.

L'optimisation n'est pas aussi simple que d'utiliser le codon le plus répandu à chaque fois, il a été montré que l'optimisation des codons pour correspondre la vitesse de traduction dans l'organisme d'origine peut améliorer les rendements d'expression. Pour certaines protéines, des sites de pause pendant la traduction peuvent être nécessaires pour assurer un pliage correct. Si la protéine ne se replie pas correctement, elle sera rapidement dégradée et votre rendement en souffrira. Ceci est décrit dans l'article "L'expression des protéines hétérologues est améliorée en harmonisant les fréquences d'utilisation des codons du gène cible avec celles de l'hôte d'expression" d'Angov et al.

Vous trouverez un bon aperçu de l'ensemble du sujet dans l'article "Vous faites partie d'un googol: optimiser les gènes pour l'expression des protéines" de Welsh et al.

Merci, scientifique fou! Oui, j'ai pensé à l'optimisation des codons et c'est définitivement sur ma liste de choses à faire. Désolé j'ai oublié de le mentionner. DNA 2.0 a un logiciel qui convertira votre séquence en une séquence optimisée. J'ai également entendu parler de Rosetta BL21, mais je ne l'ai jamais utilisé. Nous pourrions également vouloir nous en tenir à notre propre souche, car elle est le producteur hétérologue ou le médicament d'intérêt. Je suis un peu préoccupé par l'optimisation des codons, précisément à cause d'un mauvais repliement, mais je pense que nous devrions le faire.
Mais cela n'explique toujours pas pourquoi l'autre sous-unité s'exprime mieux, de même que d'autres protéines du même organisme natif sont bien exprimées dans E. coli. C'est pourquoi je pense que c'est plus une question sur les éléments de contrôle de la transcription et de la traduction, plutôt que sur l'utilisation rare des codons.
@GerganaVandova Vous devriez comparer l'utilisation des codons de vos deux sous-unités, il se peut que l'une utilise des codons plus rares que l'autre.
J'assiste à une conférence de Claes Gustafsson de DNA2.0 - et je suppose que nous le savions déjà - que l'utilisation des codons est utile, mais ne fonctionne pas toujours. ils ont une méthode propriétaire qui est plus fiable ...
#2
+6
Amy
2011-12-22 05:41:32 UTC
view on stackexchange narkive permalink

Avez-vous essayé de placer vos deux gènes sur deux plasmides séparés (avec des origines différentes de réplication et de sélection d'antibiotiques, bien sûr) et de co-exprimer de cette façon? Si la première des deux sous-unités s'exprime bien et la seconde non, c'est probablement parce que les ribosomes tombent de l'ARNm avant de transcrire complètement le second gène. Les gènes sont-ils d'origine eucaryote? Je pense qu'il est difficile de «tromper» les ribosomes d'E. Coli pour qu'ils traitent les séquences hétérologues comme un opéron, mais peut-être que quelqu'un avec plus de connaissances en traduction procaryote pourrait aider.

En fait, il suffit d'ajouter un deuxième promoteur T7 devant du gène 2 aiderait probablement pas mal:

Les gènes sont transcrits soit à partir de promoteurs individuels, soit à partir d'un seul promoteur, conduisant à un long ARNm polycistronique. Il a été rapporté que l'expression polycistronique conduit à une expression plus faible de la protéine codée plus en aval, qui peut être exploitée pour influencer la stoechiométrie d'un complexe protéique (9). Une expression plusieurs fois plus élevée avec des promoteurs individuels par rapport à la transcription polycistronique a été rapportée (10). ( Source)

Je sais par expérience personnelle que la co-expression utilisant deux plasmides peut très bien fonctionner avec les bons gènes!

Merci pour votre réponse. J'aime l'idée d'ajouter un promoteur T7 supplémentaire, bien que le fait d'avoir des séquences répétitives puisse entraîner d'autres problèmes futurs (je ne veux pas entrer dans les détails). Mais je travaille avec des gènes 3 fois plus gros et un promoteur pour les 2 sous-unités fonctionne bien. C'est peut-être très spécifique à la séquence.
#3
+2
Nick T
2011-12-17 11:19:41 UTC
view on stackexchange narkive permalink

Mad Scientist a couvert les problèmes potentiels de biais de codons (qui peuvent être améliorés avec Rosettas), mais plus généralement, j'ai constaté une énorme variabilité des taux d'expression entre différents vecteurs (pET-28 vs pET-24) sans aucune raison apparente. Notre laboratoire a eu un énorme succès avec les vecteurs inductibles par IPTG (passant de pBC-SK à pET-24 augmenté de 50 fois).

Au-delà de l'expression, la protéine peut être perdue lors de la préparation de l'extrait acellulaire. Il peut ne pas être dans le culot cellulaire s'il est exporté avec la permission d'un peptide signal, ou peut être jeté dans le culot de «débris» lors de la rotation vers le bas des cellules lysées s'il est peu soluble. J'ai entendu une théorie selon laquelle les problèmes de solubilité peuvent être exagérés par des vecteurs qui saturent les machines d'exportation, qui peuvent à la fois entraver la synthèse et / ou être si efficaces qu'ils ne font que provoquer des précipitations. Le Manuel du système pET suggère que des temps d'expression plus longs (pendant la nuit) à des températures inférieures (15-20 ° C) peuvent aider à résoudre les problèmes de solubilité. Quelle que soit la raison, l'ingénierie du peptide signal a considérablement augmenté l'expression de plusieurs de nos protéines.

#4
+2
Gergana Vandova
2012-01-07 01:15:01 UTC
view on stackexchange narkive permalink

J'ai trouvé un très bon article: Concevoir des gènes pour une expression protéique réussie, qui couvre la plupart des facteurs qui déterminent l'expression des protéines. J'en poste des parties, car je suis sûr que cela sera utile à certains d'entre vous.

La traduction peut être contrôlée au niveau de l'initiation et de l'élongation. L'initiation de la traduction dépend principalement de la séquence du site de liaison au ribosome (RBS) et de la structure secondaire de l'ARNm précoce. D'autres déterminants de l'expression des protéines sont moins bien compris mais tout aussi puissants.

1. Lancement de la traduction

Un élément clé affectant l'initiation de la traduction chez les procaryotes est le RBS qui se produit entre 5 et 15 bases en amont du cadre de lecture ouvert (ORF) AUG commencez le codon. La liaison du ribosome à la séquence Shine – Dalgarno (SD) dans le RBS localise le ribosome au codon d'initiation ... L'affinité du RBS pour le ribosome est un facteur critique contrôlant l'efficacité avec laquelle le nouveau les chaînes polypeptidiques sont initiées. Cette interaction est en compétition avec d'éventuelles interactions d'appariement de bases impliquant la région RBS qui peut se former dans l'ARNm lui-même. Ainsi, les séquences SD avec un appariement de bases plus faible avec le ribosome sont plus sensibles aux interférences de la structure de l'ARNm. Cependant, certaines expériences suggèrent que les séquences SD avec une affinité trop forte peuvent être délétères, en particulier à des températures abaissées, en bloquant l'allongement initial. La distance entre le RBS et le codon de départ avec 5-7 bases du consensus SD AGGAGG est également critique.

De nombreuses sources de données suggèrent que les 15–25 codons initiaux de l'ORF méritent une attention particulière dans l'optimisation des gènes. Des études ont montré que l'impact des codons rares sur le taux de traduction est particulièrement fort dans ces premiers codons, pour l'expression à la fois dans Escherichia coli et Saccharomyces cerevisiae. Chez E. coli, la chute du peptidyl-ARNt lors de la traduction des codons initiaux semble être accentuée par la présence de codons NGG rares. Ces effets semblent être indépendants de la structure secondaire locale de l'ARNm. Il est également vrai que l'expression peut être récupérée par remplacement de séquence en 5 'même pour les séquences qui ne présentent pas de structure d'ARNm particulièrement forte ou qui contiennent des codons rares ou d'autres éléments délétères évidents dans cette région.

2. Biais de codon

La deuxième façon dont les fréquences de codon hôte peuvent être utilisées est de faire correspondre les fréquences de codon hôte dans le gène conçu. Cela peut être fait simplement en choisissant chaque codon avec une probabilité qui correspond à la fréquence du codon hôte ... En utilisant des ensembles de gènes largement variés dans les caractéristiques de conception des gènes, Welch et al. ont constaté que la variation des fréquences d’utilisation des codons synonymes avait un effet profond sur la quantité de protéine produite dans E. coli, indépendamment des effets de la séquence locale 5 ’. Une variation d'au moins deux ordres de grandeur dans l'expression a été observée en raison de la substitution au-delà des 15 codons initiaux de l'ORF. Cette variation était fortement corrélée avec les fréquences globales d'utilisation des codons des gènes, bien que les fréquences de codons trouvées dans les variantes les plus exprimées ne correspondent pas à celles trouvées dans le génome ou dans les gènes endogènes hautement exprimés d'E. Coli. Une analyse multivariée a montré que les fréquences de codons spécifiques pour environ six acides aminés pouvaient prédire les différences d'expression observées. La base biochimique de cette corrélation n'est pas claire.

3. Structure de l'ARNm et allongement translationnel

Bien que de nombreuses preuves suggèrent que la structure de l'ARNm peut interférer avec l'initiation de la traduction chez les procaryotes et les eucaryotes, les effets de la structure sur l'élongation sont moins bien compris. Cela peut être en partie dû à l'activité hélicase intrinsèque des ribosomes, qui permet la traduction à travers des épingles à cheveux même très fortes et peut empêcher de nombreuses structures de limiter le taux de traduction chez les procaryotes ou les eucaryotes. Peut-être plus important encore, la structure de l'ARNm est difficile à prédire, en particulier pour les messages activement traduits qui sont en flux continu entre divers états repliés et dépliés.

4. Facteurs spécifiques aux protéines offrant une complexité supplémentaire

La protéine peut être particulièrement instable chez l'hôte, surtout si elle est mal repliée en raison d'une instabilité inhérente, d'un manque de facteurs prothétiques suffisants ou d'une mauvaise post-traduction modification ... L'expression des protéines sécrétées et membranaires peut être limitée par des mécanismes pour diriger ces protéines vers la membrane. Il est même possible que la séquence d'acides aminés de la protéine puisse limiter l'efficacité de la traduction. Par exemple, on pense que la proline se traduit lentement dans E. coli, quel que soit le codon utilisé.

L'expression de la protéine peut être toxique pour la cellule, ce qui entraîne une instabilité de le vecteur d'expression ou la suppression de l'hôte de la synthèse des protéines ... Une stratégie courante pour réduire la toxicité consiste à abaisser l'expression à des niveaux tolérables. Les promoteurs de force variée peuvent être des outils précieux pour trouver un taux d'expression optimal pour un rendement maximal ... Un moyen potentiel d'éviter la toxicité de certaines protéines est de diriger l'expression vers le périplasme ou le milieu. Ceci peut être accompli par fusion N-terminale d'une séquence de signal de sécrétion.

Pour plus d'informations, veuillez lire l'article en entier. Je recommande également de lire les Paramètres de conception pour contrôler l'expression des gènes synthétiques chez Escherichia coli.

Merci pour les liens! J'ai déjà utilisé l'ADN 2.0 pour l'optimisation des codons et la synthèse de gènes et j'ai eu de bons résultats - je suis vraiment intéressé à lire leurs publications.
@Amy: Ouais, une partie de l'article porte sur les fonctionnalités de DNA2.0, que je trouve très utiles. Je suis un nouvel utilisateur et je suis toujours en train de m'habituer à leur logiciel, mais ça a l'air plutôt sympa jusqu'à présent.


Ce Q&R a été automatiquement traduit de la langue anglaise.Le contenu original est disponible sur stackexchange, que nous remercions pour la licence cc by-sa 3.0 sous laquelle il est distribué.
Loading...