J'ai trouvé un très bon article: Concevoir des gènes pour une expression protéique réussie, qui couvre la plupart des facteurs qui déterminent l'expression des protéines. J'en poste des parties, car je suis sûr que cela sera utile à certains d'entre vous.
La traduction peut être contrôlée au niveau de l'initiation et de l'élongation. L'initiation de la traduction dépend principalement de la séquence du site de liaison au ribosome (RBS) et de la structure secondaire de l'ARNm précoce. D'autres déterminants de l'expression des protéines sont moins bien compris mais tout aussi puissants.
1. Lancement de la traduction
Un élément clé affectant l'initiation de la traduction chez les procaryotes est le RBS qui se produit entre 5 et 15 bases en amont du cadre de lecture ouvert (ORF) AUG commencez le codon. La liaison du ribosome à la séquence Shine – Dalgarno (SD) dans le RBS localise le ribosome au codon d'initiation ... L'affinité du RBS pour le ribosome est un facteur critique contrôlant l'efficacité avec laquelle le nouveau les chaînes polypeptidiques sont initiées. Cette interaction est en compétition avec d'éventuelles interactions d'appariement de bases impliquant la région RBS qui peut se former dans l'ARNm lui-même. Ainsi, les séquences SD avec un appariement de bases plus faible avec le ribosome sont plus sensibles aux interférences de la structure de l'ARNm. Cependant, certaines expériences suggèrent que les séquences SD avec une affinité trop forte peuvent être délétères, en particulier à des températures abaissées, en bloquant l'allongement initial. La distance entre le RBS et le codon de départ avec 5-7 bases du consensus SD AGGAGG est également critique.
De nombreuses sources de données suggèrent que les 15–25 codons initiaux de l'ORF méritent une attention particulière dans l'optimisation des gènes. Des études ont montré que l'impact des codons rares sur le taux de traduction est particulièrement fort dans ces premiers codons, pour l'expression à la fois dans Escherichia coli et Saccharomyces cerevisiae. Chez E. coli, la chute du peptidyl-ARNt lors de la traduction des codons initiaux semble être accentuée par la présence de codons NGG rares. Ces effets semblent être indépendants de la structure secondaire locale de l'ARNm. Il est également vrai que l'expression peut être récupérée par remplacement de séquence en 5 'même pour les séquences qui ne présentent pas de structure d'ARNm particulièrement forte ou qui contiennent des codons rares ou d'autres éléments délétères évidents dans cette région.
2. Biais de codon
La deuxième façon dont les fréquences de codon hôte peuvent être utilisées est de faire correspondre les fréquences de codon hôte dans le gène conçu. Cela peut être fait simplement en choisissant chaque codon avec une probabilité qui correspond à la fréquence du codon hôte ... En utilisant des ensembles de gènes largement variés dans les caractéristiques de conception des gènes, Welch et al. ont constaté que la variation des fréquences d’utilisation des codons synonymes avait un effet profond sur la quantité de protéine produite dans E. coli, indépendamment des effets de la séquence locale 5 ’. Une variation d'au moins deux ordres de grandeur dans l'expression a été observée en raison de la substitution au-delà des 15 codons initiaux de l'ORF. Cette variation était fortement corrélée avec les fréquences globales d'utilisation des codons des gènes, bien que les fréquences de codons trouvées dans les variantes les plus exprimées ne correspondent pas à celles trouvées dans le génome ou dans les gènes endogènes hautement exprimés d'E. Coli. Une analyse multivariée a montré que les fréquences de codons spécifiques pour environ six acides aminés pouvaient prédire les différences d'expression observées. La base biochimique de cette corrélation n'est pas claire.
3. Structure de l'ARNm et allongement translationnel
Bien que de nombreuses preuves suggèrent que la structure de l'ARNm peut interférer avec l'initiation de la traduction chez les procaryotes et les eucaryotes, les effets de la structure sur l'élongation sont moins bien compris. Cela peut être en partie dû à l'activité hélicase intrinsèque des ribosomes, qui permet la traduction à travers des épingles à cheveux même très fortes et peut empêcher de nombreuses structures de limiter le taux de traduction chez les procaryotes ou les eucaryotes. Peut-être plus important encore, la structure de l'ARNm est difficile à prédire, en particulier pour les messages activement traduits qui sont en flux continu entre divers états repliés et dépliés.
4. Facteurs spécifiques aux protéines offrant une complexité supplémentaire
La protéine peut être particulièrement instable chez l'hôte, surtout si elle est mal repliée en raison d'une instabilité inhérente, d'un manque de facteurs prothétiques suffisants ou d'une mauvaise post-traduction modification ... L'expression des protéines sécrétées et membranaires peut être limitée par des mécanismes pour diriger ces protéines vers la membrane. Il est même possible que la séquence d'acides aminés de la protéine puisse limiter l'efficacité de la traduction. Par exemple, on pense que la proline se traduit lentement dans E. coli, quel que soit le codon utilisé.
L'expression de la protéine peut être toxique pour la cellule, ce qui entraîne une instabilité de le vecteur d'expression ou la suppression de l'hôte de la synthèse des protéines ... Une stratégie courante pour réduire la toxicité consiste à abaisser l'expression à des niveaux tolérables. Les promoteurs de force variée peuvent être des outils précieux pour trouver un taux d'expression optimal pour un rendement maximal ... Un moyen potentiel d'éviter la toxicité de certaines protéines est de diriger l'expression vers le périplasme ou le milieu. Ceci peut être accompli par fusion N-terminale d'une séquence de signal de sécrétion.
Pour plus d'informations, veuillez lire l'article en entier. Je recommande également de lire les Paramètres de conception pour contrôler l'expression des gènes synthétiques chez Escherichia coli.