Question:
Combien de protéines humaines ont une structure 3D résolue?
Gergana Vandova
2011-12-23 10:27:46 UTC
view on stackexchange narkive permalink

Je me demandais combien de protéines humaines ont une structure 3D résolue. Existe-t-il une base de données contenant uniquement des protéines humaines? J'ai regardé pdb mais je n'ai pas trouvé de filtre.

Je pense que vous allez avoir beaucoup de problèmes de redondance, surtout si vous voulez connaître le nombre de protéines uniques.
@GWW Je suppose qu'écrire un petit script peut éliminer la redondance.
Vous aurez peut-être plus de chance de poser cette question sur [biostar] (http://biostar.stackexchange.com).
Notez que «résolu» est très subjectif. Toutes les structures ne sont pas de haute qualité et certaines d'entre elles sont tout simplement incorrectes en raison d'erreurs expérimentales.
C'est une question très sujet pour deux raisons: La banque de données sur les protéines accepte la RMN et les structures cristallines de protéines qui offrent différents degrés de résolution et de précision. Ces structures sont également quelque peu subjectives car la protéine peut adopter différentes conformations en fonction de son contexte biologique pertinent. Troisièmement, les extractions au solvant peuvent imposer une structure erronée.
beaucoup de ces protéines n'ont qu'un domaine ou deux résolus en tant que structures. les protéines animales sont difficiles de cette façon. c'est là que cette question devient un peu difficile à mon humble avis.
Quatre réponses:
#1
+19
Michael Kuhn
2011-12-23 17:17:45 UTC
view on stackexchange narkive permalink

6405 protéines mappant sur 5220 gènes, selon Ensembl.

Dans le BioMart d'Ensembl, vous pouvez sélectionner l'ID PDB comme référence externe. Exportez les résultats et comptez les protéines / gènes uniques qui ont un ID PDB.

#2
+12
Aleksandra Zalcman
2012-01-15 06:06:53 UTC
view on stackexchange narkive permalink

PDB est une bonne ressource pour répondre à ces questions, car elle vous permettra de filtrer les résultats par de nombreux paramètres supplémentaires. Pour compter et extraire les structures 3D de protéines humaines:

  1. Ouvrez l'onglet de recherche Avancé du site Web PDB.
  2. Sélectionnez Biologie -> Organisme source dans le menu.
  3. Tapez Homo sapiens (humain) .
  4. Vous pouvez réduire la redondance en en cochant Supprimer les séquences similaires à n% d'identité ci-dessous.
  5. Soumettez la requête.

Pour ajouter d'autres filtres, cliquez sur Affiner la requête avec Recherche avancée . Vous pouvez y extraire des structures par date de dépôt, qualité (par exemple, résolution ou facteurs R pour les structures résolues par diffraction des rayons X), ligands, classification enzymatique, etc. (en cochant Ajouter des critères de recherche )

La recherche de protéines humaines avec élimination des homologues avec un seuil d'identité de 90% permet de récupérer 7117 structures. Le nombre de structures de protéines radiographiques de bonne qualité (résolution < 2.5A) est actuellement de 3964 (avec le même seuil d'identité).

Vous pouvez ensuite télécharger la liste récupérée ou créer des rapports personnalisés (menus ci-dessous).

Un bon outil (également utilisé par PDB) pour générer des ensembles de données protéiques non redondants est cd-hit.

#3
+3
GWW
2011-12-23 10:45:18 UTC
view on stackexchange narkive permalink

D'après vos commentaires, il ne semble pas que vous soyez opposé à l'écriture de scripts personnalisés, donc une option serait de profiter de la base de données NCBI Structure. Vous pouvez le filtrer par organisme, puis télécharger les résultats sous forme de fichier texte / XML. Si vous avez besoin d'accéder aux données PDB brutes, vous pouvez alors télécharger l'archive PDB et examiner celles de votre liste filtrée.

#4
  0
PDB annotator
2015-04-19 10:53:55 UTC
view on stackexchange narkive permalink

Le nouveau système de recherche de PDBe est conçu pour répondre à ces questions. http://www.ebi.ac.uk/pdbe/entry/search/index?organism_synonymes:HUMAN&view=macromolecules

montre qu'il y a 6964 macromolécules humaines uniques avec des données de structure dans la PDB.

Bien sûr, beaucoup seront des fragments de protéines plutôt que la molécule entière.



Ce Q&R a été automatiquement traduit de la langue anglaise.Le contenu original est disponible sur stackexchange, que nous remercions pour la licence cc by-sa 3.0 sous laquelle il est distribué.
Loading...