Question:
Où puis-je obtenir un fichier / une liste des noms communs et scientifiques des espèces?
aliential
2016-10-31 13:25:11 UTC
view on stackexchange narkive permalink

Je recherche un fichier de données non codé avec des noms communs et scientifiques, par exemple de quelques centaines d'espèces ou des dizaines de milliers, où je peux rechercher les étiquettes communes et scientifiques des organismes.

Noms communs anglais ou de différents pays / langues?
Je suggère d'utiliser Wikidata, bien que l'extraction des informations ne soit pas simple.
Les noms communs anglais me conviendraient, si vous avez diverses ressources connexes, il est toujours bon de savoir.
Quatre réponses:
fileunderwater
2016-10-31 13:45:52 UTC
view on stackexchange narkive permalink

Peut-être pas une réponse directe à votre question, selon ce que vous entendez par "fichier de données non codé", mais le Global Biodiversity Information Facility (GBIF) a une API où vous extrayez des données pour les noms d'espèces. Leur base de données comprend des noms communs (aka noms vernaculaires) lorsqu'ils ont cela, et souvent des noms communs de différentes langues. En utilisant cette API, vous pouvez extraire des données et créer un fichier de nom pour un taxon particulier qui vous intéresse.

À titre d'exemple, ceci est la liste des 20 premières langues vernaculaires noms trouvés pour Passer domesticus (moineau domestique):

  {"endOfRecords": false, "results": [{"language": "", "sourceTaxonKey": 100220560, "source": "Global Invasive Species Database", "vernacularName": "English sparrow"}, {"language": "", "sourceTaxonKey": 100220560, "vernacularName": "Europese huismuis", "source": "Global Invasive Species Database" }, {"vernacularName": "Gorrion domestico", "source": "Base de données mondiale sur les espèces envahissantes", "language": "", "sourceTaxonKey": 100220560}, {"source": "Système d'information taxonomique intégré (ITIS) "," vernacularName ":" Gorrión casero "," language ":" spa "," sourceTax onKey ": 102101640}, {" vernacularName ":" Gorrión Común "," sourceTaxonKey ": 123213203," language ":" spa "}, {" language ":" spa "," sourceTaxonKey ": 101186844," source ": "Le système européen d'information sur la nature (EUNIS)", "vernacularName": "Gorrión Común"}, {"language": "spa", "sourceTaxonKey": 114130266, "source": "Colaboraciones Americanas Sobre Aves", "vernacularName" : "Gorrión casero"}, {"vernacularName": "Gorrión casero", "source": "Yanayacu Natural History Research Group",
"sourceTaxonKey": 119245200, "language": "spa"}, {"vernacularName": "Gorrión casero", "source": "Catalogue of Life", "sourceTaxonKey": 119950016, "language": "spa"}, {"language": "swe", "sourceTaxonKey": 101186844, "vernacularName": "Gråsparv", "source": "The European Nature Information System (EUNIS)"}, {"vernacularName": "Gråspurv", "language ":" dan "," sourceTaxonKey ": 123213203}, {" vernacularName ":" Gråspurv "," language ":" nob "," sourceTaxonKey ": 123213203}, {" language ":" deu "," sourceTaxonKey ": 116795880, "vernacularName": "Haussperling", "source": "Liste des taxons d'animaux avec des noms allemands (dans le monde entier) compilée au SMNS", "country": "DE"}, {"language": "deu", " sourceTaxonKey ": 100483595," source ":" Belge Liste des espèces "," country ":" BE "," vernacularName ":" Haussperling "}, {" language ":" deu "," sourceTaxonKey ": 123213203," vernacularName ":" Haussperling "}, {" sourceTaxonKey ": 101186844, "language": "deu", "source": "The European Nature Information System (EUNIS)", "vernacularName": "Haussperling"}, {"source": "The Clements Checklist", "vernacularName": " House Sparrow "," language ":" eng "," sourceTaxonKey ": 113987294}, {" vernacularName ":" House Sparrow "," source ":" Taxonomy in Flux Checklist "," language ":" eng "," sourceTaxonKey ": 100159046}, {" source ":" Colaboraciones Americanas Sobre Aves "," vernacularName ":" House Sparrow "," language ":" eng "," sourceTaxonKey ": 114130266}, {" sourceTaxonKey ": 102101640,
"language": "eng", "vernacularName": "House Sparrow", "source": "Integrated Taxonomic Information System (ITIS)"}], "limit": 20, "offset": 0}  

En utilisant ce type de recherche: api.gbif.org/v1/species?name=Passer%20domesticus, vous pouvez rechercher toutes les informations sur une espèce particulière, en commençant soit par nom scientifique ou nom commun (par exemple, Passer domesticus ).

Le GBIF comprend des informations sur 1 643 948 espèces (et en comptage), mais je ne sais pas dans quelle proportion elles ont des noms communs (ou où il y a des noms communs).

noms d'espèces dans de nombreuses langues. Super merci.
Cependant, ils semblent avoir des problèmes d'encodage Unicode. Non seulement l'API n'indique pas spécifiquement via les en-têtes HTTP que le texte qu'elle renvoie est encodé en UTF-8, mais certains des noms vernaculaires (comme «Gorrión casero» ci-dessus) semblent en fait avoir un encodage UTF-8 appliqué * deux fois * .
@IlmariKaronen True. Et merci pour le reformatage.
Une grande partie de ces données est également téléchargeable à partir du GBIF: par exemple, si la base de données mondiale sur les espèces envahissantes semble avoir les noms que vous souhaitez, vous pouvez la rechercher sur http://www.gbif.org/dataset - beaucoup (la plupart ? all?) des ensembles de données peuvent être téléchargés en tant que «Darwin Core Archive» (un fichier ZIP contenant des fichiers CSV) à partir de la page de l'ensemble de données (http://www.gbif.org/dataset/b351a324-77c4-41c9-a909- f30f77268bc4).
James
2016-10-31 13:49:13 UTC
view on stackexchange narkive permalink

Uniprot a une liste du vocabulaire contrôlé pour les noms communs et scientifiques des espèces répertoriées ici.

Un exemple d'entrée:

  ACAER E 111511: N = Acanthodactylus erythrurus C = lézard frangé espagnol S = Lacerta erythrura  

Dans l'exemple, le N est le nom binomial scientifique ( Canthodactylus erythrurus ), C est le nom commun (lézard à franges espagnol).

ACAER est le code d'identification, 111511 est le code du nœud taxonomique, E signifie que c'est un eucaryote, et S est un synonyme de l'un ou l'autre nom.


La liste contient actuellement 25336 noms scientifiques, ce qui ne correspond pas aux ~ 2,5 millions d'espèces du GBIF, ou les 10, ou les centaines de millions qui sont estimés exister La liste Uniprot représente cependant tous les organismes inclus dans Uniprot, qui est largement considéré comme l'une des bases de données de protéines les plus complètes qui existent aujourd'hui.

C'est une courte liste d'espèces féeriques, si elle est destinée à un usage général (c'est-à-dire pas spécifiquement en relation avec les données Uniprot).
C'est un point intéressant. Uniprot tient des listes supplémentaires pour différentes souches qui peuvent expliquer une partie de la différence (_i.e_ GBIF compte chaque souche comme un nom distinct, Uniprot emballe de nombreuses souches sous 1 nom d'espèce - non négligeable pour les bactéries). Je ne peux pas vérifier les mesures de redondance prises par le GBIF et je ne trouve aucun article évalué par les pairs du GBIF. Cela expliquerait beaucoup de surestimation puisque tant Uniprot que GBIF tirent les noms d'espèces de plusieurs des mêmes bases de données externes.
Juste une note ici, cette liste comprend de nombreuses souches virales, qui peuvent ou non être quelque chose que vous voulez.
Mud Warrior
2016-11-01 22:24:24 UTC
view on stackexchange narkive permalink

Si vous recherchez des espèces marines, le Registre mondial des espèces marines est probablement le meilleur endroit pour trouver ces informations.

Le Système d’information biogéographique océanique contient également une énorme quantité d'espèces marines.

Merci beaucoup. Je regardais les poissons volants aujourd'hui, la liste Uniprot compte au moins 11 calamars volants et poissons volants. merci pour la ressource.
RHA
2017-03-03 14:57:13 UTC
view on stackexchange narkive permalink

Une réponse tardive, mais je pense que les sources mentionnées sont limitées et que la superbe page de téléchargement de Observado.org offre une bien meilleure alternative.

Le site Web d'Observado, un initiative visant à collecter des observations d'espèces dans le monde entier, dispose de listes mondiales d'espèces au format csv qui sont aussi complètes que possible . La liste des plantes compte actuellement 381.473 enregistrements! Vous pouvez télécharger les noms d'espèces locales dans plus de langues dont vous avez peut-être entendu parler, de l'anglais au russe et de Frysk à Dzongkha.

Notez que ces listes sont destinées aux observations sur le terrain et contiennent donc également des espèces multiples, hybrides et synonymes. Mais ceux-ci peuvent être facilement filtrés.



Ce Q&R a été automatiquement traduit de la langue anglaise.Le contenu original est disponible sur stackexchange, que nous remercions pour la licence cc by-sa 3.0 sous laquelle il est distribué.
Loading...