J'essaie de comprendre comment je peux télécharger un fichier qui représente la séquence complète d'ADN humain. Je ne me soucie pas trop du format - je suis capable d'écrire du code C ++ pour l'analyser. FASTA semble cependant être un format simple. Ce que je n'ai pas encore compris, c'est où je peux trouver un fichier complet - j'ai trouvé ce qui semble être des sous-ensembles de gènes ou d'autres séquences ou des chromosomes uniques, mais n'y a-t-il pas 46 chromosomes à inclure ou sont certains de ces doublons (c.-à-d. 22 chromosomes + 2 chromosomes sexuels)?
Sur cette page, j'ai trouvé cette liste de fichiers sous "Humain> Assemblage du génome: GRCh38" mais il semble être décomposé par chromosome ou quelque chose? Si oui, est-ce que je les fusionnerais? Mon objectif est d'afficher toutes les lettres via un projecteur sur un mur et je veux pouvoir le pointer et dire à quelqu'un, c'est tout l'ADN d'un humain (pas un sous-ensemble). Aussi, pour vérifier, c'est un "assemblage génomique" que je veux non? Soit dit en passant, je ne me soucie pas des variantes d'allèles pour le moment.
Veuillez considérer dans votre réponse que je ne connais pas une grande partie du jargon, merci.