Les phénomènes biologiques suivent-ils les statistiques gaussiennes?

irritable_phd_syndrom

2015-08-25 18:46:40 UTC

view on stackexchange narkive permalink

Je suis récemment entré dans les sciences de la vie (de la physique). Je suis préoccupé par l'utilisation des valeurs p dans la littérature des sciences de la vie. Par exemple, dans cet article, ils testent 9 à 12 rats dans un groupe témoin et le comparent à un groupe expérimental. Ils utilisent des valeurs p pour affirmer que leurs résultats sont statistiquement significatifs. Ce type d'utilisation des valeurs p semble être très courant dans la littérature.

Voici donc mes préoccupations:

Pourquoi est-il si souvent supposé que les mesures biologiques suivent une distribution normale? À ma connaissance, cela n'est pas connu a priori .
D'après mon intuition physique, il semble assez difficile de revendiquer une "signification statistique" lors de l'utilisation des échantillons de petite taille.

Oui, si / quand vous pouvez appliquer le théorème de la limite centrale. Des choses comme la masse corporelle / taille, etc. sont influencées par de nombreux facteurs atomiques relativement indépendants, vous pouvez donc appliquer le théorème. Mais ne vous trompez pas en pensant que la distribution normale est tout ce que nous avons en biologie. Les distributions binomiale, Poisson, bêta et gamma sont très courantes en génétique et en bioinformatique.

** 1) ** c'est vraiment une question empirique; parfois c'est le cas, parfois non. Même si le processus "réel" est poisson, une distribution normale peut encore être une approximation assez précise. ** 2) ** La «signification» fondée sur l'intuition et le concept technique de «signification statistique» doivent être clairement séparés. Si les hypothèses sont satisfaites, une analyse peut produire des résultats statistiquement significatifs, tout en étant faible avec des résultats plutôt incertains.

Un scepticisme sain est une bonne chose, en particulier dans la recherche biologique. Rappelez-vous également qu'en biologie, les modèles sont souvent des approximations imparfaites des questions étudiées. Cela ne veut pas dire qu'ils ne sont pas les meilleurs que nous puissions faire étant donné les limites actuelles de la technologie, mais c'est quelque chose à toujours garder à l'esprit lorsque vous lisez des publications biologiques. Il existe d'innombrables exemples ou études qui ont produit des résultats significatifs chez les rongeurs mais qui se sont effondrés lors d'essais humains. En outre, les cultures de tissus in vitro peuvent être remplies d'hypothèses qui ne peuvent pas être extrapolées à l'organisme.

Les réponses à cette question sont justes, mais quelqu'un me manque qui mentionne qu'il existe des tests pour évaluer si vos données suivent une distribution normale, bien que ces tests ne soient pas puissants si votre échantillon est petit.

La plupart des processus biologiques suivent-ils une distribution gaussienne?

À moins que vous ne sachiez par observation qu'un processus ne suit pas une distribution gaussienne (par exemple, Poisson, binôme, etc.), alors il fait probablement au moins assez bien à des fins statistiques. Bien que ~ 10 observations ne soient pas suffisantes pour tester la distribution avec précision (et ces tests sont de toute façon assez imparfaits), tant que les valeurs sont à peu près normalement distribuées, vous répondez probablement aux hypothèses du test statistique de type modèle linéaire le plus général (t -test, ANOVA, régression linéaire). Ces tests sont assez robustes aux écarts par rapport à la normalité, donc dans un sens, tant que les valeurs sont suffisamment proches de la normale, le test est correct (ce qui ne dit rien sur l'interprétation des résultats).

Est l'utilisation généralisée des valeurs p est-elle justifiée? Y a-t-il un problème avec des échantillons de petite taille?

Bien que ce ne soit certainement pas le premier à sonner l'alarme sur les valeurs p, l'article de Ioannidis (2005) a sonné le plus fort. L'idée centrale est qu'en science, il existe une forte tendance à ne publier que les résultats «significatifs» (quelle que soit la définition de signification que vous utilisez). Ainsi, la littérature regorge de faux résultats significatifs. Par exemple, si seulement 1 expérience sur 20 donne des résultats significatifs, les 19 autres ne seront probablement pas publiées. Pourtant, ces 5% pourraient représenter 95% de la littérature, et nous avons donc un fort biais dans la littérature. Tous ces résultats "significatifs" ne peuvent pas être corrects.

L'inférence statistique à partir de petits échantillons est également assez problématique (par exemple, en neuroscience; Button et al., 2013 ). Il y a eu une tendance récente à inclure les tailles d'effet pour les paramètres estimés et à simplement signaler les intervalles de confiance (qui seront suffisamment larges pour les petits échantillons).

La plupart des échecs des statistiques sont résumés dans Statistics Done Wrong: Le guide terriblement complet , auquel je n'ai aucune affiliation, sauf que j'ai aimé le lire .

Le document que vous liez est assez insuffisant dans ce que vous pourriez appeler l'analyse statistique moderne. Ce qu'ils pourraient améliorer:

Exécutez (et montrez les résultats de) une analyse de puissance a priori pour établir que la taille de leurs échantillons est adéquate

Incluez les tailles d'effet des paramètres estimés

Inclure des intervalles de confiance pour les paramètres estimés

Utilisez l'une des nombreuses procédures de comparaisons multiples disponibles pour contrôler les taux d'erreur de type I au niveau de la famille.

sur les critiques d'articles pour demander ces choses si les auteurs ne les fournissent pas volontairement.

Il n'y a aucun moyen de contourner la petite taille de l'échantillon dans de nombreuses études, il est donc possible qu'ils ne puissent pas faire grand-chose pour modifier la taille de l'échantillon. Ceux qui travaillent avec des humains ou des animaux sont sous pression pour garder des échantillons aussi petits que possible tout en maintenant une puissance adéquate. Cependant, ils pourraient montrer que ce qu'ils ont est suffisamment puissant.

Button, K. S., J. P. A. Ioannidis, C. Mokrysz, B. A. Nosek, J. Flint, E. S. J. Robinson et M. R. Munafò. 2013. Panne de courant: pourquoi la petite taille de l'échantillon nuit à la fiabilité des neurosciences. Nature Reviews Neuroscience 14: 1–12.

Ioannidis, J. P. A. 2005. Pourquoi la plupart des résultats de recherche publiés sont faux. Médecine PLoS 2: e124.