Test de Wilcoxon-Mann-Whitney

De testwiki
Version datée du 12 février 2024 à 11:37 par imported>Kelam (Présentation formelle : typographie)
(diff) ← Version précédente | Version actuelle (diff) | Version suivante → (diff)
Aller à la navigation Aller à la recherche

Modèle:Ébauche Modèle:Infobox Méthode scientifique

En statistique, le test de Wilcoxon-Mann-Whitney (ou test U de Mann-Whitney ou encore test de la somme des rangs de Wilcoxon) est un test statistique non paramétrique qui permet de tester l'hypothèse selon laquelle les distributions de chacun de deux groupes de données sont proches.

Il a été proposé par Frank Wilcoxon en 1945[1] et par Henry Mann et Donald Ransom Whitney en 1947[2].

L'énorme avantage de ce test est sa simplicité, même si de ce fait son utilisation est limitée. Comme tous les tests statistiques, il consiste, à partir de ce qui est observé, à mettre en évidence un évènement dont on connait la loi de probabilité (au moins sa forme asymptotique). La valeur obtenue, si elle est peu probable selon cette loi, suggèrera de rejeter l'hypothèse nulle.

Présentation formelle

On considère deux populations Modèle:Math et Modèle:Math de tailles respectives nx et ny. On suppose les observations indépendantes et disposant d'une relation d'ordre. On souhaite tester l'hypothèse suivante :

H0 : la probabilité qu'une observation de la population Modèle:Math soit supérieure à une observation de la population Modèle:Math est égale à la probabilité qu'une observation de la population Modèle:Math soit supérieure à une observation de la population Modèle:Math : Modèle:Math.

En général l'hypothèse plus forte « les deux distributions sont égales » est utilisée.

Si nous ordonnons les (nx+ny) éléments de XY par ordre croissant, nous pouvons définir, pour chaque individu, son rang dans la séquence ainsi formée. Soit Sx la somme des nx rangs des éléments de Modèle:Math.

On montre que, sous H0, l'évènement Sx=t suit une distribution connue, tabulée pour de petits échantillons et qui peut être approchée par une loi de probabilité gaussienne de moyenne E=nxny/2 et de variance V=nxny(nx+ny+1)12 pour des échantillons de taille supérieure à 20 environ.

Le test est construit en confrontant la valeur effectivement obtenue à cette moyenne et cet écart type : on peut ainsi estimer la probabilité de cette valeur sous l'hypothèse nulle et ainsi décider ou non de rejeter cette hypothèse nulle.

On calculera la valeur : ε=|SxE|/V, qui, si elle est supérieure à 1,96 (risque de 5 %), permet de rejeter l'hypothèse nulle H0 d'égalité des deux échantillons.

Implémentation

  • wilcox.test avec R et la bibliothèque "stats"
  • scipy.stats.mannwhitneyu avec Python3 et le module "scipy.stats"
  • pingouin.mwu avec Python3 et le module "pingouin"

Notes et références

Modèle:Références

Modèle:Palette Modèle:Portail