Test de Shapiro-Wilk
Modèle:Voir homonymes Modèle:Ébauche Modèle:Infobox Méthode scientifique
En statistique, le test de Shapiro–Wilk teste l'hypothèse nulle selon laquelle un échantillon est issu d'une population normalement distribuée. Il a été publié en 1965 par Samuel Sanford Shapiro et Martin Wilk[1].
Théorie
La statistique de test est:
où
- x(i) (avec des parenthèses entourant l'indice i) désigne la ième statistique d'ordre, i.e., le ième plus petit nombre dans l'échantillon;
- est la moyenne de l'échantillon;
- la constante ai est donnée par Modèle:Sfn
- où
et sont les espérances des statistiques d'ordre d'un échantillon de variables iid suivant une loi normale, et V est la matrice de variance-covariance de ces statistiques d'ordre.
Pour conclure, est alors comparé à une tableModèle:Sfn.
Interprétation
Sachant que l'hypothèse nulle est que la population est normalement distribuée,
- si la p-value est inférieure à un niveau alpha choisi (par exemple 0.05), alors l'hypothèse nulle est rejetée (i.e. il est improbable d'obtenir de telles données en supposant qu'elles soient normalement distribuées).
- si la p-value est supérieure au niveau alpha choisi (par exemple 0.05), alors on ne doit pas rejeter l'hypothèse nulle. La valeur de la p-value alors obtenue ne présuppose en rien de la nature de la distribution des données.
Voir aussi Q-Q plot ou droite de Henry.
Mise en œuvre
shapiro.test()avec R.