Test de Student

De testwiki
Aller à la navigation Aller à la recherche

Modèle:Autre Modèle:Infobox Méthode scientifiqueEn statistique, un test de Student[1], ou test t[2], désigne n'importe quel test statistique paramétrique où la statistique de test calculée suit une loi de Student lorsque l’hypothèse nulle est vraie.

Histoire

Façade de la brasserie historique Guinness de St. James.
William Sealy Gosset, qui inventa le test t, sous le pseudonyme Student.

Le test de Student et la loi de probabilités qui lui correspond ont été publiés en 1908 dans la revue Biometrika par William Gosset[3]. Gosset, un employé de la brasserie Guinness à Dublin, y avait développé le test t à des fins de contrôle de la qualité de la production de bière stout. La brasserie avait pour règle que ses chimistes ne publient pas leurs découvertes. Gosset argua que son article ne serait d'aucune utilité pour les concurrents et obtint l'autorisation de publier mais sous un pseudonyme, Student, pour éviter les difficultés avec les autres membres de son équipe[4].

Le test t est devenu célèbre grâce aux travaux de Ronald Fisher qui montra que ce test ne couvre pas le cas des échantillons de grande taille. Il apporta donc des modifications au test de Student afin de le généraliser.

Exemples d'utilisation

Modèle:Section vide ou incomplète Le test t a plusieurs utilisations dont voici les plus fréquentes :

  • Comparaison de moyenne d'une loi normale à une valeur si la variance est inconnue.
  • Comparaison de deux moyennes issues de deux lois normales si leurs variances sont égales et inconnues. Dans le cas où leurs variances sont différentes et inconnues, on utilise une adaptation appelée le test t de Welch.
  • Test sur les coefficients dans le cadre d'une régression linéaire.
  • Test sur des échantillons appariésModèle:Pas clair

Test de Student sur un échantillon de loi normale

On considère une population de loi normale de moyenne Modèle:Mvar et d'écart type Modèle:Mvar. L'écart type Modèle:Mvar n'est pas connu. On souhaite tester si la moyenne Modèle:Mvar est égale à une valeur déterminée Modèle:Math. L'hypothèse nulle est Modèle:Math, autrement dit on suppose a priori que la moyenne vaut Modèle:Math. On se place maintenant sous l'hypothèse nulle.

Cadre

On considère un échantillon de taille Modèle:Mvar de cette population (X1,,Xn), autrement dit, selon l'hypothèse nulle, chaque Xi est une variable aléatoire qui suit une loi normale de moyenne Modèle:Math et d'écart type Modèle:Mvar. De plus, les Xi sont indépendantes. On estime alors la moyenne par la moyenne empirique :

X=1ni=1nXi .

Comme l’hypothèse nulle est supposée vraie, la moyenne X suit également une loi normale d'espérance Modèle:Math, mais d'écart type Modèle:Sfrac. Comme la variance Modèle:Math est inconnue, on l'estime par son estimateur sans biais (on note la division par n1 au lieu de n afin d'avoir un estimateur sans biais) :

Sn2=1n1i=1n(XiXn)2.

Définition de la statistique

D'après le théorème de Cochran, sous l'hypothèse nulle, n1σ2Sn2suit une loi du chi deux à Modèle:Math degrés de liberté.

On pose la statistique de test suivante :

Z=nXμ0Sn

Par définition, la statistique Z suit une loi de Student à Modèle:Math degrés de liberté. La réalisation de la statistique de test :

z=nxnμ0sn,sn=1n1i=1n(xixn)2.

Mise en place du test

Fonction de densité de la loi de Student à 7 degrés de liberté. La zone rouge est la région de rejet.

On rappelle que l'on veut tester Modèle:Math. On choisit un risque Modèle:Mvar, généralement 0,05 ou 0,01Modèle:Référence nécessaire. Le risque α s'appelle risque de première espèce, c'est la probabilité de rejeter H0 dans le cas où H0 est vraie. La figure ci-contre correspond à un risque α de 0,1 et n=8, et donc une loi de Student avec n1=7 degrés de liberté. La figure montre le quantile d'ordre α2 (à gauche) et celui d'ordre 1α2 (à droite). Comme la loi de Student est symétrique, ces quantiles sont égaux au signe près.

  • Si la valeur de z (sur l'axe des abscisses) est dans la zone bleue (entre les deux quantiles), alors on conserve l'hypothèse nulle.
  • Si elle est dans la zone rouge, on rejette l'hypothèse nulle.

Dit autrement, si Modèle:Math est supérieur au quantile d'ordre Modèle:Math de la loi de Student à Modèle:Math degrés de liberté alors on rejette l'hypothèse nulle.

Variantes

Fonction de densité de la loi de Student à 7 degrés de liberté (toujours et encore) mais cette fois la région de rejet pour tester μμ0.

Examinons la variante où cherche à tester l'hypothèse nulle Modèle:Math. Dans ce cas, une valeur de Modèle:Mvar négative n'est pas discriminante et si Modèle:Mvar est dans la région bleue de la figure ci-contre alors on conserve l'hypothèse nulle. Par contre, si Modèle:Mvar est supérieur au quantile d'ordre Modèle:Math de la loi de Student à Modèle:Math degrés de liberté alors on rejette l'hypothèse nulle (région rouge à droite pour un risque de α = 10%).

Fonction de densité de la loi de Student à 7 degrés de libertés (encore et toujours) mais cette fois la région de rejet pour tester pour μμ0.

Tester Modèle:Math se fait de manière symétrique. Cette fois ci, des valeurs positives de Modèle:Mvar ne sont pas discrimantes. Si Modèle:Mvar est inférieur au quantile d'ordre Modèle:Mvar de la loi de Student à Modèle:Math degrés de liberté (région rouge à gauche pour un risque de α = 10% dans la figure) alors on rejette l'hypothèse nulle.

Implémentation

Langage/Logiciel Fonction Notes
R t.test [1]
SAS PROC TTEST [2]
Python scipy.stats.ttest_ind [3]
Matlab ttest [4]
Mathematica TTEST [5]
Stata ttest [6]
Julia OneSampleTTest

EqualVarianceTTest

[7]
Maple OneSampleTTest, TwoSampleTTest, TwoSamplePairedTTest [5]

Notes et références

Modèle:Références

Voir aussi

  • Loi de Student, la loi de probabilité de la statistique dans le test t
  • Test t de Welch, une adaptation pour comparer deux moyennes de deux lois normales dont les variances sont inconnues et inégales
  • Test de Wald

Modèle:Palette Modèle:Portail

  1. Modèle:Article
  2. Modèle:Ouvrage
  3. Modèle:Article
  4. Harold Hotelling (1930, Modèle:P.) dans un article de British statistics cité par S. L. Zabell dans Modèle:Article
  5. Modèle:Lien web