Test de Student
Modèle:Autre Modèle:Infobox Méthode scientifiqueEn statistique, un test de Student[1], ou test t[2], désigne n'importe quel test statistique paramétrique où la statistique de test calculée suit une loi de Student lorsque l’hypothèse nulle est vraie.
Histoire


Le test de Student et la loi de probabilités qui lui correspond ont été publiés en 1908 dans la revue Biometrika par William Gosset[3]. Gosset, un employé de la brasserie Guinness à Dublin, y avait développé le test t à des fins de contrôle de la qualité de la production de bière stout. La brasserie avait pour règle que ses chimistes ne publient pas leurs découvertes. Gosset argua que son article ne serait d'aucune utilité pour les concurrents et obtint l'autorisation de publier mais sous un pseudonyme, Student, pour éviter les difficultés avec les autres membres de son équipe[4].
Le test t est devenu célèbre grâce aux travaux de Ronald Fisher qui montra que ce test ne couvre pas le cas des échantillons de grande taille. Il apporta donc des modifications au test de Student afin de le généraliser.
Exemples d'utilisation
Modèle:Section vide ou incomplète Le test t a plusieurs utilisations dont voici les plus fréquentes :
- Comparaison de moyenne d'une loi normale à une valeur si la variance est inconnue.
- Comparaison de deux moyennes issues de deux lois normales si leurs variances sont égales et inconnues. Dans le cas où leurs variances sont différentes et inconnues, on utilise une adaptation appelée le test t de Welch.
- Test sur les coefficients dans le cadre d'une régression linéaire.
- Test sur des échantillons appariésModèle:Pas clair
Test de Student sur un échantillon de loi normale
On considère une population de loi normale de moyenne Modèle:Mvar et d'écart type Modèle:Mvar. L'écart type Modèle:Mvar n'est pas connu. On souhaite tester si la moyenne Modèle:Mvar est égale à une valeur déterminée Modèle:Math. L'hypothèse nulle est Modèle:Math, autrement dit on suppose a priori que la moyenne vaut Modèle:Math. On se place maintenant sous l'hypothèse nulle.
Cadre
On considère un échantillon de taille Modèle:Mvar de cette population , autrement dit, selon l'hypothèse nulle, chaque est une variable aléatoire qui suit une loi normale de moyenne Modèle:Math et d'écart type Modèle:Mvar. De plus, les sont indépendantes. On estime alors la moyenne par la moyenne empirique :
.
Comme l’hypothèse nulle est supposée vraie, la moyenne suit également une loi normale d'espérance Modèle:Math, mais d'écart type Modèle:Sfrac. Comme la variance Modèle:Math est inconnue, on l'estime par son estimateur sans biais (on note la division par au lieu de afin d'avoir un estimateur sans biais) :
- .
Définition de la statistique
D'après le théorème de Cochran, sous l'hypothèse nulle, suit une loi du chi deux à Modèle:Math degrés de liberté.
On pose la statistique de test suivante :
Par définition, la statistique suit une loi de Student à Modèle:Math degrés de liberté. La réalisation de la statistique de test :
- où .
Mise en place du test

On rappelle que l'on veut tester Modèle:Math. On choisit un risque Modèle:Mvar, généralement 0,05 ou 0,01Modèle:Référence nécessaire. Le risque α s'appelle risque de première espèce, c'est la probabilité de rejeter dans le cas où est vraie. La figure ci-contre correspond à un risque de 0,1 et , et donc une loi de Student avec degrés de liberté. La figure montre le quantile d'ordre (à gauche) et celui d'ordre (à droite). Comme la loi de Student est symétrique, ces quantiles sont égaux au signe près.
- Si la valeur de (sur l'axe des abscisses) est dans la zone bleue (entre les deux quantiles), alors on conserve l'hypothèse nulle.
- Si elle est dans la zone rouge, on rejette l'hypothèse nulle.
Dit autrement, si Modèle:Math est supérieur au quantile d'ordre Modèle:Math de la loi de Student à Modèle:Math degrés de liberté alors on rejette l'hypothèse nulle.
Variantes

Examinons la variante où cherche à tester l'hypothèse nulle Modèle:Math. Dans ce cas, une valeur de Modèle:Mvar négative n'est pas discriminante et si Modèle:Mvar est dans la région bleue de la figure ci-contre alors on conserve l'hypothèse nulle. Par contre, si Modèle:Mvar est supérieur au quantile d'ordre Modèle:Math de la loi de Student à Modèle:Math degrés de liberté alors on rejette l'hypothèse nulle (région rouge à droite pour un risque de = 10%).

Tester Modèle:Math se fait de manière symétrique. Cette fois ci, des valeurs positives de Modèle:Mvar ne sont pas discrimantes. Si Modèle:Mvar est inférieur au quantile d'ordre Modèle:Mvar de la loi de Student à Modèle:Math degrés de liberté (région rouge à gauche pour un risque de = 10% dans la figure) alors on rejette l'hypothèse nulle.
Implémentation
| Langage/Logiciel | Fonction | Notes |
|---|---|---|
| R | t.test | [1] |
| SAS | PROC TTEST | [2] |
| Python | scipy.stats.ttest_ind | [3] |
| Matlab | ttest | [4] |
| Mathematica | TTEST | [5] |
| Stata | ttest | [6] |
| Julia | OneSampleTTest
EqualVarianceTTest |
[7] |
| Maple | OneSampleTTest, TwoSampleTTest, TwoSamplePairedTTest | [5] |
Notes et références
Voir aussi
- Loi de Student, la loi de probabilité de la statistique dans le test t
- Test t de Welch, une adaptation pour comparer deux moyennes de deux lois normales dont les variances sont inconnues et inégales
- Test de Wald
- ↑ Modèle:Article
- ↑ Modèle:Ouvrage
- ↑ Modèle:Article
- ↑ Harold Hotelling (1930, Modèle:P.) dans un article de British statistics cité par S. L. Zabell dans Modèle:Article
- ↑ Modèle:Lien web