Intervalle de fluctuation

Modèle:Confusion Modèle:Confusion Modèle:À sourcer En statistique, un intervalle de fluctuation, aussi appelé intervalle de pari est un intervalle dans lequel une grandeur observée se trouve avec une forte probabilité (souvent de 95 %).

Une valeur en dehors de cet intervalle met en cause la représentativité de l'échantillon. En revanche, sa présence à l'intérieur de l'intervalle ne garantit pas la validité de l'échantillon.

Quelques principes généraux

Lorsque la grandeur observée est une proportion d'individus qui satisfait un critère, lModèle:'intervalle de fluctuation résulte de la loi binomiale. Si la taille de l'échantillon Modèle:Mvar est suffisamment importante^[1] et la proportion Modèle:Mvar vérifie Modèle:Math et Modèle:Math, alors cette loi binomiale est approchée par la loi normale en vertu du théorème central limite. Il en découle une formulation explicite de l'intervalle de fluctuation au seuil de 95 %, pour un échantillon de taille Modèle:Mvar dont une proportion Modèle:Mvar satisfait la propriété étudiée :

I = [p - 1, 96 \sqrt{\frac{p (1 - p)}{n}}; p + 1, 96 \sqrt{\frac{p (1 - p)}{n}}] .

Si la taille de l'échantillon Modèle:Math et la probabilité Modèle:Mvar varie entre 0,2 et 0,8, cet intervalle est approché par un intervalle à la formule plus simple :

I = [p - \frac{1}{\sqrt{n}}; p + \frac{1}{\sqrt{n}}] .

Étude d'une proportion

Prendre une décision

L'intervalle de fluctuation est un outil important en statistiques, car il permet de prendre une décision avec un risque d'erreur contrôlé. L'intervalle de fluctuation n'a de sens que lorsque la proportion Modèle:Mvar est connue, comme dans un lancer de pièce (Modèle:Math). En revanche, si cette proportion est inconnue, c’est l'intervalle de confiance qui est pertinent.

Pile ou face

Simulation du lancer d'une pièce à pile ou face avec les premières valeurs^[2] de `random(2)` de Free Pascal.
Nombre de lancers	20	100	1000	10000
Nombre de 1	12	55	496	4990
Proportion	60 %	55 %	49,6 %	49,9 %

Une pièce de monnaie est dite équilibrée si elle tombe sur pile ou face avec la même probabilité de 0,5 (soit 50%). Cela signifie, en vertu de la loi des grands nombres, que sur un grand nombre de lancers, le côté pile apparaîtra à peu près aussi souvent que le côté face. Il est d'ailleurs possible de simuler un grand nombre de lancers à l'aide d'un générateur de nombres pseudo-aléatoire pour obtenir des fréquences d'apparition de plus en plus précises.

Cependant, si la proportion se rapproche de 0,5 avec le nombre de lancers, elle est très rarement égale à 0,5. La probabilité d'obtenir autant de fois chaque côté décroît même avec le nombre (pair) de lancers^[3]. Par exemple, sur dix lancers, il y a moins d'une chance sur 4 d'obtenir exactement 5 fois chaque côté.

Loi de probabilité du nombre de sorties d'un côté d'une pièce équilibrée sur 10 lancers.
	0	1	2	3	4	5	6	7	8	9	10
Probabilité exacte	Modèle:Fraction	Modèle:Fraction	Modèle:Fraction	Modèle:Fraction	Modèle:Fraction	Modèle:Fraction	Modèle:Fraction	Modèle:Fraction	Modèle:Fraction	Modèle:Fraction	Modèle:Fraction
Valeur approchée	0,1 %	0,9 %	4,4 %	11,7 %	20,5 %	24,6 %	20,5 %	11,7 %	4,4 %	0,9 %	0,1 %

Les numérateurs des fractions affichées sont les coefficients binomiaux de rang 10.

Ce tableau montre que tous les nombres de sortie sont possibles, mais qu'il y a environ 98 % de chances d'obtenir au moins deux fois pile et deux fois face sur dix lancers.

Un intervalle de fluctuation peut donc être défini dans ce cas par [2 ; 8] pour le nombre de sorties de chaque côté, ce qui revient à donner un intervalle de fluctuation de 0,2 à 0,8 pour la fréquence d'apparition de chaque côté. Une pièce tombant au moins 9 fois du même côté (et donc moins d'une fois de l'autre) au cours de dix lancers sera donc suspecte, même si ce résultat n'est pas complètement impossible avec une pièce équilibrée.

Cas général

La même méthode peut être utilisée pour tester une probabilité différente de 0,5. En répétant une même expérience aléatoire ayant une certaine probabilité Modèle:Mvar de réussite, la variable aléatoire Modèle:Mvar associée au nombre de réussites suit une loi binomiale dont les paramètres sont le nombre d'expériences Modèle:Mvar et la probabilité Modèle:Mvar :

ℙ (S = k) = (\binom{n}{k}) p^{k} (1 - p)^{n - k} .

L'intervalle de fluctuation se calcule en éliminant les valeurs extrêmes de Modèle:Mvar qui représentent moins de 2,5 % de chaque côté. Cela revient à définir les entiers Modèle:Mvar le plus grand possible et Modèle:Mvar le plus petit possible tels que

ℙ (S < a) \leq 0, 025

ℙ (S > b) \leq 0, 025.

Il est possible que l'une ou l'autre de ces valeurs corresponde à une valeur extrême (c'est-à-dire 0 ou Modèle:Mvar), notamment si le paramètre Modèle:Mvar est proche de 0 ou de 1.

L'intervalle de fluctuation pour la fréquence de réussite s'écrit alors :

I = [\frac{a}{n}; \frac{b}{n}] .

Approximation à l'aide de la loi normale

Le théorème central limite stipule que la différence entre la fréquence observée et la fréquence théorique, multipliée par la racine carrée de la taille de l'échantillon, converge en loi vers une loi normale centrée de même variance que la loi de Bernoulli sous-jacente, donc d'écart type

σ = \sqrt{p (1 - p)}

.

Autrement dit, la fonction de répartition suivante

t \mapsto ℙ (\sqrt{\frac{n}{p (1 - p)}} (\frac{S}{n} - p) \leq t)

converge vers la fonction de répartition de la loi normale centrée réduite.

Modèle:Démonstration/début N.B. : ce changement de variable aléatoire peut aussi prendre la forme d'une autre expression explicite : $\sqrt{\frac{n}{p (1 - p)}} (\frac{S}{n} - p) = \frac{S - n p}{\sqrt{n p (1 - p)}}$ . Or la loi binomiale nous indique que l'espérance vaut :

μ = n p

et l'écart-type vaut :

σ = \sqrt{n p (1 - p)}

d'où :

\sqrt{\frac{n}{p (1 - p)}} (\frac{S}{n} - p) = \frac{S - μ}{σ}

.

Le centrage par rapport à l'espérance et la réduction de l'écart-type à 1 peuvent ainsi mieux s'entendre. Modèle:Démonstration/fin

Or les quantiles de cette loi peuvent être calculés par approximation numérique. L'antécédent de 0,975 par la fonction de répartition vaut environ 1,96, d'où l'approximation suivante :

ℙ (- 1, 96 \leq \sqrt{\frac{n}{p (1 - p)}} (\frac{S}{n} - p) \leq 1, 96) \approx 0, 95.

Par conséquent, la double inégalité suivante est vraie avec une probabilité de 0,95 environ :

p - 1, 96 \sqrt{\frac{p (1 - p)}{n}} \leq \frac{S}{n} \leq p + 1, 96 \sqrt{\frac{p (1 - p)}{n}} .

Ces inégalités définissent donc une approximation de l'intervalle de fluctuation au seuil de 95 %.

Remarque. À la suite des diverses approximations du raisonnement, le résultat d'un seuil de 95 % n'est pas toujours assuré. On arrive à un résultat inférieur à 95 % pour certaines valeurs de Modèle:Mvar et Modèle:Mvar, par exemple

si Modèle:Math et Modèle:Math , alors

ℙ (- 1, 96 \leq \sqrt{\frac{n}{p (1 - p)}} (\frac{S}{n} - p) \leq 1, 96) < 0, 94

;

si Modèle:Math et Modèle:Math , alors

ℙ (- 1, 96 \leq \sqrt{\frac{n}{p (1 - p)}} (\frac{S}{n} - p) \leq 1, 96) ≃ 0, 94

;

si Modèle:Math et Modèle:Math , alors

ℙ (- 1, 96 \leq \sqrt{\frac{n}{p (1 - p)}} (\frac{S}{n} - p) \leq 1, 96) = 0, 945

;

si Modèle:Math et Modèle:Math , alors

ℙ (- 1, 96 \leq \sqrt{\frac{n}{p (1 - p)}} (\frac{S}{n} - p) \leq 1, 96) < 0, 938

.

Pour changer le seuil, il suffit de modifier le coefficient 1,96 par un autre quantile de la fonction de répartition de la loi normale centrée réduite.

Quantiles de la fonction de répartition de la loi normale centrée réduite.
Seuil de l'intervalle de fluctuation	90 %	95 %	98 %	99 %	99,5 %	99,9 %
Valeur de la fonction de répartition	0,95	0,975	0,99	0,995	0,9975	0,9995
Valeur approchée du coefficient	1,64	1,96	2,33	2,58	2,81	3,29

Formule simplifiée

En majorant le coefficient 1,96 par 2 et en majorant le produit Modèle:Math par son maximum (Modèle:Fraction), la formule précédente peut être simplifiée pour l'intervalle de fluctuation à 95 % par

I = [p - \frac{1}{\sqrt{n}}; p + \frac{1}{\sqrt{n}}] .

La première majoration est une bonne approximation, tandis que la seconde majoration augmente de 25 % la longueur de l'intervalle lorsque la fréquence théorique Modèle:Mvar vaut 0,2 ou 0,8. Cette simplification est donc en général acceptée seulement si la fréquence théorique se situe entre ces deux valeurs.

L'inclusion de l'intervalle de fluctuation de la fréquence dans l'intervalle [0 ; 1] est alors automatique dès que la taille de l'échantillon est supérieure ou égale à 25. Lorsque Modèle:Math et Modèle:Math, la probabilité $ℙ (\frac{S}{n} \in I)$ fluctue au-dessus de 93%, en se concentrant surtout entre 0.95 et 0.99 .

Quelle que soit la probabilité Modèle:Mvar entre 0 et 1, l'intervalle de fluctuation $I = [p - \frac{1}{\sqrt{n}}; p + \frac{1}{\sqrt{n}}]$ est au seuil de 91 % pour tout Modèle:Math, au seuil de 92 % pour tout Modèle:Math, de 93 % pour tout Modèle:Math, de 94 % pour tout Modèle:Math, de 95 % pour tout Modèle:Math.

Variance

Dans le cas d'un échantillon de Modèle:Mvar variables indépendantes d'une même loi normale centrée réduite, la variance observée au sein de l'échantillon, multipliée par Modèle:Math, suit une loi du χ² de paramètre Modèle:Math. L'intervalle de fluctuation peut alors être défini à l'aide des quantiles de la fonction de répartition correspondante.

Ce calcul permet de tester l'adéquation d'un échantillon à une loi normale.

Notes et références

Modèle:Références

Modèle:Portail

↑ Il n'y a pas de seuil officiel pour la validité de cette approximation, mais les programmes de mathématiques de classe de seconde en France requièrent un effectif minimal de 30 pour la formule de l'intervalle de fluctuation.
↑ Le générateur random décrit toujours la même suite pseudo-aléatoire lors du lancement d'un programme, sauf en cas d'appel à l'instruction randomize.
↑ Cette probabilité est équivalente à Modèle:Frac lorsque le nombre Modèle:Math de lancers tend vers l'infini (voir le site de Chronomath pour un calcul explicite à l'aide de la loi binomiale et de la formule de Stirling). Pour un nombre impair de lancers, il est impossible d'obtenir autant de fois pile que face.

[1] Il n'y a pas de seuil officiel pour la validité de cette approximation, mais les programmes de mathématiques de classe de seconde en France requièrent un effectif minimal de 30 pour la formule de l'intervalle de fluctuation.

[2] Le générateur random décrit toujours la même suite pseudo-aléatoire lors du lancement d'un programme, sauf en cas d'appel à l'instruction randomize.

[3] Cette probabilité est équivalente à Modèle:Frac lorsque le nombre Modèle:Math de lancers tend vers l'infini (voir le site de Chronomath pour un calcul explicite à l'aide de la loi binomiale et de la formule de Stirling). Pour un nombre impair de lancers, il est impossible d'obtenir autant de fois pile que face.

[1]

[2]

[3]

Intervalle de fluctuation

Sommaire

Quelques principes généraux

Étude d'une proportion

Prendre une décision

Pile ou face

Cas général

Approximation à l'aide de la loi normale

Formule simplifiée

Variance

Notes et références

Menu de navigation

Intervalle de fluctuation

Quelques principes généraux

Étude d'une proportion

Prendre une décision

Pile ou face

Cas général

Approximation à l'aide de la loi normale

Formule simplifiée

Variance

Notes et références

Menu de navigation

Rechercher