Fréquence (statistiques)

De testwiki
Aller à la navigation Aller à la recherche

Modèle:Voir homonymes

Fréquence des traits de kanji

En statistique, on appelle fréquence absolue l'effectif des observations d'une classe et fréquence relative ou simplement fréquence, le quotient de cet effectif par celui de la population.

fréquence=taille de la classetaille de la population

L'expression fréquence = valeur n'est jamais ambigüe. Si valeur est un nombre entier positif, il s'agit de la fréquence absolue, c'est-à-dire l'effectif de la classe. Si valeur est un nombre compris entre 0 et 1 ou un pourcentage, il s'agit de la fréquence relative.

Le calcul d'une fréquence permet des comparaisons entre des séries d'observations portant sur des populations inégalement nombreuses. L'expression en pourcentage facilite ces comparaisons[1].

Plus la population est nombreuse, plus la fréquence d'une observation se rapproche de la probabilité de cette observation.

Propriétés

La liste des fréquences s'appelle distribution des fréquences[2].

La somme de l'effectif de toutes les classes étant l'effectif de la population, la somme de leurs fréquences relatives est toujours égale à 1 (100%).

Il est possible de retrouver les effectifs d'une série statistique à partir de ses fréquences et de l'effectif de la population totale, aux arrondis près.

Précautions

Pour la détermination des fréquences, les observations doivent d'abord être divisées en classes. Pour que le résultat soit pertinent, il est nécessaire de choisir le critère de classement de telle sorte que l'effectif des classes soit suffisant. Si, en effet, l'effectif d'une classe est trop faible, une action marginale sur le critère de classement pourrait affecter le résultat. Modèle:Exemple Pour répondre à ce problème, on constitue souvent des classes définies de telle façon que leur fréquence soit déterminée à l'avance. Une telle classe, dont le critère s'adapte à la fréquence à obtenir, s'appelle un quantile. Quand la fréquence est un quart, c'est un quartile ; si c'est un dixième, un décile ; de même pour un centième, un centile. Avec cette méthode, le résultat de l'analyse statistique est le critère de classement[3].

Dans le résumé statistique d'une série d'observations, l'utilisation des fréquences et des pourcentages peut masquer un résultat non significatif. Pour être significative, une fréquence doit être égale à plusieurs fois l'inverse de l'effectif de la population.

Fréquences cumulées

Lorsqu'on constitue les classes à partir de variables quantitatives, on peut calculer des fréquences cumulées, qui sont celles de l'effectif de la classe constituée par la population dont l'indice est inférieur ou supérieur à une valeur.

La fréquence cumulée est égale à la somme des fréquences de toutes les classes qui la précèdent dans l'ordre de classement.

Ce calcul a l'avantage de réduire le nombre de classes dont l'effectif n'est pas significatif.

Fréquences de valeurs numériques discrètes

Lorsque la distribution de fréquences résume les observations pour des valeurs numériques discrètes, on peut en tirer la moyenne arithmétique de ces valeurs.

Pour une série statistique dont les valeurs sont données par : x1,x2,,xn et les fréquences par : f1,f2,,fn,

la moyenne est donnée par : x¯=f1x1+f2x2++fnxn=i=1nfixi.

Sachant que fi=nin, on constate que la moyenne calculée à partir des fréquences peut être vue comme une moyenne arithmétique pondérée : x¯=i=1nfixi=i=1nninxi=1ni=1nnixi=n1x1+n2x2++nnxnn=n1nx1+n2nx2++nnnxn=f1x1+f2x2++fnxn.

Exemple — longueur moyenne des mots à partir de la distribution des longueurs
La distribution des fréquences du nombre de lettres par mot de la langue française, établie sur une population des 228 mots de dix pages du Petit Robert, édition 1973, est donnée par le tableau :
Nombres de lettres 4 5 6 7 8 9 10 11 12 13 14 15 16
Fréquences 7228 12228 31228 37228 29228 35228 29228 17228 15228 9228 0228 6228 1228
pourcentage 3 % 5 % 14 % 16 % 13 % 15 % 13 % 7 % 7 % 4 % n.s. 3 % n.s.
La longueur moyenne des mots est x¯=7228×4+12228×5++1228×16=8,60. Il y a ainsi 8,6 lettres en moyenne par mot Modèle:Harv.

L'utilisation des pourcentages, arrondis à une précision qui tienne compte de l'effectif de la population, facilite les comparaisons.

Fréquences statistiques et probabilités

Plus la population est nombreuse, plus la fréquence d'une observation se rapproche de la probabilité de cette observation. Cette propriété, basée sur la loi des grands nombres, est utilisée dans de nombreux domaines. Par exemple, les compagnies d'assurance évaluent la probabilité d'un sinistre à partir de statistiques établies sur un grand nombre d'années et sur des populations nombreuses. Elles déterminent ainsi le coût d'assurance de ce risque.

La fréquence, obtenue par synthèse des observations, et la probabilité, basée sur le calcul des issues possibles d'une expérience, sont des notions différentes, mais qui reposent l'une et l'autre sur un calcul des proportions[4].

Malgré ce lien formel, la distinction entre les deux est capitale, en particulier lorsqu'on cherche à déterminer la probabilité d'un évènement à partir de sa fréquence dans un échantillon. La probabilité est la chance ou risque de voir se réaliser un évènement ; tandis que la fréquence est le rapport entre le nombre d'évènements effectivement réalisés et l'effectif de l'échantillon.

Lorsqu'on suppose que la fréquence mesurée sur un échantillon s'applique à la population entière, on l'utilise pour évaluer le nombre total d'évènements dans cette population, en appliquant à l'effectif total la proportion relevée dans l'échantillon.


Compléments

Bibliographie

Notes et références

Modèle:Références

Liens internes

Modèle:Portail