Algorithme de Flajolet et Martin

De testwiki
Aller à la navigation Aller à la recherche

Modèle:Voir homonymes L'algorithme de Flajolet et Martin[1] est un algorithme donnant une estimation du nombre d'éléments distincts dans un flot, en une seule passe et avec une complexité logarithmique en mémoire, proportionnelle au nombre maximum d'éléments distincts. Cet algorithme a été inventé en 1984 par Philippe Flajolet and G. Nigel Martin[2], puis amélioré par Marianne Durand et Philippe Flajolet[3]Modèle:,[4]. C'est un algorithme de fouille de flots de données (streaming).

En 2010[5], Daniel M. Kane, Jelani Nelson et David P. Woodruff ont proposé un algorithme avec une complexité spatiale presque optimale et un coût de modification en O(1).

L'algorithme

L'algorithme nécessite une fonction de hashage hash(x), associant à une entrée x un entier dans [0,2L1], dont les images sont uniformément réparties. L'ensemble des entiers de 0 à 2L1 correspond en fait à l'ensemble des chaînes binaires de longueur L.

Étant donné un entier positif y, on note bit(y,k) le k-ème bit dans la représentation binaire de y, de sorte que :

y=k0bit(y,k)2k

On définit ensuite une fonction ρ(y) qui associe à y la position du bit de poids faible dans sa représentation binaire :

ρ(y)=minbit(y,k)0;k0k

avec ρ(0)=L. Par exemple, ρ(13)=ρ(1101)=0 car le premier bit est non nul, alors que ρ(8)=ρ(0100)=2 avec le bit de poids faible en troisième position. Étant donné que les images de la fonction de hashage sont uniformément réparties, la probabilité d'observer un nombre finissant par 2k (un 1 suivi de k zéros) est 2(k+1) et correspond à tirer k piles suivi d'un face en lançant une pièce de monnaie équilibrée.

Description de l'algorithme

Modèle:Théorème

Commentaires

Avec n le nombre d'éléments distincts de M, alors BITMAP[0] est accédé environ n/2 fois, BITMAP[1] accédé n/4 fois, etc. Ainsi, si ilog2nBITMAP[i] vaut certainement 0, de même que si ilog2nBITMAP[i] vaut certainement 1. Si ilog2n alors BITMAP[i] vaut soit 1 soit 0.

Les calculs pour obtenir le facteur de correction ϕ0.77351 sont détaillés dans l'article de Flajolet et Martin.

Voir aussi

Références

Modèle:Références

Liens externes

Modèle:Portail