Méthode ziggourat
La méthode ziggourat est un algorithme pour engendrer des nombres aléatoires de loi non uniforme. Il s'agit d'une méthode de rejet et peut être choisie pour simuler une variable aléatoire ayant une densité strictement monotone. Cette méthode peut aussi être appliquée à des lois symétriques unimodales telles que la loi normale en choisissant un point sur l'une des moitiés et en choisissant le côté aléatoirement. Cette méthode a été développée par George Marsaglia et Wai Wan Tsang[1].
Comme la plupart des algorithmes de ce type, il suppose que l'on dispose d'un générateur de nombres aléatoires de loi uniforme, en général un générateur pseudo-aléatoire. Dans la plupart des cas, comme la loi normale ou la loi exponentielle, l'algorithme consiste à engendrer un nombre flottant, un index aléatoire de table, faire une recherche dans une table, une multiplication et une comparaison. Cet algorithme est considérablement plus rapide que les autres méthodes pour simuler des variables aléatoires de loi normale, comme la méthode de Box-Muller qui requièrent de calculer une racine carrée ou un logarithme. D'un autre côté, cette méthode est plus complexe à mettre en œuvre et nécessite des tables précalculées, de sorte qu'il vaut mieux l'utiliser lorsque l'on a besoin de nombres aléatoires en grande quantité.
Le nom de cette méthode provient du fait qu'elle couvre la densité de la loi avec des segments rectangulaires empilés par ordre de taille décroissant, ce qui ressemble donc à une ziggourat.
Théorie
La méthode ziggourat est une méthode de rejet. La position d'un point est engendrée aléatoirement à l'intérieur d'une courbe délimitant une surface légèrement plus grande que celle délimitée par la densité de la loi considérée. On teste alors si ce point se trouve dans cette dernière surface. Si c'est le cas, on retourne l'abscisse du point. Sinon, on rejette ce point et on en tire un nouveau.
Pour construire la surface qui recouvre la densité, on choisit une surface composée de n régions de tailles égales, dont n-1 sont des rectangles empilés au-dessus d'une région non rectangulaire qui couvre la queue de la densité de la loi.
Si Modèle:Mvar est la densité de la loi à simuler, la base de la ziggourat se compose donc d'un rectangle allant dont le coin inférieur gauche a pour coordonnées (0 ; 0) et le coin supérieur a pour coordonnées Modèle:Math, et de l'ensemble des points situés sous la courbe Modèle:Math pour Modèle:Math. Cette couche délimite une région d'aire Modèle:Mvar. On place au-dessus une région rectangulaire dont le coin inférieur gauche est Modèle:Math et le coin supérieur droit Modèle:Math, où Modèle:Math est pour que l'aire de ce rectangle soit égale à Modèle:Mvar. On construit de même un rectangle de coordonnées définies par Modèle:Math et Modèle:Math d'aire Modèle:Mvar. On construit ainsi une suite de points Modèle:Math pour un nombre n de couches donné à l'avance (typiquement, n-256). Les coordonnées des points Modèle:Math dépendent de n.
En ignorant pour l'instant le problème de la première couche qui n'est pas rectangulaire, l'algorithme est le suivant :
- On choisit aléatoirement de façon une couche i avec une probabilité 1/n.
- Si i = 0, on utilise alors un algorithme spécifique (voir plus bas)
- On se donne une réalisation Modèle:Math d'une variable aléatoire uniforme sur [0 ; 1[
- On pose Modèle:Math
- Si , alors on retourne xModèle:'
- Sinon on se donne une réalisation Modèle:Math d'une variable aléatoire uniforme sur [0 ; 1[
- On calcule avec
- Si , on retourne xModèle:'
- Sinon, on recommence l'algorithme depuis le début.
Pour une loi dont la densité est symétrique, il suffit juste de tester si en utilisant pour Modèle:Math une variable aléatoire uniforme sur ]-1 ; 1[.

Algorithmes pour la queue de la densité
Lorsque la densité à un support non compact (comme c'est le cas pour la loi normale, la loi exponentielle...), il est alors nécessaire d'utiliser un algorithme spécifique lorsque la première tranche est sélectionnée. Cet algorithme dépend de la loi.
La première couche peut se diviser en une région centrale rectangulaire, et une région avec une queue infinie. On peut utiliser le même algorithme en ajoutant un point fictif et en tirant un point où Modèle:Math une réalisation d'une variable aléatoire uniforme sur [0 ; 1 [. Si , on retourne Modèle:Mvar. Sinon, on a besoin de tirer une réalisation de cette variable aléatoire sachant qu'elle est plus grande que la valeur Modèle:Math. Pour la loi exponentielle de paramètre Modèle:Mvar, cela se fait très facilement par où U est la réalisation d'une variable aléatoire uniforme sur [0 ; 1 [.
Une autre possibilité consiste à appeler l'algorithme ziggourat de façon récursive sur la queue de la densité.
Pour la loi normale, G. Marsaglia[2] propose la méthode suivante :
- On calcule Modèle:Math où Modèle:Math est la réalisation d'une variable aléatoire uniforme sur [0 ; 1 [.
- On calcule Modèle:Math où Modèle:Math est la réalisation d'une variable aléatoire uniforme sur [0 ; 1 [.
- Si Modèle:Math alors on retourne Modèle:Math,
- Sinon, on revient au premier pas.
Comme pour une taille de table typique (n = 128), Modèle:Math, le test du pas Modèle:Numéro3 est presque toujours vérifié. Puisque Modèle:Math renvoie une réalisation d'une variable aléatoire exponentielle, si l'on dispose d'une méthode ziggourat pour l'exponentielle, on peut l'utiliser à cette fin.
Optimisations
L'algorithme peut tourner de façon efficace en utilisant des tables précalculées pour les Modèle:Mvar et les Modèle:Mvar, mais il existe des astuces pour le rendre encore plus rapide. La principale idée est que rien ne requiert que l'on utilise pour Modèle:Mvar une fonction d'aire 1. On peut donc utiliser cet algorithme sur des densités non normalisées, ce qui accélère le calcul de Modèle:Math (par exemple, pour la loi normale, on peut utiliser Modèle:Math au lieu de Modèle:Math ).
Comment engendrer les tables ?
Il est possible de stocker dans l'algorithme la table entière des points Modèle:Mvar et , ou bien juste les valeurs n, Modèle:Mvar et Modèle:Math et de calculer les autres valeurs juste durant la phase d'initialisation des calculs.
Comment trouver Modèle:Math et Modèle:Mvar ?
Étant donné un nombre de niveau n, on a besoin de trouver la valeur de Modèle:Math et de Modèle:Mvar telles que et . Pour la loi exponentielle de paramètre Modèle:Mvar, on a l'aire . La fonction de répartition de la loi normale est très souvent incluse dans de nombreuses bibliothèques numériques. Pour d'autres lois, il peut être nécessaire d'utiliser des procédures d'intégration numérique. L'idée est alors d'utiliser un algorithme de recherche de zéro en partant d'une estimation initiale de Modèle:Math afin de résoudre
en calculant les successivement jusqu'à de sorte que l'aire de chaque tranche soit égale à pour une estimation donnée de Modèle:Math.
Voir aussi
Notes et références
Bibliographie
- Modèle:En George Marsaglia et Wai Wan Tsang, « The Ziggurat Method for Generating Random Variables », dans Journal of Statistical Software, volume 5, Modèle:Numéro8, 2000. Modèle:Doi
- Modèle:En Jurgen A. Doornik, « An Improved Ziggurat Method to Generate Normal Random Samples », Nuffield College, Oxford.
- Modèle:En David B. Thomas, Philip G.W. Leong, Wayne Luk et John D. Villasenor, « Gaussian Random Number Generators », dans ACM Computing Surveys, volume 39, 2007. Modèle:Doi