Algorithme de McNaughton et Yamada

En informatique théorique, et notamment en théorie des automates finis, lModèle:'algorithme de McNaughton et Yamada est un algorithme pour calculer une expression régulière à partir d'un automate fini.

Origine

Il porte le nom de Robert McNaughton et Hisao Yamada, deux scientifiques américain et japonais qui ont décrit l'algorithme^[1]. Cet algorithme est également appelé algorithme de KleeneModèle:Référence souhaitée.

On appelle également algorithme de McNaughton et Yamada un autre algorithme, donné dans le même article^[1], qui permet de construire un automate sans epsilon transition à partir d'une expression régulière.

Principe

Étant donné un automate à n états, et dont les états sont numérotés de 1 à n, on donne une expression pour les langages composés des mots qui étiquettent les chemins de i à j, pour tout couple i, j. Cette expression est construite par récurrence au moyen d'une condition sur les chemins ; cette condition stipule que les chemins ne passent que par certains états autorisés. À chaque itération de l’algorithme, on fixe un nouvel état par lequel on s’autorise à passer. À la fin de l’algorithme, on obtient alors tous les chemins possibles.

Le fonctionnement de cet algorithme rappelle alors l’algorithme de Floyd-Warshall sur les graphes, où à chaque nouvelle étape, on s’autorise à passer par un nouveau sommet fixé.

Description

Soit $𝒜 = (Q, ℱ, I, T)$ un automate fini sur un alphabet $A$ , donné par un ensemble fini d'états $Q$ , un ensemble $ℱ \subset Q \times A \times Q$ de transitions, et des ensembles $I, T \subseteq Q$ d'états initiaux respectivement terminaux.

On note $L_{p, q}$ l'ensemble des mots qui sont étiquettes de chemins de $p$ à $q$ . Le langage $L$ reconnu par l'automate est l'ensemble

L = ⋃_{i \in I} ⋃_{t \in T} L_{i, t}

L'algorithme de McNaugthon et Yamada est une méthode pour calculer des expressions régulières pour les $L_{p, q}$ .

On note $L_{p, q}^{(k)}$ l'expression pour l’ensemble des mots qui étiquettent des chemins de $p$ à $q$ et dont tous les sommets intermédiaires sont inférieurs ou égaux à $k$ . Les sommets de départ $p$ et d’arrivée $q$ ne sont pas intermédiaires, donc ils ne sont pas soumis à la contrainte d’être inférieurs ou égaux à $k$ .

On construit les $L_{p, q}^{(k)}$ par récurrence sur $k$ , en commençant avec $k = 0$ , et en terminant avec $k = n$ . Lorsque $k = n$ , la contrainte sur $k$ n’est plus une restriction, et $L_{p, q}^{(n)} = L_{p, q}$ si $p \neq q$ , et $ε + L_{p, p}^{(n)} = L_{p, p}$ .

Pour $k = 0$ , comme les sommets sont numérotés à partir de 1, la contrainte exprime simplement qu’il n’y a pas de sommet intermédiaire. Les seuls chemins sont des transitions de $p$ à $q$ (on ignore un chemin de longueur 0 en un état $p$ ).

On a donc

L_{p, q}^{(0)} = \sum_{(p, a, q) \in ℱ} a

Pour la récurrence, on considère un chemin de $p$ à $q$ dont les sommets intermédiaires sont plus petits que $k$ . Deux cas sont alors possibles :

les sommets intermédiaires sont plus petits que $k - 1$ ; alors l’étiquette est dans $L_{p, q}^{(k - 1)}$ ;
le chemin passe par l’état $k$ . On décompose alors le chemin en parties dont les sommets intermédiaires sont plus petits que $k - 1$ . Pour cela, on considère chaque occurrence du sommet $k$ dans ce chemin : entre deux occurrences consécutives, les sommets intermédiaires sont plus petits que k-1. On a alors la formule

L_{p, q}^{(k)} = L_{p, q}^{(k - 1)} + L_{p, k}^{(k - 1)} (L_{k, k}^{(k - 1)})^{*} L_{k, q}^{(k - 1)}

.

Il y a donc $n + 1$ étapes ( $k = 0, \dots, n$ ). Chacune des étapes demande le calcul de $n^{2}$ expressions, et la taille des expressions elles-mêmes croît avec $k$ . S’il est facilement programmable, l’algorithme est assez pénible à la main. Il est alors utile d’utiliser les règles qui permettent de simplifier des expressions régulières.

Pseudo-code

On va représenter les $L^{(k)}$ (respectivement $L$ ) sous forme de matrices, dont le coefficient en $(i, j)$ est $L_{i, j}^{(k)}$ (respectivement $L_{i, j}$ ). On a alors, pour $𝒜 = (Q, ℱ, I, T)$ un automate fini à $n$ états sur l'alphabet $A$ :

  Fonction McNaughton-Yamada( $𝒜$ )
      $L : = (\sum_{(p, a, q) \in ℱ} a)_{1 \leq 𝑝, 𝑞 \leq n}$   \\à l'itération k de la boucle for, cette matrice représente  $L^{(k)}$ 
     for  $𝑘 : = 1$  to  $𝑛$ 
         for  $𝑝 : = 1$  to  $𝑛$ 
             for  $𝑞 : = 1$  to  $𝑛$ 
                 $L_{𝑝, 𝑞} : = L_{𝑝, 𝑞} + L_{𝑝, 𝑘} (L_{𝑘, 𝑘})^{*} L_{𝑘, 𝑞}$ 
     R :=  $\emptyset$   \\expression rationnelle à retourner
     for  $𝑝 \in I$ :
         for  $𝑞 \in T$ :
             if  $𝑝 = = 𝑞$  then
                R := R +  $ε$  +  $L_{p, p}$  \\on n'ajoute  $ε$  qu'aux  $L_{p, p}$  où  $𝑝 \in I \cap T$ 
             else
                R := R +  $L_{p, q}$ 
     retourner R
  Fin Fonction

Exemples

Un premier exemple

Appliquons l'algorithme de McNaughton et Yamada à l'automate $𝒜_{1}$ représenté. On va utiliser la représentation matricielle introduite dans la partie précédente. On a :

$L^{(0)} = (\begin{matrix} a & b \\ \emptyset & b \end{matrix})$ ;
$L^{(1)} = (\begin{matrix} a + a (a)^{*} a & b + a (a)^{*} b \\ \emptyset & b + \emptyset (a)^{*} b \end{matrix}) = (\begin{matrix} a^{+} & a^{*} b \\ \emptyset & b \end{matrix})$ ;
$L^{(2)} = (\begin{matrix} a^{+} + (a^{*} b) (b)^{*} \emptyset & a^{*} b + (a^{*} b) (b)^{*} b \\ \emptyset & b + b b^{*} b \end{matrix}) = (\begin{matrix} a^{+} & a^{*} b^{+} \\ \emptyset & b^{+} \end{matrix})$ .

D'où $L = (\begin{matrix} ϵ + a^{+} & a^{*} b^{+} \\ \emptyset & ϵ + b^{+} \end{matrix}) = (\begin{matrix} a^{*} & a^{*} b^{+} \\ \emptyset & b^{*} \end{matrix})$ .

Le langage $L (𝒜_{1})$ reconnu par $𝒜_{1}$ est alors dénoté par l'expression rationnelle $L_{1, 1} + L_{1, 2} = a^{*} + a^{*} b^{+}$ . Après simplifications, on a $L (𝒜_{1}) = a^{*} b^{+}$ , ce qui est bien le résultat attendu.

Considérons maintenant le même automate, mais avec une numérotation différente des états. L'algorithme appliqué à cet automate donne :

$L^{(0)} = (\begin{matrix} b & \emptyset \\ b & a \end{matrix})$
$L^{(1)} = (\begin{matrix} b^{+} & \emptyset \\ b & a \end{matrix})$
$L^{(2)} = (\begin{matrix} b^{+} & \emptyset \\ a^{*} b^{+} & a^{+} \end{matrix})$

D'où

L = (\begin{matrix} b^{*} & \emptyset \\ a^{*} b^{+} & a^{*} \end{matrix})

.

$L (𝒜_{1})$ est alors dénoté par $L_{2, 2} + L_{2, 1} = a^{*} + a^{*} b^{+}$ , soit exactement la même expression rationnelle que précédemment : pour cet exemple particulier, le choix du nouvel état autorisé à chaque étape ne change pas l'expression rationnelle obtenue en fin d'algorithme.

Un deuxième exemple, où la numérotation des états change le résultat

Donnons maintenant l'exemple présenté dans l'ouvrage de référence de Sakarovitch^[2]. Appliquons maintenant l'algorithme à l'automate $𝒜_{2}$ . On a :

$L^{(0)} = (\begin{matrix} a & b \\ a & b \end{matrix})$
$L^{(1)} = (\begin{matrix} a^{+} & a^{*} b \\ a^{+} & a^{*} b \end{matrix})$
$L^{(2)} = (\begin{matrix} (a^{*} b)^{*} a^{+} & (a^{*} b)^{+} \\ (a^{*} b)^{*} a^{+} & (a^{*} b)^{+} \end{matrix})$
$L = (\begin{matrix} ε + (a^{*} b)^{*} a^{+} & (a^{*} b)^{+} \\ (a^{*} b)^{*} a^{+} & (a^{*} b)^{*} \end{matrix})$ .

D'où $L (𝒜_{2}) = L_{1, 1} = ε + (a^{*} b)^{*} a^{+}$ .

De même que pour le premier exemple, appliquons à nouveau l'algorithme en changeant la numérotation des états. On a :

$L^{(0)} = (\begin{matrix} b & a \\ b & a \end{matrix})$
$L^{(1)} = (\begin{matrix} b^{+} & b^{*} a \\ b^{+} & b^{*} a \end{matrix})$
$L^{(2)} = (\begin{matrix} (b^{*} a)^{*} b^{+} & (b^{*} a)^{+} \\ (b^{*} a)^{*} b^{+} & (b^{*} a)^{+} \end{matrix})$
$L = (\begin{matrix} (b^{*} a)^{*} b^{*} & (b^{*} a)^{+} \\ (b^{*} a)^{*} b^{+} & (b^{*} a)^{*} \end{matrix})$ .

D'où $L (𝒜_{2}) = L_{2, 2} = (b^{*} a)^{*}$ : l'expression rationnelle obtenue pour le même langage est différente.

Notes et références

Modèle:Références

Bibliographie

Modèle:Article.
Modèle:Ouvrage Modèle:Commentaire biblio SRL.
Modèle:En Jacques Sakarovitch, Elements of automata theory, Cambridge University Press, Modèle:Date-, 782 p. Modèle:ISBN, p. 96

Articles connexes

Modèle:Portail

↑ ^1,0 et ^1,1 Modèle:Harvsp.
↑ Modèle:Ouvrage

[:0-1] 1,0 et ^1,1 Modèle:Harvsp.

[2] Modèle:Ouvrage

[1]

[2]

Algorithme de McNaughton et Yamada

Sommaire

Origine

Principe

Description

Pseudo-code

Exemples

Un premier exemple

Un deuxième exemple, où la numérotation des états change le résultat

Notes et références

Bibliographie

Articles connexes

Menu de navigation

Algorithme de McNaughton et Yamada

Origine

Principe

Description

Pseudo-code

Exemples

Un premier exemple

Un deuxième exemple, où la numérotation des états change le résultat

Notes et références

Bibliographie

Articles connexes

Menu de navigation

Rechercher