Automate fini inambigu

En théorie des automates, un automate fini inambigu (on dit aussi non ambigu, en anglais Modèle:Citation étrangère, abrégé en UFA) est un automate fini non déterministe d'un type particulier. C'est un automate qui, pour chaque mot accepté, ne possède qu'un seul calcul réussi. Tout automate fini déterministe est inambigu, mais la réciproque est fausse. Les trois types d'automates : non déterministe, inambigu, déterministe, reconnaissent les mêmes langages formels, à savoir les langages réguliers.

Le nombre d'états d'un automate inambigu peut être exponentiellement plus petit qu'un automate déterministe équivalent. En contre-partie, certains problèmes sont plus difficiles à résoudre pour les automates inambigus que pour les automates déterministes. Par exemple, partant d'un automate Modèle:Math, un automate Modèle:Math reconnaissant le complément du langage accepté par Modèle:Math se construit en temps linéaire si Modèle:Math est déterministe, mais il a été démontré qu'il ne peut être calculé en temps polynomial si Modèle:Math est inambigu^[1].

La notion d'automate inambigu se généralise à d'autres modèles de machines ou de calcul. Un présentation générale a été donnée par Thomas Colcombet^[2].

Définition

Un automate fini non déterministe $𝒜 = (Q, I, ℱ, T)$ , où $ℱ$ est l'ensemble des transitions, $I$ l’ensemble des états initiaux et $T$ l'ensemble des états terminaux, est dit inambigu si, pour tout mot $w = a_{1} \dots a_{n}$ reconnu par l'automate, il existe un seul chemin réussi d'étiquette $w$ , donc un seul chemin

c = (i, a_{1}, p_{1}) (p_{1}, a_{2}, p_{2}) \dots (p_{n - 1}, a_{n}, t)

, avec

i \in I

et

t \in T

.

Exemple

Soit $L_{n} = A^{*} a A^{n - 1}$ l'ensemble des mots sur l'alphabet binaire $A = {a, b}$ dont la lettre en position $n$ depuis la fin est un $a$ . Les figures ci-contre montrent un automate inambigu reconnaissant ce langage pour n=2, et un automate déterministe pour ce même langage.

L'automate déterministe minimal acceptant $L_{n}$ a $2^{n}$ états, alors que l’automate inambigu pour le même langage n'a que $n + 1$ états.

Propriétés

Test d'ambiguïté

On peut tester si un automate fini non déterministe à m transitions est inambigu en temps $O (m^{3})$ . On peut même calculer le degré d’ambiguïté, et savoir si l'ambiguïté est bornée, si elle croit polynomialement ou exponentiellement avec la longueur des mots^[3].

Inclusion

Le problème d'inclusion consiste à tester si le langage reconnu par un automate $A$ est contenu dans le langage reconnu par un automate $B$ . Le problème est bien entendu décidable. La question est celle de sa complexité.

Le problème de l'inclusion pour les automates inambigus est décidable en temps polynomial : il est dans la classe PTIME alors que ce même problème est PSPACE-complet pour les automates non déterministes^[4]Modèle:,^[5]. C'est d'ailleurs ce problème, décrit par Meyer et Stockmeyer en 1972^[6] qui est le premier problème de cette classe.

La démonstration de cette propriété utilise le fait que le produit cartésien de deux automates inambigus est également inambigu^[4].

Modèle:Boîte déroulante/début

Soient $A$ et $B$ deux automates, et $L (A)$ et $L (B)$ les langages acceptés. On a $L (A) \subset L (B)$ si et seulement si $L (A \times B) = L (A)$ , où $A \times B$ désigne l'automate produit reconnaissant $L (A) \cap L (B)$ . Les deux ensembles $L (A \times B)$ et $L (A)$ sont égaux si et seulement si le nombre de mots de longueur $n$ dans $L (A \times B)$ et égal au nombre de mots de longueur $n$ dans $L (A)$ pour tout $n$ . Comme ces suites de nombres de mots satisfont une relation de récurrence linéaire, il suffit de vérifier qu'elles sont égales sur leurs premiers termes, en fait pour $n$ jusqu'au produit du nombre d'états de $A$ et de $B$ . Le nombre de mots de longueur $n$ acceptés par un automate peut être calculé sur l'image commutative^[4].

Modèle:Boîte déroulante/fin

Universalité et équivalence

Le problème de lModèle:'universalité, c'est-à-dire de savoir si un automate accepte tous les mots, et le problème de l'équivalence, c'est-à-dire de savoir si deux automates acceptent les mêmes mots, sont tous deux dans la classe PTIME, par réduction au problème de l'inclusion.

Extensions

Le coût en place de la transformation d'un automate inambigu en un automate déterministe est difficile à borner. Pour des alphabets unaires, une minoration est donnée par Okhotin^[7] à l'aide d'une fonction arithmétique liée à la fonction de Landau.

La notion d’ambiguïté s'étend aux transducteurs finis : un transducteur est fonctionnel si la transformation qu'il réalise est une fonction (partielle), il est inambigu si, pour tout mot, il existe un seul calcul de la valeur de la fonction. Il est décidable si la transduction réalisée par un transducteur est une fonction.

Il y a aussi une interprétation algébrique naturelle du degré d’ambiguïté au moyen d'automates pondérés : on associe à chaque transition le poids 1 dans le monoïde des entiers naturels ; le poids associé à un mot est alors la simplement le nombre de chemins acceptant ce mot.

Enfin, il existe la même notion pour les mots infinis et les automates les reconnaissants comme les automates de Büchi. Dans ce cas, il y a différence entre automates non déterministes et automates déterministes, puisque ces derniers reconnaissent moins de langages. Les automates de Büchi inambigus reconnaissent les mêmes langages que les automates de Büchi non déterministes^[4]Modèle:,^[8].

L'ambiguïté d'un automate fini est simplement relié à la notion d'ambiguïté dans les grammaires formelles par le biais de la correspondance entre les automates et les grammaires régulières : chaque dérivation dans une grammaire régulière correspond à un calcul dans l'automate correspondant. C'est d'ailleurs la notion de grammaire qui est mise en avant dans l'article historique de Stearns et Hunt^[5]

Complexité des opérations

Modèle:Article détaillé La complexité inambigüe d’un langage, notée usc(L) (pour Modèle:Citation étrangère) est par définition le nombre minimal d’états d’un automate inambigu reconnaissant le langage L.

Bornes connues

Soient L, M des langages rationnels sur un alphabet commun, avec usc(L)=m et usc(M)=n. On a les résultats suivants^[9] :

image miroir : $usc (L^{\sim}) = usc (L)$ , où $L^{\sim}$ est le langage miroir ;
intersection : $usc (L \cap M) \leq m n$ , et la borne est atteinte sur un alphabet à au moins 2 lettres.
quotient gauche : $usc (L^{- 1} M) \leq 2^{n} - 1$ , et la borne est atteinte sur un alphabet à au moins 2 lettres.
quotient droit : $usc (L M^{- 1}) \leq 2^{n} - 1$ , et la borne est atteinte sur un alphabet à au moins 2 lettres.
mélange : $usc (L ш M) \leq 2^{n m} - 1$ , et la borne est atteinte sur un alphabet à au moins 5 lettres.
produit : $usc (L M) \leq 3 / 4 \cdot 2^{n + m} - 1$ , pourvu que $n, m \geq 2$ , et la borne est atteinte sur un alphabet à au moins 6 lettres.
étoile propre (opération plus) : $usc (L) \leq 3 / 4 \cdot 2^{m} - 1$ , pourvu que $m \geq 2$ , et la borne est atteinte sur un alphabet à au moins 3 lettres.
étoile : $usc (L) \leq 3 / 4 \cdot 2^{m}$ , pourvu que $m \geq 2$ , et la borne est atteinte sur un alphabet à au moins 3 lettres.

Il est intéressant de comparer la complexité des opérations sur les langages au moyen d' automates déterministes, d'automates inambigus et automates non déterministes. Pour cela, on introduit les notations :

sc(L), nombre minimal d’états d’un automate déterministe reconnaissant le langage L.
usc(L), comme ci-dessus le nombre minimal d’états d’un automate inambigu reconnaissant le langage L.
nsc(L), nombre minimal d’états d’un automate non déterministe déterministe reconnaissant le langage L.

Dans la table suivante, les complexités sont résumées pour des langages donnés de complexité inambiguë n et m^[9] :

Opération	sc	nsc	usc
miroir	$2^{n}$	$n + 1$	$n$
intersection	$m n$	$m n$	$m n$
quotient gauche	$2^{n} - 1$	$n + 1$	$2^{n} - 1$
quotient droit	$n$	$n$	$2^{n} - 1$
étoile positive	$3 / 4 \cdot 2^{n} - 1$	$n$	$3 / 4 \cdot 2^{n} - 1$
étoile	$3 / 4 \cdot 2^{n}$	$n + 1$	$3 / 4 \cdot 2^{n}$
mélange	$\geq 2^{(m - 1) (n - 1)}$	$m n$	$2^{m n}$
produit	$m \cdot 2^{n}$	$m + n$	$3 / 4 \cdot 2^{m + n} - 1$
complément	$2^{n}$	$n$	$\leq 2^{0, 79 n + \log n}$ $\geq n^{d} \forall d$ ^[1]

Calcul de minorants

Il existe une méthode générale pour calculer des minorants de la complexité inambigüe. Couplée avec la construction en général plus facile, d'un automate inambigu, elle fournit une borne inférieur à la complexité d'une opération sur les automates inambigus. La méthode est basée sur le calcul du rang d'une matrice associée à un automate ; elle a été développée par Schmidt dans une thèse non publiée de 1978, puis par Leung^[10], et par Hromkovič et al.^[11], et est reprise dans Jirásek et al.^[9].

On considère un automate fini non déterministe $𝒜 = (Q, I, ℱ, T)$ sur un alphabet A, où $I$ et $T$ sont des ensembles d'états initiaux et terminaux.

Un état $q$ est dit accessible à partir de l'état $p$ par le mot $w$ s'il existe un chemin d'étiquette $w$ de $p$ à $q$ . Un ensemble $S \subseteq Q$ d'états est dit accessible s'il existe un mot $w$ tel que $S$ est l'ensemble des états accessibles à partir d'un état initial par un chemin d'étiquette $w$ . On dit qu'un ensemble $P$ d'états est coaccessible si $P$ est accessible dans l'automate transposé de $𝒜$ ^[12].

Les ensembles non vides d'états qui sont accessibles ou coaccessibles sont notés

ℛ = {S \subseteq Q ∣ S accessible, S \neq \emptyset}

et

𝒞 = {P \subseteq Q ∣ P accessible, P \neq \emptyset} .

On a alors la propriété suivante :

L'automate

𝒜

est inambigu si et seulement si deux ensembles d'états

S

de

ℛ

et

P

de

𝒞

quelconques ont au plus un élément en commun :

| S \cap R | \leq 1 .

On s'en sert pour établir le résultat suivant, qui relie la complexité du langage au rang d'une matrice :

Modèle:Théorème

Exemple

Pour vérifier que la complexité de l'intersection atteint bien la valeur $m n$ pour des automates à $m$ et $n$ états, on considère des langages et automates particuliers, et on montre que l'automate pour l'intersection, qui a $m n$ états, ne peut être remplacé par un automate inambigu plus petit à l'aide du théorème.

On considère les langages sur l'alphabet ${a, b}$ définis par $K = {w ∣ | w |_{a} = m - 1}$ et $L = {w ∣ | w |_{b} = n - 1}$ , pour $m$ et $n$ fixés. Ce sont donc les langages de mots contenant exactement $m - 1$ lettres $a$ respectivement exactement $n - 1$ lettres $b$ . Des automates inambigus (déterministe et incomplets) acceptant ces langages sont $𝒜 = (Q_{A}, 0, m - 1, F_{A})$ et $ℬ = (Q_{B}, 0, n - 1, F_{B})$ , avec $Q_{A} = {0, \dots, m - 1}$ , $Q_{B} = {0, \dots, n - 1}$ , et les flèches de $F_{A}$ composées de $(i, a, i + 1)$ pour $0 \leq i \leq m - 2$ et $(j, b, j)$ pour tout j, et pour $F_{B}$ composées de $(i, a, i)$ pour tout i et $0 \leq i \leq m - 1$ et $(j, b, j + 1)$ pour $0 \leq j \leq n - 2$ .

L’automate produit est l’automate $(Q_{A} \times Q_{B}, (0, 0), (m - 1, n - 1), F)$ , où l'ensemble de flèches $F$ est composé des flèches $((p, q), a, (p^{'}, q^{'}))$ pour $(p, a, p^{'}) \in F_{A}$ et $(q, a, q^{'}) \in F_{B}$ .

Tout ensemble singleton $(i, j)$ est accessible dans l’automate produit (par $a^{i} b^{j}$ ), et est coaccessible (par $a^{m - 1 - i}, b^{n - 1 - j}$ ), et seuls des ensembles singletons sont accessibles ou coaccessibles. La matrice $M$ de l’énoncé est donc la matrice identité d’ordre $m n$ , ce qui donne la borne inférieure pour l'intersection^[9].

Notes et références

Modèle:Références

Bibliographie

Modèle:Article — Les transparents de sa présentation.
Modèle:Article.
Modèle:Article.
Modèle:Article.
Modèle:Article.
Modèle:Article.
Modèle:Article
Modèle:Chapitre
Modèle:Chapitre.

Articles connexes

Modèle:Palette Automates finis et langages réguliers

Modèle:Portail

↑ ^1,0 et ^1,1 Modèle:Article. Accepté pour ICALP 2018 à Prague.
↑ Modèle:Harvsp.
↑ Modèle:Harvsp.
↑ ^4,0 ^4,1 ^4,2 et ^4,3 Modèle:Harvsp.
↑ ^5,0 et ^5,1 Modèle:Harvsp.
↑ Modèle:Harvsp.
↑ Modèle:Harvsp.
↑ Modèle:Harvsp.
↑ ^9,0 ^9,1 ^9,2 et ^9,3 Modèle:Harvsp.
↑ Modèle:Article
↑ Modèle:Article
↑ L'automate transposé est l'automate obtenu en inversant le sens des transitions, et en échangeant les états initiaux avec les états terminaux.

[Raskin-1] 1,0 et ^1,1 Modèle:Article. Accepté pour ICALP 2018 à Prague.

[2] Modèle:Harvsp.

[3] Modèle:Harvsp.

[L-4] 4,0 ^4,1 ^4,2 et ^4,3 Modèle:Harvsp.

[StearnsHunt-5] 5,0 et ^5,1 Modèle:Harvsp.

[6] Modèle:Harvsp.

[7] Modèle:Harvsp.

[8] Modèle:Harvsp.

[jj-9] 9,0 ^9,1 ^9,2 et ^9,3 Modèle:Harvsp.

[Leung2005-10] Modèle:Article

[HromkovičSeibert2002-11] Modèle:Article

[12] L'automate transposé est l'automate obtenu en inversant le sens des transitions, et en échangeant les états initiaux avec les états terminaux.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

Automate fini inambigu

Sommaire

Définition

Exemple

Propriétés

Test d'ambiguïté

Inclusion

Universalité et équivalence

Extensions

Complexité des opérations

Bornes connues

Calcul de minorants

Exemple

Notes et références

Bibliographie

Articles connexes

Menu de navigation

Automate fini inambigu

Définition

Exemple

Propriétés

Test d'ambiguïté

Inclusion

Universalité et équivalence

Extensions

Complexité des opérations

Bornes connues

Calcul de minorants

Exemple

Notes et références

Bibliographie

Articles connexes

Menu de navigation

Rechercher