Automate fini inambigu

De testwiki
Version datée du 20 février 2025 à 05:16 par imported>AgrffRRRrrrr (growthexperiments-addlink-summary-summary:1|0|0)
(diff) ← Version précédente | Version actuelle (diff) | Version suivante → (diff)
Aller à la navigation Aller à la recherche
Un automate fini inambigu à n+1 états reconnaissant les mots qui ont un a en position n depuis la fin. Un automate déterministe équivalent a au moins 2n états

En théorie des automates, un automate fini inambigu (on dit aussi non ambigu, en anglais Modèle:Citation étrangère, abrégé en UFA) est un automate fini non déterministe d'un type particulier. C'est un automate qui, pour chaque mot accepté, ne possède qu'un seul calcul réussi. Tout automate fini déterministe est inambigu, mais la réciproque est fausse. Les trois types d'automates : non déterministe, inambigu, déterministe, reconnaissent les mêmes langages formels, à savoir les langages réguliers.

Le nombre d'états d'un automate inambigu peut être exponentiellement plus petit qu'un automate déterministe équivalent. En contre-partie, certains problèmes sont plus difficiles à résoudre pour les automates inambigus que pour les automates déterministes. Par exemple, partant d'un automate Modèle:Math, un automate Modèle:Math reconnaissant le complément du langage accepté par Modèle:Math se construit en temps linéaire si Modèle:Math est déterministe, mais il a été démontré qu'il ne peut être calculé en temps polynomial si Modèle:Math est inambigu[1].

La notion d'automate inambigu se généralise à d'autres modèles de machines ou de calcul. Un présentation générale a été donnée par Thomas Colcombet[2].

Définition

Un automate fini non déterministe 𝒜=(Q,I,,T), où est l'ensemble des transitions, I l’ensemble des états initiaux et T l'ensemble des états terminaux, est dit inambigu si, pour tout mot w=a1an reconnu par l'automate, il existe un seul chemin réussi d'étiquette w, donc un seul chemin

c=(i,a1,p1)(p1,a2,p2)(pn1,an,t), avec iI et tT.

Exemple

Soit Ln=A*aAn1 l'ensemble des mots sur l'alphabet binaire A={a,b} dont la lettre en position n depuis la fin est un a. Les figures ci-contre montrent un automate inambigu reconnaissant ce langage pour n=2, et un automate déterministe pour ce même langage.

Automate inambigu pour le langage L2.
Automate déterministe pour le langage L2.

L'automate déterministe minimal acceptant Ln a 2n états, alors que l’automate inambigu pour le même langage n'a que n+1 états.

Propriétés

Test d'ambiguïté

On peut tester si un automate fini non déterministe à m transitions est inambigu en temps O(m3). On peut même calculer le degré d’ambiguïté, et savoir si l'ambiguïté est bornée, si elle croit polynomialement ou exponentiellement avec la longueur des mots[3].

Inclusion

Le problème d'inclusion consiste à tester si le langage reconnu par un automate A est contenu dans le langage reconnu par un automate B. Le problème est bien entendu décidable. La question est celle de sa complexité.

Le problème de l'inclusion pour les automates inambigus est décidable en temps polynomial : il est dans la classe PTIME alors que ce même problème est PSPACE-complet pour les automates non déterministes[4]Modèle:,[5]. C'est d'ailleurs ce problème, décrit par Meyer et Stockmeyer en 1972[6] qui est le premier problème de cette classe.

La démonstration de cette propriété utilise le fait que le produit cartésien de deux automates inambigus est également inambigu[4].

Modèle:Boîte déroulante/début

Soient A et B deux automates, et L(A) et L(B) les langages acceptés. On a L(A)L(B) si et seulement si L(A×B)=L(A), où A×B désigne l'automate produit reconnaissant L(A)L(B). Les deux ensembles L(A×B) et L(A) sont égaux si et seulement si le nombre de mots de longueur n dans L(A×B) et égal au nombre de mots de longueur n dans L(A) pour tout n. Comme ces suites de nombres de mots satisfont une relation de récurrence linéaire, il suffit de vérifier qu'elles sont égales sur leurs premiers termes, en fait pour n jusqu'au produit du nombre d'états de A et de B. Le nombre de mots de longueur n acceptés par un automate peut être calculé sur l'image commutative[4].

Modèle:Boîte déroulante/fin

Universalité et équivalence

Le problème de lModèle:'universalité, c'est-à-dire de savoir si un automate accepte tous les mots, et le problème de l'équivalence, c'est-à-dire de savoir si deux automates acceptent les mêmes mots, sont tous deux dans la classe PTIME, par réduction au problème de l'inclusion.

Extensions

Le coût en place de la transformation d'un automate inambigu en un automate déterministe est difficile à borner. Pour des alphabets unaires, une minoration est donnée par Okhotin[7] à l'aide d'une fonction arithmétique liée à la fonction de Landau.

La notion d’ambiguïté s'étend aux transducteurs finis : un transducteur est fonctionnel si la transformation qu'il réalise est une fonction (partielle), il est inambigu si, pour tout mot, il existe un seul calcul de la valeur de la fonction. Il est décidable si la transduction réalisée par un transducteur est une fonction.

Il y a aussi une interprétation algébrique naturelle du degré d’ambiguïté au moyen d'automates pondérés : on associe à chaque transition le poids 1 dans le monoïde des entiers naturels ; le poids associé à un mot est alors la simplement le nombre de chemins acceptant ce mot.

Enfin, il existe la même notion pour les mots infinis et les automates les reconnaissants comme les automates de Büchi. Dans ce cas, il y a différence entre automates non déterministes et automates déterministes, puisque ces derniers reconnaissent moins de langages. Les automates de Büchi inambigus reconnaissent les mêmes langages que les automates de Büchi non déterministes[4]Modèle:,[8].

L'ambiguïté d'un automate fini est simplement relié à la notion d'ambiguïté dans les grammaires formelles par le biais de la correspondance entre les automates et les grammaires régulières : chaque dérivation dans une grammaire régulière correspond à un calcul dans l'automate correspondant. C'est d'ailleurs la notion de grammaire qui est mise en avant dans l'article historique de Stearns et Hunt[5]

Complexité des opérations

Modèle:Article détaillé La complexité inambigüe d’un langage, notée usc(L) (pour Modèle:Citation étrangère) est par définition le nombre minimal d’états d’un automate inambigu reconnaissant le langage L.

Bornes connues

Soient L, M des langages rationnels sur un alphabet commun, avec usc(L)=m et usc(M)=n. On a les résultats suivants[9] :

  • image miroir : usc(L)=usc(L), où L est le langage miroir ;
  • intersection : usc(LM)mn, et la borne est atteinte sur un alphabet à au moins 2 lettres.
  • quotient gauche : usc(L1M)2n1, et la borne est atteinte sur un alphabet à au moins 2 lettres.
  • quotient droit : usc(LM1)2n1, et la borne est atteinte sur un alphabet à au moins 2 lettres.
  • mélange :usc(Lш M)2nm1, et la borne est atteinte sur un alphabet à au moins 5 lettres.
  • produit : usc(LM)3/42n+m1, pourvu que n,m2, et la borne est atteinte sur un alphabet à au moins 6 lettres.
  • étoile propre (opération plus) : usc(L)3/42m1, pourvu que m2, et la borne est atteinte sur un alphabet à au moins 3 lettres.
  • étoile : usc(L)3/42m, pourvu que m2, et la borne est atteinte sur un alphabet à au moins 3 lettres.

Il est intéressant de comparer la complexité des opérations sur les langages au moyen d' automates déterministes, d'automates inambigus et automates non déterministes. Pour cela, on introduit les notations :

  • sc(L), nombre minimal d’états d’un automate déterministe reconnaissant le langage L.
  • usc(L), comme ci-dessus le nombre minimal d’états d’un automate inambigu reconnaissant le langage L.
  • nsc(L), nombre minimal d’états d’un automate non déterministe déterministe reconnaissant le langage L.

Dans la table suivante, les complexités sont résumées pour des langages donnés de complexité inambiguë n et m[9] :

Opération sc nsc usc
miroir 2n n+1 n
intersection mn mn mn
quotient gauche 2n1 n+1 2n1
quotient droit n n 2n1
étoile positive 3/42n1 n 3/42n1
étoile 3/42n n+1 3/42n
mélange 2(m1)(n1) mn 2mn
produit m2n m+n 3/42m+n1
complément 2n n 20,79n+logn
nd d[1]

Calcul de minorants

Il existe une méthode générale pour calculer des minorants de la complexité inambigüe. Couplée avec la construction en général plus facile, d'un automate inambigu, elle fournit une borne inférieur à la complexité d'une opération sur les automates inambigus. La méthode est basée sur le calcul du rang d'une matrice associée à un automate ; elle a été développée par Schmidt dans une thèse non publiée de 1978, puis par Leung[10], et par Hromkovič et al.[11], et est reprise dans Jirásek et al.[9].

On considère un automate fini non déterministe 𝒜=(Q,I,,T) sur un alphabet A, où I et T sont des ensembles d'états initiaux et terminaux.

Un état q est dit accessible à partir de l'état p par le mot w s'il existe un chemin d'étiquette w de p à q. Un ensemble SQ d'états est dit accessible s'il existe un mot w tel que S est l'ensemble des états accessibles à partir d'un état initial par un chemin d'étiquette w. On dit qu'un ensemble P d'états est coaccessible si P est accessible dans l'automate transposé de 𝒜[12].

Les ensembles non vides d'états qui sont accessibles ou coaccessibles sont notés

={SQS accessible,S} et 𝒞={PQP accessible,P}.

On a alors la propriété suivante :

L'automate 𝒜 est inambigu si et seulement si deux ensembles d'états S de et P de 𝒞 quelconques ont au plus un élément en commun : |SR|1.

On s'en sert pour établir le résultat suivant, qui relie la complexité du langage au rang d'une matrice :

Modèle:Théorème

Exemple

Pour vérifier que la complexité de l'intersection atteint bien la valeur mn pour des automates à m et n états, on considère des langages et automates particuliers, et on montre que l'automate pour l'intersection, qui a mn états, ne peut être remplacé par un automate inambigu plus petit à l'aide du théorème.

On considère les langages sur l'alphabet {a,b} définis par K={w|w|a=m1} et L={w|w|b=n1}, pour m et n fixés. Ce sont donc les langages de mots contenant exactement m1 lettres a respectivement exactement n1 lettres b. Des automates inambigus (déterministe et incomplets) acceptant ces langages sont 𝒜=(QA,0,m1,FA) et =(QB,0,n1,FB), avec QA={0,,m1}, QB={0,,n1}, et les flèches de FA composées de (i,a,i+1) pour 0im2 et (j,b,j) pour tout j, et pour FB composées de (i,a,i) pour tout i et 0im1 et (j,b,j+1) pour 0jn2.

L’automate produit est l’automate (QA×QB,(0,0),(m1,n1),F), où l'ensemble de flèches F est composé des flèches ((p,q),a,(p,q)) pour (p,a,p)FA et (q,a,q)FB.

Tout ensemble singleton (i,j) est accessible dans l’automate produit (par aibj), et est coaccessible (par am1i,bn1j), et seuls des ensembles singletons sont accessibles ou coaccessibles. La matrice M de l’énoncé est donc la matrice identité d’ordre mn, ce qui donne la borne inférieure pour l'intersection[9].

Notes et références

Modèle:Références

Bibliographie

Articles connexes

Modèle:Palette Automates finis et langages réguliers

Modèle:Portail

  1. 1,0 et 1,1 Modèle:Article. Accepté pour ICALP 2018 à Prague.
  2. Modèle:Harvsp.
  3. Modèle:Harvsp.
  4. 4,0 4,1 4,2 et 4,3 Modèle:Harvsp.
  5. 5,0 et 5,1 Modèle:Harvsp.
  6. Modèle:Harvsp.
  7. Modèle:Harvsp.
  8. Modèle:Harvsp.
  9. 9,0 9,1 9,2 et 9,3 Modèle:Harvsp.
  10. Modèle:Article
  11. Modèle:Article
  12. L'automate transposé est l'automate obtenu en inversant le sens des transitions, et en échangeant les états initiaux avec les états terminaux.