Récursivité gauche

De testwiki
Aller à la navigation Aller à la recherche

En informatique, et notamment en théorie des langages formels, en compilation et analyse syntaxique descendante, la récursivité gauche est un concept de grammaires formelles qui décrit un certain type de réapparition d'une variable dans une dérivation lors d'un processus d'analyse syntaxique.

Dans la terminologie des grammaires formelles et notamment des grammaires algébriques, une variable est récursive gauche s'il existe une règle de la grammaire dont le membre droit débute par cette variable (ce cas est dit récursivité directe) ou pour laquelle un mot dérivé débute par cette variable (cas de la récursivité indirecte).

L'élimination de la récursivité gauche est une étape préliminaire pour pouvoir utiliser l'analyse syntaxique descendante.

Définition

Une grammaire est récursive gauche s'il existe une variable A qui dérive en un mot du langage étendu[1] qui débute par cette variable, formellement si

A+Aα,

+ indique l'opération consistant à appliquer une ou plusieurs règle de grammaire, et où α est une suite de symboles terminaux et non terminaux.

Récursivité gauche directe

La récursivité gauche est directe si la définition est réalisée en une étape, c'est-à-dire si la grammaire possède une règle de la forme

AAα

α est une suite de symboles terminaux et non terminaux. Par exemple, la règle

EE+T

d'une grammaire usuelle pour les expressions arithmétiques est récursive gauche directe. Un analyseur descendant pourrait l'implémenter par une procédure du type

function Expression()
{
    Expression();  match('+');  Terme();
}

ce qui provoque une boucle infinie d'appels récursifs à l’exécution.

Récursivité gauche indirecte

La récursivité gauche est indirecte si la définition est réalisée en plusieurs étapes. Formellement, elle demande l’existence d'une suite de règles selon le schéma suivant :

A0β0A1α0
A1β1A2α1
AnβnA0αn

β0,β1,,βn sont des mots qui chacun peuvent dériver en le mot vide et α0,α1,,αn sont des mots quelconques. La dérivation

A0β0A1α0+A1α0β1A2α1α0++A0αnα1α0

produit A0 comme premier symbole du mot dernier étendu.

Élimination de la récursivité gauche

Élimination de la récursivité directe

L'élimination de la récursivité directe procède par le remplacement de règles récursives gauche par d'autres, et l'introduction de nouveaux non-terminaux. Pour une variable récursive gauche A, on supprime d'abord la règle AA si elle existe, puis on considère les règles restantes :

AAα1Aαnβ1βm

où :

  • chaque α est formé de symboles terminaux ou non terminaux, et
  • chaque β est un mot formé de symboles terminaux ou non terminaux et qui ne commence pas par A.

On remplace ces règles par deux ensembles de règles, un groupe de règles commençant par la variable A :

Aβ1AβmA

et un autre pour une nouvelle variable A (appelée le « reste » ou la « queue ») :

Aα1AαnAε

On répète ce processus jusqu'à épuisement des variables récursives gauches directes.

Cette méthode à l'inconvénient d'introduire des epsilon-règle ; une variante évite ce défaut, au prix de plus de règles. Les règles récursives gauches sont remplacées par[2] :

Aβ1AβmAβ1βm
Aα1AαnAα1αn

Exemples

Par exemple, dans une grammaire simplifiée des expressions arithmétiques, les règles :

EE+EIN

peuvent être remplacées, pour supprimer la récursion gauche, par :

EIENE
E+EEε.

L'image miroir du langage de Lukasiewicz a pour grammaire :

SSSab.

on introduit une nouvelle variable T et on remplace les règles par :

SbT
TSaTε.

Puis, on substitue bT à S dans la deuxième règle, et on obtient :

SbT
TbTaTε.

On peut aussi écrire, avec la deuxième méthode :

SbTb
TSaTSa,

puis remplacer la variable S dans les deuxièmes règles :

SbTb
TbTaTbaTbTb.

Élimination de toute récursivité gauche

Une façon — brutale — d'éliminer toute récursivité gauche est de mettre la grammaire sous forme normale de Greibach. Plus simplement, on peut d'abord éliminer les ε-règles, c'est-à-dire les règles de la forme Aε et les règles triviales AA. Ensuite, on numérote les variables, puis on opère sur les règles

AiAjα

pour avoir toujours i<j. Si pour une règle, cette condition n'est pas vérifiée, on remplace Aj par ses membres droits de règle. Plus formellement, l'algorithme est le suivant[3] :

Numéroter les variables en A1,,An
pour  i=1,,n
   pour j=1,,i1
      remplacer chaque production AiAjγ par les productions
         Aiδ1γδkγ, où
         Ajδ1δk sont toutes les productions de Aj
   éliminer la récursivité gauche directe pour les productions de Ai

Voici un exemple, tiré du livre de Hopcroft et Ullman[4] : On considère la grammaire

A1A2A3,A3A1A2
A2A3A1,A3a,A2b

Seule la règle A3A1A2 doit être modifiée, on remplace A1 par son unique membre de règle A2A3. La nouvelle grammaire est alors

A1A2A3,A3A2A3A2
A2A3A1,A3a,A2b.

Comme le membre droit de la règle A3A2A3A2 commence par une variable de numéro inférieur, on substitue à la première occurrence de A2 les membres droits de règle A3A1 et b. Ainsi, la règle A3A2A3A2 est remplacée par les règles A3A3A1A3A2 et A3bA3A2 La nouvelle grammaire est

A1A2A3,A3A3A1A3A2,A3bA3A2
A2A3A1,A3a,A2b.

On obtient ainsi une grammaire où ne subsiste qu'une récursivité gauche directe pour la variable A3 que l'on élimine par la procédure précédente.

Un exemple traditionnel

La grammaire récursive gauche suivante est une grammaire traditionnelle pour décrire les expressions arithmétiques dans leur forme la plus rudimentaire :

E → E + T | T
T → T * F | F
F → (E) | id

Elle se transforme, en appliquant les règles ci-dessus, en :

E → T E’
E’→ +T E’ | ε
T → F T’
T’→ *F T’ | ε
F → (E) | id

On obtient une grammaire non récursive gauche et par conséquent on peut appliquer une analyse descendante sur celle-ci.

Note bibliographique

Les manuels de théorie des langages formels traitent indirectement de l'élimination de la récursivité gauche dans le cadre de la mise sous forme normale de Greibach. Les manuels de programmation, comme le « Dragon book », traitent l'élimination dans le cadre de l'analyse descendante; leur algorithme[3] 4.19 décrit la méthode esquissée ci-dessus plus en détail.

En linguistique informatique aussi ce problème est d'intérêt, comme le montre l'article suivant : Modèle:Article

Notes et références

Modèle:Références

Articles connexes

Modèle:Portail

  1. Un mot du langage étendu (en anglais « sentential form ») est un mot qui dérive de l’'axiome de la grammaire, mais qui est susceptible de contenir encore des variables.
  2. Ceci est la méthode préconisée par exemple dans : Modèle:Carton1.
  3. 3,0 et 3,1 Modèle:Ouvrage.
  4. Modèle:Ouvrage, , page 55.