Théorème de Chomsky-Schützenberger (combinatoire)

De testwiki
Version datée du 5 octobre 2023 à 22:08 par imported>JerGer (Chomsky Schützenberger)
(diff) ← Version précédente | Version actuelle (diff) | Version suivante → (diff)
Aller à la navigation Aller à la recherche

Modèle:Confusion

En informatique théorique, en mathématiques discrètes et en combinatoire, le théorème de Chomsky-Schützenberger est un énoncé sur le nombre de mots de longueur donnée dans un langage engendré par une grammaire algébrique inambiguë. Le théorème montre un lien entre la théorie des langages formels et l'algèbre. Il est nommé d'après Noam Chomsky et Marcel-Paul Schützenberger.

Énoncé

Pour énoncer le théorème, nous avons besoin de quelques notions d'algèbre.

Une série entière sur est une série de la forme

f=f(x)=k=0akxk=a0+a1x1+a2x2+a3x3+

à coefficients ak dans . La multiplication de deux séries entières f et g est définie, de manière habituelle, comme la convolution des suites an et bn :

f(x)g(x)=k=0(i=0kaibki)xk.

En particulier, on écrit f2=f(x)f(x), f3=f(x)f(x)f(x), etc. En analogie avec les nombres algébriques, une série entière f(x) est dite algébrique sur (x) s'il existe des polynômes p0(x), p1(x), p2(x), …, pn(x), à coefficients rationnels, tels que

p0(x)+p1(x)f+p2(x)f2++pn(x)fn=0.

Le théorème s'énonce comme suit.

Modèle:Théorème La série fL(x) est la série génératrice du nombre de mots du langage L. Des preuves de ce théorème sont données dans Modèle:Harvsp et Modèle:Harvsp.

Un exemple

Le langage de Lukasiewicz est le langage engendré par la grammaire algébrique inambiguë

SaSS|b

Un mot du langage code un arbre binaire, le codage étant obtenu par un parcours préfixe de l'arbre. La série génératrice y=f(x) du nombre de mots de Lukasiewicz vérifie l'équation

y=xy2+x

Les coefficients an sont les nombres de Catalan.

Une application

Par contraposition, le théorème de Chomsky-Schützenberger donne un moyen de prouver qu'un langage est inhéremment ambigu, autre que le lemme d'Ogden :

Si la série génératrice fL(x) d'un langage algébrique L est transcendante, alors le langage L est inhéremment ambigu.

On prouve ainsi que le langage de Goldstine G est inhéremment ambigu[1]Modèle:,[2]. On considère pour cela le complémentaire de ce langage ; il est formé des mots qui se terminent par la lettre a, et par les mots de l'ensemble

F={ε,ab,aba2b,aba2ba3b,}.

La série génératrice des mots se terminant par la lettre a est x/(12x). La série génératrice de l'ensemble F est

fF(x)=1+x2+x5+x9+=n1xn(n+1)/21.

Par conséquent,

fG(x)=1x12xfF(x).

Comme fG(x) est transcendante si et seulement si fF(x) l'est, il suffit de considérer la dernière. Or, la série

fF(x)/x=n1xn(n+1)/2

est transcendante, car c'est une série lacunaire.

Notes et références

Modèle:Traduction/Référence Modèle:Références

Bibliographie

Modèle:Portail

  1. L'exposé suit Modèle:Harvsp.
  2. Modèle:Carton2, proposition 2.50.