Mot primitif

En informatique théorique, en combinatoire, et notamment en combinatoire des mots, un mot primitif est un mot qui n’est pas une puissance d'un autre mot. Par exemple, abba est un mot primitif et abab n'est pas primitif puisqu'il est le carré du mot ab. Les mots primitifs représentent en quelque sorte l'équivalent combinatoire des nombres premiers en arithmétique. Les mots primitifs interviennent dans divers domaines, comme les équations entre mots, les mots de Lyndon, les langages formels. Ils sont liés aux colliers ou mots circulaires. Un mot primitif est aussi appelé apériodique.

Définition

Un mot $x$ sur un alphabet $A$ est primitif s'il n’est pas une puissance d'un autre mot, donc s'il n'existe pas de mot $y \neq x$ tel que $x = y^{n}$ pour un entier naturel $n$ positif. Le mot vide n’est pas primitif.

Pour un alphabet à deux lettres $a, b,$ les premiers mots primitifs sont :

a, b, a b, b a, a a b, a b a, a b b, b a a, b a b, b b a, a a a b, \dots

.

Propriétés

Unicité

Les propriétés suivantes se trouvent dans les manuels, comme ceux de Lothaire^[1] ou de Shallit^[2] Modèle:Théorème On trouve parfois le nom « racine » de $x$ pour désigner l'unique mot primitif dont $x$ est une puissance ; il est aussi noté $\sqrt{x}$ . L'entier $n$ tel que $x = {\sqrt{x}}^{n}$ est l'« exposant » de $x$ . Par exemple, pour $x = a b a b a b$ , $\sqrt{x} = a b$ et $x = (a b)^{3}$ , d'exposant 3. La propriété se démontre à l'aide du lemme ci-dessous. Modèle:Théorème Prenons par exemple $x = a b a a b$ . Ses conjugués sont

a b a a b, b a a b a, a a b a b, a b a b a, b a b a a

.

Ils sont tous primitifs. Modèle:Théorème

Nombre de mots primitifs

Comme les conjugués d'un mot primitif sont tous distincts, car s'il y en avait deux égaux, ils vérifieraient une équation décrite dans le lemme ci-dessous, et seraient puissances d'un troisième mot, donc imprimitifs. La classe de conjugaison d'un mot primitif, ou de manière équivalent le mot circulaire associé à ce mot, est appelé un collier apérodique. Le nombre de colliers apériodiques de longueur $n$ , donc le nombre de classes de conjugaison de mots primitifs de longueur longueur n sur un alphabet à k lettres est

M_{k} (n) = \frac{1}{n} \sum_{d ∣ n} μ (d) k^{n / d}

.

Ici, $μ$ est la fonction de Möbius. Comme les conjugués d'un mot primitif sont tous primitifs et distincts, le nombre de mots primitifs de longueur longueur n sur un alphabet à k lettres est

n M_{k} (n) = \sum_{d ∣ n} μ (d) k^{n / d}

.

Les fonctions $M_{k} (n)$ sont aussi appelés les polynômes de colliers (en la variable $k$ ), et la formule est attribuée au colonel Moreau. Pour $k = 2$ , la suite des $M_{k} (n)$ est la Modèle:OEIS. Pour $n = 3$ et $n = 4$ , les colliers apériodiques binaires sont respectivement 001,011 et 0001,0011,0111.

Le nombre $M_{k} (n)$ est le nombre de mots de Lyndon de longueur $n$ sur $k$ lettres : Toute classe de conjugaison d'un mot primitif contient un seul élément qui est plus petit que les autres dans un ordre lexicographique fixé, et c'est l'unique mot de Lyndon de la classe, de sorte que les mots de Lyndon forment un système de représentants des classes de mots primitifs ou de colliers apériodiques.

Théorème de Lyndon et Schützenberger

Modèle:Théorème La première partie de cette propriété est en fait une paraphrase du théorème de Lyndon et Schützenberger qui dit que si $x^{n} y^{m} = z^{p}$ pour $n, m, p \geq 2$ , alors $x, y$ et $z$ ont même racine. Ceci n'est plus vrai si $n = 1$ ou $m = 1$ . Ainsi, pour $x = a b a$ et $y = b a a b$ , le mot $x^{2} y = a b a a b a b a a b$ est un carré. La deuxième partie de l'énoncé^[3] dit qu'au plus l'un des mots $x^{n} y$ ou $x y^{m}$ n'est pas primitif. Si $x$ et $y$ sont de même longueur, alors le seul mot éventuellement imprimitif est $x y$ . Par exemple, si $x = a b a$ et $y = b a b$ , alors $x y = (a b)^{3}$ . On peut montrer^[4] que dans le cas général, si $x y^{m}$ est imprimitif, alors $m \leq M$ , avec $M = 2 + (| x | - 2) / | y |$ . Ainsi, pour $x = a a b a b a$ et $y = a b$ , on a $M = 2 + (| x | - 2) / | y | = 2 + (6 - 2) / 2 = 4$ , et pour $m = 2$ , on a $x y^{2} = (a a b a b)^{2}$ .

Mots sans bord

Modèle:Théorème Un bord d'un mot $w$ est un mot qui est à la fois un préfixe propre et un suffixe propre de $w$ . Un mot sans bord est un mot qui ne possède pas de bord non vide. Modèle:Démonstration

Un lemme

Le résultat suivant est utile dans les démonstrations des propriétés des mots primitifs : Modèle:Théorème

Modèle:Démonstration Ainsi, pour démontrer que tout mot a une racine unique, on peut supposer qu'un mot $w$ s'écrit de deux façons comme puissance d'un mot primitif, soit $w = x^{n} = y^{m}$ avec $x$ et $y$ des mots primitifs. Par la condition (3), il en résulte que $x = z^{p}$ et $y = z^{q}$ , et comme $x$ et $y$ sont primitifs, on a $p = q = 1$ et $x = y$ .

Le langage des mots primitifs

Il est de tradition de noter $Q$ l'ensemble des mots primitifs sur un alphabet fixé. Sur une lettre, il n'y a qu'un seul mot primitif. Sur plus d'une lettre, le problème de la nature de l'ensemble $Q$ , dans le cadre de la théorie des langages formels, a été posé sans être encore résolu (en 2016). Pál Dömösi et Masami Ito ont consacré un ouvrage de plus de 500 pages à cette question^[5]Modèle:,^[6]. Un article de synthèse est de Gerhard Lischke^[7].

On ne sait pas si le langage $Q$ est algébrique. Holger Petersen a prouvé, dans un article paru en 1996, que le langage $Q$ n'est pas algébrique inambigu^[8]. Il utilise pour cela la série génératrice du nombre de mots de $Q$ sur k lettres qui s'écrit

Q (z) = \sum_{n = 0}^{\infty} n M (n) = \sum_{n = 0}^{\infty} \sum_{d ∣ n} μ (d) k^{n / d}

et s'appuie sur le théorème de Chomsky-Schützenberger selon lequel la série génératrice du nombre de mots d’un langage algébrique inambigu est une fonction algébrique. Pour montrer que la série $Q (z)$ n'est pas algébrique, il applique l'un des critères développés par Philippe Flajolet^[9].

Les outils usuels pour prouver qu'un langage n'est pas algébrique, comme le lemme d'itération d'Ogden, ou d'autres lemmes d'itération comme le lemme de Bader et Moura ou même le lemme d'échange d'Ogden, Winklmann et Ross, ne permettent pas de conclure.

Le langage $Q$ des mots primitifs est la fermeture, par permutation circulaire, du langage $L$ des mots de Lyndon. Si $L$ était algébrique, il en serait de même de $Q$ puisque les langages algébriques sont fermés par permutation circulaire. Or il a été démontré par Berstel et Boasson ^[10] que $L$ n'est pas algébrique en appliquant le lemme d'Ogden.

Le langage $Q$ n'est pas non plus algébrique linéaire, mais c'est langage contextuel déterministe^[11], c'est-à-dire reconnu par un automate linéairement borné déterministe. Quant à la complexité de reconnaissance, le langage est dans la classe DTIME(n^2), c'est-à-dire qu'il est reconnu par une machine de Turing déterministe en temps quadratique.

Morphisme préservant les mots primitifs

Un morphisme d'un demi-groupe libre dans un deuxième demi-groupe libre préserve les mots primitifs si l'image d'un mot primitif est toujours un mot primitif^[12].

Des exemples de morphismes préservant les mots primitifs sont fournis par les morphismes de Lyndon qui sont, par définition, les morphismes qui préservent les mots de Lyndon. Un tel morphisme $f$ préserve aussi les mots primitifs : en effet, si $x$ est un mot primitif, il existe un conjugué $y$ de $x$ qui est un mot de Lyndon ; l'image $f (y)$ de $y$ est par hypothèse un mot de Lyndon, donc primitif, et l'image $f (x)$ de $x$ , qui est un mot conjugué de $f (y)$ , est donc aussi un mot primitif^[13]. Une étude détaillée des morphismes préservant les mots primitifs a été faite par Viktor Mitrana^[14]. Une version longue est disponible en ligne^[15]. Le résultat principal est une caractérisation des morphismes préservant les mots primitifs. Pour cela, on définit la notion de code pur. Un code à longueur variable $X$ est un code pur si, pour tout élément $x$ de $X^{+}$ , la racine $\sqrt{x}$ est également élément de $X^{+}$ . On peut montrer qu'un code est pur si et seulement si $X^{*}$ est un langage sans étoile. Modèle:Théorème

Notes et références

Modèle:Références

Bibliographie

Modèle:Ouvrage — Une seconde édition révisée est parue chez Cambridge University Press, dans la collection Cambridge Mathematical Library, en 1997, Modèle:ISBN
Modèle:Ouvrage

Articles liés

Modèle:Portail

↑ Modèle:Harvsp.
↑ Modèle:Harvsp.
↑ Lischke attribue ce résultat à Modèle:Article.
↑ Modèle:Article
↑ Modèle:Ouvrage
↑ C'est surtout le chapitre 8 du livre, intitulé Some Properties of the Language of Primitive Words, qui étudie l'algébricité du langage.
↑ Modèle:Article.
↑ Modèle:Article.
↑ Modèle:Article.
↑ Modèle:Article.
↑ Modèle:Harvsp.
↑ On trouve parfois le terme « morphisme primitif » pour un morphisme préservant les mots primitifs, mais ce terme est maintenant plutôt réservé, en combinatoire des mots, à un morphisme dont la matrice associée est primitive.
↑ Modèle:Lien web.
↑ Modèle:Article.
↑ Modèle:Lien web.

[1] Modèle:Harvsp.

[2] Modèle:Harvsp.

[3] Lischke attribue ce résultat à Modèle:Article.

[Echi2017-4] Modèle:Article

[5] Modèle:Ouvrage

[6] C'est surtout le chapitre 8 du livre, intitulé Some Properties of the Language of Primitive Words, qui étudie l'algébricité du langage.

[7] Modèle:Article.

[8] Modèle:Article.

[9] Modèle:Article.

[10] Modèle:Article.

[11] Modèle:Harvsp.

[12] On trouve parfois le terme « morphisme primitif » pour un morphisme préservant les mots primitifs, mais ce terme est maintenant plutôt réservé, en combinatoire des mots, à un morphisme dont la matrice associée est primitive.

[13] Modèle:Lien web.

[14] Modèle:Article.

[15] Modèle:Lien web.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

Mot primitif

Sommaire

Définition

Propriétés

Unicité

Nombre de mots primitifs

Théorème de Lyndon et Schützenberger

Mots sans bord

Un lemme

Le langage des mots primitifs

Morphisme préservant les mots primitifs

Notes et références

Bibliographie

Articles liés

Menu de navigation

Mot primitif

Définition

Propriétés

Unicité

Nombre de mots primitifs

Théorème de Lyndon et Schützenberger

Mots sans bord

Un lemme

Le langage des mots primitifs

Morphisme préservant les mots primitifs

Notes et références

Bibliographie

Articles liés

Menu de navigation

Rechercher