Complexité d'un mot

Modèle:Article principal

La complexité combinatoire d'un mot ou plus simplement la complexité d'un mot ou d'une suite est un moyen de mesurer, en combinatoire et en mathématique, et spécialement en combinatoire des mots, divers paramètres d'un mot qui expriment combien il est « compliqué ».

La complexité combinatoire est une mesure différente de la complexité algorithmique ou complexité de Kolmogorov. Ici, on considère le plus souvent la complexité en facteurs (en anglais « subword complexity »).

Parmi les mots distingués dans les diverses mesures de complexité combinatoire, il y a ceux dont la complexité est particulièrement basse. Un mot de faible complexité est un mot infini dont la fonction de complexité est « à croissance lente »; on entend par là une fonction qui croît linéairement, ou polynomialement, en tout cas nettement moins vite qu'une exponentielle. Il existe de nombreuses familles de mots infinis, comme les mots automatiques, les mots morphiques, les mots sturmiens et les mots épisturmiens, qui ont une croissance lente en ce sens.

Une application importante de l'étude des mots infinis à croissance lente est à la théorie des nombres : les mots infinis qui représentent le développement d'un nombre sont à croissance lente si le nombre est rationnel ou transcendant, et plus rapide si le nombre est algébrique irrationnel. On dispose ainsi d'un moyen assez général pour construire des nombres transcendants.

La complexité d'un mot fini ou infini peut se mesurer aussi par le nombre de palindromes; on parle alors de complexité palindromique. Ces deux notions de complexité combinatoire sont liées. Encore une autre mesure de complexité est la complexité abélienne d'un mot.

Complexité en facteurs

La fonction de complexité ou complexité en facteurs d'un mot fini ou infini $x$ est la fonction

n \mapsto c_{x} (n)

qui, pour chaque entier $n$ , donne le nombre $c_{x} (n)$ de facteurs (ou blocs) distincts de longueur $n$ dans ce mot. On trouve aussi la notation $p_{x} (n)$ ou $P (x, n)$ pour la valeur en $n$ de cette fonction.

Premier exemple. Le mot infini

u = 01 (10)^{ω} = 01101010 \dots

.

Il a pour complexité $c_{u} (0) = 1, c_{u} (1) = 2, c_{u} (2) = 3$ et $c_{u} (n) = 4$ pour $n \geq 3$

Deuxième exemple. Le mot infini de Champernowne

x = 0110111001011101111000 \dots

.

Ce mot est obtenu en concaténant les développements binaires des entiers naturels. Pour tout $n$ , chacun des $2^{n}$ mots de longueur $n$ est facteur de $x$ , donc la complexité du mot de Champernowne est $2^{n}$ .

Justification de la terminologie

L'entropie topologique d'un mot infini $x$ est la limite

\lim_{n \to \infty} \frac{1}{n} \log c_{x} (n)

Cette limite existe, car on a

c_{x} (n + m) \leq c_{x} (n) c_{x} (m)

donc la fonction $\log c_{x} (n)$ est sous-additive et la limite ci-dessus existe par le lemme de Fekete. Les mots de faible complexité sont les mots d'entropie nulle.

Complexité minimale

Pour un mot infini $x$ , un résultat dû à Ethan M. Coven et Gustav Hedlund dit que si $c_{x} (n) \leq n$ pour un entier $n$ , alors le mot $x$ est ultimement périodique. Plus précisément, on a:

Modèle:Théorème

Les mots infinis apériodiques de complexité minimale sont binaires (sur un alphabet à deux lettres), et ont une fonction de complexité égale à $n + 1$ . Ce sont les mots sturmiens. Le plus connu des mots sturmiens est le mot de Fibonacci.

Complexité de mots morphiques

Mots purement morphiques

Le théorème suivant donne une classification des fonctions de complexités pour les mots purement morphiques.

Modèle:Théorème

Exemples

Les mots ultimement périodiques sont de complexité ultimement constante.

Le mot de Fibonacci est sturmien et morphique. Il est de complexité linéaire.

Un mot de complexité en $Θ (n^{2})$ : le morphisme

\begin{matrix} a & \mapsto & a b \\ b & \mapsto & b c \\ c & \mapsto & c \end{matrix}

engendre, à partir de la lettre $a$ , le mot infini :

a b b c b c^{2} b c^{3} \dots b c^{n} \dots

Sa complexité est en $Θ (n^{2})$ .

Un mot de complexité en $Θ (n \log n)$ : le morphisme

\begin{matrix} a & \mapsto & a b c \\ b & \mapsto & b b \\ c & \mapsto & c c c \end{matrix}

engendre, à partir de la lettre $a$ , le mot infini :

a b c b^{2} c^{3} b^{4} c^{9} \dots b^{2^{n}} c^{3^{n}} \dots

Sa complexité est $Θ (n \log n)$ .

Un mot de complexité en $Θ (n \log \log n)$ : le morphisme

\begin{matrix} a & \mapsto & a b a b \\ b & \mapsto & b b \end{matrix}

engendre, à partir de la lettre $a$ , le mot infini :

(a b a) b^{3} (a b a) b^{7} (a b a) b^{3} (a b a) b^{15} (a b a) b^{3} (a b a) b^{7} (a b a) b^{3} (a b a) b^{31} \dots

La suite des exposants des $b$ est : $1, 3, 1, 7, 1, 3, 1, 15, 1, 3, 1, 7, 1, 3, 1, 31 \dots$ . Sa complexité est $Θ (n \log \log n)$ (ça demande un peu de calcul !).

Mots morphiques

Les fonctions de complexité des mots morphiques ne sont pas encore complètement caractérisées en 2010 (voir Modèle:Harvsp). On sait : Modèle:Théorème On sait que pour tout entier $m \geq 1$ , il existe effectivement un mot infini binaire morphique $x$ tel que $c_{x} (n) = Θ (n \sqrt[m]{n})$ .

Exemple

Soit $A = {a, b_{0}, b_{1}, \dots, b_{m}}$ un alphabet à $m + 2$ lettres et considérons le morphisme $f : A^{*} \to A^{*}$ défini par

\begin{matrix} f (a) = a b_{m} \\ f (b_{i}) = b_{i} b_{i - 1} (i = 1, \dots, m) \\ f (b_{0}) = b_{0} \end{matrix}

et soit $g : A^{*} \to {0, 1}^{*}$ donné par $g (b_{i}) = 0$ pour $i = 0, \dots, m - 1$ , $g (b_{r}) = 1$ , et $g (a) = ε$ . On voit que

x = g (f^{ω} (a)) = g (a b_{r} f (b_{r}) f^{2} (b_{r}) \dots) = 1 0^{e_{0}} 1 0^{e_{1}} 1 0^{e_{2}} 1 0^{e_{3}} \dots)

pour des entiers $e_{i}$ , et on peut prouver que la suite de $e_{i}$ croît comme $i^{m} / m!$ d'où l'on peut déduire que $c_{x} (n) \sim n \sqrt[m]{n}$ .

Complexité et transcendance

Il y a un lien étroit entre la transcendance d'un nombre réel et la complexité du mot infini qu'est son développement dans une base donnée. Soit $b > 1$ un entier. Pour tout nombre réel $ξ$ avec $0 < ξ < 1$ , il existe un mot infini unique

x = a_{0} a_{1} a_{2} \dots a_{n} \dots

à éléments dans l'ensemble ${0, 1, \dots, b - 1}$ tel que

ξ = \sum_{n = 0}^{\infty} \frac{a_{n}}{b^{n + 1}} = 0, a_{0} a_{1} a_{2} \dots a_{n} \dots

avec la condition supplémentaire que $x$ ne se termine pas par une infinité de $b - 1$ . Par exemple, en base 10, on a

3 / 7 = 0, (428571)^{ω}

.

Réciproquement, un développement en base $b$ décrit un nombre réel unique. Un nombre réel est rationnel si et seulement si son développement est ultimement périodique.

On note

c (ξ, b, n)

le nombre de facteurs de longueur $n$ du mot infini $x$ qui est le développement de $ξ$ en base $b$ , en d'autre termes $c (ξ, b, n) = c_{x} (n)$ . On dira pour faire vite que c'est la complexité de $ξ$ , au lieu de dire la complexité du développement de $ξ$ . On a alors le théorème suivant Modèle:Théorème La conclusion du théorème dit que la fonction de complexité de $ξ$ croît plus vite que linéairement. La conséquence immédiate de ce théorème est que si $c (ξ, b, n) = O (n)$ , et si $ξ$ est irrationnel, alors $ξ$ est transcendant. Or, il existe de nombreux mots infinis de complexité linéaire, et tous ces mots infinis représentent donc des nombres soit rationnels, soit transcendants.

Par exemple, tous les nombres irrationnels dont le développement est une suite automatique sont transcendants. Tous les nombres dont le développement est un mot sturmien sont transcendants. La même conclusion vaut pour les mots épisturmiens non ultimement périodiques.

Complexité abélienne

Modèle:Loupe

La complexité abélienne d'un mot fini ou infini est la fonction qui compte le nombre de facteurs de longueur donnée dans ce mot, à permutation de lettres près. C'est une autre mesure de la complexité combinatoire d'une suite.

Exemple. Les 7 facteurs de longueur 6 du mot de Fibonacci $010010100100101001010 \dots$ sont Modèle:Indente Ces facteurs se regroupent, par une permutation des lettres, en deux classes : les cinq mots contenant deux occurrences de $1$ , et les deux qui en contiennent trois. La complexité abélienne prend donc la valeur 2.

Mots de complexité abélienne maximale

On note $α_{x}$ la fonction complexité abélienne d'un mot $x$ .

Propriété.- La complexité abélienne d'un mot infini $x$ sur $k$ lettres vérifie Modèle:Indente pour tout $n \geq 1$ .

Cette borne est atteinte par la suite de Champernowne par exemple.

Mot de Thue-Morse

Le mot de Thue-Morse $t$ a la fonction de complexité suivante :

α_{t} (n) = {\begin{matrix} 2 & n impair \\ 2 & n > 0 pair. \end{matrix}

En fait, une sorte de réciproque est vraie aussi^[1]: Si un mot infini binaire récurrent a la même fonction de complexité et la même fonction de complexité abélienne que le mot de Thue-Morse, alors il a les mêmes facteurs.

Mots sturmiens

Un mot sturmien est un mot infini binaire qui a exactement $n + 1$ facteurs de longueur $n$ , pour tout entier naturel $n$ . L'exemple paradigmatique de mot sturmien est le mot de Fibonacci.

Parmi les nombreuses propriétés des mots sturmiens, on a la caractérisation^[1] :

Propriété.- La complexité abélienne d'un mot sturmien $x$ est constante et égale à $2$ . Réciproquement, un mot apériodique qui a complexité abélienne constante égale à $2$ est sturmien.

Complexité binomiale

Deux mots sont dits k-binomialement équivalents lorsqu'ils possèdent les mêmes sous-mots de longueur au plus k avec les mêmes multiplicités. Cette mesure est un raffinement de l'équivalence abélienne et de la congruence de Simon^[2]. La complexité k-binomiale d'un mot infini $x$ est, pour tout entier $n$ , le nombre de classes, pour cette relation d'équivalence, de l'ensemble des facteurs de longueur $n$ apparaissant dans $x$ ^[3]Modèle:,^[4]. La complexité $k$ -binomiale du mot de Thue-Morse, bien que le mot de Thue-Morse soit apériodique, ne prend que deux valeurs^[5].

Définition

Formellement, deux mots u et v sont k-binomialement équivalents si

(\binom{u}{x}) = (\binom{v}{x})

pour tout mot $x$ de longueur au plus $k$ . Dans cette définition,

(\binom{u}{x})

est le nombre d'occurrences du mot x comme sous-mot de $u$ . Les coefficients binomiaux de mots ont des propriétés proches de celles des nombres. Ainsi, on a par exemple :

(\binom{p s}{z}) = \sum_{x y = z} (\binom{p}{x}) (\binom{s}{y})

Exemples

Les quatre mots $a b a b b b a, a b b a b a b, b a a b b a b$ et $b a b a a b b$ sont 2-binomialement équivalents. Si $w$ est l'un de ces quatre mots, on a en effet les coefficients suivants :

(\binom{w}{a}) = 3, (\binom{w}{b}) = 4

et

(\binom{w}{a a}) = 3, (\binom{w}{a b}) = 7, (\binom{w}{b a}) = 5, (\binom{w}{a b}) = 6

.

Ces mots ne sont pas 2-binomialement équivalents. Par exemple, on a

(\binom{a b a b b b a}{a a b}) = 3

et

(\binom{a b b a b a b}{a a b}) = 4

.

En effet, dans ce deuxième mot, le sous-mot $a a b$ apparaît en 4 positions :

\underline{a} b b \underline{a} \underline{b} a b, \underline{a} b b \underline{a} a \underline{b}, \underline{a} b b a \underline{a} \underline{b}, a b b \underline{a b} a \underline{b}

.

Pour $k = 1$ , l'équivalence binomiale coïncide avec l'équivalence commutative.

On note $u \sim_{k} v$ le fait que $u$ et $v$ sont $k$ -binomialement équivalents. La relation est compatible avec la concaténation :

u \sim_{k} v

implique

p u s \sim_{k} p v s

pour tous mots

p, s

.

Complexité binomiale du mot de Thue-Morse

On note $c_{x} (n)$ la complexité d'un mot $x$ , c'est-à-dire le nombre de facteur de longueur $n$ apparaissant dans $x$ , et on note $b_{x, k} (n)$ ou plus simplement $b_{x} (n)$ la complexité $k$ -binomiale de $x$ , c'est-à-dire le nombre classes de sous-mots $k$ -équivalents de longueur $n$ du mot $x$ . Pour le mot de Thue-Morse, on a le résultat suivant :

Modèle:Théorème

Ainsi, pour $n \geq 2^{k}$ , la complexité $k$ -binomiale du mot de Thue-Morse ne prend que 2 valeurs ; de plus, la deuxième valeur est égale à $c_{t} (2^{k} - 1)$ .

Complexité binomiale des mots sturmiens

La complexité $k$ -binomiale d'un mot sturmien est égale à sa complexité en facteur. Plus précisément, on Modèle:Théorème Pour $k = 1$ , la complexité binomiale est égale à la complexité abélienne, et vaut donc 2. Pour des valeurs plus grandes de k, on montre que deux facteurs distincts de même longueur d'un mot sturmien ne sont jamais $k$ -binomialement équivalents^[3].

Complexité cyclique

Définition

La complexité cyclique d’un mot infini $x$ est la fonction $c_{x} (n)$ ^[6] qui compte le nombre de classes de conjugaison (ou mots circulaires, ou colliers) de facteurs de longueur $n$ dans le mot $x$ : pour être tout à fait précis : $c_{x} (n)$ est le nombre de classes de conjugaison que rencontre l’ensemble des facteurs de longueur $n$ ^[7].

Exemple. Les cinq facteurs de longueur 4 du mot de Fibonacci infini $010010100100101001010 \dots$ sont Modèle:Indente Ces facteurs se regroupent, par permutation circulaire, en deux classes : les trois mots forment contenant une seule occurrence de $1$ , et les deux qui en contiennent deux. La complexité cyclique prend donc la valeur 2.

On a $a_{x} (n) \leq c_{x} (n) \leq p_{x} (n)$ , où $a_{x}$ est la complexité abélienne et $p_{x} (n)$ est la complexité ordinaire. La complexité en facteurs, la complexité abélienne et la complexité cyclique peuvent être vues comme des actions de divers sous-groupes du groupe symétrique sur les indices d’un mot fini, à savoir respectivement le sous-groupe trivial, le groupe symétrique en entier et le sous-groupe cyclique engendré par la permutation (1,2,…,n).

Théorème : Un mot est ultimement périodique si et seulement si sa complexité cyclique est bornée.

Ceci est l’analogue du théorème de Morse-Hedlund.

Mots sturmiens

Propriété : Soient $x$ et $y$ deux mots infinis de même complexité cyclique. Si l’un des deux mots est sturmien, alors l’autre l’est également et, à un renommage des lettres près, ils ont même ensemble de facteurs.

La valeur minimale de la fonction de complexité cyclique d’un mot non périodique est 2, car si tous les facteurs de longueur $n$ d’un mot sont conjugués, ce mot est périodique. En particulier, si $x$ est sturmien, alors $\underset{n \to \infty}{lim inf} c_{x} (n) = 2$ , mais ceci ne caractérise pas les mots sturmiens.

Mot de Thue-Morse

Pour le mot de Thue-Morse $t$ la fonction de complexité cyclique n'est pas bornée : on a $\underset{n \to \infty}{lim inf} c_{t} (n) = + \infty$ ,

Complexité en palindromes

Définition

La fonction de complexité en palindromes ou complexité palindromique^[8] d'un mot fini ou infini $x$ est la fonction

n \mapsto p_{x} (n)

qui, pour chaque entier $n$ , donne le nombre $p_{x} (n)$ de facteurs (ou blocs) distincts de longueur $n$ dans ce mot qui sont des palindromes. Bien entendu, on a toujours $p_{x} (n) \leq c_{x} (n)$ .

Exemple Le mot $x = 01101001$ , préfixe du mot de Prouhet-Thue-Morse a les facteurs 9 palindromes

ε, 0, 1, 00, 11, 010, 101, 0110, 1001

,

et $p_{x} (0) = 1$ , et $p_{x} (1) = p_{x} (2) = p_{x} (3) = p_{x} (4) = 2$ .

Exemple Le mot de Fibonacci infini $f = 0100101001001 \dots$ a les facteurs palindromes

ε, 0, 1, 00, 010, 101, 1001, \dots

,

et on peut démontrer que

p_{f} (n) = {\begin{matrix} 1 & si n est pair; \\ 2 & sinon. \end{matrix}

Cette propriété est caractéristique des mots sturmiens.

Comparaison des deux mesures de complexité

Soit $x$ un mot infini, et soit $p_{x} (n)$ sa complexité en palindromes et $c_{x} (n)$ sa complexité en facteurs. Bien entendu, on a toujours $p_{x} (n) \leq c_{x} (n)$ . Il y a une borne bien meilleure^[9] :

p_{x} (n) \leq \frac{16}{n} c_{x} (n + ⌊ \frac{n}{4} ⌋)

Cette propriété peut être raffinée dans le cas de mots infinis dont l'ensemble des facteurs est fermé par image miroir, c'est-à-dire tel que pour tout facteur $u$ , l'image miroir $u^{\sim}$ est encore facteur.

Modèle:Théorème

Exemple. Pour tout mot sturmien, on a $c (n) = n + 1$ . Ainsi, le membre droit de l'équation s'évalue en $c (n + 1) - c (n) + 2 = 3$ . Il en résulte que $p (n) + p (n + 1) \leq 3$ . On verra que dans ce cas, on peut remplacer l'inégalité par une égalité. On a donc $p (n) + p (n + 1) = 3$ , donc le nombre de palindromes est alternativement 1 et 2, comme déjà dit plus haut.

Le nombre moyen de facteurs palindromes distincts dans un mot aléatoire de longueur $n$ est $θ (\sqrt{n})$ ^[10].

Mots riches en palindromes

Soit $w$ un mot fini, et soit $Pal (w)$ l'ensemble des facteurs de $w$ qui sont des palindromes, et soit $𝒫 (w)$ le nombre d'éléments de $Pal (w)$ . On sait^[11] que pour tout mot fini $w$ , on a

𝒫 (w) \leq | w | + 1

.

Un mot $w$ est riche en palindromes^[12] si l'inégalité est une égalité, donc si

𝒫 (w) = | w | + 1

.

De même, un mot infini est riche en palindromes si tous ses facteurs sont riches en palindromes. Les mots sturmiens, épisturmiens, et plus généralement les mots infinis qui codent des échanges d'intervalles symétriques sont riches. Le mot de Thue-Morse n'est pas riche. Le préfixe $01101001$ de longueur 8 du mot de Thue-Morse et riche puisqu'il a 9 facteurs palindromes. Un examen exhaustif montre que tous les mots binaires de longueur au plus 8 sont riches. Des définitions équivalentes ont été trouvées pour les mots riches :

Modèle:Théorème

Exemple. Prenons le mot infini de Fibonacci

f = 010010100100101001010 \dots

qui est sturmien donc riche. Prenons par exemple le facteur $w = 100100101001$ . Les suffixes palindromes de ce mot sont $1, 1001$ et $100101001$ . Les deux premiers ont plusieurs occurrences dans w, le troisième, le plus long, n'a qu'une seule occurrence. Le préfixe $01001010$ a trois suffixes palindromes non vides, à savoir $0$ , $010$ , et $01010$ . Le dernier est le seul qui est unirécurrent. Pour le facteur 1001, les deux mots de retour complets sont $1001001$ et $100101001$ . Ils sont tous deux palindromes. Enfin, comme $c (n) = n + 1$ , on a $c (n + 1) - c (n) + 2 = 3$ pour tout $n$ , et d'autre part le mot de Fibonacci a deux facteurs palindromes de longueur paire et un seul de longueur impaire pour toute longueur, donc $p (n) + p (n + 1) = 3$ .

Modèle:Théorème Les mêmes arguments donnent aussi une majoration pour le nombre de facteurs d'un mot riche en palindromes : Modèle:Théorème

On peut se demander^[13] comment sont les mots infinis qui ne sont pas riches. On appelle défaut ou défaut palindromique d'un mot $w$ le nombre $𝒟 (w)$ défini par

𝒟 (w) = 1 + | w | - 𝒫 (w)

Ce nombre est toujours positif ou nul. Pour un mot infini $x$ , on pose

𝒟 (x) = \max {𝒟 (w) ∣ w facteur de x}

.

Ce défaut est nul si le mot est riche. Il est utile, pour simplifier l'énoncé qui suit, de poser

T_{w} (n) = c_{w} (n + 1) - c_{w} (n) + 2 - p_{w} (n) - p_{w} (n + 1)

.

Pour tout mot fini $w$ de longueur $k$ , on a

2 𝒟 (w) = \sum_{n = 0}^{k} T_{w} (n)

.

La conjecture^[14] selon laquelle l'équation

2 𝒟 (x) = \sum_{n = 0}^{\infty} T_{x} (n)

est vraie pour tout mot infini $x$ a été prouvée. Le théorème s'énonce comme suit : Modèle:Théorème Cela signifie aussi que si l'une des deux valeurs $𝒟 (x)$ ou $\sum_{n = 0}^{\infty} T_{x} (n)$ est infinie, l'autre l'est également.

Mots à défaut positif

Le défaut d'un mot peut être nul, positif non nul, ou infini si le mot lui-même est infini. Lorsque le mot a une forme particulière où construit au moyen d'un mécanisme bien connu, on peut donner des indications sur sa complexité en palindromes. Ceci est le cas de mots purement morphiques engendrés par des morphismes primitifs : un morphisme $f$ est primitif si sa matrice d'incidence $M (f)$ (dont le coefficient d'indice $a, b$ donne le nombre le nombre d'occurrences de la lettre $a$ dans le mot $f (b)$ ) est primitive. Le morphisme est primitif si et seulement s’il existe un entier $k$ tel que toute lettre a une occurrence dans le mot $f^{k} (b)$ , pour toute lettre $b$ de l’alphabet. On considère ici les mots purement morphiques qui sont point fixes d'un morphisme primitif.

Pour le mot de Fibonacci par exemple, on a $𝒟 (u) = 0$ , et pour le mot de Thue-Morse, $𝒟 (u) = + \infty$ . Tous les deux sont des mots purement morphiques points fixes d'un morphisme primitif.

Il existe de mots points fixes de morphismes primitifs de défaut $k$ pour tout entier naturel $k$ . mais ce sont des mots périodiques. Voici un exemple^[15] : soit $k \geq 2$ un entier naturel, et soit

z_{k} = 0 1^{k} 0 1^{k - 1} 00 1^{k - 1} 0 1^{k} 0

.

Par exemple $z_{2} = 0110100100110$ . On peut montrer que le mot infini périodique $z_{k}^{ω}$ a un défaut palindromique égal à $k$ . Ce mot est point fixe du morphisme $0 \mapsto z_{k}, 1 \mapsto z_{k}$ . Les auteurs de l’article^[15] ont formulé la conjecture suivante :

Modèle:Théorème

La conjecture est donc que si un mot a un défaut strictement positif et fini, il est périodique. La conjecture est vérifiée dans le cas d’un alphabet binaire^[16], mais elle est fausse pour des alphabets plus grands. Un contre-exemple est le mot infini engendré par le morphisme

a \mapsto a a b c a c b a, b \mapsto a a, c \mapsto a

donné par Michelangelo Bucci et Élise Vaslet^[16]. D'autres résultats ont été donnés par Kristina Ago, Bojan Bašić, Stefan Hačko et Danijela Mitrović^[17].

Complexité de Lie

La complexité de Lie d'un mot infini à droite $w$ sur un alphabet $A$ est la fonction $L_{w}$ dont la valeur $L_{w} (n)$ , pour un entier naturel $n$ , est le nombre de classes de conjugaison (pour le décalage cyclique) de facteurs de longueur $n$ de $w$ avec la propriété que chaque élément de la classe de conjugaison apparaît dans $w$ .

Exemples

1.- Soit $𝐭$ le mot de Thue-Morse, point fixe du morphisme qui envoie 0 sur 01 et 1 sur 10. On a :

L_{𝐭} (n) = {\begin{matrix} 1 & si n = 0 ou n = 2^{k} et k \geq 3 \\ 2 & si n = 1, 4 ou n = 3 \cdot 2^{k} pour k \geq 0 \\ 3 & si n = 2 \\ 0 & sinon . \end{matrix}

Ceci est en accord avec le fait que les seuls carrés dans le mot de Thue-Morse ont longueur $2^{k}$ ou $3 \cdot 2^{k}$ .

Soit $𝐟$ le mot de Fibonacci, point fixe du morphisme qui envoie 0 sur 01 et 1 sur 0. Les nombres de Fibonacci sont définies par $F_{0} = 0, F_{1} = 1$ et $F_{n} = F_{n - 1} + F_{n - 2}$ . Alors

L_{𝐟} (n) = {\begin{matrix} 1 & si n = 0 ou n = F_{k} ou n = 2 F_{k - 1} pour k \geq 4 \\ 2 & si n = 1, 2 \\ 0 & sinon . \end{matrix}

Propriétés

On note $p_{w} (n)$ le nombre de facteurs de longueur $n$ du mot infini $w$ . L'observation principale est la formule suivante :

Modèle:Théorème

Pour un mot sturmien qui a la propriété que $p_{w} (n) = n + 1$ , le membre droit de l'inégalité est 2.

Il résulte de la formule que la fonction de complexité de Lie est uniformément bornée pour les mots dont la complexité en facteurs est linéaire. Il en résulte aussi comme corollaire que les mots infinis dont la complexité en facteurs est linéaire ont au plus un nombre fini de facteurs primitifs $y$ avec la propriété que $y^{n}$ est à nouveau un facteur pour tout $n$ .

On peut montrer que la fonction de complexité de Lie d'une suite $k$ -automatique est également $k$ -automatique^[18].

Les démonstrations de Bell et Shallit sont algébriques, Alessandro De Luca et Gabriele Fici^[19] donnent des preuves combinatoires.

Complexité arithmétique

La complexité arithmétique d'un mot infini est la fonction qui compte le nombre de mots de longueur donnée composés de lettres apparaissant à des positions en progression arithmétique (et non seulement consécutives).

C'est une autre mesure de la complexité combinatoire des mots infinis qui est une extension de la complexité en facteurs. Les résultats sont moins spectaculaires que ceux concernant la complexité en facteurs.

Définition et exemples

Formellement, étant donné un mot infini

x = a_{0} a_{1} \dots a_{n} \dots

,

où les $a_{i}$ sont des lettres, on appelle clôture arithmétique de $x$ l'ensemble

A (x) = {a_{i} a_{i + d} a_{i + 2 d} \dots a_{i + k d} ∣ d \geq 1, k \geq 0}

.

La complexité arithmétique de $x$ est la fonction $a_{x}$ qui à $n$ associe le nombre $a_{x} (n)$ de mots de longueur $n$ dans $A (x)$ .

Exemples

Le mot caractéristique des carrés : Modèle:Indente Par exemple $111$ figure dans sa clôture arithmétique, parce qu'il y a un 1 en positions 1, 25 et 49.
Le mot de Prouhet-Thue-Morse : Modèle:Indente On peut montrer, directement ou comme corollaire du résultat plus général donné plus loin, que $a_{t} (n) = 2^{n}$ , c'est-à-dire que tout mot est dans la clôture arithmétique.
Le mot de Fibonacci Modèle:Indente

Il a été démontré^[20] que $a_{f} (n) = θ (n^{3})$ . Les premières valeurs sont données dans la table suivante^[20] : Modèle:Indente

Propriétés

Les résultats généraux sont plus rares que pour la complexité en facteurs.

Mots sturmiens. Pour les mots sturmiens, les résultats sont les suivants^[20] :

La complexité arithmétique d'un mot sturmien est majorée par $O (n^{3})$ .
Pour tout mot sturmien de pente entre $1 / 3$ et $2 / 3$ , la complexité est $θ (n^{3})$ .

Pour les mots sturmiens de pente comprise entre $2 / 5$ et $3 / 5$ , il existe une formule explicite, un peu compliquée à expliquer.

Mots symétriques. Une autre catégorie de mots pour lesquels on connaît la complexité arithmétique est celle des mots purement morphiques engendrés par des morphismes symétriques. Un morphisme $f : A^{*} \to A^{*}$ est symétrique s'il existe une permutation circulaire $σ$ sur $A$ qui commute avec $f$ , donc telle que Modèle:Indente pour toute lettre $a$ . L'exemple typique est le morphisme de Thue-Morse, ou le morphisme ternaire Modèle:Indente associé à la permutation $(012)$ . Les mots de engendrés par des morphismes symétriques sont eux-mêmes appelés des mots symétriques^[21]. On a la propriété suivante : Modèle:Théorème Voici deux cas particuliers :

Si $x$ est un mot symétrique périodique, alors $a_{x} (n) = q^{2}$ pour tout $n \geq 2$ .
Si $x$ est symétrique non périodique et si $q$ est un nombre premier, alors $a_{x} (n) = q^{n}$ pour tout $n$ . C'est le cas pour le mot de Prouhet-Thue-Morse.

Suites de complexité arithmétique linéaire

Quelles sont les suites de faible complexité arithmétique ? Anna Frid^[22] a caractérisé les mots infinis de complexité arithmétique linéaire. Pour formuler cette caractérisation, il faut donner quelques définitions. D'abord une notation. Pour un mot infini

x = x_{1} x_{2} \dots x_{n} \dots

où les $x_{i}$ sont des lettres, on note $x (k, d)$ ^[23] le mot commençant en $x_{k}$ et formé des lettres de $x$ prises à intervalle $d > 0$ , formellement

x (k, d) = x_{k} x_{k + d} x_{k + 2 d} \dots x_{k + n d} \dots

Par exemple, pour le mot de Prouhet-Thue-Morse

t = 0110100110010110 \dots

on a $t (1, 2) = t (1, 4) = t (4, 4) = t$ . Un mot $x$ est dit canoniquement $p$ -régulier si $x (k, p^{m})$ est périodique pour tout $m > 0$ et tout $k$ avec $1 \leq k < p^{m}$ . Par exemple, la suite de Prouhet-Thue-Morse n'est pas canoniquement 2-régulière. En revanche, la suite de pliage de papier

z = 00 10 01 10 00 11 01 10 \dots

est canoniquement 2-régulière. On peut s'en convaincre pour les petites valeurs de $m$ . On a par exemple $z (1, 2) = 010101 \dots = z (2, 4)$ et $z (1, 4) = 000 \dots, z (3, 4) = 111 \dots$ . Il reste une définition. Un mot $y$ est dans l'orbite d'un mot $x$ si l'ensemble des facteurs de $y$ est contenu dans l'ensemble des facteurs de $x$ ^[24]. L'énoncé est le suivant

Modèle:Théorème

Exemple. Nous avons déjà dit que le mot des pliages est canoniquement 2-régulier. On a de plus $z (2, 2) = z (4, 4) = z$ , donc la deuxième condition est remplie également.

Dans cet article, A. Frid donne une autre caractérisation des suites de complexité linéaire par des suites dites de Toeplitz d'un type spécifique.

Suites de complexité arithmétique maximale

Konieczny et Müllner^[25] classifient les suites automatiques $x$ sur un alphabet fini $A$ avec la propriété que chaque mot sur $A$ apparaît dans $x$ le long d'une progression arithmétique. Plus généralement, ils obtiennent une formule asymptotique pour la complexité arithmétique (et même polynomiale) des sous-mots d'une séquence automatique donnée.

Complexité non-répétitive

La complexité non-répétitive et la complexité non-répétitive initiale sont deux mesures de complexité introduites par T. K. Subrahmonian Moothathu^[26], étudiée par Jeremy Nicholson et Narad Rampersad^[27], et par Medková, Pelantová et Vandomme^[28], et considérées par Yann Bugeaud et Dong Han Kim^[29] sous une forme un peu différente. Ces mesures sont liées à l'indice de récurrence et de récurrence initiale dans un mot infini.

Définitions

Les notations varient avec les auteurs. Soit $x$ un mot infini et $m$ un entier.

La complexité non-répétitive initiale est définie par Moothathu comme suit :

i c (m, x)

est la longueur du plus court préfixe de

x

qui ne contient pas le début d'une deuxième occurrence du préfixe de longueur

m

.

La complexité non-répétitive est par définition^[28] :

n c (m, x)

est la longueur du plus court facteur de

x

qui ne contient pas le début d'une deuxième occurrence du préfixe de longueur

m

.

L'indice de récurrence est :

R (m, x)

est la longueur du plus court facteur de

x

qui contient tous les facteurs de longueur

m

.

L'indice de récurrence initiale est :

R^{'} (m, x)

est la longueur du plus court préfixe de

x

qui contient tous les facteurs de longueur

m

.

Ces deux dernières mesures sont les contraposées logiques des indices de non-répétivité.

Bugeaud et Kim définissent une fonction notée $r (m, x)$ par :

r (m, x)

est la longueur du plus court préfixe de

x

qui contient deux occurrences (éventuellement chevauchantes) du préfixe de longueur

m

.

Le lien entre ces ceux définitions est donné par la relation :

i c (m, x) + m = r (m, x)

.

Les relations entre les valeurs de ces divers indices sont les suivantes^[28] :

i c (m, x) \leq n c (m, x) \leq c (m, x) \leq R (m, x) + 1 - m

.

Exemples

Complexite pour Fibonacci
m	ic	r
4	5	9
5	5	10
6	5	11
7	8	15

Pour le mot de Fibonacci $f = a b a a b a b a a b a a b \dots$ , on a

i c (m, f) = F_{k}

pour

F_{k} - 2 < m \leq F_{k + 1} - 2

et

k \geq 3

.

Ici, $F_{k}$ est le $k$ -ième nombre de Fibonacci^[29]. Comme on voit sur la table ci-dessus, on a en effet $5 = i c (6, f) = F_{4}$ et $8 = i c (7, f) = F_{5}$ . La fonction est donc constante entre deux nombres de Fibonacci consécutifs (ajustés).

Pour le mot de Thue-Morse $t = 0110100110010110 \dots$ , une formule similaire de constance est vérifiée : on a

i c (m, t) = 3 \cdot 2^{k - 1}

pour

2^{k - 1} < m \leq 2^{k}

.

Propriétés

Les mots ultimement périodiques sont caractérisées avec cette nouvelle mesure de complexité comme suit : Modèle:Théorème

Les mots sturmiens admettent la caractérisation suivante : Modèle:Théorème

Une propriété de transcendance

Modèle:Théorème

Notes et références

↑ ^1,0 et ^1,1 Modèle:Harvsp.
↑ Modèle:Article.
↑ ^3,0 et ^3,1 Modèle:Article
↑ Modèle:Article.
↑ Modèle:Article.
↑ Ne pas confondre avec la complexité « ordinaire » qui, dans ce contexte, est notée $p_{x} (n)$
↑ Modèle:Article
↑ Erreur de référence : Balise <ref> incorrecte : aucun texte n’a été fourni pour les références nommées PalComp
↑ Modèle:Harvsp.
↑ Modèle:Article.
↑ C'est un théorème qui apparaît pour la première fois dans : Modèle:Article
↑ On trouve aussi la terminologie mot plein, notamment dans l'article de Modèle:Harvsp.
↑ L'article Modèle:Harvsp pose ce problème.
↑ Conjecture énoncée dans l'article Modèle:Harvsp.
↑ ^15,0 et ^15,1 Modèle:Harvsp.
↑ ^16,0 et ^16,1 Modèle:Article.
↑ Modèle:Article.
↑ Modèle:Harvsp.
↑ Modèle:Harvsp.
↑ ^20,0 ^20,1 et ^20,2 Erreur de référence : Balise <ref> incorrecte : aucun texte n’a été fourni pour les références nommées CF2007
↑ Erreur de référence : Balise <ref> incorrecte : aucun texte n’a été fourni pour les références nommées F2003
↑ Erreur de référence : Balise <ref> incorrecte : aucun texte n’a été fourni pour les références nommées F2005
↑ Frid note ce mot $x_{d}^{k}$ , mais cela rend la lecture bien difficile.
↑ C'est la version la plus simple de l'assertion que $y$ appartient au système dynamique engendré par $x$ , c'est-à-dire à la fermeture, pour la topologie sur les suites infinies, de l'ensemble des décalés du mot $x$ .
↑ Modèle:Article.
↑ Modèle:Article
↑ Modèle:Article
↑ ^28,0 ^28,1 et ^28,2 Modèle:Article
↑ ^29,0 et ^29,1 Modèle:Article.

[RSZ11-1] 1,0 et ^1,1 Modèle:Harvsp.

[2] Modèle:Article.

[RigoSalimov2015-3] 3,0 et ^3,1 Modèle:Article

[4] Modèle:Article.

[LejeuneLeroy2020-5] Modèle:Article.

[6] Ne pas confondre avec la complexité « ordinaire » qui, dans ce contexte, est notée $p_{x} (n)$

[CassaigneFici2017-7] Modèle:Article

[PalComp-8] Erreur de référence : Balise <ref> incorrecte : aucun texte n’a été fourni pour les références nommées PalComp

[9] Modèle:Harvsp.

[RubinchikShur2016-10] Modèle:Article.

[11] C'est un théorème qui apparaît pour la première fois dans : Modèle:Article

[12] On trouve aussi la terminologie mot plein, notamment dans l'article de Modèle:Harvsp.

[13] L'article Modèle:Harvsp pose ce problème.

[14] Conjecture énoncée dans l'article Modèle:Harvsp.

[BHNR-15] 15,0 et ^15,1 Modèle:Harvsp.

[LabbéPelantová2017-16] 16,0 et ^16,1 Modèle:Article.

[AgoBašić2021-17] Modèle:Article.

[18] Modèle:Harvsp.

[19] Modèle:Harvsp.

[CF2007-20] 20,0 ^20,1 et ^20,2 Erreur de référence : Balise <ref> incorrecte : aucun texte n’a été fourni pour les références nommées CF2007

[F2003-21] Erreur de référence : Balise <ref> incorrecte : aucun texte n’a été fourni pour les références nommées F2003

[F2005-22] Erreur de référence : Balise <ref> incorrecte : aucun texte n’a été fourni pour les références nommées F2005

[23] Frid note ce mot $x_{d}^{k}$ , mais cela rend la lecture bien difficile.

[24] C'est la version la plus simple de l'assertion que $y$ appartient au système dynamique engendré par $x$ , c'est-à-dire à la fermeture, pour la topologie sur les suites infinies, de l'ensemble des décalés du mot $x$ .

[25] Modèle:Article.

[Moothathu2012-26] Modèle:Article

[NicholsonRampersad2016-27] Modèle:Article

[MP2020-28] 28,0 ^28,1 et ^28,2 Modèle:Article

[BK-29] 29,0 et ^29,1 Modèle:Article.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

Complexité d'un mot

Complexité en facteurs

Justification de la terminologie

Complexité minimale

Complexité de mots morphiques

Mots purement morphiques

Exemples

Mots morphiques

Exemple

Complexité et transcendance

Complexité abélienne

Mots de complexité abélienne maximale

Mot de Thue-Morse

Mots sturmiens

Complexité binomiale

Définition

Exemples

Complexité binomiale du mot de Thue-Morse

Complexité binomiale des mots sturmiens

Complexité cyclique

Définition

Mots sturmiens

Mot de Thue-Morse

Complexité en palindromes

Définition

Comparaison des deux mesures de complexité

Mots riches en palindromes

Mots à défaut positif

Complexité de Lie

Exemples

Propriétés

Complexité arithmétique

Définition et exemples

Propriétés

Suites de complexité arithmétique linéaire

Suites de complexité arithmétique maximale

Complexité non-répétitive

Définitions

Exemples

Propriétés

Une propriété de transcendance

Notes et références

Références

Bibliographie

Voir aussi

Menu de navigation

Rechercher