Complexité d'un mot

De testwiki
Aller à la navigation Aller à la recherche

Modèle:Article principal

La complexité combinatoire d'un mot ou plus simplement la complexité d'un mot ou d'une suite est un moyen de mesurer, en combinatoire et en mathématique, et spécialement en combinatoire des mots, divers paramètres d'un mot qui expriment combien il est « compliqué ».

La complexité combinatoire est une mesure différente de la complexité algorithmique ou complexité de Kolmogorov. Ici, on considère le plus souvent la complexité en facteurs (en anglais « subword complexity »).

Parmi les mots distingués dans les diverses mesures de complexité combinatoire, il y a ceux dont la complexité est particulièrement basse. Un mot de faible complexité est un mot infini dont la fonction de complexité est « à croissance lente »; on entend par là une fonction qui croît linéairement, ou polynomialement, en tout cas nettement moins vite qu'une exponentielle. Il existe de nombreuses familles de mots infinis, comme les mots automatiques, les mots morphiques, les mots sturmiens et les mots épisturmiens, qui ont une croissance lente en ce sens.

Une application importante de l'étude des mots infinis à croissance lente est à la théorie des nombres : les mots infinis qui représentent le développement d'un nombre sont à croissance lente si le nombre est rationnel ou transcendant, et plus rapide si le nombre est algébrique irrationnel. On dispose ainsi d'un moyen assez général pour construire des nombres transcendants.

La complexité d'un mot fini ou infini peut se mesurer aussi par le nombre de palindromes; on parle alors de complexité palindromique. Ces deux notions de complexité combinatoire sont liées. Encore une autre mesure de complexité est la complexité abélienne d'un mot.

Complexité en facteurs

La fonction de complexité ou complexité en facteurs d'un mot fini ou infini x est la fonction

ncx(n)

qui, pour chaque entier n, donne le nombre cx(n) de facteurs (ou blocs) distincts de longueur n dans ce mot. On trouve aussi la notation px(n) ou P(x,n) pour la valeur en n de cette fonction.

Premier exemple. Le mot infini

u=01(10)ω=01101010.

Il a pour complexité cu(0)=1,cu(1)=2,cu(2)=3 et cu(n)=4 pour n3

Deuxième exemple. Le mot infini de Champernowne

x=0110111001011101111000.

Ce mot est obtenu en concaténant les développements binaires des entiers naturels. Pour tout n, chacun des 2n mots de longueur n est facteur de x, donc la complexité du mot de Champernowne est 2n.

Justification de la terminologie

L'entropie topologique d'un mot infini x est la limite

limn1nlogcx(n)

Cette limite existe, car on a

cx(n+m)cx(n)cx(m)

donc la fonction logcx(n) est sous-additive et la limite ci-dessus existe par le lemme de Fekete. Les mots de faible complexité sont les mots d'entropie nulle.

Complexité minimale

Pour un mot infini x, un résultat dû à Ethan M. Coven et Gustav Hedlund dit que si cx(n)n pour un entier n, alors le mot x est ultimement périodique. Plus précisément, on a:

Modèle:Théorème

Les mots infinis apériodiques de complexité minimale sont binaires (sur un alphabet à deux lettres), et ont une fonction de complexité égale à n+1. Ce sont les mots sturmiens. Le plus connu des mots sturmiens est le mot de Fibonacci.

Complexité de mots morphiques

Mots purement morphiques

Le théorème suivant donne une classification des fonctions de complexités pour les mots purement morphiques.

Modèle:Théorème

Exemples

Les mots ultimement périodiques sont de complexité ultimement constante.

Le mot de Fibonacci est sturmien et morphique. Il est de complexité linéaire.

Un mot de complexité en Θ(n2) : le morphisme

aabbbccc

engendre, à partir de la lettre a, le mot infini :

abbcbc2bc3bcn

Sa complexité est en Θ(n2).

Un mot de complexité en Θ(nlogn) : le morphisme

aabcbbbcccc

engendre, à partir de la lettre a, le mot infini :

abcb2c3b4c9b2nc3n

Sa complexité est Θ(nlogn).

Un mot de complexité en Θ(nloglogn) : le morphisme

aababbbb

engendre, à partir de la lettre a, le mot infini :

(aba)b3(aba)b7(aba)b3(aba)b15(aba)b3(aba)b7(aba)b3(aba)b31

La suite des exposants des b est :1,3,1,7,1,3,1,15,1,3,1,7,1,3,1,31. Sa complexité est Θ(nloglogn) (ça demande un peu de calcul !).

Mots morphiques

Les fonctions de complexité des mots morphiques ne sont pas encore complètement caractérisées en 2010 (voir Modèle:Harvsp). On sait : Modèle:Théorème On sait que pour tout entier m1, il existe effectivement un mot infini binaire morphique x tel que cx(n)=Θ(nnm).

Exemple

Soit A={a,b0,b1,,bm} un alphabet à m+2 lettres et considérons le morphisme f:A*A* défini par

f(a)=abmf(bi)=bibi1(i=1,,m)f(b0)=b0

et soit g:A*{0,1}* donné par g(bi)=0 pour i=0,,m1, g(br)=1, et g(a)=ε. On voit que

x=g(fω(a))=g(abrf(br)f2(br))=10e010e110e210e3)

pour des entiers ei, et on peut prouver que la suite de ei croît comme im/m! d'où l'on peut déduire que cx(n)nnm.

Complexité et transcendance

Il y a un lien étroit entre la transcendance d'un nombre réel et la complexité du mot infini qu'est son développement dans une base donnée. Soit b>1 un entier. Pour tout nombre réel ξ avec 0<ξ<1, il existe un mot infini unique

x=a0a1a2an

à éléments dans l'ensemble {0,1,,b1} tel que

ξ=n=0anbn+1=0,a0a1a2an

avec la condition supplémentaire que x ne se termine pas par une infinité de b1. Par exemple, en base 10, on a

3/7=0,(428571)ω.

Réciproquement, un développement en base b décrit un nombre réel unique. Un nombre réel est rationnel si et seulement si son développement est ultimement périodique.

On note

c(ξ,b,n)

le nombre de facteurs de longueur n du mot infini x qui est le développement de ξ en base b, en d'autre termes c(ξ,b,n)=cx(n). On dira pour faire vite que c'est la complexité de ξ, au lieu de dire la complexité du développement de ξ. On a alors le théorème suivant Modèle:Théorème La conclusion du théorème dit que la fonction de complexité de ξ croît plus vite que linéairement. La conséquence immédiate de ce théorème est que si c(ξ,b,n)=O(n), et si ξ est irrationnel, alors ξ est transcendant. Or, il existe de nombreux mots infinis de complexité linéaire, et tous ces mots infinis représentent donc des nombres soit rationnels, soit transcendants.

Par exemple, tous les nombres irrationnels dont le développement est une suite automatique sont transcendants. Tous les nombres dont le développement est un mot sturmien sont transcendants. La même conclusion vaut pour les mots épisturmiens non ultimement périodiques.

Complexité abélienne

Modèle:Loupe

La complexité abélienne d'un mot fini ou infini est la fonction qui compte le nombre de facteurs de longueur donnée dans ce mot, à permutation de lettres près. C'est une autre mesure de la complexité combinatoire d'une suite.

Exemple. Les 7 facteurs de longueur 6 du mot de Fibonacci 010010100100101001010 sont Modèle:Indente Ces facteurs se regroupent, par une permutation des lettres, en deux classes : les cinq mots contenant deux occurrences de 1, et les deux qui en contiennent trois. La complexité abélienne prend donc la valeur 2.

Mots de complexité abélienne maximale

On note αx la fonction complexité abélienne d'un mot x.

Propriété.- La complexité abélienne d'un mot infini x sur k lettres vérifie Modèle:Indente pour tout n1.

Cette borne est atteinte par la suite de Champernowne par exemple.

Mot de Thue-Morse

Le mot de Thue-Morse t a la fonction de complexité suivante :

αt(n)={2n impair 2n>0 pair. 

En fait, une sorte de réciproque est vraie aussi[1]: Si un mot infini binaire récurrent a la même fonction de complexité et la même fonction de complexité abélienne que le mot de Thue-Morse, alors il a les mêmes facteurs.

Mots sturmiens

Un mot sturmien est un mot infini binaire qui a exactement n+1 facteurs de longueur n, pour tout entier naturel n. L'exemple paradigmatique de mot sturmien est le mot de Fibonacci.

Parmi les nombreuses propriétés des mots sturmiens, on a la caractérisation[1] :

Propriété.- La complexité abélienne d'un mot sturmien x est constante et égale à 2. Réciproquement, un mot apériodique qui a complexité abélienne constante égale à 2 est sturmien.

Complexité binomiale

Deux mots sont dits k-binomialement équivalents lorsqu'ils possèdent les mêmes sous-mots de longueur au plus k avec les mêmes multiplicités. Cette mesure est un raffinement de l'équivalence abélienne et de la congruence de Simon[2]. La complexité k-binomiale d'un mot infini x est, pour tout entier n, le nombre de classes, pour cette relation d'équivalence, de l'ensemble des facteurs de longueur n apparaissant dans x[3]Modèle:,[4]. La complexité k-binomiale du mot de Thue-Morse, bien que le mot de Thue-Morse soit apériodique, ne prend que deux valeurs[5].

Définition

Formellement, deux mots u et v sont k-binomialement équivalents si

(ux)=(vx)

pour tout mot x de longueur au plus k. Dans cette définition,

(ux)

est le nombre d'occurrences du mot x comme sous-mot de u. Les coefficients binomiaux de mots ont des propriétés proches de celles des nombres. Ainsi, on a par exemple :

(psz)=xy=z(px)(sy)

Exemples

Les quatre mots ababbba,abbabab,baabbab et babaabb sont 2-binomialement équivalents. Si w est l'un de ces quatre mots, on a en effet les coefficients suivants :

(wa)=3,(wb)=4 et (waa)=3,(wab)=7,(wba)=5,(wab)=6.

Ces mots ne sont pas 2-binomialement équivalents. Par exemple, on a

(ababbbaaab)=3 et (abbababaab)=4.

En effet, dans ce deuxième mot, le sous-mot aab apparaît en 4 positions :

a_bba_b_ab,a_bba_ab_,a_bbaa_b_,abbab_ab_.

Pour k=1, l'équivalence binomiale coïncide avec l'équivalence commutative.

On note ukv le fait que u et v sont k-binomialement équivalents. La relation est compatible avec la concaténation :

ukv  implique  puskpvs pour tous mots p,s.

Complexité binomiale du mot de Thue-Morse

On note cx(n) la complexité d'un mot x, c'est-à-dire le nombre de facteur de longueur n apparaissant dans x, et on note bx,k(n) ou plus simplement bx(n)la complexité k-binomiale de x, c'est-à-dire le nombre classes de sous-mots k-équivalents de longueur n du mot x. Pour le mot de Thue-Morse, on a le résultat suivant :

Modèle:Théorème

Ainsi, pour n2k, la complexité k-binomiale du mot de Thue-Morse ne prend que 2 valeurs ; de plus, la deuxième valeur est égale à ct(2k1).

Complexité binomiale des mots sturmiens

La complexité k-binomiale d'un mot sturmien est égale à sa complexité en facteur. Plus précisément, on Modèle:Théorème Pour k=1, la complexité binomiale est égale à la complexité abélienne, et vaut donc 2. Pour des valeurs plus grandes de k, on montre que deux facteurs distincts de même longueur d'un mot sturmien ne sont jamais k-binomialement équivalents[3].

Complexité cyclique

Définition

La complexité cyclique d’un mot infini x est la fonction cx(n)[6] qui compte le nombre de classes de conjugaison (ou mots circulaires, ou colliers) de facteurs de longueur n dans le mot x : pour être tout à fait précis : cx(n) est le nombre de classes de conjugaison que rencontre l’ensemble des facteurs de longueur n[7].

Exemple. Les cinq facteurs de longueur 4 du mot de Fibonacci infini 010010100100101001010 sont Modèle:Indente Ces facteurs se regroupent, par permutation circulaire, en deux classes : les trois mots forment contenant une seule occurrence de 1, et les deux qui en contiennent deux. La complexité cyclique prend donc la valeur 2.

On a ax(n)cx(n)px(n), où ax est la complexité abélienne et px(n) est la complexité ordinaire. La complexité en facteurs, la complexité abélienne et la complexité cyclique peuvent être vues comme des actions de divers sous-groupes du groupe symétrique sur les indices d’un mot fini, à savoir respectivement le sous-groupe trivial, le groupe symétrique en entier et le sous-groupe cyclique engendré par la permutation (1,2,…,n).

Théorème : Un mot est ultimement périodique si et seulement si sa complexité cyclique est bornée.

Ceci est l’analogue du théorème de Morse-Hedlund.

Mots sturmiens

Propriété : Soient x et y deux mots infinis de même complexité cyclique. Si l’un des deux mots est sturmien, alors l’autre l’est également et, à un renommage des lettres près, ils ont même ensemble de facteurs.

La valeur minimale de la fonction de complexité cyclique d’un mot non périodique est 2, car si tous les facteurs de longueur n d’un mot sont conjugués, ce mot est périodique. En particulier, si x est sturmien, alors lim infncx(n)=2, mais ceci ne caractérise pas les mots sturmiens.

Mot de Thue-Morse

Pour le mot de Thue-Morse t la fonction de complexité cyclique n'est pas bornée : on a lim infnct(n)=+,

Complexité en palindromes

Définition

La fonction de complexité en palindromes ou complexité palindromique[8] d'un mot fini ou infini x est la fonction

npx(n)

qui, pour chaque entier n, donne le nombre px(n) de facteurs (ou blocs) distincts de longueur n dans ce mot qui sont des palindromes. Bien entendu, on a toujours px(n)cx(n).

Exemple Le mot x=01101001, préfixe du mot de Prouhet-Thue-Morse a les facteurs 9 palindromes

ε,0,1,00,11,010,101,0110,1001,

et px(0)=1, et px(1)=px(2)=px(3)=px(4)=2.

Exemple Le mot de Fibonacci infini f=0100101001001 a les facteurs palindromes

ε,0,1,00,010,101,1001,,

et on peut démontrer que

pf(n)={1si n est pair;2sinon.

Cette propriété est caractéristique des mots sturmiens.

Comparaison des deux mesures de complexité

Soit x un mot infini, et soit px(n) sa complexité en palindromes et cx(n) sa complexité en facteurs. Bien entendu, on a toujours px(n)cx(n). Il y a une borne bien meilleure[9] :

px(n)16ncx(n+n4)

Cette propriété peut être raffinée dans le cas de mots infinis dont l'ensemble des facteurs est fermé par image miroir, c'est-à-dire tel que pour tout facteur u, l'image miroir u est encore facteur.

Modèle:Théorème

Exemple. Pour tout mot sturmien, on a c(n)=n+1. Ainsi, le membre droit de l'équation s'évalue en c(n+1)c(n)+2=3. Il en résulte que p(n)+p(n+1)3. On verra que dans ce cas, on peut remplacer l'inégalité par une égalité. On a donc p(n)+p(n+1)=3, donc le nombre de palindromes est alternativement 1 et 2, comme déjà dit plus haut.

Le nombre moyen de facteurs palindromes distincts dans un mot aléatoire de longueur n est θ(n)[10].

Mots riches en palindromes

Soit w un mot fini, et soit Pal(w) l'ensemble des facteurs de w qui sont des palindromes, et soit 𝒫(w) le nombre d'éléments de Pal(w). On sait[11] que pour tout mot fini w, on a

𝒫(w)|w|+1.

Un mot w est riche en palindromes[12] si l'inégalité est une égalité, donc si

𝒫(w)=|w|+1.

De même, un mot infini est riche en palindromes si tous ses facteurs sont riches en palindromes. Les mots sturmiens, épisturmiens, et plus généralement les mots infinis qui codent des échanges d'intervalles symétriques sont riches. Le mot de Thue-Morse n'est pas riche. Le préfixe 01101001 de longueur 8 du mot de Thue-Morse et riche puisqu'il a 9 facteurs palindromes. Un examen exhaustif montre que tous les mots binaires de longueur au plus 8 sont riches. Des définitions équivalentes ont été trouvées pour les mots riches :

Modèle:Théorème

Exemple. Prenons le mot infini de Fibonacci

f=010010100100101001010

qui est sturmien donc riche. Prenons par exemple le facteur w=100100101001. Les suffixes palindromes de ce mot sont 1,1001 et 100101001. Les deux premiers ont plusieurs occurrences dans w, le troisième, le plus long, n'a qu'une seule occurrence. Le préfixe 01001010 a trois suffixes palindromes non vides, à savoir 0, 010, et 01010. Le dernier est le seul qui est unirécurrent. Pour le facteur 1001, les deux mots de retour complets sont 1001001 et 100101001. Ils sont tous deux palindromes. Enfin, comme c(n)=n+1, on a c(n+1)c(n)+2=3 pour tout n, et d'autre part le mot de Fibonacci a deux facteurs palindromes de longueur paire et un seul de longueur impaire pour toute longueur, donc p(n)+p(n+1)=3.

Modèle:Théorème Les mêmes arguments donnent aussi une majoration pour le nombre de facteurs d'un mot riche en palindromes : Modèle:Théorème

On peut se demander[13] comment sont les mots infinis qui ne sont pas riches. On appelle défaut ou défaut palindromique d'un mot w le nombre 𝒟(w) défini par

𝒟(w)=1+|w|𝒫(w)

Ce nombre est toujours positif ou nul. Pour un mot infini x, on pose

𝒟(x)=max{𝒟(w)w facteur de x}.

Ce défaut est nul si le mot est riche. Il est utile, pour simplifier l'énoncé qui suit, de poser

Tw(n)=cw(n+1)cw(n)+2pw(n)pw(n+1).

Pour tout mot fini w de longueur k, on a

2𝒟(w)=n=0kTw(n).

La conjecture[14] selon laquelle l'équation

2𝒟(x)=n=0Tx(n)

est vraie pour tout mot infini x a été prouvée. Le théorème s'énonce comme suit : Modèle:Théorème Cela signifie aussi que si l'une des deux valeurs 𝒟(x) ou n=0Tx(n) est infinie, l'autre l'est également.

Mots à défaut positif

Le défaut d'un mot peut être nul, positif non nul, ou infini si le mot lui-même est infini. Lorsque le mot a une forme particulière où construit au moyen d'un mécanisme bien connu, on peut donner des indications sur sa complexité en palindromes. Ceci est le cas de mots purement morphiques engendrés par des morphismes primitifs : un morphisme f est primitif si sa matrice d'incidence M(f) (dont le coefficient d'indice a,b donne le nombre le nombre d'occurrences de la lettre a dans le mot f(b)) est primitive. Le morphisme est primitif si et seulement s’il existe un entier k tel que toute lettre a une occurrence dans le mot fk(b), pour toute lettre b de l’alphabet. On considère ici les mots purement morphiques qui sont point fixes d'un morphisme primitif.

Pour le mot de Fibonacci par exemple, on a 𝒟(u)=0, et pour le mot de Thue-Morse, 𝒟(u)=+. Tous les deux sont des mots purement morphiques points fixes d'un morphisme primitif.

Il existe de mots points fixes de morphismes primitifs de défaut k pour tout entier naturel k. mais ce sont des mots périodiques. Voici un exemple[15] : soit k2 un entier naturel, et soit

zk=01k01k1001k101k0.

Par exemple z2=0110100100110. On peut montrer que le mot infini périodique zkω a un défaut palindromique égal à k. Ce mot est point fixe du morphisme 0zk,1zk. Les auteurs de l’article[15] ont formulé la conjecture suivante :

Modèle:Théorème

La conjecture est donc que si un mot a un défaut strictement positif et fini, il est périodique. La conjecture est vérifiée dans le cas d’un alphabet binaire[16], mais elle est fausse pour des alphabets plus grands. Un contre-exemple est le mot infini engendré par le morphisme

aaabcacba,baa,ca

donné par Michelangelo Bucci et Élise Vaslet[16]. D'autres résultats ont été donnés par Kristina Ago, Bojan Bašić, Stefan Hačko et Danijela Mitrović[17].

Complexité de Lie

La complexité de Lie d'un mot infini à droite w sur un alphabet A est la fonction Lw dont la valeur Lw(n), pour un entier naturel n, est le nombre de classes de conjugaison (pour le décalage cyclique) de facteurs de longueur n de w avec la propriété que chaque élément de la classe de conjugaison apparaît dans w.

Exemples

1.- Soit 𝐭 le mot de Thue-Morse, point fixe du morphisme qui envoie 0 sur 01 et 1 sur 10. On a :

L𝐭(n)={1si n=0 ou n=2k et k32si n=1,4 ou n=32kpour k03si n=20sinon .

Ceci est en accord avec le fait que les seuls carrés dans le mot de Thue-Morse ont longueur 2k ou 32k .

Soit 𝐟 le mot de Fibonacci, point fixe du morphisme qui envoie 0 sur 01 et 1 sur 0. Les nombres de Fibonacci sont définies par  F0=0,F1=1 et Fn=Fn1+Fn2. Alors

L𝐟(n)={1si n=0 ou n=Fk ou n=2Fk1 pour k42si n=1,20sinon .

Propriétés

On note pw(n) le nombre de facteurs de longueur n du mot infini w. L'observation principale est la formule suivante :

Modèle:Théorème

Pour un mot sturmien qui a la propriété que pw(n)=n+1, le membre droit de l'inégalité est 2.

Il résulte de la formule que la fonction de complexité de Lie est uniformément bornée pour les mots dont la complexité en facteurs est linéaire. Il en résulte aussi comme corollaire que les mots infinis dont la complexité en facteurs est linéaire ont au plus un nombre fini de facteurs primitifs y avec la propriété que yn est à nouveau un facteur pour tout n.

On peut montrer que la fonction de complexité de Lie d'une suite k-automatique est également k-automatique[18].

Les démonstrations de Bell et Shallit sont algébriques, Alessandro De Luca et Gabriele Fici[19] donnent des preuves combinatoires.

Complexité arithmétique

La complexité arithmétique d'un mot infini est la fonction qui compte le nombre de mots de longueur donnée composés de lettres apparaissant à des positions en progression arithmétique (et non seulement consécutives).

C'est une autre mesure de la complexité combinatoire des mots infinis qui est une extension de la complexité en facteurs. Les résultats sont moins spectaculaires que ceux concernant la complexité en facteurs.

Définition et exemples

Formellement, étant donné un mot infini

x=a0a1an,

où les ai sont des lettres, on appelle clôture arithmétique de x l'ensemble

A(x)={aiai+dai+2dai+kdd1,k0}.

La complexité arithmétique de x est la fonction ax qui à n associe le nombre ax(n) de mots de longueur n dans A(x).

Exemples

Il a été démontré[20] que af(n)=θ(n3). Les premières valeurs sont données dans la table suivante[20] : Modèle:Indente

Propriétés

Les résultats généraux sont plus rares que pour la complexité en facteurs.

Mots sturmiens. Pour les mots sturmiens, les résultats sont les suivants[20] :

  • La complexité arithmétique d'un mot sturmien est majorée par O(n3).
  • Pour tout mot sturmien de pente entre 1/3 et 2/3, la complexité est θ(n3).

Pour les mots sturmiens de pente comprise entre 2/5 et 3/5, il existe une formule explicite, un peu compliquée à expliquer.

Mots symétriques. Une autre catégorie de mots pour lesquels on connaît la complexité arithmétique est celle des mots purement morphiques engendrés par des morphismes symétriques. Un morphisme f:A*A* est symétrique s'il existe une permutation circulaire σ sur A qui commute avec f, donc telle que Modèle:Indente pour toute lettre a. L'exemple typique est le morphisme de Thue-Morse, ou le morphisme ternaire Modèle:Indente associé à la permutation (012). Les mots de engendrés par des morphismes symétriques sont eux-mêmes appelés des mots symétriques[21]. On a la propriété suivante : Modèle:Théorème Voici deux cas particuliers :

  • Si x est un mot symétrique périodique, alors ax(n)=q2 pour tout n2.
  • Si x est symétrique non périodique et si q est un nombre premier, alors ax(n)=qn pour tout n. C'est le cas pour le mot de Prouhet-Thue-Morse.

Suites de complexité arithmétique linéaire

Quelles sont les suites de faible complexité arithmétique ? Anna Frid[22] a caractérisé les mots infinis de complexité arithmétique linéaire. Pour formuler cette caractérisation, il faut donner quelques définitions. D'abord une notation. Pour un mot infini

x=x1x2xn

où les xi sont des lettres, on note x(k,d)[23] le mot commençant en xk et formé des lettres de x prises à intervalle d>0, formellement

x(k,d)=xkxk+dxk+2dxk+nd

Par exemple, pour le mot de Prouhet-Thue-Morse

t=0110100110010110

on a t(1,2)=t(1,4)=t(4,4)=t. Un mot x est dit canoniquement p-régulier si x(k,pm) est périodique pour tout m>0 et tout k avec 1k<pm. Par exemple, la suite de Prouhet-Thue-Morse n'est pas canoniquement 2-régulière. En revanche, la suite de pliage de papier

z=00 10 01 10 00 11 01 10

est canoniquement 2-régulière. On peut s'en convaincre pour les petites valeurs de m. On a par exemple z(1,2)=010101=z(2,4) et z(1,4)=000,z(3,4)=111. Il reste une définition. Un mot y est dans l'orbite d'un mot x si l'ensemble des facteurs de y est contenu dans l'ensemble des facteurs de x[24]. L'énoncé est le suivant

Modèle:Théorème

Exemple. Nous avons déjà dit que le mot des pliages est canoniquement 2-régulier. On a de plus z(2,2)=z(4,4)=z, donc la deuxième condition est remplie également.

Dans cet article, A. Frid donne une autre caractérisation des suites de complexité linéaire par des suites dites de Toeplitz d'un type spécifique.

Suites de complexité arithmétique maximale

Konieczny et Müllner[25] classifient les suites automatiques x sur un alphabet fini A avec la propriété que chaque mot sur A apparaît dans x le long d'une progression arithmétique. Plus généralement, ils obtiennent une formule asymptotique pour la complexité arithmétique (et même polynomiale) des sous-mots d'une séquence automatique donnée.

Complexité non-répétitive

La complexité non-répétitive et la complexité non-répétitive initiale sont deux mesures de complexité introduites par T. K. Subrahmonian Moothathu[26], étudiée par Jeremy Nicholson et Narad Rampersad[27], et par Medková, Pelantová et Vandomme[28], et considérées par Yann Bugeaud et Dong Han Kim[29] sous une forme un peu différente. Ces mesures sont liées à l'indice de récurrence et de récurrence initiale dans un mot infini.

Définitions

Les notations varient avec les auteurs. Soit x un mot infini et m un entier.

La complexité non-répétitive initiale est définie par Moothathu comme suit :

ic(m,x) est la longueur du plus court préfixe de x qui ne contient pas le début d'une deuxième occurrence du préfixe de longueur m.

La complexité non-répétitive est par définition[28] :

nc(m,x) est la longueur du plus court facteur de x qui ne contient pas le début d'une deuxième occurrence du préfixe de longueur m.

L'indice de récurrence est :

R(m,x) est la longueur du plus court facteur de x qui contient tous les facteurs de longueur m.

L'indice de récurrence initiale est :

R(m,x) est la longueur du plus court préfixe de x qui contient tous les facteurs de longueur m.

Ces deux dernières mesures sont les contraposées logiques des indices de non-répétivité.

Bugeaud et Kim définissent une fonction notée r(m,x) par :

r(m,x) est la longueur du plus court préfixe de x qui contient deux occurrences (éventuellement chevauchantes) du préfixe de longueur m.

Le lien entre ces ceux définitions est donné par la relation :

ic(m,x)+m=r(m,x).

Les relations entre les valeurs de ces divers indices sont les suivantes[28] :

ic(m,x)nc(m,x)c(m,x)R(m,x)+1m.

Exemples

Complexite pour Fibonacci
m ic r
4 5 9
5 5 10
6 5 11
7 8 15

Pour le mot de Fibonacci f=abaababaabaab, on a

ic(m,f)=Fk pour Fk2<mFk+12 et k3.

Ici, Fk est le k-ième nombre de Fibonacci[29]. Comme on voit sur la table ci-dessus, on a en effet 5=ic(6,f)=F4 et 8=ic(7,f)=F5. La fonction est donc constante entre deux nombres de Fibonacci consécutifs (ajustés).

Pour le mot de Thue-Morse t=0110100110010110, une formule similaire de constance est vérifiée : on a

ic(m,t)=32k1 pour 2k1<m2k.

Propriétés

Les mots ultimement périodiques sont caractérisées avec cette nouvelle mesure de complexité comme suit : Modèle:Théorème

Les mots sturmiens admettent la caractérisation suivante : Modèle:Théorème

Une propriété de transcendance

Modèle:Théorème

Notes et références

Références

Modèle:Références

Bibliographie

Voir aussi

Modèle:Portail

  1. 1,0 et 1,1 Modèle:Harvsp.
  2. Modèle:Article.
  3. 3,0 et 3,1 Modèle:Article
  4. Modèle:Article.
  5. Modèle:Article.
  6. Ne pas confondre avec la complexité « ordinaire » qui, dans ce contexte, est notée px(n)
  7. Modèle:Article
  8. Erreur de référence : Balise <ref> incorrecte : aucun texte n’a été fourni pour les références nommées PalComp
  9. Modèle:Harvsp.
  10. Modèle:Article.
  11. C'est un théorème qui apparaît pour la première fois dans : Modèle:Article
  12. On trouve aussi la terminologie mot plein, notamment dans l'article de Modèle:Harvsp.
  13. L'article Modèle:Harvsp pose ce problème.
  14. Conjecture énoncée dans l'article Modèle:Harvsp.
  15. 15,0 et 15,1 Modèle:Harvsp.
  16. 16,0 et 16,1 Modèle:Article.
  17. Modèle:Article.
  18. Modèle:Harvsp.
  19. Modèle:Harvsp.
  20. 20,0 20,1 et 20,2 Erreur de référence : Balise <ref> incorrecte : aucun texte n’a été fourni pour les références nommées CF2007
  21. Erreur de référence : Balise <ref> incorrecte : aucun texte n’a été fourni pour les références nommées F2003
  22. Erreur de référence : Balise <ref> incorrecte : aucun texte n’a été fourni pour les références nommées F2005
  23. Frid note ce mot xdk, mais cela rend la lecture bien difficile.
  24. C'est la version la plus simple de l'assertion que y appartient au système dynamique engendré par x, c'est-à-dire à la fermeture, pour la topologie sur les suites infinies, de l'ensemble des décalés du mot x.
  25. Modèle:Article.
  26. Modèle:Article
  27. Modèle:Article
  28. 28,0 28,1 et 28,2 Modèle:Article
  29. 29,0 et 29,1 Modèle:Article.