Motif inévitable

De testwiki
Aller à la navigation Aller à la recherche

En informatique théorique, en combinatoire, et notamment en combinatoire des mots, un motif inévitable est un motif (au sens défini ci-dessous) qui apparaît dans tout mot assez long. Un motif est évitable, sinon. Par exemple, le motif xx est inévitable sur deux lettres et évitable sur trois lettres, parce que tout mot assez long sur deux lettres contient un carré (composé de deux facteurs consécutifs égaux), et qu'il existe des mots arbitrairement longs sans carré sur trois lettres.

Les motifs évitables et inévitables généralisent la notion de répétition dans les mots, et leur étude s'inscrit dans celle des régularités dans les mots.

Définitions

Soit A un alphabet, et soit E un autre alphabet, appelé l'alphabet des symboles de motifs ou des variables. Un motif est un mot non vide sur E. Un mot v sur A est une instance d'un motif p s'il existe un morphisme non effaçant f:E+A+ tel que f(p)=v. Un mot w évite le motif p si aucun facteur v de w n'est une instance de p. Une définition équivalente est la suivante : le langage du motif p est l'ensemble des mots f(p), où f est comme ci-dessus un morphisme non effaçant; un mot w évite le motif p si aucun facteur de w n'est dans le langage de p. Si w n'évite pas le motif p, on dit que w rencontre p ou contient une instance du motif p[1].

Par exemple, le mot aabaac (où a,b,c sont des lettres de A) rencontre le motif xyx (x et y sont des lettres de E); en effet, le facteur aba de aabaac est l'image de xyx par le morphisme qui envoie x sur a et y sur b. Le facteur aabaa aussi est dans le langage du motif xyx : il est l'image de xyx par le morphisme qui envoie x sur aa et y sur b. Le mot abac évite le motif xx, puisqu'il ne contient pas de carré, c'est-à-dire pas deux facteurs consécutifs égaux[2].

Un motif p est évitable s'il existe une infinité de mots sur un alphabet fini qui évitent p. De manière équivalente, un motif est évitable s'il existe un mot infini qui évite p. Dans le cas contraire, le motif p est dit inévitable[2]. Par exemple, le motif xyx est inévitable : tout mot assez long contient deux occurrences de la même lettre séparées par au moins une lettre.

Exemples

En arithmétique

Il est possible de s'intéresser aux motifs inévitables contenus dans l'écriture décimale (ou dans d'autres bases de numération) de nombres appartenant à des sous-ensembles de l'ensemble des entiers naturels. Ainsi 14 est un motif inévitable de l'ensemble S={124;1894} car les écritures des deux éléments de S contiennent les chiffres 1 et 4 dans cet ordre.

Nombres premiers inévitables

On s'intéresse aux motifs inévitables contenus dans l'écriture des nombres premiers qui sont eux-mêmes des nombres premiers. Plus précisément, on cherche le plus petit ensemble de nombres premiers dont au moins l'un des éléments apparait dans l'écriture de tout nombre premier. On a alors les résultats suivants[7]:

  • en base 2 l'ensemble inévitable minimal des nombres premiers est {10;11}[alpha 1];
  • en base 3 l'ensemble inévitable minimal des nombres premiers est {2;10;111}[alpha 2];
  • en base 4 l'ensemble inévitable minimal des nombres premiers est {2;3;11}[alpha 3];
  • en base 10 l'ensemble inévitable minimal des nombres premiers est {2;3;5;7;11;19;41;61;89;409;449;499;881;991;6469;6949;9001;9049;9649;9949;60649;666649;946649;60000049;66000049;66600049}.

Tout nombre premier écrit en base 10 contient l'un des motifs de l'ensemble donné ci-dessus. Par exemple 6 661 contient le motif 61.

Puissances de deux

On s'intéresse aux motifs inévitables contenus dans l'écriture en base 10 des puissances de deux qui sont eux-mêmes des puissances de deux. Il est conjecturé que l'ensemble inévitable minimal des puissances de deux est[7]: {1;2;4;8;65536}.

Le motif ABACABA

Ce motif est le point de départ d'études ou de recherches sur des objets auto-similaires, et donné lieu à plusieurs publications scientifiques ou plus ludiques[8], notamment

Indice d'évitabilité

S'il existe un mot infini sur k lettres qui évite un motif p, le motif est dit k-évitable. Sinon, il est k-inévitable. Si p est évitable, le plus petit entier k tel que p est k-évitable, noté λ(p), est appelé l'indice d'évitabilité de p[9]. Si p est inévitable, son indice d'évitabilité est, par définition, . Par exemple, comme le motif xyx est inévitable, son indice est . En revanche, l'indice d'évitabilité du motif xx est 3, car il existe un mot sans carré infini sur trois lettres, et il n'en existe pas sur deux lettres. Ainsi λ(xx)=3.

Pour les motifs binaires, sur deux variables x et y, on a[10]Modèle:,[11] :

  • 1,x,xy,xyx sont inévitables;
  • les motifs xx,xxy,xyy,xxyx,xxyy,xyxx,xyxy,xyyx,xxyxx,xxyxy,xyxyy ont l'indice d'évitabilité 3;
  • tous les autres motifs ont l'indice d'évitabilité 2.

Une variable qui n’apparaît qu'une fois dans un motif est dite isolée. On associe à un motif p une « formule » f en remplaçant dans p chaque variable isolée par un point. Les facteurs entre des points sont appelés des fragments.

Une occurrence d'une formule f dans un mot w est un morphisme non effaçant h tel que l'image par h de chaque fragment de f est un facteur de w. Comme pour les motifs, l'indice d'évitabilité λ(f) d'une formule f est la taille du plus petit alphabet qui ne contient pas d'occurrence de la formule f. Si f est la formule associée à un motif p, tout mot évitant f évite aussi p, et on a donc λ(p)λ(f). S'il existe un mot infini qui évite p, il existe aussi un mot infini récurrent qui évite p. Ce mot récurrent évite aussi f, de sorte qu'on a λ(p)λ(f).

L'indice d'évitabilité de toute formule binaire, c'est-à-dire composée de deux variables, a été déterminé par Pascal Ochem et Matthieu Rosenfeld[12].

Une formule f est dite divisible par une formule f si f n'évite pas f, en d'autres termes s'il existe un morphisme non effaçant h tel que l'image par h de tout fragment de f est un facteur d'un fragment de f. Si f est divisible par f, alors tout mot évitant f évite aussi f, donc λ(f)λ(f). Le retourné fR d'une formule f et f ont même indice d'évitabilité, donc λ(fR)=λ(f). Par exemple, le fait que ABAAABB est 2-évitable implique que ABAABB ou BABAABB sont 2-évitables.

R. J. Clark a introduit[13] la notion de base de n-évitabilité pour les formules : c'est le plus petit ensemble X de formules tel que, pour tout indice in, toute formule évitable à i variables est divisible par une formule à au plus i variables dans X.

Une formule circulaire[14] est une formule dont chaque fragment est obtenu par une permutation circulaire des lettres du précédent, par exemple ABABAB ou ABCABCABCABC.

Clark a montré que l'index d'évitabilité est au plus 4 pour toute formule circulaire et pour toute formule de la base de 3-évitabilité, et donc pour toute formule évitable contenant au plus 3 variables. Cette propriété a été précisé par Gamard et al.[14]

Bornes sur les mots de Zimin

Les mots de Zimin sont définis par récurrence par

Z0=ε et Zn=Zn1anZn1,

a1,,an, sont des lettres. Les premiers mots sont : a,aba,abacaba,abacabadabacaba

On s'intéresse à la longueur des mots sur un alphabet à q lettres qui contient en facteur une copie du mot de Zimin Zn, c'est-à-dire une image du mot Zn, où chaque lettre est remplacée par un mot non vide. Ainsi, le mot

aabbaacccaabbaa

est une copie de abacaba, de même abacaba est une copie de aba (en remplace au choix a par aba et c par b, ou on laisse a inchangé et on remplace b par bacab). Plus généralement, Zn contient deux copies de Zn1, et Zn est une copie de Zn1 obtenue en remplaçant les occurrences de la première lettre a1 par aba.

On définit une fonction f(n,q) par :

f(n,q) est le plus petit entier M tel que tout mot de longueur M sur un alphabet à q lettres contient en facteur une copie du mot de Zimin Zn.

On a f(1,q)=1 et f(2,q)=2q+1. La deuxième égalité vient du fait que, par le principe du tiroir, au moins une lettre apparaît trois fois dans tout mot de longueur 2q+1. La copie de Z2=aba consiste en la première et la troisième occurrence de cette lettre, le facteur non vide qui les sépare étant l'image de la lettre b. D'autre part, la borne est atteinte puisque le mot a1a1a2a2aqaq de longueur 2q ne contient pas de copie de aba.

Une relation de récurrences sur f(n,q) est donnée par la formule suivante de Cooper et Rorabaugh[15] :

f(n+1,q)(f(n,q)+1)(qf(n,q)+1)1.

Un mot de longueur (f(n,q)+1)(qf(n,q)+1)1 se factorise en effet en qf(n,q)+1 mots, chacun de longueur f(n,q) séparés par une lettre. Chacun des facteurs de longueur f(n,q) contient une copie de Zn. Comme il y en a qf(n,q)+1, deux de ces facteurs sont égaux. Comme ces deux copies sont séparées par au moins une lettre, ceci fournit une copie de Zn+1. On peut améliorer cette majoration dans le cas de 3 lettres[16] :

f(3,q)2q+1(q+1)!

En fait, on a même[17] :

f(3,q)=θ(2qq!).

Des majorations et minorations pour d'autres cas font intervenir une fonction tour (tower en anglais) d'itération d'exponentiation, notée T et définie par :

T(0,k)=1 et T(n+1,k)=kT(n,k).

Ainsi

T(1,k)=k, T(2,k)=kk, T(3,k)=kkk, T(4,k)=kkkk.

Avec ces notations, on a:

f(n,q)T(n,q)

et aussi une minoration sous forme d'une tour d'exponentielles, même dans le cas d'un alphabet binaire[17]Modèle:,[18]Modèle:,[19] :

f(n,q)T(n,q) et f(n,2)T(n3,2) (pour n4).

Notes et références

Notes

Modèle:Références

Références

Modèle:Références Modèle:Traduction/Référence


Bibliographie

Chapitres dans des livres
Articles
Thèse

Modèle:Portail


Erreur de référence : Des balises <ref> existent pour un groupe nommé « alpha », mais aucune balise <references group="alpha"/> correspondante n’a été trouvée