Mot infini

De testwiki
Aller à la navigation Aller à la recherche

En mathématiques, notamment en combinatoire, en informatique théorique, en théorie des automates et en combinatoire des mots, un mot infini sur un alphabet A, est une suite infinie x=(a0,a1,,an,) d'éléments pris dans un ensemble A, en général fini. Un mot infini est plutôt noté, comme pour les mots finis, sous la forme

x=a0a1an

Les mots infinis ont de nombreux usages. Ce sont :

Les exemples de mots infinis les plus connus sont le mot de Fibonacci, et plus généralement les mots sturmiens, et la suite de Prouhet-Thue-Morse et plus généralement les suites automatiques.

Définition et notations

Un mot infini sur un alphabet A est une suite infinie

x=a0a1an

composée d'éléments de A.

On peut donc voir un mot infini comme une suite indexée par les entiers naturels — parfois la numérotation commence à 1 — ou comme une fonction des entiers naturels dans l'alphabet A. On peut aussi voir le mot comme un produit infini de lettres, et on rencontre alors la notation

x=n=0an.

Cette notation a l'avantage de s'étendre au produit infini de mots au lieu du produit infini de lettres.

On note A ou Aω l'ensemble des mots infinis sur A. On peut considérer aussi des mots infinis bilatères, indexés par au lieu de .

L'opérateur ω de répétition infinie est employé pour dénoter ou construire des mots infinis. Ainsi,

  • aω est le mot infini composé uniquement de lettres a;
  • Xω, où X est un ensemble de mots finis, est l'ensemble des mots infinis de la forme x0x1xn, où chaque xi est dans X.

Le produit de concaténation de deux mots infinis n'existe pas, mais le produit d'un mot fini u et d'un mot infini x, noté ux, est le mot formé en ajoutant le mot x après le mot u. Ainsi :

  • baω est le mot infini composé de la lettre b suivie uniquement de lettres a;
  • baω est l'ensemble des mots infinis commençant par un nombre fini de lettres b suivies de lettres a;
  • {a,b}aω est l’ensemble des mots infinis contenant un nombre fini d'occurrences de la lettre b.

Comme exemple de l'usage des notations, on considère la suite caractéristique des carrés. C'est un mot infini w=c0c1cn, avec cn=1 si et seulement si n est un carré, et cn=0 sinon. Cette définition fonctionnelle fournit le produit

c=11001000010000001=n=01(00)n.

L'ensemble des mots finis ou infinis est noté A=AAω.

Topologie

L'ensemble Aω est doté d'une distance définie comme suit :

Pour deux mots x et y de Aω, on note (x,y) la longueur du plus long préfixe commun de x et y. C'est un entier naturel ou +. La distance d(x,y) est le nombre

d(x,y)=2(x,y).

Il est clair que d(x,y)=0 si et seulement si x=y, et aussi que d(x,y)=d(y,x). L'inégalité triangulaire traditionnelle d'une distance est renforcé par l'inégalité

d(x,y)max(d(x,z),d(z,y))

pour tout mot infini z, qui en fait une distance ultramétrique. Cette inégalité revient en effet à

(x,y)min((x,z),(z,y))

et pour se convaincre que cette formule est valide, supposons que (x,z)>(x,y). Alors les mots x et z coïncident sur le préfixe commun entre x et y mais pas au-delà, donc (x,y)=(z,y).

La notion de convergence est usuelle : une suite (xn) de mots infinis converge vers un mot infini x si d(xn,x)0 quand n. Par exemple, la suite de mots infinis xn=anbnaω tend vers aω.

La topologie ainsi définie sur l'ensemble Aω est la topologie produit de la topologie discrète sur l'alphabet A. L'espace est un espace de Cantor, c'est-à-dire un espace compact totalement disconnecté, sans point isolé.

On étend comme suit la topologie aux mot finis et infinis. On ajoute à l'alphabet A une lettre supplémentaire $, et on identifie A à A$ω. Ainsi, une suite (xn) de mots finis converge vers un mot infini x si la longueur du plus long préfixe commun entre xn et x tend vers l'infini avec n. On écrit alors

x=limnxn.

Par exemple, la suite de mot finis xn=anbn tend vers aω.

Un cas particulier de cette situation se présente lorsque les mots xn sont chacun préfixe du mot suivant. Pourvu que la suite des longueurs tende vers l'infini, la limite x est alors le mot infini dont les xn sont des préfixes.

Mots morphiques

Modèle:Article détaillé Un morphisme f:A*A* est prolongeable pour une lettre a de A si a est un préfixe propre de f(a), et si de plus, la suite des longueurs de itérés fn(a) tend vers l'infini lorsque n tend vers l'infini.

Si f:A*A* est prolongeable en a, il existe un mot non vide u tel que f(a)=au. En itérant, on obtient l'expression :

fn(a)=auf(u)fn1(u)

La suite de ces mots converge vers un mot infini noté fω(a) :

fω(a)=limnfn(a)

Ce mot est le mot infini engendré par f en a. Un mot infini x sur un alphabet A est purement morphique s'il existe un morphisme f:A*A* et une lettre a dans A tel que

x=fω(a)

Un mot infini y sur un alphabet B est morphique s'il est l'image, par un morphisme littéral (lettre à lettre), d'un mot purement morphique.

Exemples

— Le morphisme de Thue-Morse μ est défini par

aabbba.

Il est prolongeable à la fois en la lettre a et en la lettre b. Pour la lettre a, on obtient le mot infini de Thue-Morse :

abbabaabbaababbabaababbaabbabaab

et pour la lettre a, on obtient le mot opposé

baababbaabbabaababbabaabbaababba

— Le morphisme de Fibonacci est défini par

aabba.

Il est prolongeable en a ; en itérant, on obtient le mot infini :

abaababaabaababaababa.

Ces deux mots infinis sont donc purement morphiques.

— Le morphisme :

aa1100100

est prolongeable en a. En itérant, on obtient le mot infini :

a1001000010000001000000001

qui, à la première lettre près, est la suite caractéristique des carrés (0, 1, 4, 9, 16, etc). En lui appliquant le morphisme littéral qui identifie a et 1, on obtient exactement la suite caractéristique, qui est donc un mot morphique.

— Lorsque le morphisme qui est itéré est uniforme, c'est-à-dire lorsque les images des lettres ont toutes la même longueur (par exemple, le morphisme de Thue-Morse est uniforme), la suite engendrée est une suite automatique.

Décalage

Modèle:Article détaillé L'opérateur de décalage σ est défini, pour tout mot infini

x=a0a1an,

par

σ(x)=a1an.

La même définition vaut pour les mots infinis bilatères. Dans ce cas, σ est une bijection. L'opérateur de décalage est une fonction continue.

Un système dynamique symbolique sur l'alphabet A est un ensemble S non vide de mots infinis sur A qui est :

  1. fermé pour l’opérateur de décalage σ ;
  2. fermé pour la topologie.

La même définition vaut pour les mots infinis bilatères.

Ensemble rationnel de mots infinis

Modèle:Article détaillé Un ensemble rationnel (on dit aussi langage rationnel ou ω-langage rationnel) de mots infinis sur un alphabet A est une union finie d'ensembles de la forme

KMω

KA* et MA+ sont des langages rationnels sur A. La famille des ensembles rationnels de mots infinis est fermée par union, et par produit à gauche par un langage rationnel sur A.

Exemples :

  • Le langage a*bω des mots sur a et b qui ont un nombre fini de a est rationnel.
  • Le langage (b*a)ω des mots sur a et b qui contiennent une infinité de a est rationnel.

Bibliographie

Modèle:Portail