Mot (mathématiques)

De testwiki
Aller à la navigation Aller à la recherche

Modèle:Homonyme En mathématiques ou en informatique théorique, un mot est une suite finie w d'éléments pris dans un ensemble A. L'ensemble A est appelé l'alphabet, ses éléments sont appelés symboles ou lettres. On dit que w est un mot sur A.

En utilisant l'étoile de Kleene, l'ensemble des mots sur A est noté A*.

Exemples

  • Un « mot binaire ». C'est un mot sur un alphabet à deux symboles, notés généralement 0 et 1. Par exemple, le développement binaire d'un entier naturel, ou son écriture binaire, est la suite des chiffres de sa représentation en base 2. Ainsi, l'écriture binaire de « dix-neuf » est 10011.
  • Une « séquence d'acide désoxyribonucléique » (ADN). C'est un mot généralement formé d'une suite de quatre lettres correspondant aux quatre nucléotides formant l'enchaînement de l'ADN : A pour « adénine », G pour « guanine », T pour « thymine », C pour « cytosine ».
  • Une « protéine » est une macromolécule composée d’une chaîne d'acides aminés. Il y a 20 acides aminés. C'est donc un mot sur un alphabet de 20 symboles.

Propriétés

Un mot w=(a1,a2,,an) est écrit plus simplement : w=a1a2an

La longueur d'un mot est le nombre de positions des symboles qui le composent : le mot w ci-dessus est de longueur n. Par exemple, le mot abacaba sur l'alphabet A={a,b,c} est de longueur 7. Un mot peut être vide. C'est le mot de longueur 0. Il est fréquemment noté ε.

La concaténation de deux mots u et v est le mot uv obtenu en mettant bout à bout u et v. Par exemple, la concaténation de u=abraca et v=dabra donne uv=abracadabra. La concaténation est une opération associative, mais non commutative. Son élément neutre est le mot vide.

L'ensemble des mots sur un alphabet A, muni de la concaténation, forme donc un monoïde. En tant que structure algébrique, c'est un monoïde libre au sens de l'algèbre universelle. Cela signifie que tout mot est produit de concaténation des symboles qui le composent.

L'ensemble des mots sur un alphabet A est traditionnellement noté A*.

Terminologie supplémentaire

  • Les préfixes d'un mot w=a1an sont les n+1 mots ε et a1ai, pour i=1,,n.
    Les 5 préfixes du mot abac sont: ε, a, ab, aba et abac lui-même. Si on exclut le mot vide, on parle de préfixe non vide, si on exclut le mot lui-même, on parle de préfixe propre. De manière équivalente, un mot p est un préfixe d'un mot w s'il existe un mot s tel que w=ps.
  • Les suffixes d'un mot w=a1an sont les n+1 mots ε et aian, pour i=1,,n.
    Les 5 suffixes du mot abac sont: les mots abac, bac, ac, c et ε. De manière équivalente, un mot s est un suffixe d'un mot w s'il existe un mot p tel que w=ps.
  • Les facteurs d'un mot w=a1an sont les mots aiaj, pour 1ijn.
    Les facteurs du mot abac sont les mots ε, a, b, c, ab, ba, ac, aba, bac et abac. De manière équivalente, un mot x est un facteur d'un mot w s'il existe des mots p,s tel que w=pxs.
  • Un mot x est un sous-mot d'un mot y s'il existe une factorisation y=z0x1z1x2xnzn en mots z0,x1,z1,x2,,xn,zn telle que x=x1x2xn.
    Ainsi, x s'obtient à partir de y en effaçant des symboles dans y. Par exemple, aa est sous-mot de abac[1].
  • L'image miroir ou le retourné d'un mot w=a1an est le mot w~=ana1.
    Par exemple, l'image miroir du mot abac est le mot caba.
  • Un palindrome est un mot qui est égal à son image miroir.
    Par exemple, le mot abacaba est un palindrome.
  • Un mot x est puissance entière d'un mot y s'il existe un entier positif n tel que x=yn (y répété n fois).
  • Un mot est primitif s'il n'est pas puissance entière d'un autre mot.
    Par exemple, le mot bonbon n'est pas primitif, parce qu'il est le carré du mot bon.
  • Deux mots x et y sont conjugués s'il existe des mots p et s tels que x=ps et y=sp. Autrement dit, l’un des mots s’obtient depuis l’autre par une rotation de ses lettres.
    Par exemple, les mots abaab et ababa sont conjugués. La conjugaison est une relation d'équivalence.
  • Une classe de conjugaison ou mot circulaire ou collier est l'ensemble des conjugués d'un mot. Un mot circulaire de représentant x est parfois noté (x).
    Par exemple, la classe de conjugaison de abaab est composée des cinq mots abaab,baaba,aabab,ababa,babaa.
  • Une période d'un mot x=a1a2an, où a1,a2,,an sont des symboles, est un entier p avec 1pn tel que ai=ai+p pour i=1,,np.
    Par exemple, le mot abaababa a les périodes 5, 7 et 8.
  • Un mot périodique est un mot dont la longueur est au moins deux fois sa période minimale. Un carré, c'est-à-dire un mot de la forme uu est périodique. Le mot aababaabab=(aabab)2 est périodique alors que le mot abaababa ne l'est pas.
  • Un bord d'un mot x est un mot y qui est à la fois un préfixe propre et un suffixe propre de x.
    Par exemple, les bords du mot abaababa sont le mot vide, et a,aba. Si y est un bord d'un mot x, alors |x||y| est une période de x. Un mot sans bord est un mot dont le seul bord est le mot vide. C'est un mot dont la seule période est sa longueur.
  • Le produit de mélange x ш y de deux mots x et y est l'ensemble des mots x1y1x2y2xnyn, où les xi et les yi sont des mots, tels que x=x1x2xn et y=y1y2yn.
    Par exemple, ab ш ab={aabb,abab}[2]Modèle:,[3].
  • L'ordre lexicographique sur les mots se définit à partir d'un ordre total sur l'alphabet. C'est l'ordre alphabétique, formellement donné par xy si et seulement si x est préfixe de y ou si x=zax, et y=zby pour des mots z,x,y et des symboles a et b avec a<b. Par exemple, pour l'alphabet formé de 0 et 1 avec 0<1, on a ε<0<00<000<01<1<10.

Modèle:Article détaillé

Lemme de Levi

Modèle:Article détaillé Modèle:Théorème

Une autre façon d'exprimer ce résultat est de dire que si x et x sont tous les deux des préfixes d'un mot, alors x est préfixe de x ou x est préfixe de x.

Un résultat fondamental

Le résultat suivant caractérise les mots qui commutent.

Modèle:Théorème

Parmi les conséquences, il y a :

  • Tout mot est puissance d'un mot primitif unique.
  • Les conjugués d'un mot primitif sont eux-mêmes primitifs.
  • La classe de conjugaison d'un mot primitif de longueur n a n éléments.

Le théorème admet une version plus forte: Modèle:Énoncé

On peut exprimer ces résultats sous forme d'équations entre mots : le premier dit que l'équation

XY=YX

en les inconnues X,Y n'a que des solutions cycliques, c'est-à-dire dont tous les mots sont des puissances d'un même mot ; le deuxième dit que toute équation en deux variables sans constante n'a que des solutions cycliques.

Une autre propriété concerne la conjugaison. Modèle:Théorème Ce résultat est parfois attribué à Lyndon et Schützenberger[4]. On peut voir cet énoncé comme la description des solutions de l'équation

XY=YZ

en trois variables X,Y,Z.

Morphisme

Modèle:Loupe Une application

h:A*B*

est un morphisme ou un homomorphisme si elle vérifie

h(xy)=h(x)h(y)

pour tous les mots x,yA*. Tout morphisme est déterminé par sa donnée sur les lettres de l'alphabet A. En effet, pour un mot w=a1a2an, on a

h(w)=h(a1)h(a2)h(an).

De plus, l'image du mot vide est le mot vide :

h(ε)=ε

parce que ε est le seul mot égal à son carré, et

h(ε)=h(εε)=h(ε)h(ε).

Exemples

Modèle:Article détaillé Le morphisme de Thue-Morse permet de définir la suite de Prouhet-Thue-Morse. C'est le morphisme μ:A*A* sur A={0,1} défini par

μ(0)=01
μ(1)=10

En itérant, on obtient

μ(01)=0110
μ(0110)=01101001
μ(01101001)=0110100110010110

Modèle:Article détaillé Le morphisme de Fibonacci permet de définir le mot de Fibonacci. C'est le morphisme ϕ:A*A*, avec A={a,b}, défini par

ϕ(a)=ab
ϕ(b)=a

En itérant, on obtient

ϕ(ab)=aba
ϕ(aba)=abaab
ϕ(abaab)=abaababa

Morphismes particuliers

  • Un automorphisme h:A*A* est une bijection si et seulement l'image d'un symbole est un symbole.
  • Un morphisme h est non effaçant si l'image d'un symbole n'est jamais le mot vide. Il est équivalent de dire que l'image d'un mot est toujours au moins aussi longue que le mot de départ : |h(w)||w|. On dit aussi morphisme non décroissant, ou croissant au sens large. On dit aussi que c'est un morphisme de demi-groupes puisque sa restriction au demi-groupe A+=A*ε est à valeurs dans B+.
  • Un morphisme est alphabétique si l'image d'un symbole est un symbole ou le mot vide. Il est équivalent de dire que l'image d'un mot est toujours moins longue que le mot de départ.
  • Un morphisme est littéral ou lettre à lettre ou préserve la longueur si l'image d'une symbole est un symbole. Il est équivalent de dire que l'image d'un mot est de même longueur que le mot de départ.
  • Un morphisme h est uniforme si les images des symboles ont toutes la même longueur. Si la longueur commune est k, ont dit aussi que le morphisme est k-uniforme. Le morphisme de Thue-Morse est 2-uniforme; le morphisme de Fibonacci est non effaçant, et n'est pas uniforme. Un morphisme littéral est 1-uniforme.
  • Un morphisme h:A*A* est symétrique[5] s'il existe une permutation circulaire s:AA de l'alphabet qui commute avec h, c'est-à-dire telle que Modèle:Indente pour tout symbole a. Ici s est étendu en un automorphisme de A*. Cette formule implique que h est uniforme. Le morphisme de Thue-Morse est symétrique.

Applications

Un polynôme non commutatif est une combinaison linéaire de mots sur une famille d’indéterminées.

Notes et références

Références

Modèle:Références

Articles connexes

Bibliographie

Modèle:Portail

  1. Dans la littérature en langue anglaise, on dit Modèle:Langue pour facteur et Modèle:Langue pour sous-mot.
  2. Le symbole « ш » est la lettre sha de l'alphabet cyrillique, On utilise aussi le caractère unicode U+29E2 (SHUFFLE PRODUCT)). Dans une formule mathématique, on peut aussi utiliser \text{ш}.
  3. Pour bien comprendre cet exemple, écrivons en majuscules les lettres du deuxième mot. Avec cette convention, on a
    ab ш AB={abAB,aAbB,AabB,aABb,AaBb,ABab}
    et quand on revient aux minuscules, il ne reste plus que les deux mots indiqués.
  4. Par exemple dans le manuel de Modèle:Harvsp.
  5. Cette terminologie est employée par Modèle:Article.