Théorème de Cobham
Le théorème de Cobham est un théorème de combinatoire des mots qui a des connexions importantes avec la théorie des nombres, et notamment des nombres transcendants, et avec la théorie des automates. Le théorème stipule que si les écritures, en deux bases multiplicativement indépendantes, d'un ensemble d'entiers naturels S sont des langages rationnels, alors l'ensemble S est une union finie de progressions arithmétiques. Le théorème a été prouvé par Alan Cobham en 1969. Depuis, il a donné lieu à de nombreuses extensions et généralisations[1].
Définitions
Soit un entier. L'écriture en base d'un entier naturel est la suite de chiffres tels que
avec et . La suite est souvent noté ou plus simplement .
Un ensemble d'entiers naturels S est reconnaissable en base ou plus simplement -reconnaissable si l'ensemble des écritures en base b de ses éléments est un langage reconnu par un automate fini, sur l'alphabet .
Deux entiers positifs et sont multiplicativement indépendants s'il n'existe pas d'entiers non nuls et tels que . Par exemple, 2 et 3 sont multiplicativement indépendants, alors que 8 et 16 ne le sont pas puisque . Deux entiers sont multiplicativement dépendants si et seulement s'ils sont puissances d'un même troisième entier.
Énoncés
Énoncé original
Plusieurs énoncés équivalents du théorème ont été donnés. La version originale de Cobham est la suivante : Modèle:Théorème
Une autre façon d'énoncer le théorème le relie aux suites automatiques. Cobham lui-même les appelle « uniform tag sequences »[2]. Il se trouve sous la forme suivante dans le livre d'Allouche et Shallit[3] : Modèle:Théorème
On peut en effet montrer que la suite caractéristique d'un ensemble entiers naturels S reconnaissable par automate fini en base k est une suite k-automatique et que réciproquement, pour toute suite k-automatique et tout entier , l'ensemble des entiers tels que est reconnaissable en base .
Formulation en logique
Le théorème de Cobham peut se formuler dans une logique du premier ordre, en utilisant un théorème démontré par Büchi en 1960. Cette formulation logique a donné lieu à des extensions et généralisations. L'expression logique fait appel à la théorie[4]
des entiers naturels équipés de l'addition et de plus de la fonction définie par V_r(0)=1 et pour un entier positif , prend la valeur si est la plus haute puissance de qui divise . Par exemple, , et . Un ensemble
Un ensemble d’entiers est définissable en logique du premier ordre dans s’il peut être décrit par un formule du premier ordre avec égalité, addition et .
Exemples :
- L’ensemble des nombres impairs est définissable (sans ) par la formule
- L’ensemble des puissances de 2 est définissable par la formule toute simple .
On peut pousser plus loin l’analogie avec la logique en notant que S est définissable au premier ordre dans l’arithmétique de Presburger si et seulement s’il est ultimement périodique. Ainsi, un ensemble S est définissable dans les logiques et si et seulement s'il est définissable dans l'arithmétique de Presburger.
Généralisations
Approche par morphisme
Une suite automatique est un mot morphique particulier, dont le morphisme générateur est uniforme. Un ensemble d'entiers est donc k-reconnaissable si et seulement si sa suite caractéristique est engendrée par un morphisme uniforme suivie d'un morphisme de codage. Par exemple, la suite caractéristique des puissances de 2 est produite par le morphisme 2-uniforme sur l'alphabet défini par
qui engendre le mot infini
- ,
suivi du morphisme de codage (c'est-à-dire lettre à lettre) qui envoie sur et laisse et inchangés, ce qui donne .
La notion a été étendue comme suit : Un mot morphique est -substitutif pour un certain nombre s'il s'écrit sous la forme
où le morphisme , prolongeable en , a les propriétés suivantes :
- toutes les lettres de ont des occurrences dans , et
- est la valeur propre dominante de la matrice du morphisme .
Un ensemble S d'entiers naturels est -reconnaissable si sa suite caractéristique est -substitutive.
Une dernière définition : Un nombre de Perron est un nombre algébrique tel que tous ses conjugués appartiennent au disque . Ce sont exactement les valeurs propres dominantes des matrices entières positives primitives.
On a alors l'énoncé suivant[5] :
Approche logique
L'équivalence logique a permis de considérer des situations plus générales : les suites automatiques sur les entiers naturels ou ensembles reconnaissables ont été étendues aux entiers relatifs , aux produits cartésiens , aux nombres réels et aux produits cartésiens [4].
- Extension à
On code les entiers base en faisant précéder l’écriture d'un entier positif par le chiffre 0, et d’un entier négatif par suivi du complément à . Par exemple, en base 2, l’entier -6=-8+2 s’écrit 1010. Les puissances de 2 s’écrivent 010^* , et leurs opposés 110^* (car 11000 = -16+8=-8)
- Extension à
Une partie de est reconnaissable en base si les éléments de , écrits comme vecteurs à composantes sont reconnaissables sur l’alphabet produit.
Par exemple
En base 2, on a et ; le vecteur est écrit comme .
Une preuve élégante de ce théorème est de Muchnik en 2003, par récurrence sur .
D'autres extensions ont été données aux nombres réels et aux vecteurs de nombres réels[4].
Démonstrations
Samuel Eilenberg énonce le théorème sans preuve dans son livre[6] ; il dit « The proof is correct, long, and hard. It is a challenge to find a more reasonable proof of this fine theorem ». Georges Hansel a proposé une preuve plus simple, publiée dans des actes difficilement accessibles d'un colloque[7]. La preuve de Dominique Perrin[8] et celle du livre d'Allouche et Shallit[3] contiennent la même erreur dans un des lemmes, mentionnée dans la liste d'erratas du livre[9]. Cette erreur a été relevée dans une note de Tomi Kärki[10], et corrigée par Michel Rigo et Laurent Waxweiler[11]. Cette partie de la démonstration a fait l'objet d'une rédaction récente[12].
En janvier 2018, Thijmen J. P. Krebs annonce, sur Arxiv, une preuve simplifiée du théorème original, basée sur un critère d'aproximation de Dirichlet plutôt que de Kronecker ; l’article est paru en 2021[13]. La méthode employée est raffinée et utilisée par Mol, Rampersad, Shallit et Stipulanti[14].
Notes et références
Bibliographie
- ↑ Une synthèse des résultats récents est présentée dans Modèle:Harvsp et dans Modèle:Harvsp.
- ↑ Modèle:Harvsp.
- ↑ 3,0 et 3,1 Modèle:Harvsp.
- ↑ 4,0 4,1 et 4,2 Modèle:Harvsp.
- ↑ Modèle:Harvsp.
- ↑ Modèle:Ouvrage.
- ↑ Modèle:Chapitre.
- ↑ Modèle:Chapitre.
- ↑ Errata for Automatic Sequences: Theory, Applications, Generalizations
- ↑ Modèle:Lien web.
- ↑ Modèle:Article.
- ↑ Modèle:Lien web.
- ↑ Modèle:Harvsp.
- ↑ Modèle:Harvsp.