Théorie des ensembles de Zermelo

De testwiki
Aller à la navigation Aller à la recherche

Modèle:Sources à lier

La théorie des ensembles de Zermelo, est la théorie des ensembles introduite en 1908 par Ernst Zermelo dans un article fondateur de l'axiomatisation de la théorie des ensembles moderne, mais aussi une présentation moderne de celle-ci, où les axiomes sont repris dans le langage de la logique du premier ordre, et où l'axiome de l'infini est modifié pour permettre la construction des entiers naturels de von Neumann.

Axiomes de la théorie des ensembles, dans l'article de Zermelo

Cette section présente les axiomes originaux de l'article de Zermelo paru en 1908[1], numérotés comme dans cet article.

Les axiomes de Zermelo sont exprimés pour un Modèle:Nobr (en allemand : Bereich ) qui est une collection de « choses »[2] appelées objets ; certains de ces objets, mais pas nécessairement tous, sont appelés ensembles  (les versions ultérieures de la théorie des ensembles partent le plus souvent du principe que tous les objets sont des ensembles). Zermelo introduit une relation d'appartenance, qu'il note par la lettre epsilon : Modèle:Nobr ; cette relation se lit : a est élément de b, ou b contient a comme élément ; Zermelo écrit Modèle:Nobr pour signifier que Modèle:Nobr désignent le même objet du domaine. À une seule exception près (l'ensemble vide de Modèle:Nobr ci-dessous), un objet b du Modèle:Nobr est appelé ensemble quand et seulement quand il contient au moins un objet a comme élément, c'est-à-dire quand il existe un objet a du domaine tel que Modèle:Nobr. Un ensemble M est appelé sous-ensemble d'un ensemble N quand tous les éléments de M sont aussi éléments Modèle:Nobr

Voici la liste des sept axiomes[3] que le Modèle:Nobr doit satisfaire. On a respecté dans la mesure du possible les notations de l'article de Zermelo en 1908.

Entre les axiomes, Zermelo tire les premières conséquences : il existe un « plus petit » ensemble Z0 qui vérifie les propriétés énoncées dans l'axiome VII de l'infini, au sens que Z0 est sous-ensemble de tout ensemble Z qui satisfait Modèle:Nobr ; cet ensemble Z0 jouera le rôle de l'ensemble des entiers naturels ; dans ce point de vue, Modèle:Nobr est l'ensemble Modèle:Nobr, Modèle:Nobr est le Modèle:Nobr, et plus généralement le successeur de l'entier représenté par un ensemble n est l'ensemble singleton {n} ; par exemple, Modèle:Nobr est représenté par Modèle:Nobr, ensemble dont le seul élément est Modèle:Nobr qui représente Modèle:Nobr.

Autre conséquence directe des axiomes : si M et N sont deux ensembles, l'axiome de la réunion appliqué à l'ensemble paire {MN} produit la réunion habituelle M ∪ N de ces deux ensembles. Dans les travaux plus récents, on a préféré définir le successeur de l'entier n (qui est déjà un ensemble) comme étant la réunion n ∪ {n} de l'ensemble n et du singleton {n} ; l'axiome de l'infini est alors modifié en conséquence.

L'axiome de séparation

Dans l'introduction de son article, Zermelo écrit que l'existence même de la discipline de la théorie des ensembles Modèle:Citation. Zermelo fait bien sûr référence au paradoxe de Russell. On ne peut plus s'en tenir à la définition d'origine de Cantor.

Zermelo veut montrer comment la théorie originelle de Georg Cantor et Richard Dedekind peut être réduite à quelques définitions et aux sept principes ou axiomes. Il signale qu'il n'a pas été en mesure de prouver que les axiomes sont cohérents les uns avec les autres, c'est-à-dire qu'ils n'entraînent pas une contradiction du type 0=1, en d'autres termes que son système d'axiomes est non-contradictoire. Zermelo explique que l'axiome III de son système permet l'élimination des antinomies :

Modèle:Citation[4]

Zermelo se débarrasse du paradoxe de Russell par le biais du théorème suivant[5] : Modèle:Citation.

En notation actuelle, soit M0={xM|xx} le sous-ensemble de M qui est "séparé" par la propriété xx (c'est-à-dire défini comme sous-ensemble de M par l'axiome III). L'ensemble M0 ne peut pas être élément de M0, sinon M0 contiendrait un élément x tel que xx, à savoir M0 lui-même, ce qui est absurde d'après la définition de M0 qui implique qu'aucun de ses éléments x n'ait cette propriété.

On voit ensuite que M0 ne peut pas être élément de M : sinon, puisqu'on a vu que M0M0, l'ensemble M0 serait un élément x de M qui remplirait la condition xx, on aurait donc M0M0 ce qui est une contradiction.

Par conséquent, M0 ne peut pas être élément de M, ce qui prouve le théorème.

Il en résulte que tous les objets du domaine universel B ne peuvent être éléments d'un seul et même ensemble : le domaine B lui-même n'est pas un ensemble. Le domaine B est d'une autre nature mathématique, qui renvoie à la notion de classe.

Théorème de Cantor

L'article de Zermelo présente sous le nom de théorème de Cantor (Modèle:Lang) un résultat de ce dernier[6], dont c'est peut-être la première mention sous ce nom. Zermelo définit « M est de cardinalité plus faible que N »[7], au sens strictement plus faible, noté Modèle:Nobr, c'est-à-dire : l'ensemble M est équipotent (Modèle:Lang) à un sous-ensemble de N, mais N ne l'est pas à un sous-ensemble Modèle:Nobr[8] ; c'est essentiellement la définition de la subpotence stricte (il existe une injection de M dans N mais pas d'injection de N Modèle:Nobr). On note ici Modèle:Nobr, comme on le fait de nos jours, l'ensemble des parties de Modèle:Nobr, ensemble fourni par l'axiome IV.

Modèle:Citation.

Zermelo remarque d'abord que M est équipotent à l'ensemble des singletons formés sur ses éléments. Il montre ensuite que P(M) ne peut être équipotent à un sous-ensemble M0 de M (c'est-à-dire qu'il n'existe pas d'injection de P(M) Modèle:Nobr). Zermelo le montre directement, mais c'est aussi une conséquence de ce qu'il n'existe pas de surjection de P(M) dans M (voir théorème de Cantor). La démonstration est essentiellement la même.

Évolution de la théorie axiomatique des ensembles

Le texte de Zermelo en 1908 ne propose pas d'ensemble, objet du Modèle:Nobr, qui traduise la notion de paire ordonnée (ab). La paire ordonnée (ou couple) peut servir à représenter une fonction f par l'intermédiaire de son graphe, formé des paires ordonnées de la forme (af(a)). La paire ordonnée apparaît en tant qu'ensemble chez Hausdorff en 1914[9], ce qui permet d'englober la notion de fonction dans celle d'ensemble, en assimilant fonction et graphe de fonction.

En 1922, Abraham Fraenkel affirme que la théorie de Zermelo présente des lacunes[10], qu'elle ne permet pas de définir certains ensembles dont l'existence serait naturelle. Il propose un nouvel axiome, l'axiome de remplacement (Ersetzungsaxiom) dont l'esprit est le suivant : si une correspondance F est bien définie sur le Modèle:Nobr et associe à chaque objet du domaine un autre objet uniquement déterminé, alors pour tout ensemble a il existe un nouvel ensemble b dont les éléments d sont précisément les images d = F(c) des éléments c de a par la correspondance F. La même année, Thoralf Skolem en vient à des conclusions analogues[11] ; de plus, Skolem précise clairement dans son article[12] la notion de proposition bien définie restée encore vague chez Zermelo, dans l'énoncé de l'axiome III de « séparation ».

Dès 1923[13], von Neumann propose une nouvelle conception pour les nombres ordinaux de Cantor, que ce dernier avait définis à partir de l'abstraction du type d'ordre des ensembles bien ordonnés. Von Neumann envisage les ordinaux comme des ensembles spécifiques introduits grâce aux axiomes de la théorie des ensembles. Il commence avec l'ensemble Modèle:Nobr, puis le singleton {0} pour Modèle:Nobr, suivi de la paire Modèle:Nobr Modèle:Nobr : ainsi l'ordinal 2 contient 0 et 1 comme éléments ; après chaque ordinal n (qui est un ensemble) vient son successeur, défini comme étant la réunion n ∪ {n}. Sans aller plus loin dans la description, on peut ajouter que l'ordinal ω est le plus petit ordinal qui contient tous les ordinaux finis, c'est le premier ordinal infini, qui est suivi de ω+1 = ω ∪ {ω}, etc… Von Neumann développe par la suite, en utilisant l'axiome de remplacement, la puissante méthode de définition d'ensembles par induction ordinale, méthode qui tient toujours une bonne place dans les livres actuels[14] de théorie des ensembles.

En 1930, Zermelo propose un nouveau système d'axiomes qu'il désigne par ZF, en référence à lui-même et Fraenkel[15]. Ce système contient l'axiome de remplacement et l'axiome de fondation. Cependant, Zermelo ne se restreint pas au cadre de la logique du premier ordre, contrairement à Skolem [16]. Comme en 1908, Zermelo permet l'existence d'Urelements, des objets du domaine qui ne sont pas des ensembles et ne contiennent pas d'éléments ; ces objets sont maintenant habituellement omis des théories des ensembles[17].

Le système d'axiomes GB[18] (ou BG[19]), pour Gödel et Bernays, apparu avant 1940[20], est une extension de ZF. Le langage de GB comporte des variables d'ensemble et des variables de classe (on peut penser que les variables de classe représentent certaines familles d'ensembles[21]) ; cependant, les énoncés qui ne concernent que les ensembles et qui peuvent être démontrés dans GB peuvent aussi être démontrés dans ZF[22].

En 1966, le livre de Paul Cohen consacré à la preuve de l'indépendance de l'hypothèse du continu[23] présente la théorie ZF comme on le fait aujourd'hui.

Présentation moderne de la théorie des ensembles de Zermelo

La version moderne de la théorie des ensembles de Zermelo comprend les axiomes suivants[24] :

  • axiome d'extensionnalité ;
  • axiome de la paire ;
  • axiome de la réunion ;
  • axiome de l'ensemble des parties ;
  • axiome de compréhension (ou de séparation) ;
  • axiome de l'infini[25].

L'axiome du choix n'en fait pas partie. Cependant, comme il est très difficile de faire des mathématiques sans une forme minimale de choix, on ajoute souvent une forme dénombrable de choix, l'axiome du choix dépendant[26].

L'axiome de compréhension peut être énoncé comme en 1908, mais la formation de la « fonction propositionnelle » P(x) qu'il renferme est maintenant ainsi précisée[27] : l'énoncé de P est constitué à partir de variables x, y,…, à partir des énoncés « atomiques » x ∈ y et x = y, des connecteurs logiques « ou », « non » et des quantificateurs ∃ et ∀ ; si un Modèle:Nobr (on dit plutôt aujourd'hui un univers) est un modèle pour le système d'axiomes, les variables x, y,… de l'énoncé ne seront remplacées dans l'application des axiomes que par des éléments a, b,… du domaine (à l'exclusion de parties du domaine). La présence de la « propriété » P(x), qui peut prendre une infinité de formes, fait que l'axiome de compréhension n'est pas à proprement parler un unique axiome, mais un schéma d'axiomes.

La théorie des ensembles la plus largement utilisée et acceptée aujourd'hui est connue sous le nom de ZF, c'est la théorie des ensembles de Zermelo–Fraenkel ; on lui ajoute le plus souvent l'axiome du choix, pour obtenir le système noté ZF+AC ou ZFC. Dans la théorie ZF, on n'a plus besoin d'axiome pour l'existence des ensembles élémentaires, qui découle des autres axiomes[28], et l'axiome de l'infini de Zermelo (axiome VII) y est modifié comme suit : il existe un ensemble Z qui contient 0, et qui avec chacun de ses éléments a contient également l'ensemble a ∪ {a}. Les ordinaux de ZF sont les ordinaux de von Neumann ; on peut énoncer l'axiome de l'infini sous la forme : il existe un ordinal non fini[29].

La nouveauté essentielle du système de Zermelo–Fraenkel, comparé au système de Zermelo, consiste en l'introduction de l'axiome de remplacement (en réalité, un schéma d'axiome), plus puissant que l'axiome de séparation de Zermelo (axiome III, qui peut donc être omis dans ZF). Une conséquence mineure de l'axiome de remplacement est l'existence des « ensembles élémentaires » de Zermelo, mais il permet surtout le développement de la théorie des ordinaux et les définitions par induction sur la collection des ordinaux. L'axiome de régularité (ou axiome de fondation) et l'axiome de remplacement ont été introduits après les travaux de Thoralf Skolem et d'Abraham Fraenkel en 1922. L'axiome de fondation implique en particulier qu'on n'ait jamais Modèle:Nobr. Comme l'axiome du choix, l'axiome de fondation n'est pas en général inclus dans ZF, on parle de ZF+AF quand on l'inclut.

Dans les systèmes modernes Z ou ZF, la fonction propositionnelle désignée dans l'axiome de séparation est interprétée comme Modèle:Citation. La notion de Modèle:Citation n'était pas connue en 1908 quand Zermelo a publié son système d'axiomes, et plus tard, il a rejeté cette interprétation comme trop restrictive. La théorie des ensembles de Zermelo est généralement considérée comme une théorie de premier ordre, elle peut également être considérée comme une théorie de logique du second ordre, où l'axiome de séparation est un seul axiome. L'interprétation de second ordre de la théorie des ensembles de Zermelo est probablement plus proche de la propre conception de Zermelo, et est plus forte que l'interprétation de premier ordre.

Dans la hiérarchie cumulative habituelle Vα de la théorie des ensembles ZFC (où α varie dans la classe des ordinaux), tout ensemble Vα pour α ordinal limite plus grand que le premier ordinal infini ω (comme Vω·2) constitue un modèle de la théorie des ensembles de Zermelo. Donc la cohérence de la théorie des ensembles de Zermelo est un théorème de la théorie des ensembles ZFC. Les axiomes de Zermelo n'impliquent pas l'existence du cardinalω ou de cardinaux infinis plus grands, car le modèle Vω·2 ne contient pas un tel cardinal (les cardinaux doivent être définis différemment dans la théorie des ensembles de Zermelo, car la définition usuelle des cardinaux et des ordinaux n'y fonctionne pas très bien : avec la définition habituelle, il n'est même pas possible de prouver l'existence de l'ordinal ω·2).

Théorie des ensembles de Mac Lane

La théorie des ensembles de Mac Lane, présentée par Modèle:Référence Harvard sans parenthèses, est la théorie des ensembles de Zermelo avec l'axiome de séparation restreint aux formules de premier ordre, dans lesquelles chaque quantificateur est borné. La théorie des ensembles de Mac Lane est similaire en force à la théorie des topos avec un objet nombre naturel, ou avec le système des Principia mathematica. Elle est assez riche pour couvrir les besoins de presque toutes les mathématiques ordinaires, celles qui ne sont pas directement liées à la théorie des ensembles ou à la logique.

Consistance relative des axiomes de Zermelo

Zermelo et Fraenkel se sont posé la question de la non-contradiction de leurs systèmes d'axiomes respectifs. Le second théorème d'incomplétude de Gödel vient éclairer cette question en 1931 : il est impossible de prouver la non-contradiction du système d'axiomes de Zermelo en n'utilisant que les axiomes de Zermelo, et de même pour le système ZF ; il reste la possibilité d'une preuve de cohérence relative : en partant des axiomes (plus forts) de ZFC, prouver la non-contradiction des axiomes de Zermelo.

Un argument valide dans le cadre de la théorie des ensembles de Zermelo–Fraenkel procède comme suit[30]. On définit un Modèle:Nobr, pour α variant parmi les ordinaux 0, 1, 2,…,ω, ω+1, ω+2,…, ω·2, de la façon suivante :

  • V0 est l'ensemble vide ;
  • pour α ordinal successeur de la forme β+1, Vα est la collection de tous les sous-ensembles de Vβ, c'est-à-dire que Modèle:Nobr ;
  • pour α ordinal limite (par exemple, ω, ω·2), alors Vα est défini comme la réunion des Vβ pour Modèle:Nobr.

Alors les axiomes de la théorie des ensembles de Zermelo sont vrais dans le modèle Vω·2. Alors qu'un non-constructiviste pourrait considérer cela comme un argument valable, un constructiviste ne le ferait probablement pas : bien qu'il n'y ait pas de problèmes avec la construction des ensembles jusqu'à Vω, la construction de Vω+1 est moins évidente, car on ne peut pas définir de manière constructive chaque sous-ensemble de Vω.

Notes et références

Modèle:Traduction/Référence Modèle:Références

Voir aussi

Bibliographie

Article connexe

Liens externes

Modèle:Portail

  1. Modèle:Harvsp, traduit en anglais dans Modèle:Harvsp.
  2. Zermelo parle d'une collection « d'objets » (Objekte) qu'il appelle « choses » (Dinge), mais la répétition du mot « chose » dans tout ce paragaphe ne serait pas très bien venue en français ; on a évité ici le mot « élément » qui prend, tout de suite après, un sens précis.
  3. dans l'article Modèle:Harvsp, la liste n'est pas présentée comme ici : elle est entrecoupée de remarques et conséquences ; la présentation des axiomes s'étend de la page 263 à la page 267.
  4. Modèle:Harvsp.
  5. C'est le point 10. de Modèle:Harvsp.
  6. Modèle:Article, repris dans Georg Cantor, Gesammelte Abhandlungen mathematischen und philosophischen Inhalts, édité par E. Zermelo, 1932.
  7. M Modèle:Lang N, où Modèle:Lang se traduit plus littéralement par puissance.
  8. Modèle:Harvsp, Définition 31.
  9. Modèle:Harvsp, sec. 2.4, Hausdorff and Functions ; Modèle:Ouvrage, réimpression chez Chelsea, New York, 1965.
  10. Modèle:Article.
  11. Modèle:Harvsp, notamment le point 4 Modèle:P..
  12. Modèle:Harvsp, point 2 de l'article.
  13. Modèle:Article réimprimé en 1961, pages 24–33 de Modèle:Ouvrage. Jean Modèle:Harvsp commence par une analyse de l'article de von Neumann, avant d'en proposer une traduction en anglais.
  14. par exemple Modèle:Harvsp, chap. 2 Modèle:P., Définitions par induction sur les ordinaux.
  15. Modèle:Article.
  16. Voir Modèle:Harvsp, sec. 3.2, Well-Foundedness and the Cumulative Hierarchy, ainsi que la longue analyse de l'article de Zermelo dans Modèle:Article, §6. Modèle:P..
  17. Cependant, Modèle:Harvsp se dit prêt à les admettre ; ils les appelle atomes.
  18. voir par exemple Modèle:Harvsp ; voir aussi l'article sur le système NBG.
  19. Modèle:Harvsp.
  20. il est utilisé dans Modèle:Ouvrage.
  21. telles que par exemple, l'univers entier (c'est le Modèle:Nobr de Modèle:Harvsp, la collection de tous les ensembles x), ou bien la collection de toutes les paires ordonnées (xy) pour lesquelles les ensembles x et y sont tels que x ∈ y.
  22. Modèle:Harvsp.
  23. Modèle:Harvsp.
  24. Modèle:Harvsp ; Modèle:Harvsp, présente les mêmes six axiomes mais dans un autre ordre.
  25. Modèle:Harvsp, au point 3.17, s'en tient à la forme donnée par Zermelo en 1908 pour l'axiome de l'infini ; pour cet axiome, Modèle:Harvsp, Comparaison des théories Z et ZF ou Modèle:Harvsp ne font pas de différence entre Z et ZF.
  26. Modèle:Harvsp, section 8.13.
  27. Modèle:Harvsp.
  28. Modèle:Harvsp, axiome de la paire Modèle:P., puis Th. 1.4. pour l'ensemble vide et existence de la paire Modèle:P..
  29. Modèle:Harvsp, "La collection des ordinaux" chap. 2 Modèle:P. et axiome de l'infini, chap. 2 sec. 5, Modèle:P. puis dernière formulation équivalente de cet axiome à la Modèle:P..
  30. par exemple Modèle:Harvsp, Comparaison des théories Z et ZF.