Paradoxe des deux enveloppes

De testwiki
Aller à la navigation Aller à la recherche
Paradoxe des deux enveloppes.

En théorie de la décision, le paradoxe des deux enveloppes est un raisonnement probabiliste aboutissant à un résultat absurde. Inspiré d'un problème posé en 1930 par le mathématicien belge M. Kraïtchik[1], ce paradoxe a été formulé par Martin Gardner[2] en 1982. Il en existe plusieurs réfutations, certaines[3] ne faisant d'ailleurs pas appel au calcul des probabilités.

Énoncé

Il existe plusieurs variantes du paradoxe. Le plus souvent, il est proposé la situation de décision suivante[4]Modèle:,[5] : deux enveloppes contiennent chacune un chèque. On sait que l'un des chèques porte un montant double de l'autre, mais on n'a aucune information sur la façon dont les montants ont été déterminés. Un animateur propose à un candidat de choisir une des enveloppes, le montant du chèque contenu dans l'enveloppe choisie lui sera acquis.

Le paradoxe proprement dit réside dans l'argument qui va suivre : avant que le candidat n'ouvre l'enveloppe choisie, l'animateur lui conseille de changer son choix avec le raisonnement suivant.

Soit V la valeur du chèque dans l'enveloppe choisie. Il y a deux cas possibles :

  • une chance sur deux que l'autre enveloppe contienne un chèque deux fois plus important (donc de valeur 2V) ;
  • une chance sur deux que l'autre enveloppe contienne un chèque deux fois plus petit (donc de valeur V/2).

L'espérance du montant obtenu en changeant d'enveloppe serait alors Epr=50%×2V+50%×V/2=V+V/4=5/4×V qui est supérieur à V.

Le candidat aurait donc intérêt à changer d'enveloppe, ce qui est absurde puisque les deux enveloppes jouent le même rôle, et que le candidat, n'ayant pas encore ouvert la première, n'a aucun moyen de les distinguer.

Résolutions du paradoxe

Calcul d’espérances mathématiques

L'espérance mathématique permet de définir sur un grand nombre d'épreuves le gain moyen d'une loi de probabilité.

Espérance mathématique associée à chaque enveloppe

Afin de déterminer le gain moyen obtenu par le choix d’une enveloppe, on associe à la première enveloppe (resp. la seconde) la variable aléatoire X1 (resp. X2).

La loi de probabilité de la variable aléatoire X1 est l’ensemble des 2 solutions possibles proposées par le jeu (noté sous la forme {valeur ; probabilité d’apparition}) : Modèle:RetraitM et 2M sont les deux montants possibles proposés par le jeu.

Pour la variable aléatoire X2, l’ensemble est constitué de façon similaire : Modèle:Retrait

L’espérance du contenu de l’enveloppe 1 est par définition : Modèle:Retrait

Pour l’enveloppe 2, on a de façon similaire : Modèle:Retrait

On constate que E1=E2=3/2.M, ce qui est logique car les deux enveloppes ont un rôle identique.

Espérance mathématique associée à chaque changement

Si l'on change d’enveloppe, par exemple de l’enveloppe 1 à l’enveloppe 2, on obtient l’espérance E12 d’obtenir le gain de l’enveloppe 2 moins celui obtenu avec l’enveloppe 1 : Modèle:Retrait

Ceci est dû à la propriété de linéarité des calculs d’espérance.

On conclut E12=0.

De façon similaire E21=E12=0.

Sur un grand nombre d’épreuves, on ne peut pas espérer de gain en permutant les choix des enveloppes.

Espérance mathématique associée à chaque changement (variante)

Si l’on considère les 2 changements possibles[5] :

  • passer d’un montant M à un montant 2M ;
  • passer d’un montant 2M à un montant M.

On obtient resp. deux gains possibles :

  • le premier est positif de valeur +M avec une probabilité d’apparition de 50% ;
  • le second est négatif de valeur M avec une probabilité d’apparition de 50%.

Ceci définit une seconde loi de probabilité avec deux issues possibles (noté {valeur ; probabilité}) : Modèle:Retrait

Cette seconde loi de probabilité a pour espérance : Modèle:Retrait

Ce calcul aboutit lui aussi à un gain moyen nul, il s'agit simplement d'une alternative au calcul détaille de E12 ou de E21.

Espérance mathématique calculée par le présentateur

Il est intéressant de voir en quoi le raisonnement de l’animateur aurait un défaut. Celui-ci propose la formule suivante :

Modèle:RetraitMc est le montant de l’enveloppe choisie. On note que l’on ne connait pas Mc qui vaut soit M, soit 2M.

Par définition de l’espérance mathématique d’une loi de probabilité, on obtient de cette formule les deux solutions (noté {valeur ; probabilité d’apparition}) : Modèle:Retrait

Pour chacune de ces deux solutions, il faut envisager les deux cas possibles Mc=M et Mc=2M :

  • dans le premier cas, on obtient (2M;50%) et (M/2;50%) ;
  • dans le second : (4M;50%) et (M;50%).

On constate que les solutions possibles (M/2;50%) et (4M;50%) sont contraires aux hypothèses et invalident le raisonnement du présentateur.

En examinant de plus près la formule du présentateur, les deux solutions {2Mc;50%} et {Mc/2;50%} définissent une autre loi de probabilité. Ainsi Epr correspond à un autre protocole :

  • ouvrir l’enveloppe choisie,
  • lire son contenu Mc,
  • puis remplacer (avec des probabilités égales) le contenu de la seconde par 2Mc ou Mc/2.

Le présentateur a commis une confusion entre deux lois de probabilité distinctes.

Pour résumer, le présentateur raisonne sur l'Univers {2Mc;Mc/2} correspondant au protocole juste ci-dessus, alors que l'Univers du paradoxe des deux enveloppes est {M;2M}.

Remarques

Supposons que E12>0. Que se passerait-il si l’on permutait plusieurs fois ? Il faudrait détailler les calculs de E121, E1212, etc. On pourrait conjecturer une impossibilité, par exemple obtenir les deux relations incompatibles E121>E12>0 et E121=E1=0.

Variables aléatoires

Il est cependant possible, en fonction de la modélisation exacte du raisonnement de l'animateur, de considérer que l'erreur réside dans l'interprétation des espérances et non dans leur calcul : David Madore fait ainsi remarquer[3] que si l'on considère qu'il y a deux variables aléatoires, X1, valant M ou 2M, et correspondant (avec probabilités (1/2;1/2)) au contenu de la première enveloppe, et X2, valant 2M ou M, et correspondant au contenu de la seconde enveloppe, alors l'espérance de X1 est bien égale à celle de X2 et vaut 3M/2. Cependant l'espérance du rapport X2/X1 vaut (2M/M+M/2M)/2=5/4 ; l'erreur de raisonnement consiste alors à interpréter ce dernier résultat comme signifiant que X2 est plus intéressant que X1 (et donc qu'il faut changer d'enveloppe), alors que la seule conclusion à en tirer est le résultat surprenant, mais nullement paradoxal, que : Modèle:Retrait

Modifications de l'énoncé

Si le candidat est autorisé à consulter le contenu de la première enveloppe, une approche probabiliste à ce problème de décision redevient possible : Keith Devlin (suivant une analyse de Amos Storkey) fait ainsi remarquer que si l'animateur a choisi le contenu des enveloppes selon une règle (probabiliste ou non) connue du joueur, il devient possible de prendre une décision rationnelle d'échange en fonction du contenu de la première enveloppe (par exemple, si la règle propose un choix aléatoire uniforme de valeurs d'enveloppes, de choisir d'échanger si le contenu découvert est inférieur à la moyenne des choix offerts par la règle), et David Madore montre même qu'on peut (si peu vraisemblable que cela paraisse) obtenir une probabilité strictement supérieure à 1/2 de choisir la bonne enveloppe quelle que soit la règle utilisée par l'animateur, et ce sans connaitre celle-ci[3]. Avec une information supplémentaire, l'échange peut procurer un gain.

Attention à ne pas confondre avec le paradoxe de Bertrand ou paradoxe de Monty Hall.

Un autre protocole de choix des enveloppes

John Broome, repris par d'autres auteurs, propose le protocole suivant[6] : l'animateur place dans les enveloppes les montants 2n et 2n+1 avec une probabilité 2n3n+1 pour n positif ou nul[7]. Il remarque d'abord que lorsque l'enveloppe choisie contient Mc=1 on a intérêt à échanger puisque l'autre enveloppe contient 2 puis il montre que lorsque Mc=2n avec n>0 il y a un gain de 110×Mc espéré dans l'échange. Il en conclut que dans tous les cas le candidat a intérêt à changer même s'il n'ouvre pas l'enveloppe. Ce qui est paradoxal puisque, si le candidat n'ouvre pas les enveloppes, on a déjà montré qu'il n'y a aucun gain à espérer dans l'échange. Déduire un avantage lorsqu'on n'ouvre pas l'enveloppe de l'avantage espéré en prenant connaissance du contenu de l'enveloppe semble donc abusif ; l'explication vient de ce qu'avec cette distribution, l'espérance (que l'on change ou non d'enveloppe) est infinie[6].

Références

Modèle:Références

Liens externes


Modèle:Portail

  1. Modèle:Ouvrage
  2. Modèle:Ouvrage.
  3. 3,0 3,1 et 3,2 Explication du paradoxe par David Madore
  4. Modèle:Lien web
  5. 5,0 et 5,1 Modèle:Ouvrage
  6. 6,0 et 6,1 [1]
  7. Cette distribution est bien une loi, puisque l'on a (voir série géométrique)n=02n/3n+1=1 ; on peut cependant remarquer que la variable aléatoire ainsi définie n'a pas d'espérance, puisque n=0(1/2)(2n+2n+1)(2n/3n+1)=+