Problème de Robbins

De testwiki
Version datée du 4 décembre 2023 à 18:39 par imported>Loxyger
(diff) ← Version précédente | Version actuelle (diff) | Version suivante → (diff)
Aller à la navigation Aller à la recherche

Le problème de Robbins, aussi appelé quatrième problème de la secrétaire, est un problème mathématique de théorie des probabilités et plus particulièrement de théorie de l'arrêt optimal. Il doit son nom au mathématicien Herbert Robbins qui l'a énoncé la première fois en 1990[1]. Le problème de Robbins reste jusqu'à ce jour encore ouvert.

Énoncé

Informellement, le problème est le suivant : un recruteur travaillant dans une entreprise cherche à embaucher un secrétaire. Pour cela il va faire passer un entretien d'embauche à un certain nombre de candidats (ce nombre est fini et connu du recruteur). À la fin de chaque entretien, le recruteur attribue une note (un nombre réel) entre 0 et 1 en fonction des performances du candidat. Plus la note est proche de 0, plus le candidat est qualifié. On suppose que pour chaque candidat toutes les notes possibles sont équiprobables (les candidats ont autant de chance d'être bons que mauvais). On suppose aussi que les notes des candidats n'influent pas sur les performances des autres. A la fin de chaque entretien le recruteur doit prendre une décision irrévocable : soit il accepte le candidat et l'embauche sur le champ sans faire passer l'entretien aux prochains ; soit il refuse le candidat et alors il ne pourra plus revenir sur sa décision. Le problème consiste alors à déterminer une stratégie optimale permettant de minimiser le rang du candidat retenu (le rang étant le classement par rapport aux autres, par exemple le candidat de rang 1 est le meilleur de tous, celui de rang 2 est le deuxième meilleur, etc).

Plus formellement, soit X1,,Xn des variables i.i.d de loi uniforme dans [0,1]. Pour tout 0kn, on pose k:=σ(X1,,Xk) la tribu engendrée par les k premières variables aléatoires X1,,Xk. On définit le rang absolu :

Rk:=i=1n𝟏XiXk.

On cherche alors un temps d'arrêt optimal τ* qui minimiserait la quantité Vn:=infτ𝔼[Rτ] où l'infimum est pris sur l'ensemble des temps d'arrêt adaptés à la filtration (k).

Résultats

Les premières valeurs de Vn sont connues pour n=1,2,3,4[2] :

V1=1, V2=1,25, V3=1,39155 et V4=1,4932

La complexité des calculs grandit très vite et calculer V4 n'est pas trivial.

Un argument de «prophète»[1] permet de montrer que la suite (Vn) est croissante. De plus elle est bornée. En effet, dans le troisième problème de la secrétaire, qui est identique au problème de Robbins à la différence que le recruteur n'a accès qu'aux rangs relatifs et non aux notes des candidats, la suite associée (V'n) est bornée. Or il est clair que VnV'n pour tout n1. Ainsi la suite (Vn) converge vers une limite notée V.

Actuellement la valeur de V est inconnue et le meilleur encadrement connu est 1.909V2,32614. La borne inférieure a été trouvée en utilisant une méthode de troncation[3] tandis que la borne supérieure a été trouvée en utilisant une stratégie à seuil sans mémoire modifiée[4].

Stratégie à seuil sans mémoire

Une stratégie à seuil sans mémoire consiste à sélectionner le candidat numéro k si et seulement si sa note est inférieure à un certain seuil, sans se soucier des performances des candidats précédents (d'où l'appellation «sans mémoire»). Plus formellement, fixons une fonction de seuil s:{1,,n}[0,1] telle que s(n)=1. La stratégie à seuil sans mémoire associée à la fonction s correspond alors au temps d'arrêt

τ:=inf{k:Xks(k)}.

Par exemple en prenant

s(k):=2nk+2k=1,2,,n

on obtient que l'espérance de la note du candidat retenu vérifie, pour tout n1[3] :

𝔼(Rτ)7/3.

Cela implique donc en particulier que V7/3.

Références

Modèle:Références

Articles connexes

Modèle:Portail