Recouvrement par jauge

De testwiki
Version datée du 11 janvier 2021 à 13:04 par imported>WikiCleanerBot (v2.04b - Correction syntaxique (Modèle avec paramètre obsolète))
(diff) ← Version précédente | Version actuelle (diff) | Version suivante → (diff)
Aller à la navigation Aller à la recherche

Le recouvrement par jauge[1] est une technique d'optimisation mathématique, structurellement et intentionnellement semblable à la poursuite de base, qui étend cette dernière sur deux points :

  • l'espace sous-jacent est un espace euclidien général (au lieu de l'espace vectoriel n),
  • le critère de sélection est une jauge polyédrique définie sur cet espace (au lieu de la [[Norme (mathématiques)#Exemples|norme ℓModèle:1]]).

Cette généralisation permet d'appliquer cette technique de recouvrement de données codées, dans des contextes plus variés. Par exemple, on pourra s'intéresser au recouvrement d'objets représentés par des matrices et utiliser la norme nucléaire comme critère de sélection.

Nous renvoyons aux articles « Poursuite de base » et « Acquisition comprimée » pour des indications sur les problématiques pratiques conduisant à des problèmes de ce type. Voir aussi Modèle:Harvsp.

Connaissances supposées : le vocabulaire de l'optimisation mathématique et de l'algèbre linéaire.

Notations

Recouvrement par jauge polyédrique abstraite

Définition du problème

De manière plus précise, le problème s'écrit comme suit

(Pf){inff(x)Ax=b,

où l'inconnue est un vecteur x de E, f:E{+} est une jauge polyédrique (c'est-à-dire dont l'épigraphe est un polyèdre convexe) pouvant donc prendre des valeurs infinies, A est une application linéaire de E dans F et bF.

On note

:={xEf(x)1},

l'ensemble de sous-niveau 1 de la jauge f, qui joue le rôle de boule-unité (c'est ce qu'il serait si le jauge était une norme). Comme f est une jauge polyédrique, est un polyèdre convexe contenant 0. Il revient au même de se donner f et d'en déduire comme ci-dessus, ou de se donner un polyèdre convexe contenant 0 et d'en déduire la jauge polyédrique f par la formule de Minkowski :

xEf(x)=inf{t>0xt}.

C'est ce qui sera fait dans la section suivante, avec une description plus précise de .

Le sous-différentiel de la jauge f en x joue un rôle important dans les conditions d'existence et d'unicité de solution. Il est noté 𝒮(x) et sa valeur est donnée par la formule

𝒮(x):=argmaxyy,x.

Contraintes polyédriques

Le modèle de problème (Pf) peut prendre en compte des contraintes polyédriques, c'est-à-dire un problème de la forme

{inff0(x)xP,

f0:E{+} est la jauge d'un polyèdre convexe 0E contenant 0, et P est un autre polyèdre convexe de E. Le polyèdre convexe P peut toujours être écrit comme suit

P={xEAxb},

A:Em est une application linéaire, bm et l'inégalité agit composante par composante. Donc le problème s'écrit

{inf(x,s)E×mf0(x)Ax+s=bs0.

Ce dernier problème peut s'écrire sous la forme d'un problème de recouvrement par jauge sous la forme standard (Pf), à savoir

{inf(x,s)E×mf(x,s)Ax+s=b,

en prenant pour f la jauge du polyèdre convexe contenant 0 suivant :

0×cone{e1,,em}=0×+mE×m,

ei désigne le i-ème vecteur de la base canonique de m. L'équivalence entre ces problèmes repose sur le fait que f(x,s)=f0(x) si s0, et f(x,s)=+ si s⩾̸0. C'est en réalité sa polyédricité qui permet d'obtenir la condition nécessaire et suffisante de solution de la proposition suivante, comme en optimisation linéaire.

Modèle:Théorème

Ce résultat ne dit rien sur la valeur optimale de (Pf) et celle-ci peut très bien valoir + alors que le problème a une solution. Il en sera ainsi si, et seulement si, b est dans l'image de A (ce qui assure l'existence d'une solution par la proposition) et l'ensemble admissible ne rencontre pas le domaine de f. Une telle situation (sans intérêt) ne se rencontre pas en optimisation linéaire, car le critère ne prend alors que des valeurs finies.

Des conditions nécessaires et suffisantes assurant l'existence et l'unicité de la solution de (Pf) sont moins aisées à déterminer. On notera que celles présentées ci-dessous[2] dépendent du point x¯ considéré comme candidat-solution ; elles s'apparentent donc à des conditions d'optimalité d'un point x¯n donné : la première condition, celle caractérisant x¯ comme solution, traduit d'ailleurs l'appartenance de zéro au sous-différentiel de f+𝒳 en x¯ (𝒳 est l'indicatrice de l'ensemble admissible 𝒳) et le vecteur y¯ apparaissant dans toutes les conditions est une solution du problème dual (voir la section « Dualité lagrangienne »).

Dans le résultat ci-dessous, on note Sol(Pf) l'ensemble des solutions du problème (Pf).

Modèle:Théorème

Existence et unicité de solution

Modèle:Théorème

Modèle:Ancre

Dualité lagrangienne

Le problème dual lagrangien de (Pf) s'écrit comme le problème en yF suivant :

(Df){supyb,yA*y.

Modèle:Théorème

Modèle:Ancre

Recouvrement par jauge polyédrique sous description primale

Cette section donne les détails du problème de recouvrement par jauge polyédrique lorsque celle-ci est vue comme jauge d'un polyèdre convexe , lequel est décrit comme une enveloppe convexe de points plus une enveloppe conique de directions (description primale ou interne d'un polyèdre convexe).

Définition du problème

Le problème considéré s'écrit comme dans le cas abstrait, à savoir

(Pf){inff(x)Ax=b,

mais la jauge polyédrique f est définie comme jauge d'un polyèdre convexe par la formule

xEf(x)=inf{t>0xt}.

Le polyèdre convexe est décrit comme suit :

=co{ciiI}+cone{djjJ},

où les points ci sont dans E et en nombre fini (I est fini) et les directions dj sont dans E et en nombre fini (J est fini). Tout polyèdre convexe peut s'écrire de cette manière. On doit supposer que

0

pour que la jauge associée s'annule en l'origine. Mais on ne suppose pas que 0 est intérieur à , si bien que f peut prendre la valeur +. Comme est fermé, la jauge f est « fermée », c'est-à-dire semi-continue inférieurement.

Soient I0I et J0J. Il est utile d'introduire les applications linéaires

CI0:αI0|I0|CI0αI0:=iI0αiciE,C:=CI,DJ0:β|J0|DJ0β:=jJ0βjdjE,D:=DI.

On adopte la notation matricielle pour l'application linéaire

(CI0DJ0):(αI0,βJ0)|I0|×|J0|(CI0DJ0)(αI0,βJ0)=CI0αI0+DJ0βJ0E

et l'on note (CD):=(CIDJ). Avec ces notations, l'ensemble s'écrit aussi

={Cα+DβαΔI,β+|J|},

ΔI:={α+|I|iIαi=1} est le simplexe unité de |I|.

Grâce à la condition 0, on a l'équivalence

f(x)=0x=Dβpour unβ0(oux=0siJ=).

Le polaire de l'ensemble introduit ci-dessus s'écrit

={x*EiIx*,ci1 et jJx*,dj0}.

Alors le sous-différentiel de la jauge f en x est donné par la formule

𝒮(x):=argmaxx* tel queiIx*,ci1 et jJx*,dj0x*,x.

Existence de solution

Le résultat d'existence de solution II du cas abstrait devient le suivant.

Modèle:Théorème

Les coefficients α¯ et β¯ permettant de représenter x¯ par x¯=Cα¯+Dβ¯ dans ce résultat sont en réalité les multiplicateurs de Lagrange associés aux contraintes du problème d'optimisation linéaire définissant 𝒮(x¯). Au second point, ces coefficients α¯ et β¯ sont des multiplicateurs optimaux satisfaisant en plus la stricte complémentarité.

Existence et unicité de solution

Le résultat d'existence et d'unicité de solution du cas abstrait devient le suivant.

Modèle:Théorème

La seconde condition semble plus forte que la troisième, mais ce résultat montre qu'il n'en est rien. Cette seconde condition est utilisée par l'algorithme de détection d'unicité présenté plus loin. Cet algorithme détermine d'abord des ensembles d'indices I+I et J+J satisfaisant les deux premiers points de la condition 2 et détermine ensuite si l'unicité a lieu en vérifiant si Ker(A)Im(CI+DJ+)={0}.

Méthode de résolution

La méthode de résolution du problème de recouvrement par jauge sous forme primale (Pf) décrite dans cette section transforme ce problème en le problème d'optimisation linéaire suivant

(P'f){sup(α,β,t)|I|×|J|×tA(Cα+Dβ)=tb(α,β)ΔI×+|J|,

où les opérateurs linéaire C et D ont été définis ci-dessus et ΔI est le simplexe unité de |I|. En quelques mots, dans le problème (Pf), l'ensemble de sous-niveau un de f est mis à l'échelle de manière que sa frontière vienne en contact avec le sous-espace affine 𝒳={xEAx=b} (par l'homogénéité positive de f cela revient à trouver son bon ensemble de sous-niveau), tandis que dans (P'f), le même sous-espace affine 𝒳 est translaté de manière à venir en contact avec la frontière de . Le sens de cette équivalence entre (Pf) et (P'f) est précisé dans le résultat suivant.

Modèle:Théorème

Le fait que le problème (Pf) soit équivalent au problème d'optimisation linéaire (Pf) rend possible la résolution de (Pf) en temps polynomial, par exemple en utilisant un algorithme de points intérieurs.

Le dual lagrangien de (Pf) s'écrit

(Df){inf(y,s)F×s,iIA*y,cis,jJA*y,dj0,b,y=1.

Il n'y a pas de saut de dualité :

Modèle:Bloc emphase

Détection de l'unicité

Le résultat d'existence et unicité de solution ci-dessus permet de mettre au point un algorithme détectant l'unicité de solution du problème (Pf).

Modèle:Théorème

Annexes

Notes

Modèle:Références

Bibliographie

Modèle:Portail

  1. Modèle:Lang en anglais : voir par exemple Modèle:Harvsp ou Modèle:Harvsp.
  2. Voir Modèle:Harvsp.