Qualification de contraintes

De testwiki
Version datée du 28 décembre 2018 à 15:15 par imported>HerculeBot (Lien portail; changements de type cosmétique)
(diff) ← Version précédente | Version actuelle (diff) | Version suivante → (diff)
Aller à la navigation Aller à la recherche

En mathématiques, lorsqu'une partie d'un espace normé est décrit par des fonctions différentiables, appelées contraintes dans ce contexte, la question se pose de savoir si l'on peut obtenir le cône tangent à cet ensemble en linéarisant ces contraintes. Si c'est le cas, on dit que les contraintes sont qualifiées (on simplifie un peu, voir ci-dessous pour une définition précise). L'intérêt d'avoir des contraintes qualifiées est de disposer d'une formulation analytique du cône tangent qui, sans qualification, peut être difficile à calculer.

Cette notion est utilisée

Connaissances supposées : le calcul différentiel, l'algèbre linéaire, les bases de l'analyse convexe, la notion de cône tangent.

Introduction

Soient 𝔼 un espace normé, X une partie de 𝔼 et x un point de 𝔼. On s'intéresse au calcul du cône tangent à X en x, que l'on note

TxX,

lorsque X est défini comme l'image réciproque d'un ensemble par une fonction. De manière plus précise, supposons que X soit défini comme suit

X:={x𝔼:c(x)G}c1(G),

G est une partie d'un espace normé 𝔽, c:𝔼𝔽 est une fonction différentiable, que l'on appelle contrainte, et l'exposant «1» est utilisé pour désigner l'image réciproque. On introduit le cône linéarisant

TxX:={d𝔼:c(x)dTc(x)G}c(x)1(Tc(x)G).

On montre facilement que

Modèle:Bloc emphase

On n'a pas nécessairement l'égalité entre les deux cônes TxX et T'xX, car T'xX peut être convexe (c'est le cas si G est convexe) alors que TxX ne l'est pas nécessairement. En optimisation (et c'est avec ce point de vue que cet article est écrit), c'est gênant, car c'est le cône tangent TxX qui intervient dans la condition nécessaire d'optimalité générique de Peano-Kantorovitch alors que le cône linéarisant T'xX a l'avantage d'avoir une expression analytique que l'on aimerait pouvoir exploiter. La notion de qualification des contraintes définissant X est liée au fait de pouvoir avoir l'égalité entre les deux cônes, mais pas seulement. La technique de démonstration conduisant aux conditions d'optimalité du premier ordre cherche à montrer que le gradient f(x*) appartient à un cône que l'on peut expliciter. Deux ingrédients interviennent dans cette approche :

  • l'égalité entre le cône tangent et le cône linéarisant, qui permet ainsi d'avoir une expression exploitable du premier,
  • le fait de pouvoir se passer de la prise de l'adhérence après application du lemme de Farkas.

Le second point est à l'origine de la seconde condition ci-dessous.

Modèle:Théorème

La seconde condition est immédiatement vérifiée si G est un polyèdre convexe, car alors le cône tangent TxG est aussi un polyèdre convexe et son dual (TxG)+ également ; il en résulte que c(x)*[(Tc(x)G)+] est un polyèdre convexe et donc un fermé. Cette condition de polyédricité sera vérifiée pour les ensembles XE et XEI ci-dessous.

La qualification est une propriété de la fonction c, pas de l'ensemble X dont la définition utilise cette fonction. On peut en effet définir l'ensemble X par diverses fonctions c, sans modifier donc le cône tangent TxX, alors que TxX sera le plus souvent affecté par le changement de fonction c. Dès lors, cette notion de qualification permet de sélectionner les bonnes fonctions c, dans un sens qui dépend du contexte.

Qualification de contraintes d'égalité

L'ensemble XE

On considère dans cette section que l'ensemble est décrit comme l'image réciproque d'un point par une application différentiable c:𝔼𝔽 entre deux espaces vectoriels de dimension finie 𝔼 et 𝔽 :

XE:={x𝔼:c(x)=0}.

Le point de 𝔽 dont on prend l'image réciproque par c est l'origine ; c'est sans perte de généralité, car un autre point pourrait être intégré dans la fonction c.

Conditions suffisantes de qualification de la contrainte définissant XE

D'après la formule générale de TxX ci-dessus, le cône tangent TxXE est inclus dans le cône suivant

TxXE:={d𝔼:c(x)d=0}

et on dit que la contrainte c définissant XE est qualifiée en x si TxXE=TxXE. Une condition suffisante de qualification est la suivante.

Modèle:Théorème

Qualification de contraintes d'égalité et d'inégalité

L'ensemble XEI

On considère dans cette section que l'ensemble est décrit comme l'image réciproque d'un cône particulier Gm par une application c:𝔼m définie sur un espace vectoriel de dimension finie 𝔼 :

XEI:={x𝔼:cE(x)=0,cI(x)0}.

On a noté E et I des ensembles d'indices formant une partition de l'ensemble des m premiers entiers {1,,m} :

EI={1,,m}etEI=.

Les cardinaux de E et I sont notés respectivement

mE:=|E|etmI:=|I|,

si bien que m=mE+mI. Alors cE:𝔼mE désigne la fonction dont les composantes ci sont celles de c avec iE. De même pour cI. Le cône de m dont XEI est l'image réciproque par c est donc

G={vm:vi=0siiE,vi0siiI}.

Son cône tangent en yG est donné par

TyG={hm:hi=0siiE,hi0siiIetyi=0}.

Conditions suffisantes de qualification de la contrainte définissant XEI

D'après la formule générale de TxX et celle de TyG ci-dessus, le cône tangent TxXEI est inclus dans le cône suivant

TxXEI:={d𝔼:c'E(x)d=0,c'I0(x)(x)d0},

où on a noté

I0(x)Ix0:={iI:ci(x)=0}

l'ensemble des indices des contraintes d'inégalité actives en x. On rappelle que la contrainte c définissant XEI est dite qualifiée en x si TxXEI=TxXEI. Vérifier que cette égalité a lieu est une tâche difficile car il faut calculer le cône tangent. On connaît un grand nombre de conditions assurant que cette qualification a lieu (des conditions suffisantes donc). Elles supposent toutes que les contraintes actives au point considéré sont différentiables en ce point, car les dérivées de ces contraintes interviennent dans la définition du cône linéarisant. Voici les principales conditions suffisantes de qualification, donnant un petit aperçu de la galerie des conditions qui sont utilisées aujourd'hui.

Affinité locale (QC-A)

Cette condition suffisante de qualification est utilisée pour des contraintes linéaires (ou affines), comme en optimisation linéaire ou quadratique.

Modèle:Théorème

Slater (QC-S)

Les conditions suffisantes de qualification de Slater[1] sont essentiellement utilisées pour les ensembles définis par des contraintes convexes.

Modèle:Théorème

Indépendance linéaire (QC-IL)

Cette condition suffisante de qualification a bien des défauts mais elle a l'avantage de la simplicité et de n'utiliser qu'un concept d'algèbre linéaire.

Modèle:Théorème

Au point 3, l'ensemble affine peut être vide (il est en réalité réduit à un point ou vide). Cette condition exprime de manière compliquée que c'EI0(x)(x)* est injective ; cette affirmation a été mise sous cette forme pour la rapprocher de celle que l'on obtient (condition 4) avec (QC-MF) ci-dessous.

Mangasarian-Fromovitz (QC-MF)

Cette condition suffisante de qualification, qui fut trouvée assez tardivement (1967)[2], est celle qui est la mieux adaptée aux problèmes avec contraintes d'inégalité non linéaires.

Modèle:Théorème

La comparaison de la première condition de (QC-IL) et de la première condition de (QC-MF) montre clairement que l'on a Modèle:Bloc emphase La réciproque n'est pas vraie, comme le montre le cas de deux boules tangentes intérieurement : au point de tangence, (QC-MF) est vérifiée, mais pas (QC-IL).

La seconde condition de (QC-MF) est aussi clairement plus faible que la seconde condition de (QC-IL), puisqu'elle exprime une espèce de sous-surjectivité de la jacobienne c'EI0(x)(x).

L'expression duale 4 des conditions de Mangasarian-Fromovitz ci-dessus est due à Gauvin (1977)[3] ; elle fait intervenir un produit scalaire sur 𝔼 et l'adjoint des opérateurs dérivées. Appliquée à l'optimisation, cette expression implique que l'ensemble des multiplicateurs optimaux est borné si et seulement si (QC-MF) a lieu.

Examinons à présent les liens entre (QC-S) et (QC-MF).

Modèle:Théorème

Qualification de contraintes générales

L'ensemble XG

Dans cette section, on suppose que l'ensemble XXG est défini comme dans l'introduction de cet article, à savoir

XG:={x𝔼:c(x)G}=c1(G),

c:𝔼𝔽 est une fonction et G est un convexe fermé non vide de l'espace euclidien 𝔽. Le produit scalaire des espaces euclidiens 𝔼 et 𝔽 sont tous deux notés ,.

Condition suffisante de qualification de Robinson

La condition suffisante de qualification de Robinson[4] est une généralisation à l'ensemble XG de la condition de Mangasarian-Fromovitz de l'ensemble XEI.

Modèle:Théorème

Dans (QC-R), l'écriture c(x)𝔼 est une autre manière de désigner (c(x)), l'image de l'opérateur linéaire c(x). Cette condition (QC-R) n'est pas simple ; elle est difficile à décrire géométriquement et à mémoriser. Lorsqu'elle est écrite en x=x0, il est sans doute utile (et c'est comme cela qu'elle intervient dans son analyse) de la voir comme l'image de la multifonction «linéarisée»

T0:𝔼𝔽:x𝔼c(x0)+c(x0)(xx0)G.

Cette dernière multifonction est en effet une espèce de linéarisation en x0 de la multifonction

T:𝔼𝔽:x𝔼c(x)G,

qui a tout son sens dans l'analyse de XG puisque xXG si, et seulement si, 0T(x).

Le résultat de qualification précis est le suivant ; il demande un peu plus de régularité pour c en x.

Modèle:Théorème

La condition de Robinson peut s'écrire sous les différentes formes ci-dessous ; on y a noté Tc(x)aG:=+(Gc(x)) le cône des directions admissibles de G en c(x).

Modèle:Théorème

La condition de Robinson a essentiellement un lien avec la stabilité de XG pour de petites perturbations y de G, dans le sens où l'on a la caractérisation suivante.

Modèle:Théorème

Le point 2 de ce résultat est équivalent à la régularité métrique en (x0,0) de la multifonction T:𝔼𝔽 définie en x𝔼 par T(x)=c(x)G parce qu'avec cette multifonction, on a dist(x,c1(y+G))=dist(x,T1(y)) et dist(c(x),y+G)=dist(y,T(x)). Ce qu'affirme ce point 2 est la propriété suivante : pour tout x proche de x0 et pour toute petite perturbation y de G, la distance de x à la perturbation c1(y+G) de XG reste contrôlable par la distance de c(x) à la perturbation y+G de G.

Maintenant, le membre de droite de l'inégalité du point 2 est toujours fini (G est non vide), si bien que le membre de gauche l'est aussi; ce qui a pour conséquence que la perturbation c1(y+G) de XG est non vide lorsque y est suffisamment petit.

Modèle:Théorème

Un autre corollaire est obtenu en prenant y=0 dans le point 2 : on obtient alors une borne d'erreur pour G.

Modèle:Théorème

Annexes

Notes

Modèle:Références

Articles connexes

Lien externe

Ouvrages généraux

  • Modèle:En J. F. Bonnans, A. Shapiro (2000). Perturbation Analysis of Optimization Problems. Springer Verlag, New York.
  • J.-B. Hiriart-Urruty (1996). L’Optimisation. Que sais-je, n° 3184. Presses Universitaires de France.
  • Modèle:En J.-B. Hiriart-Urruty, C. Lemaréchal (1993). Convex Analysis and Minimization Algorithms. Grundlehren der mathematischen Wissenschaften, 305-306. Springer-Verlag.
  • Modèle:En R. T. Rockafellar (1993). Lagrange multipliers and optimality. SIAM Review, 35, 183– 238.

Modèle:Portail

en:Karush–Kuhn–Tucker conditions#Regularity conditions (or constraint qualifications)

  1. Modèle:En M. Slater (1950). Lagrange multipliers revisited: a contribution to non-linear programming. Cowles Commission Discussion Paper, Math. 403.
  2. Modèle:En O. L. Mangasarian, S. Fromovitz (1967), The Fritz John necessary optimality conditions in the presence of equality and inequality constraints, Journal of Mathematical Analysis and Applications, 17, 37–47.
  3. Modèle:En J. Gauvin (1977). A necessary and sufficient regularity condition to have bounded multipliers in nonconvex programming. Mathematical Programming, 12, 136–138.
  4. Modèle:En S.M. Robinson (1976). Stability theory for systems of inequalities, part II: differentiable nonlinear systems. SIAM Journal of Numerical Analysis, 13, 487-513.