Dualité (optimisation)

Modèle:Voir homonymes En théorie de l'optimisation, la dualité ou principe de dualité désigne le principe selon lequel les problèmes d'optimisation peuvent être vus de deux perspectives, le problème primal ou le problème dual, et la solution du problème dual donne une borne inférieure à la solution du problème (de minimisation) primal^[1]. Cependant, en général les valeurs optimales des problèmes primal et dual ne sont pas forcément égales : cette différence est appelée saut de dualité. Pour les problèmes en optimisation convexe, ce saut est nul sous contraintes.

Problème dual

Le terme de problème dual renvoie généralement au problème dual de Lagrange mais d'autres existent – comme le problème dual de Wolfe ou de Fenchel. Le problème dual de Lagrange est obtenu en écrivant le Lagrangien d'un problème de minimisation avec des multiplicateurs de Lagrange positifs pour ajouter les contraintes à la fonction objectif puis en résolvant sur les variables primales qui minimisent la fonction objectif originale. Cette solution donne les variables primales comme fonctions des multiplicateurs de Lagrange, appelés variables duales, et le nouveau problème consiste à maximiser la fonction objectif sur les variables duales sous les contraintes dérivées sur ces variables duales (comptant au minimum les contraintes non négatives).

En général, avec deux paires d'espaces localement convexes séparés Modèle:Math et Modèle:Math et la fonction Modèle:Math, on peut définir le problème primal ainsi : déterminer $\hat{x}$ vérifiant $f (\hat{x}) = \inf_{x \in X} f (x) .$ Ainsi, si $\hat{x}$ existe, $f (\hat{x})$ est le minimum de la fonction Modèle:Mvar et l'infimum (plus grand minorant) de la fonction est atteint.

S'il y a des contraintes, on peut modifier la fonction objectif Modèle:Mvar en $\tilde{f} = f + I_{c o n t r a i n t e s}$ avec Modèle:Math une fonction convenable sur Modèle:Mvar qui atteint son minimum, égal à 0, quand les contraintes sont satisfaites, ce qui permet de prouver que $\inf_{x \in X} \tilde{f} (x) = \inf_{x c o n t r a i n t} f (x)$ . Cette dernière condition est trivialement, mais pas toujours de façon idéale, satisfaite pour la fonction indicatrice (i.e. Modèle:Math avec Modèle:Mvar satisfaisant les contraintes et Modèle:Math sinon). On étend alors $\tilde{f}$ en une fonction de perturbation Modèle:Math telle que $F (x, 0) = \tilde{f} (x)$ ^[2].

Le saut de dualité est la différence entre les deux terme de l'inégalité

\sup_{y^{*} \in Y^{*}} - F^{*} (0, y^{*}) \leq \inf_{x \in X} F (x, 0),

où Modèle:Math est le conjugué convexe sur les deux variables et Modèle:Math désigne le supremum (plus petit majorant)^[2]Modèle:,^[3]Modèle:,^[4].

Saut de dualité

Modèle:Article détaillé

Le saut de dualité désigne la différence entre les valeurs prises par les problèmes primal et dual aux points solutions. Si Modèle:Math est la valeur optimale duale et Modèle:Math est la valeur primale optimale, le saut de dualité vaut Modèle:Math. Cette valeur est toujours positive ou nulle, et ne s'annule que si et seulement si les conditions de dualité forte sont vérifiées ; sinon, le saut est strictement positif et on parle de dualité faible^[5].

En optimisation numérique, un autre saut de dualité est évoqué : la différence des valeurs entre une solution duale et la valeur d'une solution primale admissible mais sous-optimale. Ce saut alternatif quantifie la différence entre la valeur d'un itéré admissible mais sous-optimal pour le problème primal et la valeur du problème dual ; la valeur du problème dual est, sous conditions de régularité, égale à la valeur de relaxation convexe du problème primal : la relaxation convexe est le problème levé en remplaçant un ensemble admissible non convexe par son enveloppe convexe fermée et en remplaçant une fonction non convexe par sa fermeture convexe, ainsi la fonction a l'épigraphe qui est l'enveloppe convexe fermée de la fonction objectif primale d'origine^[6]Modèle:,^[7]Modèle:,^[8]Modèle:,^[9]Modèle:,^[10]Modèle:,^[11]Modèle:,^[12]Modèle:,^[13]Modèle:,^[14]Modèle:,^[15]Modèle:,^[16].

Cas linéaire

Modèle:Article détaillé Les problèmes d'optimisation linéaire sont des problèmes d'optimisation dans lesquels la fonction objectif et les contraintes sont toutes linéaires. Dans le problème primal, la fonction objectif est une combinaison linéaire de Modèle:Mvar variables. Il y a Modèle:Mvar contraintes, qui chacune place une majoration sur une combinaison linéaire des Modèle:Mvar variables. Le but est de maximiser la valeur de la fonction objectif soumise aux contraintes. Une solution sera alors un vecteur de Modèle:Mvar valeurs qui atteint le maximum possible pour la fonction objectif.

Dans le problème dual, la fonction objectif est une combinaison linéaire des Modèle:Mvar valeurs qui sont limites sur les Modèle:Mvar contraintes pour le problème primal. Il y a donc Modèle:Mvar contraintes duales, chacune plaçant une minoration sur une combinaison linéaire des Modèle:Mvar variables duales.

Relation entre les problèmes primal et dual

Dans le cas linéaire, pour le problème primal, pour chaque point sous-optimal satisfaisant toutes les contraintes, il y a une direction ou sous-espace de directions à déplacer qui augmente la valeur de la fonction objectif. Déplacer dans une de ces directions est supposé supprimer une erreur entre la solution candidate et une ou plusieurs contraintes. Une valeur non admissible de la solution candidate provoque un excès sur une ou plusieurs contraintes.

Dans le problème dual, le vecteur dual multiplie les contraintes qui déterminent les positions des contraintes dans le primal. Faire varier le vecteur dual dans le problème dual est équivalent à revoir les majorants du problème primal. Le plus petit majorant est recherché. Ainsi, le vecteur dual est minimisé de façon à diminuer la marge entre les positions candidates des contraintes et le véritable optimum. Une valeur non admissible du vecteur dual est une qui serait trop basse. Elle place les positions candidates d'une ou plusieurs contraintes dans une position qui exclut l'optimum recherché.

Cas non linéaire

En optimisation non linéaire, les contraintes ne sont pas nécessairement linéaires. Certaines idées directrices restent applicables.

Pour assurer que le maximum global d'un problème non linéaire soit facilement identifié, la formulation du problème demande souvent que les fonctions soient convexes et des ensembles faiblement compacts.

C'est ce qu'on retrouve à travers les conditions de Karush-Kuhn-Tucker. Elles donnent des conditions nécessaires pour identifier des optima locaux de problèmes d'optimisation non linéaire. Il y a des conditions supplémentaires (qualifications de contrainte) qui sont nécessaires de sorte qu'il sera possible de définir la direction vers une solution optimale. Cette solution optimale sera un optimum local, pas forcément global.

Principe de Lagrange fort : dualité de Lagrange

Modèle:Ancre Soit un problème d'optimisation non linéaire dans sa forme standard

\begin{matrix} minimiser & f (x) \\ avec & g_{i} (x) \leq 0, i \in {1, \dots, m} \\ h_{j} (x) = 0, j \in {1, \dots, p} \end{matrix}

dans le domaine $𝒟 \subset ℝ^{n}$ non vide, le lagrangien $ℒ : ℝ^{n} \times ℝ^{m} \times ℝ^{p} \to ℝ$ est défini par

ℒ (x, λ, ν) = f (x) + \sum_{i = 1}^{m} λ_{i} g_{i} (x) + \sum_{j = 1}^{p} ν_{j} h_{j} (x) .

Les vecteurs Modèle:Mvar et Modèle:Mvar sont appelés variables duales ou vecteurs multiplicateurs de Lagrange associés au problème. La fonction duale de Lagrange $g : ℝ^{m} \times ℝ^{p} \to ℝ$ est définie par :

g (λ, ν) = \inf_{x \in 𝒟} ℒ (x, λ, ν) = \inf_{x \in 𝒟} (f (x) + \sum_{i = 1}^{m} λ_{i} g_{i} (x) + \sum_{j = 1}^{p} ν_{j} h_{j} (x)) .

La fonction duale Modèle:Mvar est concave, même si le problème initial n'est pas convexe, car c'est l'infimum ponctuel de fonctions affines. La fonction duale a des bornes inférieures sur la valeur optimale Modèle:Math du problème initial ; pour tout Modèle:Math et tout Modèle:Mvar, on a Modèle:Math.

Si une contrainte telle que la condition de Slater est vérifiée et que le problème original est convexe, on a alors une dualité forte :

d^{*} = \max_{λ \geq 0, ν} g (λ, ν) = \inf f_{0} = p^{*}

.

Problèmes convexes

Pour un problème de minimisation convexe avec contraintes d'inégalité,

\begin{matrix} \min_{x \in 𝒟} & f (x) \\ avec & g_{i} (x) \leq 0, i = 1, \dots, m \end{matrix}

on peut utiliser plusieurs versions du problème dual :

Problème dual de Lagrange: $\begin{matrix} \sup_{λ \in ℝ^{m}} & \inf_{x} (f (x) + \sum_{j = 1}^{m} λ_{j} g_{j} (x)) \\ avec & λ_{i} \geq 0, i = 1, \dots, m \end{matrix}$

où la fonction objectif est la fonction duale de Lagrange. Sachant que les fonctions Modèle:Mvar et Modèle:Math sont continûment dérivables, l'infimum est le point où le gradient s'annule.

Problème dual de Wolfe: $\begin{matrix} \sup_{x, λ} & f (x) + \sum_{j = 1}^{m} λ_{j} g_{j} (x) \\ avec & \nabla f (x) + \sum_{j = 1}^{m} λ_{j} \nabla g_{j} (x) = 0 \\ λ_{i} \geq 0, i = 1, \dots, m \end{matrix}$

Ce problème peut être difficile à résoudre numériquement car la fonction objectif n'est pas concave en tout point Modèle:Math. De même, la contrainte d'égalité $\nabla f (x) + \sum_{j = 1}^{m} λ_{j} \nabla g_{j} (x)$ est non linéaire en général, ainsi le problème dual de Wolfe est typiquement un problème d'optimisation non convexe. Dans tous les cas, on a une dualité faible^[17].

Problème dual de Fenchel

Modèle:... Pour un problème de minimisation

\inf_{x \in 𝒟} (f (x) + \sum_{j = 1}^{m} g_{j} (x))

le problème dual de Fenchel s'écrit :

\sup_{ϕ \in X} (- f^{*} (ϕ) - \sum_{j = 1}^{m} g_{j}^{*} (- ϕ)) ou - \inf_{ϕ \in X} (f^{*} (ϕ) + \sum_{j = 1}^{m} g_{j}^{*} (- ϕ))

où Modèle:Math et les Modèle:Math désignent les conjuguées de Fenchel-Legendre respectives de Modèle:Mvar et Modèle:Mvar :

\forall ϕ \in ℝ^{n}, f^{*} (ϕ) = \sup_{x \in ℝ^{n}} (⟨ ϕ, x ⟩ - f (x)) .

Cette approche est notamment utilisée dans les algorithmes de lissage pour le traitement du signal et le traitement d'image^[18].

Dans la littérature, il en est régulièrement fait mention sous le nom de dualité de Fenchel-Rockafellar. Pour plus de détails, voir la page Wikipédia anglaise : Fenchel's duality theorem.

Histoire

Selon George Dantzig, le théorème de dualité pour l'optimisation linéaire a été conjecturé par John von Neumann immédiatement après que Dantzig a présenté les problèmes d'optimisation linéaire. Von Neumann note qu'il utilise l'information de sa théorie des jeux, et suppose qu'un jeu matriciel à deux personnes à somme nulle est équivalent à un problème d'optimisation linéaire. Des preuves rigoureuses ont d'abord été publiés en 1948 par Albert W. Tucker et son groupe (préambule de Dantzig à Nering et Tucker, 1993).

Voir aussi

Notes

Modèle:Traduction/Référence Modèle:Références

Références

Ouvrages

Articles

Modèle:Article
Modèle:Article
Duality in Linear Programming Gary D. Knott

Modèle:Portail

[Boyd-1] Modèle:Ouvrage

[BWG-2] 2,0 et ^2,1 Modèle:Ouvrage

[3] Modèle:Ouvrage

[Zalinescu-4] Modèle:Ouvrage

[5] Modèle:Ouvrage

[6] Modèle:Ouvrage

[7] Modèle:Ouvrage

[8] Modèle:Ouvrage

[9] Modèle:Ouvrage

[10] Modèle:Ouvrage

[11] Modèle:Ouvrage

[12] Modèle:Ouvrage

[13] Modèle:Ouvrage

[14] Modèle:Ouvrage

[15] Modèle:Ouvrage

[16] Modèle:Ouvrage

[17] Modèle:Article

[18] Modèle:Article

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

Dualité (optimisation)

Sommaire

Problème dual

Saut de dualité

Cas linéaire

Relation entre les problèmes primal et dual

Cas non linéaire

Principe de Lagrange fort : dualité de Lagrange

Problèmes convexes

Histoire

Voir aussi

Notes

Références

Ouvrages

Articles

Menu de navigation

Dualité (optimisation)

Problème dual

Saut de dualité

Cas linéaire

Relation entre les problèmes primal et dual

Cas non linéaire

Principe de Lagrange fort : dualité de Lagrange

Problèmes convexes

Histoire

Voir aussi

Notes

Références

Ouvrages

Articles

Menu de navigation

Rechercher