Algorithme de Frank-Wolfe

L' algorithme de Frank-Wolfe permet de résoudre des problèmes d'optimisation pour des fonctions convexes. Il a été proposé pour la première fois par Marguerite Frank et Philip Wolfe en 1956^[1]. Le principe de fonctionnement est d'approximer à chaque itération une fonction par son développement en série de Taylor au premier ordre.

Présentation du problème

On cherche à minimiser une fonction convexe $f$ définie sur un espace vectoriel $D$ ou une partie convexe de celui-ci.

On veut donc trouver $x$ tel que $f (x) = \min {f (y) | y \in D}$ .

Initialisation : On initialise $x$ avec une valeur aléatoire de $D$ et $k = 0$

Lancement de la boucle sur $k$

On cherche $s$ tel que $𝐬^{T} \nabla f (𝐱_{k})$ est minimal (On cherche le vecteur $s \in D$ qui a le produit scalaire le plus faible avec $\nabla f (𝐱_{k})$ - donc qui va dans la direction la plus opposée.)
Classiquement, on utilise une variable $γ = \frac{2}{2 + k}$
On met à jour $𝐱_{k + 1} \leftarrow 𝐱_{k} + γ (𝐬 - 𝐱_{k})$

Cet algorithme est notamment utilisé pour l'apprentissage des réseaux de neurones comme le codage parcimonieux