Critères de Wolfe

De testwiki
Aller à la navigation Aller à la recherche

Modèle:Ébauche

En optimisation, les critères de Wolfe sont un ensemble d'inégalités permettant d'optimiser la méthode de recherche linéaire ; plus précisément, cela permet de sélectionner un pas adéquat pour la recherche linéaire. Ils portent le nom de Philip Wolfe.

Description

Soit f:n une fonction de classe C1, et soit 𝐩k une direction de descente. Un pas αk est considéré comme satisfaisant les critères de Wolfe si les deux inégalités suivantes sont vérifiées :

  1. f(𝐱k+αk𝐩k)f(𝐱k)+c1αk𝐩kTf(𝐱k) ;
  2. 𝐩kTf(𝐱k+αk𝐩k)c2𝐩kTf(𝐱k).

avec 0<c1<c2<1.

La première inégalité est connue sous le nom de condition d'Armijo (ou condition de Goldstein ou condition de Goldstein-Armijo) et la seconde comme la condition de courbure. La condition d'Armijo impose que αk permette de décroître suffisamment f, et la condition de courbure assure que le taux d'accroissement de la fonction ϕ(α)=f(𝐱k+α𝐩k) en αk est plus grand que c2 fois celui en 0.

Les critères de Wolfe donnent une façon économique de point de vue algorithmique de calculer le pas permettant de diminuer ϕ dépendant de α. Cependant, les conditions peuvent donner une valeur pour le pas qui n'est pas proche d'un minimum de ϕ. Si on modifie la condition de courbure de la manière suivante :

2.a) |𝐩kTf(𝐱k+αk𝐩k)|c2|𝐩kTf(𝐱k)|

alors les conditions 1 et 2.a) prises ensemble sont appelées conditions fortes de Wolfe, puisque αk est forcément proche d'un point critique de ϕ.

Référence

Modèle:En J. Nocedal et S. J. Wright, Numerical optimization, Springer Verlag, NY, 1999

Articles connexes

Modèle:Palette Modèle:Portail