Maximum régularisé

De testwiki
Aller à la navigation Aller à la recherche

En mathématiques, un maximum régularisé (Modèle:Lang) d'une famille indicée Modèle:Math de nombres est une approximation lisse de la fonction maximum Modèle:Math, par une famille paramétrée de fonctions Modèle:Math telle que la fonction Modèle:Mvar est régulière pour toute valeur réelle de Modèle:Mvar, et tend vers la fonction maximum pour Modèle:Math ou Modèle:Math . Le concept de minimum régularisé peut être défini de façon similaire. Dans plusieurs cas, une même famille peut servir à approcher les deux fonctions, le maximum pour des valeurs positives très grandes, le minimum vers l'infini négatif :

mαmax pour α, mαmin pour α.

Le terme peut être utilisé pour toute fonction régularisante se comportant de façon similaire à la fonction maximum, sans être paramétrée.

Exemples

Approximations dérivables de la valeur absolue

En utilisant la définition suivante du maximum de deux nombres :

max(x1,x2)=x1+x2+|x2x1|2

on peut définir une fonction maximum régularisé en remplaçant le terme en valeur absolue par une fonction lisse équivalente, comme x2+α2 ou xerf(αx), où Modèle:Math désigne la fonction d'erreur[1].

Softmax
Maximum régularisé appliqué aux fonctions Modèle:Mvar et Modèle:Mvar pour plusieurs valeurs de coefficients. On voit que la fonction est très lisse pour Modèle:Math et plus raide pour Modèle:Math.

Pour de grandes valeurs du paramètre Modèle:Math, la fonction Modèle:Mvar définie ci-après, parfois appelée « Modèle:Mvar-softmax », est une approximation lisse et différentiable de la fonction maximum. Pour des valeurs négatives du paramètre grandes en valeur absolue, elle approche le minimum. La fonction Modèle:Mvar-softmax est définie par[2] :

Sα(x1,,xn)=i=1nxieαxii=1neαxi

Modèle:Mvar a les propriétés suivantes :

  1. Sαα+max
  2. Modèle:Math renvoie la moyenne arithmétique
  3. Sααmin

Le gradient de Modèle:Mvar est lié à la fonction softmax et vaut

xiSα(x1,,xn)=eαxij=1neαxj[1+α(xiSα(x1,,xn))].

Modèle:Refsou[3]

Normes de Hölder

Modèle:Article détaillé Une forme de maximum régularisé peut être basée sur une moyenne généralisée. Par exemple, pour des valeurs Modèle:Math positives, on peut utiliser une moyenne d'ordre Modèle:Math, soit

Sα(x1,,xn)=(1nj=1nxjα)1α.
LogSumExp

Modèle:Article détaillé Un autre maximum régularisé est connu sous le nom « LogSumExp »:

LSE(x1,,xn)=ln(exp(x1)++exp(xn))

La fonction peut être normalisée si les Modèle:Mvar sont tous positifs, menant à une fonction définie sur Modèle:Math vers Modèle:Math:

g(x1,,xn)=ln(exp(x1)++exp(xn)(n1))

Le terme Modèle:Math est un coefficient de correction pour prendre en compte que Modèle:Math, assurant ainsi qu'on ait bien Modèle:Math si tous les Modèle:Mvar sont nuls.

La fonction LogSumExp peut être paramétrée pour éviter les artefacts de lissage. On appelle cette forme « Modèle:Mvar-quasimax », définie par[2]:

𝒬α(x1,,xn)=1αLSE(αx1,,αxn)=1αln(exp(αx1)++exp(αxn))

Utilisation dans des méthodes numériques

Modèle:...

Les maximums lisses ont un intérêt dans les recherches d'extrema sur des ensembles de données discrètes[4] ou des algorithmes d'optimisation par descente du gradient.

Voir aussi

Références

Modèle:Traduction/Référence Modèle:Références


Modèle:Portail