Dérivée fonctionnelle

De testwiki
Aller à la navigation Aller à la recherche

Modèle:Ébauche

La dérivée fonctionnelle est un outil mathématique du calcul des variations. Elle exprime la variation d'une fonctionnelle résultant d'une variation infinitésimale de la fonction fournie en argument. Cet outil est principalement utilisé pour trouver les extremums d'une fonctionnelle. En physique il est souvent nécessaire de minimiser une fonctionnelle, par exemple en mécanique analytique où la trajectoire suivie par un système doit minimiser l'action (voir principe de moindre action).

Cependant, la dérivée fonctionnelle n'est qu'une notation reprenant la définition de la différentielle, elle n'apporte pas de nouveaux concepts mathématiques par rapport à la différentiabilité d'une fonctionnelle.

Définition

Soit M un K espace vectoriel de fonctions, K étant le corps des scalaires. On appelle fonctionnelle sur M une application de M dans K. Notons l'ensemble des fonctionnelles sur M.

Soit une fonctionnelle F et une fonction ρM. Pour définir la dérivée fonctionnelle de F par rapport à sa variable ρ, nous avons besoin de la différentiabilité (au sens de Fréchet) de F en ρ (et donc de munir M et K de structures d'espace vectoriel normé).

Dans ce cadre, la dérivée fonctionnelle de F par rapport à ρ, notée δFδρ se définit comme la fonctionnelle sur M telle que :

ϕM,δFδρ[ϕ] =def DϕF[ρ]

DϕF représente la dérivée directionnelle de F dans la direction ϕ, cette dérivée étant bien définie au point ρ car F est supposée différentiable en ρ. Ici, l'argument des fonctionnelles est noté entre crochets [.] pour rappeler que l'argument de F et de δFδρ est une fonction.

Propriétés

  • On remarque immédiatement que la dérivée fonctionnelle de F par rapport à ρ s'identifie à la différentielle de F au point ρ : δFδρ=dFρ grâce à l'identité DϕF[ρ]=dFρ(ϕ). Cela montre que δFδρ est une forme linéaire sur M, c'est-à-dire que δFδρ appartient au dual (algébrique) de M. Dans ce cadre, la différentielle de F se note aussi δF et est appelée différentielle fonctionnelle de F.
  • Si M est un ensemble de fonction test, la propriété précédente fait de δFδρ une distribution.
  • Le fait que F soit stationnaire au point ρ s'écrit par définition δFδρ=dFρ=0, donc δFδρ=0 est une condition nécessaire pour que ρ soit un extremum local de F.

Règles de calcul

La dérivée fonctionnelle obéit à des règles similaires à celles du calcul différentiel ordinaire.

Soit deux fonctionnelles F,G et un scalaire λK :

  • Linéarité :
    δ(F+λG)δρ=δFδρ+λδGδρ
  • Règle du produit  :
    δ(FG)δρ=G[ρ]δFδρ+F[ρ]δGδρ
  • On a alors par récurrence la conséquence :
    δ(Fn)δρ=Fn1[ρ]δFδρ+F[ρ]δFn1δρ=Fn1[ρ]δFδρ+F[ρ]×(n1)Fn2[ρ]δFδρ=n×Fn1[ρ]δFδρ

Les multiplications étant définies grâce à la multiplication interne sur K : FG[ϕ] =def F[ϕ]G[ϕ]F[ϕ],G[ϕ]K.

Ces propriétés découlent directement de celles de la dérivée directionnelle, ou encore de la différentielle.

Abus de notations

On note X l'ensemble de définition des fonctions de M. Soit x,yX,

Les abus de notations suivants sont fréquemment utilisés :

  • δFδϕ[δy] =not δF[ϕ]δϕ(y) =not δFδϕ(y), avec δy, la distribution de Dirac centrée en y considérée comme une fonction de M telle que xX,δy(x)=δ(yx) (ce qui n'est pas mathématiquement rigoureux δy n'étant pas réellement une fonction sur X). On a alors :

Modèle:Bloc emphase

  • En revanche, dans le cas où F=δx, F est rigoureusement une fonctionnelle sur M : δx:MKϕϕ(x), et comme F[ϕ]=δx[ϕ]=ϕ(x), on note alors : δ(δx)[ϕ]δϕ(y)=notδϕ(x)δϕ(y). Ainsi : δϕ(x)δϕ(y)=limε0δx[ϕ+εδ(xy)]δx[ϕ]ϵ=δ(xy), on obtient alors une formule souvent utilisée en physique :

Modèle:Bloc emphase

  • Pour donner un sens mathématique à l'expression δϕ(x)δρ(y) aussi fréquemment utilisée on peut aussi voir ϕ(x)K comme une fonctionnelle ϕ~(x) en identifiant ϕ et ϕ~. En commettant alors le premier abus de notation on a : δϕ(x)δρ(y)=δϕ(x)[ρ]δρ(y)=δϕ(x)δρ[δy]

Par exemple si ϕ(x) et ρ sont reliées par une fonction de Green : ϕ(x)[ρ]=(G*ρ)(x).

ϕ(x) étant linéaire en ρ par propriété du produit de convolution, on a :

δϕ(x)δρ(y)=δϕ(x)δρ[δy]=limε0ϕ(x)[ρ+εδy]ϕ(x)[ρ]ϵ=(G*δy)(x)=G(xy)

Dans le cadre du deuxième point où ϕ(x)=δx, on a G=δ l'élément neutre du produit de convolution et on retrouve la formule précédente :

δϕ(x)δρ(y)=δϕ(x)[ρ]δρ(y)=δρ(x)δρ(y)=G(xy)=δ(xy)

Un exemple fondamental en physique

L'action est une fonctionnelle définie en mécanique analytique qui, d'après le principe de moindre action doit être minimale en la trajectoire suivie par le système physique.

Mathématiquement, en reprenant les notations de la partie définition on pose :

  • I=[tA,tB] un intervalle de temps
  • M=C1(I,n), l'ensemble des fonctions de classe C1 de I dans n qui est dense dans L2(I,n) (voir espace Lp)
  • :n×n× le Lagrangien du système physique, qui est supposé suffisamment régulier pour que l'action définie ci dessous soit continûment différentiable

On peut alors définir l'action comme la fonctionnelle :

S:MqtAtB(q(t),q˙(t),t)dt

q:n représente l'application coordonnée, aussi appelé chemin, qui à un temps donné associe la position du système physique dans l'espace n.

Pour déterminer le mouvement du système, d'après le principe de moindre action, il faut chercher à minimiser l'action. Un tel chemin q vérifie donc δSδq=0.

On calcule de la dérivée fonctionnelle de S par rapport à q pour une variation ΦM telle que Φ(tA)=Φ(tB)=0, ce qui revient physiquement à prendre une variation du chemin sans faire varier ses points de départ et d'arrivée. Il faut noter que les fonctions définies comme Φ forment un sous ensemble dense dans M. On obtient alors :

δSδq[Φ]=limϵ0tAtB(q(t)+Φ(t),q˙(t)+Φ˙(t),t)(q(t),q˙(t),t)ϵdt=tAtBΦ(t)(q(q(t),q˙(t),t)ddtq˙(q(t),q˙(t),t))dt

en faisant une intégration par partie du terme de droite, où le terme totalement intégré s'annule grâce à la définition de Φ, et où désigne le produit scalaire canonique sur n (voir l'article des équations d'Euler-Lagrange pour plus de détails sur ce calcul).

Si on note la fonction : EL:Itq(q(t),q˙(t),t)ddtq˙(q(t),q˙(t),t), on obtient :

δSδq[Φ]=EL|Φ, où | désigne le produit scalaire sur l'espace de Hilbert L2(I,n).

Comme la dérivée fonctionnelle δSδq[] est représentable au sens du théorème de représentation de Riesz par une forme linéaire sur L2(I,n) et que EL est une fonction de L2(I,n), on peut identifier : δSδq=EL. Ce raisonnement est analogue à l'identification du gradient dans le cas du calcul de la dérivée directionnelle en dimensions finies par exemple.

Le principe de moindre action fournit alors EL=0 dans le dual L2(I,n), ce qui se traduit par les équations d'Euler-Lagrange :Modèle:Bloc emphase

Références

Modèle:Palette Modèle:Portail