Dérivée directionnelle

De testwiki
Aller à la navigation Aller à la recherche

En analyse mathématique, la notion de dérivée directionnelle est fondamentale ; elle permet de quantifier la variation locale d'une fonction dépendant de plusieurs variables, en un point donné et le long d'une direction donnée dans l'espace de ces variables. Dans la version la plus simple, la dérivée directionnelle généralise la notion de dérivées partielles, dans le sens où l'on retrouve ces dernières en prenant comme directions de dérivation les axes de coordonnées.

Le concept de dérivée directionnelle est parfois le point de départ pour définir la dérivée d'une fonction, qui décrit comment sa valeur est modifiée lorsque ses arguments varient de manière infinitésimale et arbitraire (et non plus le long d'une direction préfixée) : la dérivée au sens de Gateaux est définie de cette manière, mais aussi le sous-différentiel d'une fonction convexe et le sous-différentiel de Clarke d'une fonction lipschitzienne. C'est aussi un concept précieux en optimisation, pour obtenir des conditions nécessaires d'optimalité.

On comprend alors pourquoi l'on a introduit de multiples notions de dérivée directionnelle, qui sont plus ou moins bien adaptées à la régularité (Modèle:Cad au caractère lisse) de la fonction étudiée, et dont l'utilité et le domaine d'application dépendent de leurs propriétés. Les développements sont très raffinés et se poursuivent ; l'étude des liens entre eux mériterait une monographie. Nous nous contenterons ici de donner les principales définitions, en commençant par les plus familières et les plus simples.

Fonction définie sur un espace vectoriel

Dérivée directionnelle suivant un vecteur

Définition

Soient Modèle:Mvar un espace vectoriel normé, Modèle:Mvar un ouvert de Modèle:Mvar, Modèle:Mvar une fonction définie sur Modèle:Mvar et à valeurs dans un espace vectoriel normé Modèle:Mvar (ou plus généralement, un espace vectoriel topologique séparé). On qualifie de points les éléments de Modèle:Mvar, et de vecteurs les éléments de Modèle:Mvar ; les raisons en seront détaillées plus loin. Soient également Modèle:Mvar un point de Modèle:Mvar et Modèle:Mvar un vecteur de Modèle:Mvar.

La dérivée directionnelle de Modèle:Mvar au point Modèle:Mvar suivant le vecteur Modèle:Mvar est, si elle existe, la dérivée en Modèle:Math de la fonction d'une seule variable réelle Modèle:Math :

Dhf(a)=g (0)=limt0f(a+th)f(a)t.

« Intuitivement », la dérivée directionnelle de Modèle:Mvar au point Modèle:Mvar suivant le vecteur Modèle:Mvar est la vitesse verticale en parcourant la surface représentative de Modèle:Mvar, en passant par le point de composante horizontale Modèle:Mvar, avec le vecteur vitesse horizontal(e) Modèle:Mvar.

Si Modèle:Mvar est le vecteur nul, cette limite existe toujours et sa valeur est toujours zéro. Dans ce qui suit, on pourra donc supposer que Modèle:Mvar n'est pas le vecteur nul.

Si l'espace Modèle:Mvar est de dimension finie Modèle:Mvar et muni d'une base, alors la fonction Modèle:Mvar peut être vue comme une fonction de Modèle:Mvar variables réelles, et le calcul des dérivées directionnelles de Modèle:Mvar suivant les vecteurs de base correspond au calcul des dérivées partielles de Modèle:Mvar :

Deif(a)=fxi(a).

En multipliant le vecteur Modèle:Mvar par un scalaire Modèle:Math, le calcul de dérivée directionnelle suivant le vecteur Modèle:Math est le même que suivant Modèle:Mvar, à la multiplication par le facteur Modèle:Math près :

Dαhf(a)=αDhf(a).

Ainsi, en un point, s'il existe une dérivée directionnelle suivant un vecteur, alors il en existe une suivant tout vecteur de même direction, mais la valeur de cette dérivée dépend du vecteur suivi. On parle de dérivée directionnelle de Modèle:Mvar au point Modèle:Mvar dans la direction du vecteur Modèle:Mvar si Modèle:Mvar est unitaire[1].

En revanche, il n'y a pas de raison a priori d'observer un résultat particulier en additionnant deux vecteurs Modèle:Mvar et Modèle:Mvar.

Définition alternative

La définition ci-dessus définit la dérivée directionnelle dans la direction du vecteur Modèle:Mvar si Modèle:Mvar est unitaire.

Modèle:Refsou la dérivée directionnelle de Modèle:Mvar au point Modèle:Mvar dans la direction d'un vecteur quelconque v0 par :

vf(a):=lims0f(a+sv)f(a)sv, si cette limite existe.

Le lien avec la définition précédente est donc : vf(a)=Dhf(a) pour h=vv.

« Intuitivement », la dérivée directionnelle de Modèle:Mvar au point Modèle:Mvar dans la direction du vecteur unitaire Modèle:Mvar est la vitesse verticale en parcourant la surface représentative de Modèle:Mvar, en passant par le point de composante horizontale Modèle:Mvar, avec le vecteur vitesse horizontal(e) Modèle:Mvar, de norme Modèle:Math.

Cas d'une fonction différentiable

Si la fonction Modèle:Mvar est différentiable au point Modèle:Mvar, alors elle admet une dérivée directionnelle en Modèle:Mvar dans la direction de tout vecteur. Cette dérivée se calcule avec l'application différentielle Modèle:Math de Modèle:Mvar en Modèle:Mvar, en appliquant la formule :

Dhf(a)=(df(a))(h).

Ainsi, cette fois, le résultat est linéaire en Modèle:Mvar. Notamment,

Dh+hf(a)=Dhf(a)+Dhf(a).

Enfin, si Modèle:Mvar est un espace vectoriel de dimension finie Modèle:Mvar muni d'une base, alors on peut exprimer toutes les dérivées directionnelles en termes de dérivées partielles :

Dhf(a)=i=1nhifxi(a).

En général, la réciproque est fausse : le fait qu'une application présente des dérivées directionnelles en Modèle:Mvar dans toutes les directions n'assure pas sa différentiabilité, ni même sa continuité, en Modèle:Mvar. Cependant, la réciproque est vraie si la fonction est définie sur un espace vectoriel de dimension finie Modèle:Mvar, est à valeurs réelles, et est convexe : il suffit alors qu'elle ait des dérivées directionnelles suivant Modèle:Mvar vecteurs linéairement indépendants pour qu'elle soit différentiable (au sens de Fréchet).

Si Modèle:Mvar est un espace vectoriel euclidien, Modèle:Mvar une application différentiable en Modèle:Mvar et à valeurs réelles, alors il est possible d'utiliser le gradient de Modèle:Mvar en Modèle:Mvar pour exprimer les dérivées directionnelles de Modèle:Mvar en Modèle:Mvar :

Dhf(a)=f(a)|h.

Si Modèle:Mvar présente un extremum local en un point Modèle:Mvar d'un ouvert, alors son gradient en Modèle:Mvar est le vecteur nul, et toutes ses dérivées directionnelles en Modèle:Mvar sont nulles (pour une étude plus détaillée, voir point critique).

Interprétation géométrique

La dérivée directionnelle de la fonction Modèle:Mvar au point Modèle:Mvar dans la direction du vecteur Modèle:Mvar se calcule comme la dérivée en Modèle:Math de la fonction d'une seule variable réelle Modèle:Math. Cette fonction s'interprète comme la restriction de Modèle:Mvar à la droite affine passant par Modèle:Mvar et dirigée par Modèle:Mvar.

L'angle Modèle:Math entre la tangente en Modèle:Mvar et l'horizontale est maximal si le plan de coupe contient la direction du gradient en Modèle:Mvar.

En associant à la fonction f:U2 la surface Modèle:Math d'équation cartésienne réduite Modèle:Math, la notion de dérivée directionnelle dans la direction d'un vecteur unitaire h=(h1,h2) en un point A=(a1,a2) de Modèle:Mvar peut être interprétée ainsi : le plan vertical contenant la droite passant par Modèle:Mvar et dirigée par Modèle:Mvar coupe la surface Modèle:Math selon la courbe paramétrée Modèle:Math :

tM(t)={a1+th1a2+th2f(a1+th1,a2+th2).

La fonction Modèle:Mvar est dérivable en Modèle:Math si et seulement si Modèle:Mvar admet en Modèle:Mvar une dérivée directionnelle dans la direction de Modèle:Mvar. Dans ce cas : il existe une tangente Modèle:Math à la courbe Modèle:Math au point Modèle:Math — qui est le point de Modèle:Math à la verticale de Modèle:Mvar —, et Dhf(A) est la composante verticale du vecteur directeur de composante horizontale Modèle:Mvar, unitaire, de Modèle:Math ; ainsi, Dhf(A) est la pente de Modèle:Math.

Si Modèle:Mvar est différentiable en Modèle:Mvar et Modèle:Mvar est unitaire, alors l'inégalité de Cauchy-Schwarz permet d'écrire :

f(A)Dhf(A)=f(A)|hf(A),

avec égalité si et seulement si Modèle:Mvar est colinéaire au gradient de Modèle:Mvar en Modèle:Mvar.

La pente de la tangente est donc maximale en choisissant la direction du gradient, ce qui est à la base des méthodes de descente dans les problèmes de minimisation[2].

Dérivée directionnelle au sens de Dini

Définition

Soient E un espace vectoriel, F un espace vectoriel normé et f:EF une fonction. On dit que Modèle:Math est directionnellement dérivable au sens de Dini en xE dans la direction dE si la limite dans la définition de f'D(x;d) ci-dessous existe dans F :

f'D(x;d):=limt0,t>0f(x+td)f(x)t.

Gateaux-différentiabilité

Soient E et F deux espaces vectoriels normés. Une fonction f:EF est dite Gateaux-différentiable[3] en xE si

  1. la dérivée directionnelle f'D(x;d) existe quel que soit dE,
  2. l'application DGf(x):dEf'D(x;d)F est linéaire continue.

On dit que Modèle:Math est continûment Gateaux-différentiable en xE si Modèle:Math est Gateaux-différentiable dans un voisinage Modèle:Math de Modèle:Math et DGf:V(E,F) est continue en Modèle:Math ; on a noté (E,F) l'ensemble des opérateurs linéaires continus de E dans F, muni de sa norme canonique.

Fonction ayant des valeurs infinies

En analyse convexe ou non lisse, on utilise une notion de dérivée directionnelle, qui est essentiellement celle de Dini, mais qui accepte que les fonctions prennent leurs valeurs dans la droite réelle achevée :={,+}. Les dérivées directionnelles peuvent elles-mêmes prendre leurs valeurs dans . Voici cette définition.

Soient E un espace vectoriel et f:E une fonction. On dit que f est directionnellement dérivable en xE dans la direction dE si la limite dans la définition de f(x;d) ci-dessous existe dans  :

f(x;d):=limt0,t>0f(x+td)f(x)t.

Cette définition est motivée par le résultat suivant qui assure la dérivabilité directionnelle des fonctions convexes, dans toutes les directions. On y a noté

Modèle:Théorème

Ce résultat est utilisé pour définir le sous-différentiel d'une fonction convexe.

Dérivée directionnelle au sens de Hadamard

Soient E un espace vectoriel, F un espace vectoriel normé et f:EF une fonction. On dit que Modèle:Math est directionnellement dérivable au sens de Hadamard en xE dans la direction dE si la limite dans la définition de f'H(x;d) ci-dessous existe dans F :

f'H(x;d):=limt0,t>0ddf(x+td)f(x)t.

Dérivée directionnelle au sens de Clarke

La présentation ci-dessous se fonde sur l'ouvrage de Clarke (1983)[4].

Définition

Soient E un espace de Banach et f:E une fonction. La dérivée directionnelle de Clarke de Modèle:Math en Modèle:Math dans la direction dE est notée f(x;d) et définie par

f(x;d):=lim supxxt0,t>0f(x+td)f(x)t.

Cette dérivée ne présuppose pas l'existence d'une limite ; elle existe toujours, mais elle peut cependant prendre une valeur infinie. L'utilité de cette dérivée directionnelle repose sur les propriétés suivantes.

Modèle:Théorème

La dérivée directionnelle de Clarke est utilisée pour définir le sous-différentiel de Clarke d'une fonction localement lipschitzienne.

Différentiabilité stricte

Le concept de différentiabilité naturellement relié à la dérivée directionnelle de Clarke est celui de différentiabilité stricte, que l'on trouve chez Bourbaki. La fonction considérée peut ici être à valeurs dans un espace vectoriel, pas seulement dans  ; nous avons marqué ce fait en la désignant par Modèle:Math, plutôt que Modèle:Math.

Soient 𝔼 et 𝔽 deux espaces de Banach. Une fonction F:𝔼𝔽 est dite strictement différentiable en x𝔼 si l'application

DsF(x):d𝔼limxxt0,t>0F(x+td)F(x)t𝔽

est linéaire continue et la limite est uniforme pour Modèle:Math dans un compact arbitraire.

Le résultat suivant apporte deux informations : d'une part, une fonction strictement différentiable en un point est nécessairement lipschitzienne dans un voisinage de ce point et, d'autre part, pour une fonction lipschitzienne, la différentiabilité stricte en un point est assurée sans que l'on ait besoin de vérifier la condition d'uniforme convergence pour des directions dans un compact.

Modèle:Théorème

Une fonction continûment Gateaux-différentiable est strictement différentiable.

Modèle:Théorème

Fonction définie sur une variété

Définition

Soit Modèle:Math une fonction numérique sur une variété différentielle M. Avec une définition analogue à la précédente, il est loisible d'introduire la dérivée de Modèle:Math en un point Modèle:Math de M et dans la direction d'un vecteur tangent Modèle:Math en Modèle:Math à la variété. Comme la notion de droite dirigée par Modèle:Math n'a plus de sens, il faut la remplacer par une courbe passant par Modèle:Math et de vecteur tangent Modèle:Math en ce point.

Soit γ une courbe tracée sur M, continûment dérivable, vérifiant Modèle:Math et Modèle:Math. Si la dérivée en 0 de Modèle:Math existe, elle est appelée dérivée de Modèle:Math au point Modèle:Math dans la direction de Modèle:Math. On montre en effet que cette définition ne dépend pas de la courbe γ convenable choisie.

Extension : dérivée de Lie

Si Modèle:Math est un champ de vecteurs 𝒞 sur la variété M et si Modèle:Math est une fonction numérique 𝒞 sur M, il est possible de calculer les dérivées partielles de Modèle:Math en chaque point Modèle:Math selon le vecteur Modèle:Math. La fonction obtenue en considérant toutes ces dérivées est notée Xf=Xf et est appelée dérivée de Lie de Modèle:Math par Modèle:Math.

Pour calculer la dérivée de Lie de f, il est notamment possible de prendre pour courbes tangentes aux vecteurs Modèle:Math les courbes intégrales du champ de vecteurs. La généralisation de ce point de vue à la dérivation des champs de vecteurs, formes différentielles et tenseurs est décrite à l'article « Dérivée de Lie ».

Notes et références

Modèle:Références

Voir aussi

Modèle:Ouvrage : Exemples et contre-exemples

Modèle:Portail