Calcul des variations

De testwiki
Aller à la navigation Aller à la recherche

Le calcul des variations (ou calcul variationnel) est, en mathématiques et plus précisément en analyse fonctionnelle, un ensemble de méthodes permettant de minimiser une fonctionnelle. Celle-ci, qui est à valeurs réelles, dépend d'une fonction qui est l'inconnue du problème. Il s'agit donc d'un problème de minimisation dans un espace fonctionnel de dimension infinie.

Le calcul des variations s'est développé depuis le milieu du Modèle:S- jusqu'aujourd'hui ; son dernier avatar est la théorie de la commande optimale, datant de la fin des années 1950. Le calcul des variations a des applications dans de nombreux domaines :

  1. L'inconnue étant une courbe paramétrée, on recherche une courbe de longueur minimale (ou extrémale), autrement dit une géodésique ; c'est une question fondamentale en géométrie différentielle ;
  2. L'inconnue étant une surface, on recherche, pour un périmètre donné, la surface d'aire maximale (problème d'isopérimétrie) ;
  3. En physique, le principe de moindre action affirme que les mouvements d'un système matériel se produisent de manière, sinon à minimiser l'action, du moins à rendre celle-ci stationnaire. Ces mouvements peuvent donc être déterminés en minimisant ou en rendant stationnaire cette fonctionnelle, ce qui fait du calcul des variations un outil fondamental pour les physiciens (formulation variationnelle des équations de la physique) ;
  4. Une condition nécessaire d'extremum (ou plus généralement de stationnarité) de la fonctionnelle est l'équation d'Euler-Lagrange. Or, il arrive que le but qu'on se propose soit précisément la résolution d'une équation différentielle qu'on montre (en résolvant le « problème inverse du calcul des variations ») être l'équation d'Euler-Lagrange d'un problème variationnel ; la résolution de celui-ci (effectuée, par exemple, en passant au formalisme hamiltonien) fournit la solution de celle-là.

Les principaux résultats du calcul des variations « classique », qui fait l'objet de cet article sont :

  1. L'équation d'Euler-Lagrange (condition nécessaire du premier ordre) ;
  2. Les conditions de transversalité (dans le cas de problèmes à extrémités variables) ;
  3. Les conditions du second ordre de minimum faible de Legendre et de Jacobi ;
  4. Les conditions du second ordre de minimum fort de Weierstrass ;
  5. La relation entre formalisme lagrangien et le formalisme hamiltonien (transformation de Legendre) ;
  6. Les équations de Hamilton-Jacobi et le théorème de Jacobi ;
  7. Enfin, pour ses applications à la physique, le théorème de Noether.

Historique

Sans aller jusqu'au problème de la reine Didon, on peut faire remonter les principes variationnels à Pierre de Fermat (1657) et Christian Huygens (1690) pour l'étude de la propagation de la lumière (principe de Fermat et principe de Huygens-Fresnel). Néanmoins, le calcul des variations est né en 1696, avec le problème de la courbe brachistochrone, posé par Jean Bernoulli (à la suite de Galilée dans son Dialogue sur les deux grands systèmes du monde paru en 1632)[1] ; il s’agit d’un problème de temps minimal (comme l’indique la racine grecque de brachistochrone : « Modèle:Lang (brachistos) », « le plus court » ; « Modèle:Lang (chronos) », « temps »). Ce problème fut résolu par Jean et Jacques Bernoulli, Gottfried Wilhelm Leibniz, Isaac Newton, Guillaume François Antoine de l'Hôpital et Ehrenfried Walther von Tschirnhaus. La solution de Jacques Bernoulli se fondait sur le principe d'Huygens et l'idée du front d'onde ; elle préfigurait l'équation de Hamilton-Jacobi. Celle de Jean Bernoulli était fondée sur une analogie avec la propagation de la lumière et le principe de Fermat, ainsi que la loi de Descartes. Celle de Leibniz, enfin, était fondée sur l'approximation de la courbe par des lignes brisées et était le premier pas vers l'équation d'Euler-Lagrange[2].

Jean Bernoulli (1667-1748).

Le second pas a été accompli par Euler, élève de Jean Bernoulli : Euler a ébauché à partir de considérations géométriques la méthode des « petites variations » en 1744. Joseph-Louis Lagrange a introduit le vocable « calcul des variations » vers 1760[1] et a donné sa forme actuelle à la solution d'Euler. Adrien-Marie Legendre a complété en 1786 l'équation d'Euler-Lagrange, qui est une condition du premier ordre, par la condition du second ordre qui porte son nom. Ces résultats ont été rassemblés par Lagrange dans sa Théorie des fonctions analytiques, parue en 1797 ; Lagrange a également introduit les variables canoniques en 1811 dans sa Mécanique analytique (bien qu'elles aient été attribuées à William Rowan Hamilton par Charles Gustave Jacob Jacobi)[1]. L'équation d'Euler-Lagrange a été étendue au cas du calcul des variations à intégrales multiples en 1834 par Mikhaïl Ostrogradski[3] (généralisant un résultat obtenu en 1831 par Siméon Denis Poisson sur le même sujet). L'équation d'Hamilton-Jacobi a été introduite en premier lieu par Hamilton dans son Modèle:Lang en 1835 à l'occasion d'un problème de mécanique. Jacobi a complété la condition du second ordre de Legendre en 1837, avec la théorie des « points conjugués »[4] et a reformulé la contribution de Hamilton, cette fois dans un contexte général, dans ses Modèle:Lang (1842). Alfred Clebsch a généralisé en 1858 les résultats de Legendre et de Jacobi[5]. Eduard Heine a établi le lemme fondamental du calcul des variations en 1870[6]. Il revenait à Karl Weierstrass, dans ses cours professés à l'université de Berlin, notamment celui de 1879, de définir la notion d'extremum fort, et d'établir la condition qui porte son nom, ainsi que la « condition d'arrondissement des angles » (également obtenue, indépendamment, par G. Erdmann en 1877[7]). Paul David Gustave du Bois-Reymond[8]Modèle:,[9] a établi son fameux lemme en 1879 : cette extension du lemme fondamental du calcul des variations permet d'établir de manière plus satisfaisante l'équation d'Euler-Lagrange. Enfin, David Hilbert a établi le théorème de l'intégrale invariante (qui clarifie la théorie de Weierstrass) et résolu le problème de Dirichlet[10] (le problème de calcul de variations à intégrales multiples le plus célèbre) en 1900. Les principaux résultats du calcul des variations classique avaient dès lors été obtenus.

Néanmoins, des compléments substantiels ont été apportés au tournant du Modèle:S- par Hermann Amandus Schwarz (généralisation du théorème de Weierstrass entre 1898 et 1899) et Adolf Kneser[11] (condition de transversalité, 1900). Oskar Bolza[12] et Harris Hancock[13] ont réalisé indépendamment en 1904 deux synthèses de tous les travaux précédents ; leur lecture est encore très instructive. Modèle:Lien a introduit en 1905 les « champs de Mayer » qui généralisent les champs d'extrémales de Weierstrass ; il a également réalisé une étude fine des « arcs anormaux ». William Fogg Osgood[14] et Jacques Hadamard[15]Modèle:,[16] ont continué d'étudier entre 1900 et 1906 le calcul des variations avec intégrale multiple. On peut encore citer les contributions de la première moitié du Modèle:S- dues à Emmy Noether (théorème de Noether[17] : obtenu en 1918, il est la formulation mathématique des lois de conservation en physique - de l'énergie, de l'impulsion, du moment cinétique, etc.) ; à Alfréd Haar (le lemme de Haar, datant des années 1926-1932, peut être vu comme une extension du lemme de Du Bois-Reymond au cas d'intégrales multiples)[18]Modèle:,[19] ; et à Constantin Carathéodory[20] (Modèle:Lien parlait de l'approche de Carathéodory en 1953 comme Modèle:Citation étrangère, littéralement « la voie royale du calcul des variations »). Gilbert Ames Bliss et ses élèves, dont Magnus Hestenes, ont réalisé pendant plus de vingt ans une étude détaillée du problème de Bolza, étude dont les résultats ont été rassemblés dans la vaste synthèse que sont les Modèle:Lang[1] de Bliss. Mentionnons encore George David Birkhoff et son élève Marston Morse[21] (théorie de Morse). La théorie de Morse a été généralisée par Richard Palais et Stephen Smale en 1964 (condition de compacité de Palais-Smale)[22]Modèle:,[23].

Le calcul des variations a connu un profond renouveau dans les années 1950 avec le développement de la théorie de la commande optimale, sous l'impulsion de Lev Pontriaguine[24] et Richard Bellman[25]Modèle:,[26]. Le formalisme de Pontryagin et de Bellman est une extension et une amélioration du formalisme hamiltonien classique, et clarifie la formulation de Carathéodory[27]. On peut encore mentionner les contributions, postérieures à 1960, de Jacques-Louis Lions, Ivar Ekeland et Jean-Pierre Aubin. Le calcul des variations « non lisse » développé vers la fin des années 1980 par Frank H. Clarke, est un apport significatif[28]. Le calcul des variations reste en mathématiques un domaine fort actif. Les mathématiciens qui ont contribué à son développement sont extrêmement nombreux (ils comprennent la plupart des grands noms du Modèle:S- et du début du Modèle:S mini-, et même le célèbre philosophe Edmund Husserl, élève des mathématiciens Leo Königsberger, Leopold Kronecker et Karl Weierstrass ; Husserl a soutenu en 1883 sa thèse Modèle:Lang). N'ont été mentionnés plus haut que certains parmi les plus notables de ces mathématiciens.

Un domaine d'application important du calcul des variations est l'étude des géodésiques sur une variété munie d'une connexion affine, et plus particulièrement des géodésiques minimales dans un espace de Riemann[29]. L'étude locale des géodésiques minimales sur une surface a été réalisée, à la suite de Carl Friedrich Gauss, par Jacobi (théorie des points conjugués) et Pierre-Ossian Bonnet (qui a démontré le résultat que Jacobi avait énoncé sans démonstration)[30]. Ces travaux ont été complétés par Kneser, Tullio Levi-Civita et Élie Cartan (ce dernier ayant donné de l'équation géodésique sa forme intrinsèque[31]). Le problème global n'a cessé d'être à l'ordre du jour et a donné naissance à la théorie de Morse, déjà évoquée.

Problèmes fondamentaux du calcul des variations

Problème à extrémités fixes

C'est le problème le plus simple, parfois appelé problème de Lagrange.

Soit Modèle:Math un intervalle de la droite réelle et Modèle:Math, Modèle:Math des ouverts non vides dans un espace vectoriel normé Modèle:Math qu'on peut supposer de dimension finie. Soit d'autre part

:[t0,tf]×Ω1×Ω2:(t,x,u)(t,x,u)

une fonction appelée lagrangien, supposée continûment différentiable (en abrégé : de classe 𝒞1) ainsi que sa différentielle partielle u.

Le problème de Lagrange consiste à déterminer (si elle existe) une fonction suffisamment régulière x=x(.):tx(t)Ω1

J(x(.))=t0tf(t,x(t),x˙(t))dt.

Problème à extrémités variables

Nous considérons maintenant un problème plus général où ni les bornes d'intégration Modèle:Math et Modèle:Mvar, ni les points Modèle:Math et Modèle:Mvar, ne sont fixés. La fonctionnelle à minimiser est

J(x(.))=K(t0,x0,tf,xf)+t0tf(t,x(t),x˙(t))dt

avec les contraintes (t0,x0)𝒱0, (tf,xf)𝒱f, où 𝒱0 et 𝒱f sont des sous-variétés de ×Ω1, désignant un intervalle compact de la droite réelle. La fonction vérifie les mêmes hypothèses que ci-dessus et la fonction Modèle:Mvar est continûment différentiable.

La fonctionnelle ci-dessus est mixte (du fait de la présence du terme Modèle:Math) et le problème correspondant est appelé le problème de Bolza. On se ramène au cas d'une fonctionnelle intégrale (problème de Lagrange avec extrémités variables) en définissant une inconnue supplémentaire Modèle:Mvar définie à une constante près par y˙=1tft0K(t0,x0,tf,xf), puisque alors Modèle:Math

J(x(.),y(.))=t0tf((t,x(t),x˙(t))+y˙(t))dt.

On peut aussi se ramener au cas d'un problème de la forme dite du problème de Mayer

J(x^(.))=K^(t0,x^0,tf,x^f)

en posant z˙=(t,x,x˙),x^0=(x0,z0),x^f=(xf,zf) et

K^(t0,x^0,tf,x^f)=K(t0,x0,tf,xf)+zfz0.

Minimum faible et minimum fort

Si, dans ce qui précède, on recherche des minima globaux, le problème est en général sans solution. On est donc conduit à rechercher des minima locaux. Par définition, x minimise localement Modèle:Math si J(x)J(x)0 pour toute fonction suffisamment régulière Modèle:Mvar dans un voisinage suffisamment petit de x. Il reste à préciser quel type de régularité on impose à x et, puisqu'on a ici affaire à un problème en dimension infinie, par quelle norme on définit les voisinages de 0.

Une première possibilité consiste à imposer à x d'être de classe 𝒞1, c'est-à-dire continûment dérivable, donc d'appartenir à l'espace 𝒞1(,𝐗) des fonctions continûment dérivables de dans Modèle:Math. On peut munir cet espace de la norme

x1=sup\limits t(x(t)+x˙(t))

qui en fait un espace de Banach qu'on notera 1.

Une autre possibilité consiste à imposer seulement à x d'être continûment dérivable par morceaux, c'est-à-dire continue, et ayant une dérivée continue sauf en un nombre fini de points, et ayant en ces points une dérivée à gauche et une dérivée à droite. Soit K𝒞1(,𝐗) l'espace des fonctions continûment dérivables par morceaux par morceaux de dans Modèle:Math. On peut munir cet espace de la norme

x0=sup\limits t(x(t))

qui en fait un espace vectoriel normé, non complet, qu'on notera 0.

Modèle:Théorème On montre que, sous les hypothèses qui ont été précisées, la fonction J:xJ(x) est différentiable sur 1, mais non sur 0. Il s'ensuit que la minimisation faible relève du calcul différentiel classique dans un espace de Banach, ce qui n'est pas le cas de la minimisation forte.

Remarque sur la notion de minimum fort

Pour la formulation de la notion de minimum fort, d'autres espaces fonctionnels que K𝒞1(,𝐗) sont possibles : on peut notamment le remplacer par W1,1(,𝐗), l'espace des fonctions absolument continues de dans Modèle:Math (on a W1,1(,𝐗)K𝒞1(,𝐗)) ; dans certains cas, Modèle:Math admet un minimum sur W1,1(,𝐗) mais non sur K𝒞1(,𝐗) comme l'a montré Leonida Tonelli en 1915[32]. Néanmoins, nous nous limiterons dans ce qui suit à la définition donnée plus haut qui permet d'éviter quelques difficultés.

Notons qu'une fonction continûment dérivable qui fournit un minimum local fort fournit nécessairement un minimum local faible. Par suite, pour une fonction continûment dérivable, une condition nécessaire de minimum local faible (voir, ci-dessous, la partie (A) du théorème de Jacobi-Weierstrass) est également une condition nécessaire de minimum local fort. Au contraire, une condition suffisante de minimum local fort (voir, ci-dessous, la condition suffisante de minimum fort de Weierstrass) est également une condition suffisante de minimum local faible, compte tenu du schéma logique, valide pour une fonction de classe 𝒞1 :

condition suffisante de minimum fort ⇒ minimum fort ⇒ minimum faible ⇒ condition nécessaire de minimum faible

Problèmes isopérimétriques

Ces problèmes consistent à minimiser une fonctionnelle Modèle:Math sous les contraintes Ji(x(.))=0(i=1,,m) avec

Ji(x(.))=t0tfi(t,x(t),x˙(t))dt,

toutes les fonctions i(i=0,,m) vérifiant les mêmes hypothèses que la fonction ci-dessus.

Problèmes à intégrale multiple

Soit Modèle:Mvar une variété de dimension n, éventuellement à bord, et

J(u(.))=D(x,u,ux)dx,

Modèle:Mvar étant la variable (plus haut notée Modèle:Mvar), Modèle:Math la fonction inconnue (plus haut notée Modèle:Mvar), où Modèle:Math est un espace vectoriel normé, ux sa différentielle, et Modèle:Math la mesure de Lebesgue. On suppose de classe 𝒞2. Le problème considéré ici consiste à déterminer, si elle existe, une fonction u:xu(x) de classe 𝒞2 qui minimise Modèle:Math[33].

Formalisme lagrangien

Condition du premier ordre

Première variation

Considérons le problème de Lagrange à extrémités fixes (le problème à extrémités variables conduit à ajouter les conditions de transversalité : voir, infra, le § Pseudo-hamiltonien et principe du maximum ; conditions de transversalité). Soit Modèle:Mvar un accroissement de Modèle:Mvar, où Modèle:Mvar est une fonction continûment dérivable telle que Modèle:Math (on notera ci-dessous 𝒜 l'espace vectoriel formé des Modèle:Mvar vérifiant ces conditions) et Modèle:Mvar est un nombre réel. Il en résulte un accroissement Modèle:Math de Modèle:Math, en négligeant les termes du second ordre en Modèle:Mvar pour Modèle:Mvar tendant vers 0. En effet, un développement limité au premier ordre donne

J(x+εh)=J(x)+εδJ(x;h)+o(ε)

Modèle:Math est la « première variation » de Modèle:Mvar.

Leonhard Euler (1707-1783).

Dérivée de Gateaux et condition d'Euler

Toute fonction Modèle:Mvar, définie dans un voisinage de Modèle:Mvar, et pour laquelle un tel développement limité existe est dite « [[Dérivée de Gateaux|dérivable au sens de Gateaux dans la direction de Modèle:Mvar]] », et par définition

DGJ(x)(h)=δJ(x;h)=limt0t0J(x+th)J(x)t

est la « dérivée de Gateaux » de Modèle:Mvar au point Modèle:Mvar dans la direction de Modèle:Mvar. L'application DGJ(x):𝒜hδJ(x;h) est homogène (Modèle:C.-à-d. Modèle:Math pour tout réel Modèle:Mvar) mais n'est pas linéaire en général[34].

Modèle:Théorème

Modèle:Démonstration

Équation d'Euler-Lagrange

Modèle:Article détaillé On a d'autre part

δJ(x;h)=t0tf(xh+x˙h˙)dt

et on en déduit le théorème suivant :

Modèle:Théorème

Modèle:Démonstration

Applications : voir #Géodésiques d'une variété riemannienne. L'équation d'Euler-Lagrange permet aussi de déterminer la courbe brachistochrone.

Joseph-Louis Lagrange (1736-1813).

Remarques sur l'équation d'Euler-Lagrange

  1. Une démonstration classique de cette équation (présentée dans l'article lié) utilise une intégration par parties et le lemme fondamental du calcul des variations, mais n'est licite que si x˙ et x˙ sont de classe CModèle:1. C'est pourquoi l'utilisation du lemme de du Bois-Reymond, pour lequel il suffit de supposer Modèle:Math et de classe CModèle:1, est préférable.
  2. Pour que la fonction x0 fournisse un minimum local fort, il est encore nécessaire, comme on le verra plus loin (#Pseudo-hamiltonien et principe du maximum ; conditions de transversalité), qu'elle soit solution de l'équation d'Euler-Lagrange dans chaque intervalle dans lequel elle est continûment dérivable. Si Modèle:Math est seulement supposée absolument continue, l'équation d'Euler-Lagrange doit être vérifiée presque partout.

Cas des problèmes isopérimétriques

On introduit des multiplicateurs de Lagrange λi(i=0,1,...,n)λ0{0,1}, et on forme la quantité (appelée Lagrangien, mais dans un sens qui n'est pas à confondre avec le précédent, d'où la majuscule employée)

J(x)=i=0mλiJi(x)=t0tf(t,x(t),x˙(t))dt

avec

(t,x,u)=i=0mλii(t,x,u).

Une condition nécessaire pour que Modèle:Math soit solution du problème isométrique est qu'il existe des multiplicateurs de Lagrange comme ci-dessus, non tous nuls, tels que Modèle:Math rende stationnaire Modèle:Math[35]. Cette stationnarité équivaut à la satisfaction de la même équation d'Euler-Lagrange que plus haut.

Application : voir #Problème de Didon.

Remarque sur les multiplicateurs de Lagrange

Si les différentielles Modèle:Math sont linéairement indépendantes, on a nécessairement Modèle:Math : c'est alors la formulation classique du théorème des multiplicateurs de Lagrange.

Cas des problèmes à intégrale multiple

Avec les notations introduites lors de la position du problème (§ Problèmes à intégrale multiple), une condition nécessaire de stationnarité, si l'on se restreint aux extrémales de classe C2 (pour les extrémales de classe C1, on utilisera le lemme de Haar) est donnée par l'équation d'Ostrogradski (généralisation de l'équation d'Euler-Lagrange) :

Mikhaïl Ostrogradski (1801-1862).
ux((ux))=0

ux désigne la différentielle de u ; on peut également noter cette différentielle du:DL(n,𝐗), où L(n,𝐗) est l'espace des applications linéaires de n dans Modèle:Math. Lorsque 𝐗=m, l'équation d'Ostrogradski peut s'expliciter comme suit :

uji=1nxi((ujxi))=0 (j=1,...,m).

Les fonctions u vérifiant ces conditions sont de nouveau appelées extrémales.

Modèle:Démonstration

Application : voir le § Problème de Dirichlet.

Conditions du second ordre de minimum faible

Désormais nous considérons le problème de Lagrange et nous supposons de classe 𝒞2, ainsi que ses différentielles partielles x et x˙, et Modèle:Math. On recherche dans ce paragraphe une des conditions du second ordre de minimum local faible.

Carl Gustav Jakob Jacobi (1804-1851).

Seconde variation

Soit Modèle:Math une extrémale, pour laquelle on a donc, par définition, Modèle:Math, et faisons un développement limité au second ordre de Modèle:Math. Sous l'hypothèse ci-dessus, la différentielle seconde D2J(x)L2(1;) de Modèle:Mvar existe au point Modèle:Math (où L2(1;) est l'espace des formes bilinéaires continues sur 1×1) et

J(x+εh)=J(x)+ε2δ2J(x;h)+o(ε2)

Modèle:Math. La quantité Modèle:Math est appelée la seconde variation de Modèle:Mvar au point Modèle:Math. Il vient

δ2J(x;h)=12t0tf(2x2(h,h)+22xx˙(h˙,h)+2x˙2(h˙,h˙))dt

où pour abréger on a écrit 2x2 pour 2x2(t,x(t),x˙(t)), etc. En intégrant les second terme par parties on obtient

δ2J(x;h)=12t0tf(2x˙2(h˙,h˙)+(2x2ddt(2xx˙))(h,h))dt

soit donc

δ2J(x;h)=12t0tf(P(t)(h˙,h˙)+Q(t)(h,h))dt avec
P(t)=2x˙2(t,x(t),x˙(t)),
Q(t)=2x2(t,x(t),x˙(t))ddt(2xx˙(t,x(t),x˙(t))).

Condition de Legendre

La quantité Modèle:Math doit être non négative pour tout accroissement Modèle:Mvar de classe 𝒞1 tel que Modèle:Math. On montre[36] qu'une condition nécessaire pour qu'il en soit ainsi est que la forme bilinéaire symétrique Modèle:Math (définissant le premier terme de l'intégrale ci-dessus) soit semi-définie positive, ce qu'on écrira sous la forme P(t)0 : c'est la condition faible de Legendre (ou de Legendre-Clebsch). En effet, dans l'intégrale Modèle:Math, le terme

12t0tf(P(t)(h˙,h˙))dt

« prédomine », dans le sens où l'on peut construire des fonctions réelles, définies dans Modèle:Math, nulles en Modèle:Math et Modèle:Mvar, de petite amplitude et dont la dérivée est de grande amplitude (alors qu'une fonction nulle en Modèle:Math et Modèle:Mvar, dont la dérivée est de petite amplitude sur Modèle:Math, est nécessairement de petite amplitude).

Remarque : cas du calcul des variations à intégrale multiple

(Voir les §§ Problèmes à intégrale multiple et Cas des problèmes à intégrale multiple). La condition faible de Legendre, qui porte alors le nom de condition de Legendre-Hadamard, s'écrit P(x)0

P(x)=2v2(x,u(x),v(x)) avec v=ux.

Condition de Jacobi

Reste que les deux termes de l'intégrale δ2J(x;h) doivent être considérés simultanément. Si h est la fonction nulle, il est clair que Modèle:Math. Par conséquent, cette fonction nulle doit minimiser Modèle:Math, avec les conditions aux limites Modèle:Math, dans un voisinage de 0 dans 1 (« problème de minimisation secondaire »). Ceci conduit à étudier l'équation d'Euler-Lagrange (EL) associée à ce problème secondaire. Il s'agit de l'équation de Jacobi

Q(t)hddt(P(t)h˙)=0(J).

Modèle:Théorème

S'il existe un point conjugué à Modèle:Math dans l'intervalle Modèle:Math, il existe une solution non nulle Modèle:Mvar rendant stationnaire Modèle:Math. Alors pour tout Modèle:Math, Modèle:Mvar rend stationnaire Modèle:Math.

On montre le résultat suivant dans le cas où la condition forte de Legendre Modèle:Math, est vérifiée :

L'accroissement nul Modèle:Math donne un minimum local faible strict pour Modèle:Math parmi les accroissements Modèle:Mvar de classe 𝒞1 tels que Modèle:Math, si et seulement si la condition forte de Jacobi est satisfaite : il n'existe pas de point conjugué à Modèle:Math dans l'intervalle Modèle:Math.

Weierstrass a obtenu en 1877 le théorème suivant[37] :

Modèle:Théorème

Application : voir #Principe d'action stationnaire de Hamilton.

Remarque : cas d'un intégrande ne dépendant pas de l'inconnue

Supposons que =(t,x˙). La condition forte de Jacobi devient alors triviale si la condition forte de Legendre est vérifiée. Par suite, une condition suffisante pour que Modèle:Math donne un minimum local faible strict est que la condition d'Euler-Lagrange et la condition forte de Legendre soient toutes deux satisfaites.

Ce résultat est encore valable dans le cas des problèmes à intégrale multiple (§§ Problèmes à intégrale multiple et Cas des problèmes à intégrale multiple) lorsque =(x,ux)[38]. Comme application, voir le § Problème de Dirichlet.

Remarque : cas convexe

Supposons que la condition forte de Legendre soit satisfaite (Modèle:Math) et que de plus Modèle:Math, ceci pour tout Modèle:Math. Alors il est clair que Modèle:Math pour tout Modèle:Math de classe 𝒞1 tel que Modèle:Math. Par suite, il n'y a pas de point conjugué à Modèle:Math dans l'intervalle Modèle:Math, et un minimum local faible strict de Modèle:Mvar est atteint au point Modèle:Math. Ceci généralise la remarque précédente.

Remarque : cas convexe avec intégrale multiple

Dans le cas d'un problème à intégrale multiple, considérons la forme bilinéaire symétrique

(υ,ξ)2u2(x,u(x),v(x))(υ,υ)+22uv(x,u(x),v(x))(υ,ξ)+2v2(x,u(x),v(x))(ξ,ξ)

avec les notations déjà introduites dans ce cas (i.e. v=ux). Supposons cette forme définie positive pour tout xD. Alors la variation seconde de Modèle:Mvar est strictement positive pour tout accroissement non nul et suffisamment petit h de Modèle:Math dans 𝒞1(D), s'annulant sur la frontière de D, et par conséquent un minimum local faible strict est obtenu pour Modèle:Math[39].

Conditions de minimum fort

Fonction de Weierstrass

Karl Weierstrass (1815-1897).

Considérons de nouveau le problème de Lagrange à extrémités fixes, en supposant de classe C2, mais cherchons cette fois un minimum local fort. Définissons en fonction du lagrangien (t,x,u) la fonction de Weierstrass ou « excessus »

(t,x,u;w)=(t,x,w)(t,x,u)u(t,x,u)(wu).

La condition nécessaire de Weierstrass peut s'obtenir soit directement, grâce aux « variations en aiguille » introduites par Weierstrass[40], soit, comme on va le voir plus loin, comme une conséquence du principe du maximum de la commande optimale.

Modèle:Théorème

La condition suffisante de Weierstrass est une conséquence directe sa formule intégrale, explicitée et démontrée plus bas en utilisant les apports de Hilbert, de Poincaré et de E. Cartan. Cette relation fondamentale conduit au résultat suivant :

Modèle:Théorème

Remarque sur la condition suffisante de minimum fort

La formule de Taylor d'ordre 2 avec reste de Lagrange s'écrit

(t,x,u+h)=(t,x,u)+u(t,x,u)h+2u2(t,x,u+θh)(h,h)

Modèle:Math.

En prenant Modèle:Mvar, on voit donc que la condition forte de Weierstrass est satisfaite si

2x˙2(t,x,u)0,(t,x,u)V.

(condition suffisante de minimum fort). De plus, (t,x,u;w)>0(wu) si

2x˙2(t,x,u)>0,(t,x,u)V.

(condition suffisante de minimum fort strict).

Formalisme hamiltonien

On considère à présent le problème à extrémités variables. Il suffit, comme on l'a vu, de considérer le problème de Lagrange, puisque celui de Bolza s'y ramène (cela simplifie les conditions de transversalité ci-dessous). Les fonctions et x˙ sont supposées continûment différentiables et Modèle:Math est supposé de dimension finie.

Pseudo-hamiltonien et principe du maximum ; conditions de transversalité

On appelle pseudo-hamiltonien la fonction

:×Ω×𝐗×𝐗

(où Modèle:Math est le dual de Modèle:Math) définie par

(t,x,u,p)=p|u(t,x,u).

(où .|. est le crochet de dualité).

Le dual de ×𝐗 est identifié avec ×𝐗. Soit les deux équations canoniques de Hamilton

x˙=p(t,x,u,p),
p˙=x(t,x,u,p).

Notons T(tf,xf)(𝒱f) l'espace tangent à la variété 𝒱f au point (tf,xf) et N(tf,xf)(𝒱f) l'orthogonal de T(tf,xf)(𝒱f) dans ×𝐗, c'est-à-dire l'ensemble des formes linéaires continues k×𝐗 telles que k|h=0,hT(tf,xf)(𝒱f). On définit de même T(t0,x0)(𝒱0) et N(t0,x0)(𝒱0)

On appelle conditions de transversalité les relations

((tf,xf,u(tf),p(tf)),p(tf))N(tf,xf)(𝒱f),
((t0,x0,u(t0),p(t0)),p(t0))N(t0,x0)(𝒱0),

La première d'entre elles est justifiée plus loin. Le résultat suivant est une conséquence du principe du maximum de la commande optimale[24] :

Modèle:Théorème

Cas particuliers des conditions de transversalité

Nous supposons maintenant que la variété 𝒱f soit de la forme 𝒯f×𝒳f𝒯f et 𝒳fsont des sous-variétés de et de Modèle:Math, respectivement. L'équation de transversalité s'écrit donc

(a) (tf,xf,x˙(tf),p(tf))Ntf(𝒯f),
(b) p(tf)Ntf(𝒳f).

Dans le cas d'un instant final libre, on a 𝒯f=, par conséquent Ntf(𝒯f)=0 et (a) devient

(a') (tf,xf,x˙(tf),p(tf))=0

alors que dans le cas d'un instant final fixé, 𝒯f={tf} et Ntf(𝒯f)={0}, donc (a) est trivialement vérifiée. Dans les deux cas on a une équation: (a') dans le premier, Modèle:Math dans le second.

Dans le cas d'un état final libre, on a 𝒳f=𝐗, par conséquent Nxf(𝒳f)=0 et (b) devient

(b') p(tf)=0.

Dans le cas d'un état final fixé, 𝒳f={xf} et Nxf(𝒳f)={0}, donc (b) est trivialement vérifiée. Dans les deux cas on a n équations, si Modèle:Math est de dimension n : (b') dans le premier, Modèle:Math dans le second.

Le même raisonnement s'applique évidemment pour la condition initiale.

Équation d'Euler-Lagrange, conditions de Legendre et de Weierstrass

Montrons que les conditions nécessaires de minimum local fort données plus haut, à l'exception de la condition de Jacobi, sont des conséquences du principe du maximum du calcul des variations, et ceci bien qu'on se place ici dans le contexte plus général d'extrémités éventuellement variables (la condition de Jacobi classique n'est valide que dans le cas d'extrémités fixes envisagé plus haut ; néanmoins une condition analogue, faisant intervenir la notion de point focal, due à Kneser, a été obtenue dans le cas d'une extrémité finale libre[12]Modèle:,[41]).

Les équations canoniques s'écrivent encore

x˙(t)=u(t),
p˙(t)=x(t,x(t),u(t)).

Le principe du maximum implique au premier ordre l'équation d'Euler (ou de stationnarité)

u(t,x(t),u(t),p(t))=0,

autrement dit, en utilisant la première équation canonique,

p(t)=x˙(t,x(t),x˙(t)).

La seconde équation canonique implique donc maintenant l'équation d'Euler-Lagrange (EL) en chaque point auquel Modèle:Math est continûment dérivable. D'autre part, on a

(t,x,u,p)(t,x,w,p)=(t,x,w)(t,x,u)p|wu.

Par conséquent, en utilisant l'expression de Modèle:Math qui vient d'être obtenue, on voit que le principe du maximum implique la condition faible de Weierstrass. Celle-ci à son tour implique la condition faible de Legendre.

Conditions d'arrondissement des angles de Weierstrass-Erdmann

Le principe du maximum implique que les fonctions

tp(t)=x˙(t,x(t),x˙(t)),
t(t,x(t),x˙(t),p(t))=x(t,x(t),u(t))x˙(t)(t,x(t),x˙(t))

sont continues. Ce sont les deux conditions d'arrondissement des angles de Modèle:Lien.

On dit que le lagrangien est régulier (au sens de Hilbert) si

det(2x˙2(t,x,u))0((t,x,u)×Ω×𝐗).

Modèle:Théorème

Modèle:Démonstration

Différentiabilité des extrémales

Hilbert a montré le résultat suivant en utilisant le théorème des fonctions implicites : si de classe 𝒞n(n2) et le lagrangien est régulier, alors une extrémale Modèle:Math de classe 𝒞1 sur un intervalle est de classe 𝒞n sur cet intervalle[1]. Par conséquent, dans les conditions du corollaire ci-dessus, Modèle:Math est de classe 𝒞n.

Formalisme hamiltonien classique

Supposons de nouveau le lagrangien régulier. La maximisation du pseudo-hamiltonien implique la condition d'Euler

u(t,x,u,p)=0p=u(t,x,u).

On peut écrire cette équation sous la forme G(z,u)=0 avec

z=(t,x,p) et G(z,u)=pu(t,x,u).

Puisque le lagrangien est régulier, le théorème des fonctions implicites implique que u est (localement) une fonction de classe 𝒞1 de z, qu'on peut écrire u0(z).

William Rowan Hamilton (1805-1865).

Soit alors l'hamiltonien

(t,x,p)=(t,x,u0(t,x,p),p).

Les deux équations canoniques s'écrivent maintenant

x˙(t)=p(t,x(t),p(t))
p˙(t)=x(t,x(t),p(t))

où l'on a défini le vecteur adjoint par la relation p=x˙(t,x,x˙).

Le passage des variables (t,x,x˙) aux « variables canoniques » Modèle:Math est la transformation de Legendre.

Puisque u(t,x,u0(t,x,p),p)=0, l'égalité (E) du principe du maximum implique, en tout point auquel Modèle:Math et Modèle:Math sont continûment dérivables (donc sauf en un nombre fini de points)

t(t,x(t),p(t))=ddt(t,x(t),p(t)).

Condition suffisante d'optimalité (Bellman)

Considérons de nouveau le problème de Lagrange, mais à condition initiale fixée : 𝒱0={(t0,x0)}. Le lagrangien est supposé régulier.

Principe d'optimalité du calcul des variations

D'après le principe général de la programmation dynamique de Bellman, généralisation du principe d'Huyghens-Fresnel, une fonction Modèle:Math minimise Modèle:Math, si, et seulement si pour tout Modèle:Math, Modèle:Math minimise le critère

Jτ(x)=τtf(t,x(t),x˙(t))dt

avec

x(τ)=ξ.

Désignons par Modèle:Math la valeur optimale de ce critère et considérons de nouveau le pseudo-hamiltonien (t,x,u,p). L'équation de Hamilton-Jacobi-Bellman du calcul des variations[42] est l'équation aux dérivées partielles

(HJB)::St(τ,ξ)+maxu𝐗(τ,ξ,u,Sξ(τ,ξ))=0

avec pour condition aux limites (CL):: S(tf,xf)=0,(tf,xf)𝒱f.

Introduisons comme plus haut la fonction Modèle:Math, découlant de la maximisation du pseudo-hamiltonien (dans (HJB)) et du théorème des fonctions implicites et posons, pour alléger les écritures, u^(t,x)=u0(t,x,Sξ(t,x)). On a le résultat suivant :

Modèle:Théorème Modèle:Démonstration

Formulation de Carathéodory

Constantin Carathéodory (1873-1950).

La formulation de Carathéodory[43] est équivalente au théorème de Bellman dans le contexte du Calcul des variations. Elle peut s'exprimer sous la forme suivante : supposons qu'il existe une fonction continûment différentiable S:(t,x)S(t,x) telle que, en posant, comme on l'a déjà fait plus haut,

u0(t,x,p)=argmaxu𝐗(t,x,u,p)

(à supposer que le maximum existe et soit strict), Modèle:Mvar soit solution de l'équation aux dérivées partielles « de Carathéodory »

St(t,x)+(t,x,u0(t,x,Sx(t,x)),Sx(t,x))=0.

Alors la fonction optimale Modèle:Math est solution de l'équation différentielle

x˙(t)=uo(t,x(t),Sx(t,x(t))).

Théorie de Jacobi

Équation de Hamilton-Jacobi

En récrivant l'équation de Carathéodory à l'aide de l'hamiltonien , on obtient l'équation d'Hamilton-Jacobi

St+(t,x,Sx)=0.

Théorème de Jacobi

Soit Modèle:Math, de sorte que, par identification, 𝐗=n et que ses éléments sont représentés par des vecteurs colonne. La fonction Modèle:Mvar dépend d'un vecteur Modèle:Mvar de n paramètres. Supposons donc que l'équation de Hamilton-Jacobi admette une solution Modèle:Math, de classe 𝒞2. Posons

(Dp):: p=Sx(t,x,α)

et considérons l'équation

(Dx1)::Sα(t,x,α)=β

β est une ligne de n éléments. En supposant que

(C) ::det(2Sαx)0,

d'après le théorème des fonctions implicites, cette équation détermine (localement) x en fonction de t, Modèle:Mvar et β :

(Dx2)::x=x0(t,α,β)

de sorte que l'on a

(E1):: Sα(t,x0(t,α,β),α)=β

Dérivons par rapport à t l'équation (E1). Il vient

2Sαt(t,x0(t,α,β),α)+2Sαx(t,x0(t,α,β),α)x0t(t,α,β)=0.

D'autre part, en différenciant l'équation de Hamilton-Jacobi par rapport à Modèle:Mvar, il vient

2Sαt(t,x,α)+2Sαx(t,x,α)p(t,x,Sx(t,x,α))=0

(En effet, on a l'égalité

p(t,x,Sx(t,x,α))2Sαx(t,x,α)=2Sαx(t,x,α)p(t,x,Sx(t,x,α))

qu'on peut vérifier en développant les deux membres dans la base canonique de n et sa base duale. La raison de ceci est donnée au § Justification du théorème de Pontriaguine-Boltyansky de l'article Commande optimale.)

En soustrayant ces deux équations avec x=x0(t,α,β) on obtient, en posant x˙=x0t(t,α,β)

2Sαx(t,x,α)x˙2Sαx(t,x,α)p(t,x,Sx(t,x,α))=0

qui donne en multipliant à gauche par l'inverse de 2Sαx(t,x,α) la première équation canonique

x˙=p(t,x,p).

En différenciant l'équation de Hamilton-Jacobi par rapport à x,

2Stx+x(t,x,Sx)=0

ce qui donne la seconde équation canonique

p˙=x(t,x,p).

On a donc obtenu le résultat suivant :

Modèle:Théorème

Remarque : pente d'une extrémale

On notera que puisque p=Sx(t,x,α) est indépendant de β, il en va de même de x˙=x0t(t,α,β) d'après la première équation canonique ; on peut donc supprimer β de ses arguments et écrire

x˙=ζ(t,α).

ζ(t,α)=x0t(t,α,β).

Il s'ensuit que les composantes β1,...,βn du vecteur ligne (ou covecteur) β sont des constantes d'intégration de la variable x telle que x˙=ζ(t,α). Par suite, en notant β le vecteur colonne de composantes β1,...,βn, on peut écrire

x0(t,α,β)=x^(t,α)+β.

On appelle ζ(t,α)=x^t(t,α) la pente de l'extrémale x^(t,α)+β.

Démonstration de la condition de transversalité

L'équation de Hamilton-Jacobi s'intègre avec la condition 𝒮(tf,x(tf))=0 pour (tf,x(tf))𝒱f. Pour tout accroissement admissible infiniment petit (δtf,δxf)T(tf,xf)𝒱f on a donc nécessairement

St(tf,xf)δtf+Sx(tf,xf)δxf=0.

Or, d'après l'équation de Hamilton-Jacobi, St=, et d'après (Dp), Sx=p, d'où la condition de transversalité sur la variété 𝒱f.

Théorie de Weierstrass (formule intégrale)

Revenons au problème de Lagrange à instants initial et final fixés. Le théorème de Jacobi a permis d'obtenir la solution générale des équations canoniques (donc toutes les extrémales x^(t,α)+β, de pente Modèle:Math) à partir de la fonction Modèle:Math.

Champ d'extrémales

Réciproquement, soit x*(.)=x^(.,α0)+β0 une extrémale. Soit Modèle:Math et

𝔈ε={(t,x^(t,α)+β0):αα0<ε,t[t0,tf]}.

Alors 𝔈ε est appelé un champ d'extrémales autour de Modèle:Math si par tout point (t,x)𝔈ε passe une extrémale et une seule x^(t,α)+β0, Modèle:Math étant fixé, pour laquelle αα0<ε. Cette notion est due à Weierstrass. Si un tel champ existe, on peut résoudre en Modèle:Mvar l'équation x^(t,α)+β0=x, et on obtient donc une fonction Modèle:Math. En conséquence, la pente Modèle:Mvar de l'extrémale x^ s'exprime elle aussi comme une fonction ζ^(t,x) qu'on supposera de classe 𝒞2.

On montre que si les conditions (II') et (III') sont satisfaites, l'extrémale x*=x^(.,α0)+β0, où β0 est fixé, peut être entourée d'un champ d'extrémales ayant une fonction de pente (t,x)ζ^(t,x) de classe 𝒞2[44]Modèle:,[1].

Forme de Poincaré-Cartan

Supposons que l'extrémale x* soit entourée d'un champ d'éxtrémales de pente ζ^(t,x) et posons

(t,x,p)=p|ζ^(t,x)(t,x,ζ^(t,x).

La « variable adjointe » est définie par

p=x˙(t,x,ζ^(t,x)).

En dérivant par rapport à x, on obtient

x(t,x,p)=pξ^xxx˙ζ^x=x.

Mais puisque ζ^(t,x) est la pente d'une extrémale, on a l'équation d'Euler-Lagrange

ddt(x˙(t,x,ζ^(t,x)))=x(t,x,ζ^(t,x))

et par suite p vérifie la seconde équation canonique

p˙=x,

La forme différentielle, dite forme de Poincaré-Cartan[45]Modèle:,[46]

ω=.dt+p.dx

est donc une différentielle exacte dS avec p=Sx et =St (équation de Hamilton-Jacobi).

Intégrale invariante de Hilbert

Soit maintenant x(.):tx(t) une courbe admissible quelconque (ne vérifiant donc pas a priori la première équation canonique) et x*(.):tx*(t) une extrémale admissible (qui, sous certaines conditions, sera unique). On a d'après ce qui précède

x(.)ω=x*(.)ω=S(tf,xf)S(t0,x0).
David Hilbert (1862-1943).

Cette quantité est appelée l'intégrale de Hilbert[47] ; elle est invariante, c'est-à-dire indépendante de la courbe admissible considérée x(.). On peut mettre l'intégrale de gauche sous la forme

x(.)ω=x(.){(t,x,ζ^(t,x))+x˙(t,x,ζ^(t,x)).(x˙ζ^(t,x))}dt.

Si x(.)=x*(.), on a x˙=ζ^(t,x), donc

x*(.)ω=t0tf(t,x*(t),x˙*(t))dt=J(x*).

Par conséquent, par l'invariance de l'intégrale de Hilbert,

J(x*)=x(.)ω=x(.){(t,x,ζ^(t,x))+x˙(t,x,ζ^(t,x)).(x˙ζ^(t,x))}dt

Formule intégrale de Weierstrass

On a par définition,

J(x)=t0tf(t,x,x˙)dt=x(.)(t,x,x˙)dt

et par conséquent

J(x)J(x)=x(.){(t,x,x˙)(t,x,ζ^(t,x))x˙(t,x,ζ^(t,x)).(x˙ζ^(t,x))}dt.

La fonction de Weierstrass permet d'écrire ce résultat sous la forme suivante :

Modèle:Théorème

Théorème de Noether

Emmy Noether (1882-1935).

Modèle:Article détaillé Modèle:Article détaillé Considérons une famille d'applications 𝔖α:×X×X,|α|<ε0,

𝔖α=(𝔗(t,x,α),𝔛(t,x,α))

𝔗 et 𝔛 sont de classe 𝒞1,

𝔗(t,x,0)=t,𝔛(t,x,0)=x

et plus précisément pour α0

𝔗(t,x,α)=t+T(t,x)+o(α), 𝔛(t,x,α)=x+X(t,x)+o(α).

Soit x:[t0,tf]tx(t)Ω1X. L'image du graphe de cette fonction par 𝔖α est le graphe d'une fonction

ξ(α):[τ0(α),τf(α)]τξ(α,τ)X.

Considérons maintenant le problème de Lagrange et écrivons

J(x(),t0,tf)=t0tf(t,x(t),x˙(t))dt

,x et x˙ sont continues dans Modèle:Math (avec les notations déjà considérées).

Modèle:Théorème

L'ensemble des familles de transformation laissant invariante J forme un groupe de Lie 𝔊, le groupe des symétries de J. Chaque (𝔖α) forme un sous-groupe de Lie à un paramètre de 𝔊, dont le champ de vecteurs Modèle:Math est un générateur infinitésimal, donc un élément de l'algèbre de Lie 𝔤 de 𝔊.

Considérons la forme de Poincaré-Cartan ω=dt+pdx et formons la quantité

ψ(t,x,p)=p|X(t,x)(t,x,p)T(t,x).

Modèle:Théorème

Exemple 1 : conservation de l'énergie totale

Supposons que ne dépende pas explicitement de Modèle:Mvar. Alors Modèle:Mvar est invariante par la famille de transformations xx, tt+Cte, d'où Modèle:Math, Modèle:Math. Par suite, ψ(t,x,p)=(t,x,p) et le théorème de Noether se traduit par

(t,x,p)=Cte.

En mécanique, Modèle:Mvar est l'action, dont le lagrangien est =𝒯(x˙,x)𝒰(x)𝒯(x˙,x)=12x˙TM(x)x˙ (la « masse généralisée » Modèle:Math est une matrice symétrique réelle définie positive) est l'énergie cinétique et 𝒰(x) est l'énergie potentielle. La « variable adjointe », à savoir le covecteur

p=x˙=x˙TM(x)

s'identifie dans l'espace euclidien au transposé du vecteur colonne p=M(x)x˙ qui est la quantité de mouvement. Alors

(t,x,x˙)=x˙|x˙=x˙TM(x)x˙12(x˙TM(x)x˙𝒰(x))=𝒯(x˙,x)+𝒰(x)

est l'énergie totale. Le théorème de Noether fournit donc le théorème usuel de conservation de l'énergie totale.

Exemple 2 : conservation de la quantité de mouvement

Supposons que le lagrangien de dépende pas explicitement de la variable Modèle:Math. Alors J est invariante par la famille de transformations x1x1+Cte, xixi(i=2,...,n), tt donc Modèle:Math, Modèle:Math, Modèle:Math, et par suite Modèle:Math.

On a vu que dans le cadre de la mécanique, Modèle:Math s'interprète comme la quantité de mouvement suivant la direction Modèle:Math (s'il y a m particules, 1jmpj1 se conserve).

Exemple 3 : conservation du moment cinétique

Supposons le lagrangien invariant par rotation de Modèle:Mvar autour, par exemple, de l'axe Modèle:Math dans l'espace usuel à 3 dimensions. Alors Modèle:Mvar est invariant relativement à la famille de transformations

ξ1(α)=x1cosα+x2sinα,
ξ2(α)=x1sinα+x2cosα,
ξ3=x3.

On a

ξ1α(0)=x2, ξ2α(0)=x1, ξ3α(0)=0,

par conséquent

ψ(t,x,p)=p1x2p2x1.

Dans le cadre de la mécanique, cette quantité s'interprète comme le moment cinétique (s'il y a m particules, 1impi1xi2pi2xi1 se conserve).

Calcul des variations sur une variété

Soit X une variété différentielle. Une courbe x:IX de classe 𝒞1 tracée sur X (où I est un intervalle de ) a pour dérivée au point tI le vecteur tangent x˙(t)Tx(t)(X), et (x(t),x˙(t))T(X)Modèle:Math est le fibré tangent de X. Soit alors :T(X) une fonction de classe 𝒞1 (on suppose ici, pour simplifier, que ce lagrangien ne dépend pas explicitement du temps ; sinon on devra remplacer X par Modèle:Math). La fonctionnelle considérée dans le problème de Lagrange est de nouveau

J(x(.))=t0tf(x(t),x˙(t))dt.

La variable adjointe Modèle:Mvar, ou plus exactement le couple Modèle:Math, appartient au fibré cotangent Modèle:Math. La transformation de Legendre est

T(x)(x,u(x,u))(x,p)T(X)*

en supposant qu'il s'agisse d'un difféomorphisme, dont l'application inverse est (x,p)(x,u0(x,p)). L'hamiltonien est

:I×T(X)*(x,p)p|u0(x,p)(x,u0(x,p)).

L'équation d'Euler-Lagrange est inchangée, et tx*(t) est solution de cette équation si, et seulement si Modèle:Math et p*:=x˙(x*,x˙*) sont solutions des deux équations canoniques de Hamilton.

Applications

On a rapidement évoqué plus haut quelques applications du théorème de Noether à la Mécanique. Voyons maintenant d'autres applications.

Principe d'action stationnaire de Hamilton

Soit un système conservatif (c'est-à-dire soumis à des forces qui dérivent toutes d'un potentiel) à n degrés de libertés et q=(q1,...,qn) le vecteur de ses coordonnées généralisées (noté x dans ce qui précède). L'action entre les instants t0 et tf est la quantité

S(t0,tf)=t0tf(q(t),q˙(t))dt

où le lagrangien est défini par l'expression =TU, T(q,q˙) étant l'énergie cinétique et U(q) l'énergie potentielle.

Le principe de moindre action, tel qu'énoncé par Pierre Louis Moreau de Maupertuis, postule que le mouvement entre les instants t0 et tf s'effectue de manière à rendre cette action minimale.

Considérons le cas très simple d'un point matériel se déplaçant sur l'axe des x et soumis à une force de rappel kx, k>0. Cette force dérive du potentiel U=12kx2. Le lagrangien est donc (x,u)=12mu212kx2 avec u=x˙. L'équation d'Euler-Lagrange donne l'équation de Newton habituelle du mouvement de l'extrémité d'un ressort à laquelle est accrochée une masse m, l'autre extrémité étant fixe (et le ressort lui-même étant supposé de masse négligeable) :

mx¨=kx.

On a 2x˙2=m>0, et la condition forte de Legendre est donc vérifiée. Un calcul élémentaire montre que l'équation de Jacobi est également

mh¨+kh=0

dont les solutions sont de la forme h(t)=Acos(ωt+ϕ)ω=km. La condition faible de Jacobi n'est donc pas vérifiée sur un intervalle d'amplitude plus grande que πω, et par suite l'action sur un tel intervalle intervalle n'est pas minimisée.

Le mouvement d'un ressort vibrant dont les extrémités sont fixes peut être approché par celui d'une infinité de points matériels tels que ci-dessus, ayant des pulsations ωk multiples d'une pulsation fondamentale. Il n'existe alors aucun intervalle de temps, aussi petit soit-il, sur laquelle l'action correspondante puisse être minimale[48].

Le principe de moindre action de Maupertuis doit donc être corrigé, et l'énoncé correct est principe d'action stationnaire de Hamilton : le mouvement s'effectue non pas, en général, de manière à minimiser l'action, mais la rendre stationnaire, c'est-à-dire à annuler sa première variation, ce qu'on écrit traditionnellement sous la forme δS=0.

Géodésiques d'une variété riemannienne

Cas d'une variété pseudo-riemannienne

La métrique d'une variété pseudo-riemannienne de dimension n munie de sa connexion de Levi-Civita est donnée par la forme différentielle ds définie par

Tullio Levi-Civita (1873-1941).
(ds)2=i,jgijdxidxj

où les gij sont des fonctions continûment différentiables des coordonnées xi ; les indices i et j varient entre 1 et n. La forme quadratique ci-dessus est supposée non dégénérée, autrement dit, si G désigne la matrice dont les éléments sont les gij, cette matrice est symétrique réelle inversible (le cas d'un espace de Riemann correspond à celui où toutes ces valeurs propres restent strictement positives). La longueur d'une courbe paramétrée de classe 𝒞2, x=x(t),t[t0,tf], d'extrémités fixes x(t0)=x0 et x(tf)=xf, est donc

L(x)=t0tfi,jgijx˙ix˙jdt.

Modèle:Théorème

La recherche des géodésiques est donc un problème de Lagrange à extrémités fixes. Posons

φ=2=i,jgijx˙ix˙j. L'équation d'Euler-Lagrange s'écrit
12φφx=ddt(12φφx˙).

Puisque la géodésique est parcourue à vitesse constante (c'est-à-dire ds/dt=Cte>0), le paramétrage est affine (t=as+b,a0) en fonction de l'abscisse curviligne s. On a donc φ=a et l'équation d'Euler-Lagrange s'explicite comme suit :

12p,qgpqxix˙ix˙q+p,sgpixsx˙sx˙psgsix¨s=0.

Il s'agit également de l'équation d'Euler-Lagrange pour les courbes rendant stationnaire l'« énergie »

E(x)=t0tfi,jgijx˙ix˙jdt

sans hypothèse cette fois sur la nature du paramétrage. On a donc le résultat suivant :

Modèle:Théorème

En introduisant les symboles de Christoffel de première espèce Γpq,i=12(gpixq+gqixpgpqxi), cette expression se met sous la forme

sgsix¨s+p,qΓpq,ix˙px˙q=0.

Soit maintenant gik les éléments de la matrice G1 et soit les symboles de Christoffel de deuxième espèce Γpqj=igijΓpq,i ; on obtient finalement l'équation géodésique

x¨j+p,qΓpqjx˙px˙q=0.

Modèle:Théorème

Soit uj=dxjdt. La dérivée covariante du champ de vecteurs u le long de la courbe x est donnée par

(uu)j=pujxpup+p,qΓpqjupuq=dujdt+p,qΓpqjupuq,

par conséquent les géodésiques sont les courbes de classe 𝒞2, xx(t) telles que, avec u=dxdt,

uu=0.

Autrement dit, on a le

Modèle:Théorème

C'est également de cette façon qu'on définit une courbe géodésique sur une variété munie d'une connexion affine quelconque[49]. Une géodésique reste telle par reparamétrage si, et seulement si celui-ci est affine.

Cas d'une variété riemannienne

La condition faible de Legendre n'est satisfaite que dans le cas riemannien (et dans ce cas la condition forte de Legendre est satisfaite). C'est donc dans ce cas seulement qu'on peut avoir des géodésiques minimales.

On a au sens de la métrique riemannienne

i,jgijx˙i(t)x˙j(t)=x˙(t)2

et l'inégalité de Cauchy-Schwarz implique

L(x)2(tft0)E(x)

(en considérant le produit scalaire dans L2([t0,tf]) de la fonction f(t)=i,jgijx˙i(t)x˙j(t) avec g(t)=1) avec égalité si, et seulement si f(t)=Cte0, c'est-à-dire si t dépend de manière affine de l'abscisse curviligne.

On se ramène sans perte de généralité au cas où t0=0 et tf=1.

Modèle:Théorème

Modèle:Démonstration

L'étude des géodésiques minimales peut s'effectuer grâce au théorème de Jacobi-Weierstrass et on obtient ce qui suit[50] :

Considérons une famille de courbes ξ(tx(t,ξ)) où la fonction I×J(t,ξ)x(t,ξ) est de classe C3, I est un intervalle ouvert contenant l'intervalle [t0,tf] et J est un intervalle ouvert contenant 0. On suppose de plus que pour tout ξJ, x(t0,ξ)=x0, x(tf,ξ)=xf, et xξ(t,0) n'est pas identiquement nul dans [t0,tf]. Supposons que x(.,0) soit une géodésique 𝔊 (ce qui implique que la variable t dépend de l'abscisse curviligne de 𝔊 de manière affine). On a alors le résultat suivant :

Modèle:Théorème

Cas de la sphère

La notion de point conjugué se laisse bien appréhender dans le cas de la sphère, qui est une variété riemannienne particulière. Les géodésiques de la sphère sont les grands cercles. Soit A un point d'une sphère de centre O ; son point conjugué est son antipode B. Soit C un point d'un grand cercle passant par A, orienté dans le sens trigonométrique. La distance entre A et C est minimale (resp. strictement minimale) à la surface de la sphère si, et seulement si l'angle (OA,OC)^ est inférieur ou égal (resp. strictement inférieur) à 180°. Ceci illustre la partie (2) du théorème énoncé plus haut.

Cas du cylindre

Considérons un cylindre à base circulaire, d'axe vertical. Il s'agit de nouveau d'une variété riemannienne qui est paramétrée par (θ,z)

{x=cosθy=sinθ

Soit une courbe θ=θ(t),z=z(t) à la surface de ce cylindre. Un calcul très simple montre que cette courbe est une géodésique si, et seulement si elle est un cercle (situé dans un plan horizontal) ou une droite verticale ou une hélice circulaire. Soit alors A un point du cylindre et H une hélice circulaire passant par A. Un calcul de nouveau très simple montre que A n'a pas de point conjugué sur H. Mais il existe une infinité d'hélices circulaires passant par deux points A et B du cylindre. De plus, si B est un point situé au-dessus de A, le chemin le plus court reliant A et B n'est pas une hélice circulaire, mais la droite verticale passant par A et B. Ceci illustre bien le caractère « local » de la partie (1) du théorème énoncé plus haut.

Soit D un domaine ouvert du plan (x,y) et considérons l'intégrale de Dirichlet[51]

J(u)=D((ux)2+(uy)2)dxdy.

D'après l'équation d'Ostrogradski (§ Cas des problèmes à intégrale multiple) et la remarque sur le cas d'un intégrande ne dépendant pas de l'inconnue, les fonctions de classe 𝒞2 minimisant cette fonctionnelle sont les solutions de l'équation de Laplace

2ux2+2uy2=0,

autrement dit ce sont les fonctions harmoniques. Le Principe de Dirichlet (établi de manière rigoureuse par Hilbert et Henri Lebesgue peu avant 1900, puis réexaminé par Hadamard en 1906) énonce qu'il existe une unique fonction de classe 𝒞1 sur D, minimisant l'intégrale de Dirichlet, continue sur l'adhérence de D et prenant des valeurs fixées sur sa frontière, et cette fonction est harmonique sur D.

Problème de Didon

Le problème de la reine Didon consiste à déterminer, parmi toutes les courbes de classe 𝒞1 et de longueur l, celle qui délimite avec un segment AB l'aire maximale. Il peut donc se formaliser de la manière suivante : minimiser

J0(y)=aby(x)dx

avec y(a)=y(b)=0, sous la contrainte

J1(y)=ab1+y˙2(x)dx=l.

Introduisons les multiplicateurs de Lagrange λ0{0,1} et λ1. D'après la remarque faite à propos des problèmes isopérimétriques, on a nécessairement λ0=1. Il vient donc, avec λ=λ1,

=y+λ1+y˙2.

L'équation d'Euler-Lagrange s'écrit

ddx(λy˙1+y˙2)=1

d'où en intégrant λy˙1+y˙2=xx0, ce qui équivaut à y˙=xx0λ2(xx0)2, soit encore

(yy0)2+(xx0)2=λ2.

Les courbes extrémales sont donc des arcs de cercle. Pour qu'une telle courbe soit solution du problème, il faut bien entendu que la longueur l soit supérieure ou égale à la longueur de AB.

Notes et références

Notes

Modèle:Références

Bibliographie commentée

Liens externes

Articles connexes

Modèle:Palette

Modèle:Portail

  1. 1,0 1,1 1,2 1,3 1,4 et 1,5 Modèle:Harvsp.
  2. Modèle:Harvsp.
  3. Modèle:Article.
  4. Modèle:Article.
  5. Modèle:Article.
  6. Modèle:Article.
  7. Modèle:Article.
  8. Modèle:Article.
  9. Modèle:Article.
  10. Modèle:Article.
  11. Modèle:Ouvrage.
  12. 12,0 et 12,1 Modèle:Harvsp.
  13. Modèle:Ouvrage.
  14. Modèle:Article.
  15. Modèle:Article.
  16. Modèle:Article.
  17. Modèle:Article.
  18. Modèle:Article.
  19. Modèle:Article.
  20. Modèle:Harvsp.
  21. Modèle:Harvsp.
  22. Modèle:Harvsp.
  23. Modèle:Harvsp.
  24. 24,0 et 24,1 Modèle:Harvsp.
  25. Modèle:Harvsp.
  26. Comme l'écrit Modèle:Lien dans Modèle:Lang (1969) : Modèle:Citation étrangère
  27. Voir par exemple Modèle:Article.
  28. Modèle:Harvsp ; Modèle:Harvsp.
  29. Modèle:Harvsp.
  30. Modèle:Harvsp, chap. IX (par Paulette Libermann).
  31. Modèle:Harvsp.
  32. Modèle:Article.
  33. Modèle:Harvsp.
  34. Modèle:Mvar est dite Gateaux-différentiable au point Modèle:Mvar lorsque de plus, Modèle:Math est linéaire et continue.
  35. Modèle:Harvsp.
  36. Modèle:Harvsp, Modèle:Google Livres.
  37. Modèle:Harvsp. La numérotation des conditions est celle, très commode, utilisée dans Modèle:Harvsp.
  38. Voir par exemple Modèle:Harvsp, § II. 38, ou l'article d'Osgood déjà cité dans l'historique.
  39. Modèle:Harvsp.
  40. Modèle:Harvsp.
  41. Modèle:Harvsp.
  42. L'équation de Hamilton-Jacobi-Bellman de la Commande optimale s'obtient en remplaçant Modèle:Math par un espace topologique Modèle:Math quelconque.
  43. Modèle:Harvsp.
  44. Modèle:Harvsp.
  45. Modèle:Ouvrage.
  46. Modèle:Ouvrage.
  47. On l'appelle aussi l'invariant intégral de Poincaré-Cartan. Hilbert a mis en évidence l'invariance de cette intégrale à l'occasion de son cours dispensé à l'université de Göttingen durant le semestre de l'été 1900.
  48. Modèle:Harvsp.
  49. Modèle:Harvsp.
  50. Modèle:Harvsp.
  51. Le lecteur prendra garde au fait que le vocable « intégrale de Dirichlet » n'a pas une acception unique.