Théorème de Cayley-Hamilton

De testwiki
Aller à la navigation Aller à la recherche

Modèle:Confusion

Portrait d'Arthur Cayley

En algèbre linéaire, le théorème de Cayley-Hamilton (tirant son nom des mathématiciens Arthur Cayley et William Rowan Hamilton) affirme que tout endomorphisme d'un espace vectoriel de dimension finie sur un corps commutatif quelconque annule son propre polynôme caractéristique.

En termes de matrice, cela signifie que si A est une matrice carrée d'ordre n et si

Modèle:Retrait

est son polynôme caractéristique (polynôme d'indéterminée X), alors en remplaçant formellement X par la matrice A dans le polynôme, le résultat est la matrice nulle[1] :

Modèle:Retrait

Le théorème de Cayley-Hamilton s'applique aussi à des matrices carrées à coefficients dans un anneau commutatif quelconque.

Un corollaire important du théorème de Cayley-Hamilton affirme que le polynôme minimal d'une matrice donnée est un diviseur de son polynôme caractéristique.

Bien qu'il porte les noms des mathématiciens Arthur Cayley et William Hamilton, la première démonstration du théorème est donnée par Ferdinand Georg Frobenius en 1878, Cayley l'ayant principalement utilisé dans ses travaux, et Hamilton l'ayant démontré en dimension 2.

Motivation

Ce théorème possède deux familles d'utilisation :

  • Il permet d'établir des résultats théoriques, par exemple pour calculer le polynôme caractéristique d'un endomorphisme nilpotent.
  • Il autorise aussi des simplifications puissantesModèle:Quoi dans les calculs de matrices. L'approche par les polynômes minimaux est en général moins coûteuse que celle par les déterminants.

On trouve ce théorème utilisé dans les articles sur les polynômes d'endomorphisme, endomorphismes nilpotents, et plus généralement dans la théorie générale des matrices.

Exemple

Considérons par exemple la matrice

A=(1234).

Le polynôme caractéristique s'écrit

p(X)=det(X123X4)=(X1)(X4)(2)(3)=X25X2.

Le théorème de Cayley-Hamilton affirme que

A25A2I2=0

et cette relation peut être rapidement vérifiée dans ce cas. De plus le théorème de Cayley-Hamilton permet de calculer les puissances d'une matrice plus simplement que par un calcul direct. Reprenons la relation précédente

A25A2I2=0
A2=5A+2I2

Ainsi, par exemple, pour calculer A4, nous pouvons écrire

A3=(5A+2I2)A=5A2+2A=5(5A+2I2)+2A=27A+10I2

et il vient

A4=A3A=(27A+10I2)A=27A2+10A=27(5A+2I2)+10A
A4=145A+54I2.

On peut également utiliser la relation polynomiale initiale A25A2I2=0 pour prouver l'inversibilité de A et calculer son inverse. Il suffit en effet de mettre en facteur une puissance de A là où c'est possible et

A(A5I2)=2I2

ce qui montre que A admet pour inverse

A1=12(A5I2)

Démonstrations

Il existe de très nombreuses démonstrations de ce théorème[2]. La plus simple dans son principe consiste à remarquer que le résultat est presque évident pour une matrice diagonale, puis à le démontrer pour une matrice diagonalisable A (en remarquant qu'alors XInA est semblable à XInD, et que deux matrices semblables ont même déterminant) ; on conclut en exploitant le fait que sur les complexes, l'ensemble des matrices diagonalisables est dense[3]. Malheureusement, cette démonstration ne se généralise pas aux corps scalaires topologiquement discrets.

Une preuve purement algébrique

Quelle que soit la matrice Sn(𝕂), il existe une matrice explicitement déterminée, Modèle:Math, la matrice complémentaire de Modèle:Mvar, qui vérifie SComp(S)=Comp(S)S=det(S)In. La matrice Modèle:Math est la transposée de la comatrice ou matrice des cofacteurs de Modèle:Mvar. Cette relation reste encore vraie si les coefficients de Modèle:Mvar appartiennent à un anneau, puisqu'on n'a pas fait de divisions. On peut donc poser S=XInA, dont les coefficients sont dans 𝕂[X] et on a alors la relation :

(XInA)Comp(XInA)=det(XInA)In=p(X)In.  (1)

À partir de (1), en écrivant

Comp(XInA)=j=0n1BjXj

avec Bjn(𝕂), et

p(X)=j=0npjXj.

On peut développer le produit (XInA)Comp(XInA) :

(XInA)Comp(XInA)=XnBn1+i=1n1Xi(Bi1ABi)AB0  (2),

qui est identique à

j=0nXjpjIn.  (3)

Les polynômes (2) et (3) sont égaux. Par conséquent,

pnIn=Bn1,piIn=Bi1ABi,p0In=AB0.

Il vient alors un télescopage :

p(A)=j=0nAj(pjIn)=AnBn1+i=1n1Ai(Bi1ABi)AB0=i=1nAiBi1i=0n1Ai+1Bi=0.

La preuve ne consiste pas en une substitution de Modèle:Mvar par Modèle:Mvar dans des égalités de polynômes (ce qui reviendrait à comparer un polynôme et un polynôme matriciel), mais en une identification de leurs coefficients.

Une variante

On peut également aligner des idées abstraites.

On commence par introduire un morphisme d'évaluation approprié à la résolution du problème. Tout d'abord, 𝕂[A] étant une algèbre commutative sur 𝕂, on a un morphisme d'évaluation : 𝕂[X]𝕂[A] (qui envoie X sur A et λ sur λIn pour tout scalaire Modèle:Mvar). Ce morphisme d'anneaux commutatifs induit un morphisme d'évaluation sur les anneaux de matrices n(𝕂[X])n(𝕂[A]).

Une notation auxiliaire nous sera utile : pour deux matrices carrées Modèle:Math notées C=(cij) et D=(dij), on notera CD la matrice à coefficients matriciels de terme général cijD. Si le lecteur connaît le produit de Kronecker de deux matrices, il pourra remarquer que CD est pratiquement identique à CD à ceci près que CD est une matrice Modèle:Math dont les coefficients sont des matrices Modèle:Math tandis que CD est une matrice Modèle:Math. Les formules ci-dessous ne contiennent de fait que deux cas particuliers de cette opération : des produits de la forme InC c'est-à-dire des matrices carrées avec des Modèle:Mvar sur la diagonale et des Modèle:Math ailleurs et un produit AIn c'est-à-dire une variante de Modèle:Mvar où la matrice aijIn vient remplacer le coefficient aij.

Cette notation posée, on applique le morphisme d'évaluation à la relation :

(XInA)Comp(XInA)=p(X)In.

On obtient une relation

(InAAIn)M=Inp(A)(*)

dans laquelle Modèle:Mvar est une certaine matrice à coefficients dans 𝕂[A] dont on n'aura besoin de rien savoir.

Ainsi on a écrit une formule juste, et on en pâtit : on n'a du coup pas fini, l'évaluation de XInA par une technique rigoureuse ne fournit pas Modèle:Math mais une bizarre matrice à coefficients matriciels.

Il faut une deuxième idée pour conclure. Elle consiste à remarquer que si 𝔸 est un anneau et Modèle:Mvar un 𝔸-module à droite, pour tous entiers Modèle:Mvar, Modèle:Mvar, Modèle:Mvar on peut définir par les formules habituelles un produit matriciel :

rs(E)×st(𝔸)rt(E)

pour laquelle on a associativité si on veut calculer des produits à trois termes :

rs(E)×st(𝔸)×tu(𝔸)ru(E).

On applique cette notion à E=𝕂n (pour les puristes à E=n1(𝕂)) qui est un module (dont la multiplication s'écrit spontanément à gauche mais peut l'être à droite si on préfère, l'anneau étant commutatif) sur l'anneau commutatif 𝔸=𝕂(A), la multiplication externe étant l'application : n1(𝕂)×𝕂(A) définie par (E,B)BE (ce Modèle:Mvar étant le produit matriciel ordinaire de la matrice carrée Modèle:Mvar par la matrice colonne Modèle:Mvar).

On multiplie à gauche la relation (*) par le vecteur ligne (e1en)(e1,,en) désigne la base canonique de 𝕂n : en utilisant l'expression de droite dans (*) on obtient le vecteur ligne (p(A)e1p(A)en).

Si maintenant on utilise l'expression de gauche dans (*) et qu'on déplace les parenthèses par associativité de la multiplication matricielle un peu inhabituelle décrite ci-avant, on est amené à calculer le produit :

(e1en)(InAAIn).

Pour chaque indice Modèle:Mvar, on ne peut que constater que sa Modèle:Mvar-ème composante vaut :

Aeji=1n(aijIn)ei=Aeji=1naijei=0.

En multipliant ceci à droite par l'inoffensive matrice Modèle:Mvar et en comparant les deux expressions du produit, on conclut que pour tout indice Modèle:Mvar, Modèle:Math.

Et donc Modèle:Math[4].

Remarques additionnelles sur la démonstration

La preuve qui a été donnée évite la substitution de X par une matrice dans un contexte non commutatif, mais les manipulations effectuées sont quand même proches de cette idée : on a bien décomposé l'équation en composantes suivant les puissances de X, on a multiplié à gauche par Aj la composante qui était en facteur de Xj, et on a additionné tout ensemble. En fait, on a utilisé l'opération EvA définie en (5), sans supposer qu'il s'agisse d'un homomorphisme d'anneaux, de n(𝕂)[X] dans Mn(𝕂). L'opération EvA est une évaluation à gauche, parce que la multiplication par l'indéterminée scalaire X est remplacée par la multiplication à gauche par A.

Une autre observation est importante : la forme exacte du polynôme Comp(XInA) n'a aucune importance. Il y a donc quelque chose à exploiter ici, ce que n'ont pas manqué de faire les mathématiciens.

Soit M un anneau non commutatif ; on peut définir une division euclidienne d'un polynôme PM[X] par un polynôme B unitaire. Plus précisément, il existe deux polynômes Q,RM[X], avec R de degré strictement inférieur au degré de B, tels que

P=BQ+R.

La démonstration est entièrement analogue à celle du cas scalaire. Si B=XInA, alors le reste R est de degré 0, et donc identique à une constante appartenant à M. Mais dans ce cas, en raisonnant exactement comme dans la démonstration du théorème de Cayley-Hamilton, on arrive à la conclusion

EvA(P)=R.

Il s'ensuit que EvA(P) est nul si et seulement si P est divisible à gauche par XInA.

La démonstration du théorème de Cayley-Hamilton donne aussi une autre information : le polynôme Comp(XInA) est le quotient à gauche de p(X)In par XInA. Comme p(X)In et XInA appartiennent tous deux au sous-anneau commutatif K[A][X], la division à gauche se passe entièrement dans ce sous-anneau, c'est donc une division ordinaire. En particulier, les coefficients matriciels de Comp(XInA) sont des combinaisons linéaires de puissances de A. En d'autres termes, la matrice complémentaire d'une matrice A est un polynôme en A, ce qu'il n'est pas facile de déduire directement de la définition d'une matrice complémentaire. Mieux, on peut calculer explicitement ses coefficients à partir de ceux du polynôme caractéristique p(X), puisqu'il s'agit de faire une division euclidienne ordinaire, et on trouve

Comp(-A)=j=1npjAj1.

On aurait pu également obtenir cette relation directement à partir du théorème de Cayley-Hamilton, en vertu de l'identité

p0In=det(A)In=AComp(A)=Comp(A)A.

Abstraction et généralisations

La preuve donnée ci-dessus n'utilise que les propriétés d'anneau commutatif du corps K, puisqu'elle ne comporte pas de division par des éléments de cet anneau mais s'appuie juste sur la formule de Laplace, valide pour une matrice à coefficients dans n'importe quel anneau commutatif B. On peut donc généraliser le théorème de Cayley-Hamilton à ce cas, en utilisant la formule de Laplace pour des matrices à coefficients dans l'anneau B = R [X], R étant un anneau commutatif quelconque :

Modèle:Énoncé

Soit alors M un module de type fini sur cet anneau R (l'analogue de la notion d'espace vectoriel de dimension finie sur un corps, mais sans l'existence de bases : M a seulement des familles génératrices finies), et soit φ un endomorphisme de M, le théorème de Cayley-Hamilton permet de construire comme suit des polynômes en φ qui s'annulent sur M : soit (e1, e2, ... , en) une famille génératrice de M. On peut trouver des éléments aij de R tels que

φ(ej)=i=1naijei,

et on note A la matrice nxn formée de ces coefficients. Cette matrice n'est pas unique, même pour une famille génératrice fixée, puisqu'on n'a pas supposé libre cette famille. Néanmoins, de la formule pA(A)=0 on déduit que pA(φ)=0.

Parmi les multiples démonstrations[2] du théorème de Cayley-Hamilton dans le contexte des anneaux commutatifs, soulignons l'élégance de la démonstration générique[5], dont le principe est abstrait mais courant en algèbre[6]Modèle:,[7] : elle repose sur la remarque que pour les matrices carrées A de taille n fixée, l'identité pA(A)=0 est un système de nModèle:2 identités polynomiales universelles en les coefficients de A. C'est-à-dire que pA(A)=U(ai,j) pour toute matrice A de coefficients ai,j dans n'importe quel anneau commutatif, où U(Yi,j) désigne une certaine matrice carrée de taille n à coefficients dans l'anneau de polynômes à nModèle:2 indéterminées R=[(Yi,j)1in,1jn] (cette matrice universelle U est indépendante de A car elle résulte juste des formules de développement du déterminant et des puissances de matrices n×n). Pour démontrer le théorème pour n'importe quelle matrice A dans n'importe quel anneau commutatif, il suffit donc de vérifier que cette matrice U(Yi,j) est nulle, c'est-à-dire de démontrer le théorème pour une seule matrice : la matrice Y dont les coefficients sont les Yi,j, éléments de l'anneau R.

Modèle:Démonstration

Notes et références

Modèle:Traduction/Référence Modèle:Références

Voir aussi

Modèle:Autres projets

Bibliographie

Modèle:Ouvrage

Lien externe

Modèle:Lien web

Modèle:Palette Modèle:Portail

  1. Une erreur naïve consiste à dire, pour une matrice A fixée : on remplace X par A dans la formule qui définit p(X), ce qui donne p(A) = det(AIModèle:Ind – A) = det(0) = 0. L’erreur réside dans l’ordre des étapes « évaluation du déterminant » et « substitution de A à X ». D'ailleurs, det(AIModèle:Ind – A) est un scalaire alors que la véritable valeur de p(A) est une matrice. Il est vrai qu'ici, la matrice est nulle (d'après le théorème) et le scalaire aussi (trivialement), mais on trouve facilement des exemples du même type où l'un est nul et pas l'autre, comme A=(1000) et q(X) = det(A + XIModèle:Ind).
  2. 2,0 et 2,1 Modèle:Lien web.
  3. Modèle:Ouvrage
  4. Cette preuve est celle qui figure dans Introduction to commutative algebra, M. F. Atiyah et I. G. Macdonald, Addison-Wesley, Modèle:ISBN, Modèle:P..
  5. Modèle:Ouvrage, exercice 20.11.
  6. Modèle:Lien web.
  7. Modèle:Ouvrage.