Théorème de Mercer
En mathématiques et plus précisément en analyse fonctionnelle, le théorème de Mercer, nommé en référence à James Mercer[1], est une représentation d'une fonction symétrique de type positif par le carré d'une série convergente de produits de fonctions. C'est un outil théorique important dans la théorie des équations intégrales. Il est aussi utilisé dans la théorie hilbertienne des processus stochastiques (voir Modèle:Lien et Transformée de Karhunen-Loève).
Introduction
Pour expliquer le théorème de Mercer, commençons par un cas particulier important ; voir plus bas pour une formulation plus générale.
Le terme noyau, dans ce contexte, est une fonction continue
telle que K(x, s) = K(s, x).
K est dit de type positif[2]Modèle:,[3] si
pour toute suites finies de points xModèle:Ind, …,xModèle:Ind de [a, b] et tout choix des réels cModèle:Ind, …,cModèle:Ind (Modèle:Cf. Modèle:Lien).
À K on associe l'opérateur intégral défini par :
Pour des raisons techniques nous supposerons que φ peut parcourir l'[[Espace L2|espace LModèle:2[a, b]]] des fonctions réelles de carré intégrable.
Détails
Donnons avec force détails la structure de la preuve du théorème de Mercer, particulièrement dans ses rapports avec la théorie spectrale des opérateurs compacts normaux.
- L'application est injective.
- TModèle:Ind est un opérateur compact autoadjoint positif sur LModèle:2[a,b] ; de plus K(x, x) ≥ 0.
Pour montrer la compacité, on remarque d'abord que l'image de la boule unité de LModèle:2[a,b] par TModèle:Ind est équicontinue. Le théorème d'Ascoli permet d'en déduire que cette image est relativement compacte dans C([a,b]) muni de la norme de la convergence uniforme et a fortiori dans LModèle:2[a,b].
La théorie spectrale des opérateurs compacts normaux sur un espace de Hilbert montre qu'il existe une base hilbertienne (eModèle:Ind)Modèle:Ind de LModèle:2[a,b] propre pour TModèle:Ind :
Pour tout λi > 0, le vecteur propre eModèle:Ind est donc une fonction continue sur [a,b] (comme toutes les images par TModèle:Ind d'éléments de LModèle:2[a,b]). Or[3]
et d'après le théorème de Dini pour les suites croissantes de fonctions continues cette convergence est uniforme, ce qui permet, grâce à l'inégalité de Cauchy-Schwarz et au critère de Cauchy, de montrer[3] que la série
converge absolument et uniformément en t vers un noyau K0 dont il est aisé de voir qu'il définit le même opérateur que le noyau K. Donc K = K0, d'où le théorème de Mercer.
Trace
On déduit de ce qui précède :
Cela montre que l'opérateur TModèle:Ind est à trace et
Généralisations
Le théorème se généralise en remplaçant l'intervalle [a, b] par un espace compact, la mesure de Lebesgue sur [a, b] étant remplacée par une mesure finie dénombrablement additive μ sur les boréliens de X. Supposons que le support de μ est X, c'est-à-dire que μ(U) > 0 pour tout ouvert U non vide de X. Alors on a essentiellement le même résultat :
Modèle:Théorème La généralisation suivante porte sur la représentation des noyaux mesurables.
Soit (X, M, μ) un espace mesuré σ-fini. Un noyau LModèle:2 sur X est une fonction
Tout noyau LModèle:2 définit un opérateur borné TModèle:Ind, par la formule :
TModèle:Ind est un opérateur compact (c'est même un Modèle:Lien). Si le noyau K est symétrique, par le théorème spectral pour les opérateurs compacts normaux sur un espace de Hilbert, il existe une base hilbertienne constituée de vecteurs propres pour TModèle:Ind. Les vecteurs de cette base correspondant aux valeurs propres non nulles forment une famille dénombrable (eModèle:Ind)Modèle:Ind (même si le Hilbert n'est pas séparable).
Modèle:Théorème Noter que si le noyau n'est plus supposé continu, le développement ne converge plus nécessairement uniformément.
Utilisations
Le théorème de Mercer est utilisé en apprentissage automatique, pour l'astuce du noyau.
Notes et références
- ↑ Modèle:Article.
- ↑ Srishti D. Chatterji, Cours d'analyse, vol. 3 : Équations différentielles ordinaires et aux dérivées partielles, PPUR, 1998 Modèle:ISBN, Modèle:Google Livres.
- ↑ 3,0 3,1 et 3,2 Houcine Chebli, Analyse Hilbertienne, éd. université de Tunis Modèle:ISBN, p. 170 et suivantes.
Bibliographie
- Modèle:En Alain Berlinet et Christine Thomas, Reproducing Kernel Hilbert Spaces in Probability and Statistics, Kluwer Academic Publishers, 2004
- Modèle:En Modèle:Lien, Linear Analysis, North Holland, 1960
- Modèle:En Konrad Jörgens, Linear Integral Operators, Pitman, Boston, 1982
- Modèle:De Richard Courant et David Hilbert, Modèle:Lien, vol 1, Interscience, 1953
- Modèle:En Robert B. Ash, Information Theory, Dover, 1990
- Modèle:En Modèle:Lien, Eigenvalue Distribution of Compact Operators, Birkhäuser, 1986Modèle:Commentaire biblio SRL