Concentration de mesure

De testwiki
Aller à la navigation Aller à la recherche

En mathématiques, la concentration de la mesure est un principe appliqué en théorie de la mesure, en statistiques, en probabilités et en combinatoire, et a des conséquences dans d'autres domaines tels que la théorie des espaces de Banach. Informellement, cela signifie qu'une fonction qui ne varie pas trop d'un point à un autre (fonction lipschitzienne) prend d'autant moins de valeurs différentes que son nombre de variables est grand. Cette fonction apparaît donc quasiment constante. Concrètement, en statistique, ce phénomène explique notamment pourquoi une fonction qui dépend de nombreuses variables indépendantes de manière lipschitzienne est essentiellement constante, permettant ainsi de fournir une autre démonstration au théorème central limite.

Le phénomène de concentration de la mesure a été mis en avant dans le début des années 1970 par Vitali Milman dans ses travaux sur la théorie locale des espaces de Banach, en étendant une idée qui remonte à l'œuvre de Paul Lévy[1]Modèle:,[2]. Il fut approfondi dans les travaux de Milman et Gromov, Maurey, Pisier, Modèle:Lien, Talagrand, Ledoux, et d'autres.

Cadre général

Soit (X,d,μ) un espace métrique muni d'une mesure μ sur la tribu borélienne, telle que μ(X)=1. Soit

α(ϵ)=sup{μ(XAϵ)|μ(A)1/2},

ϵ>0 et où

Aϵ={xX|d(x,A)<ϵ}

est l'ϵ-extension d'un sous-ensemble A de X.

La fonction α() est appelée le taux de concentration de l'espace (X,d,μ). La définition équivalente suivante a de nombreuses applications :

α(ϵ)=supμ({FM+ϵ}),

où le supremum est pris sur toutes les fonctions 1-lipschitziennes F:X, et où la médiane (ou moyenne de Lévy) M=MedF satisfait les inégalités

μ{FM}1/2,μ{FM}1/2.

Informellement, l'espace X présente un phénomène de concentration si α(ϵ) diminue très vite quand ϵ grandit. Plus formellement, une famille d'espaces métriques mesurés (Xn,dn,μn) est appelée famille de Lévy si les taux de concentration correspondants αn satisfont :

ϵ>0αn(ϵ)0lorsquen,

et une famille de Lévy normale s'il existe des constantes c,C>0 telles que :

ϵ>0αn(ϵ)Cexp(cnϵ2).

Voir ci-dessous pour des exemples.

Concentration sur la sphère

Le premier exemple remonte à Paul Lévy. Considérons la sphère Sn munie de la mesure sphérique normalisée σn (de masse totale 1, σn(Sn)=1). D'après le théorème isopérimétrique sphérique, parmi tous les sous-ensembles A de la sphère Sn de mesure sphérique σn(A) prescrite, disons σn(A)=m, la calotte sphérique

{xSn|dist(x,x0)R},

de mesure m (pour un R approprié) a la plus petite ϵ-extension Aϵ, pour tout ϵ>0.

En appliquant ceci à des ensembles de mesure σn(A)=1/2, on peut déduire l'inégalité de concentration suivante :

σn(Aϵ)1Cexp(cnϵ2),

C,c sont des constantes universelles ; en pratique C=1,c=1/2 sont valables mais sont non-optimales. Par conséquent, la famille des sphères (Sn)n correspond à la définition ci-dessus d'une famille de Lévy normale.

Vitali Milman a appliqué ce fait à plusieurs problèmes dans la théorie locale des espaces de Banach, en particulier afin d'établir une nouvelle preuve du théorème de Dvoretzky.

Ce résultat est contre-intuitif car il implique que si vous vous tenez à la surface d'une sphère de dimension n et de rayon 1, alors la quasi-totalité de cette surface est à une distance de vous qui est voisine de π/2 (si la distance utilisée est la plus courte distance parcourue sur la sphère, la distance géodésique). Ce résultat est contre-intuitif car notre intuition n'est confrontée qu'aux sphères de dimension 0 (2 points), 1 (un cercle) et 2 (une balle de ping-pong) et que cet effet est peu marqué pour d'aussi petites dimensions (voir tableauModèle:Référence nécessaire. On rappelle que tous les points de Sn sont à une distance inférieure à π de vous).

dimension proportion de la surface de Sn à

plus d'une distance π/4 de vous

0 1/2 = 0.5
1 3/4 = 0.75
2 18π160.9286
20 1exp(20(π/4)22)0.998
100 1exp(100(π/4)22)0.9999998

Autres exemples

Notes

  1. « The concentration of f(μ), ubiquitous in the probability theory and statistical mechanics, was brought to geometry (starting from Banach spaces) by Vitali Milman, following the earlier work by Paul Lévy » - M. Gromov, Spaces and questions, GAFA 2000 (Tel Aviv, 1999), Geom.
  2. "The idea of concentration of measure (which was discovered by V.Milman) is arguably one of the great ideas of analysis in our times.

Bibliographie

Modèle:Portail