Complexité de Rademacher

De testwiki
Aller à la navigation Aller à la recherche

La complexité de Rademacher est un concept d'informatique théorique ; il se situe plus précisément à l'intersection de théorie de apprentissage automatique et de la théorie de la complexité. La complexité de Rademacher mesure la richesse d'une classe de fonctions à valeur réelle, selon une distribution de probabilité. Elle porte le nom de Hans Rademacher.

Définition

Complexité empirique

Étant donné des observations S=(z1,z2,,zm)Zm, et une classe de fonctions à valeurs réelles définies sur un espace Z, la complexité empirique de Rademacher de est définie comme :

^S()=2m𝔼[suph|i=1mσih(zi)| | S]

σ1,σ2,,σm sont des variables aléatoires indépendantes, tirées selon la loi de Rademacher i.e. (σi=+1)=(σi=1)=1/2 pour i=1,2,,m.

Complexité de Rademacher

Soit P, la distribution de probabilité sur Z. La complexité de Rademacher de la classe de fonction selon P pour des données de taille m est :

m()=𝔼[^S()]

où les espérances, ci-dessus, sont calculées selon des observations indépendantes et identiquement distribuées (i.i.d.) S=(z1,z2,,zm) générées selon P.

Propriétés

On peut montrer qu'il existe une constante C, telle que n'importe quelle classe de fonctions indicatrices sur {0,1} avec la dimension de Vapnik-Chervonenkis d a la complexité de Rademacher majorée par Cdm.

Mesure similaire : la complexité gaussienne

La complexité gaussienne est une mesure de complexité similaire, avec des interprétations physiques similaires. Elle peut être obtenue à partir de la complexité précédente en utilisant les variables aléatoires gi au lieu de σi, où gi sont des variables aléatoires gaussiennes centrées réduites et i.i.d, i.e. gi𝒩(0,1).

Bibliographie

  • Giorgio Gnecco, Marcello Sanguineti (2008) Approximation Error Bounds via Rademacher's Complexity. Applied Mathematical Sciences, Vol. 2, 2008, no. 4, 153 - 176

Modèle:Palette Modèle:Portail