Lemme de Sauer

De testwiki
Version datée du 14 avril 2021 à 20:42 par 2a01:e0a:96f:e640:e5ac:a944:66bf:73d4 (discussion) (Références : cat)
(diff) ← Version précédente | Version actuelle (diff) | Version suivante → (diff)
Aller à la navigation Aller à la recherche

Le lemme de Sauer ou lemme de Sauer-Shelah est un résultat issu de la théorie des probabilités et en particulier de la théorie de Vapnik-Chervonenkis. Il précise le nombre maximal d'échantillons de taille n qu'une classe VC de dimension finie peut pulvériser. Ce résultat a été montré en 1972 par les mathématiciens Norbert Sauer[1] et Saharon Shelah[2].

Énoncé

Modèle:Article détaillé On dit qu'une classe 𝒞 d'un ensemble 𝒳 prélève un sous-ensemble S de {x1,,xn} s'il existe un élément C𝒞 vérifiant C{x1,,xn}=S. On dit que cette classe pulvérise {x1,,xn} s'il prélève tout sous-ensemble S de {x1,,xn}. Enfin cette classe est appelée classe VC de dimension n si 𝒞 n'arrive pas à pulvériser tout ensemble {x1,,xn} de taille n. On note Δ(𝒞;n) le nombre maximum de sous-ensemble prélevées de taille n, i.e.

Δ(𝒞;n)=maxx1,,xn𝒳card{C{x1,,xn}:C𝒞}.

Le lemme de Sauer donne une borne majorante de Δ(𝒞;n) si 𝒞 est une classe VC. Formellement si 𝒞 est une classe VC de dimension 𝒱 alors

n<𝒱,Δ(𝒞;n)i=0𝒱(ni)etn𝒱,Δ(𝒞;n)(en𝒱)𝒱=O(n𝒱).

Preuve

Une manière classique de démontrer ce résultat est de le faire par récurrence[3]Modèle:,[4]. On raisonne par récurrence sur des classes de dimension VC n+𝒱.

Initialisation : Si n=0,{𝒞:C𝒞}={} donc Δ(𝒞,0)=1=i=0𝒱(0i).

Si 𝒱=1,𝒞 n'arrive à pulvériser aucun point.

Hérédité : Supposons que la propriété soit vérifiée pour tout n+𝒱<n+𝒱. Soit 𝒞 une classe VC (de sous-ensemble d'un ensemble 𝒳) de dimension 𝒱 et S un ensemble de n points de 𝒳. On se fixe un élément sS et on découpe 𝒞 par 𝒞=𝒞1𝒞2 avec

𝒞1={C𝒞:s∉C}{C{s}𝒞:C∉𝒞}𝒞2={C{s}𝒞:C𝒞}.

On a que

Δ(𝒞;S)=Δ(C1;S)+Δ(C2;S)

et par construction

Δ(𝒞1;S)=Δ(𝒞;S{s})

. En notant

𝒞

les

C

qui constituent

𝒞2

, i.e.

𝒞={C𝒞:s∉C,C{s}𝒞}.

on a que

Δ(𝒞2;S)=Δ(𝒞;S{s})

.

Par construction, si 𝒞 pulvérise un échantillon, 𝒞 pulvérise également cet échantillon et ce même si on lui rajoute {s} d'où VCD(𝒞)+1VCD(𝒞)VCD(𝒞)𝒱1. Ainsi par hypothèse de récurrence,

Δ(𝒞;S)=Δ(𝒞;S{s})+Δ(𝒞;S{s})i=0𝒱(n1i)+i=0𝒱1(n1i)=i=0𝒱(ni)

Si n𝒱, alors en utilisant le résultat précédent et l'inégalité 1+xex,

(𝒱n)𝒱1(𝒱n)𝒱Δ(𝒞,n)(𝒱n)𝒱i=0𝒱(ni)i=0𝒱(ni)(𝒱n)i(1+𝒱n)nΔ(C,n)(n𝒱)𝒱(1+𝒱n)n(en𝒱)𝒱

Références

Modèle:Portail