Lemme de Sauer
Le lemme de Sauer ou lemme de Sauer-Shelah est un résultat issu de la théorie des probabilités et en particulier de la théorie de Vapnik-Chervonenkis. Il précise le nombre maximal d'échantillons de taille qu'une classe VC de dimension finie peut pulvériser. Ce résultat a été montré en 1972 par les mathématiciens Norbert Sauer[1] et Saharon Shelah[2].
Énoncé
Modèle:Article détaillé On dit qu'une classe d'un ensemble prélève un sous-ensemble de s'il existe un élément vérifiant . On dit que cette classe pulvérise s'il prélève tout sous-ensemble de . Enfin cette classe est appelée classe VC de dimension n si n'arrive pas à pulvériser tout ensemble de taille . On note le nombre maximum de sous-ensemble prélevées de taille , i.e.
Le lemme de Sauer donne une borne majorante de si est une classe VC. Formellement si est une classe VC de dimension alors
Preuve
Une manière classique de démontrer ce résultat est de le faire par récurrence[3]Modèle:,[4]. On raisonne par récurrence sur des classes de dimension VC .
Initialisation : Si donc .
Si n'arrive à pulvériser aucun point.
Hérédité : Supposons que la propriété soit vérifiée pour tout . Soit une classe VC (de sous-ensemble d'un ensemble ) de dimension et un ensemble de points de . On se fixe un élément et on découpe par avec
On a que
et par construction
. En notant
les
qui constituent
, i.e.
on a que
.
Par construction, si pulvérise un échantillon, pulvérise également cet échantillon et ce même si on lui rajoute d'où . Ainsi par hypothèse de récurrence,
Si , alors en utilisant le résultat précédent et l'inégalité ,