Structural Similarity

De testwiki
Version datée du 27 mai 2023 à 16:41 par imported>Sehidinan (growthexperiments-addlink-summary-summary:3|0|0)
(diff) ← Version précédente | Version actuelle (diff) | Version suivante → (diff)
Aller à la navigation Aller à la recherche

Structural SIMilarity ou SSIM est une mesure de similarité entre deux images numériques.

Description

Elle a été développée pour mesurer la qualité visuelle d'une image compressée, par rapport à l'image originale. L'idée de SSIM est de mesurer la similarité de structure entre les deux images, plutôt qu'une différence pixel à pixel comme le fait par exemple le PSNR. L'hypothèse sous-jacente est que l'œil humain est plus sensible aux changements dans la structure de l'image.

La métrique SSIM est calculée sur plusieurs fenêtres d'une image. La mesure entre deux fenêtres x et y de taille NxN est :

𝑆𝑆𝐼𝑀(x,y)=l(x,y).c(x,y).s(x,y)=(2μxμy+c1)(2σxσy+c2)(covxy+c3)(μx2+μy2+c1)(σx2+σy2+c2)(σxσy+c3)

avec

  • μx la moyenne de x ;
  • μy la moyenne de y ;
  • σx2 la variance de x ;
  • σy2 la variance de y ;
  • covxy la covariance de x et y ;
  • c1=(k1L)2, c2=(k2L)2 et c3=c22 trois variables destinées à stabiliser la division quand le dénominateur est très faible ;
  • L la dynamique des valeurs des pixels, soit 255 pour des images codées sur 8 bits ;
  • k1 = 0,01 et k2 = 0,03 par défaut.

Pour l'évaluation de qualité d'une image, la formule précédente est appliquée sur la luminance uniquement. Typiquement, les grandeurs sont calculées sur des fenêtres de taille 8x8. La fenêtre courante peut se déplacer pixel par pixel sur l'ensemble de l’image. Cependant, les auteurs proposent de ne considérer qu'un sous-ensemble de ces fenêtres, par exemple en réduisant leur nombre d’un facteur deux dans les deux dimensions. Ceci permet de diminuer la complexité du calcul.

Structural dissimilarity (DSSIM) est une métrique dérivée de SSIM, elle est donnée par la formule suivante :

𝐷𝑆𝑆𝐼𝑀(x,y)=1𝑆𝑆𝐼𝑀(x,y)2

Discussions sur les performances

Dans de nombreux cas, le SSIM surpasse significativement le MSE (Mean Squared Error) et ses dérivés en termes de précision, y compris dans des recherches menées par ses propres auteurs et d'autres [1]Modèle:,[2]Modèle:,[3]Modèle:,[4]Modèle:,[5]Modèle:,[6]. Le SSIM est particulièrement performant face au MSE pour des distorsions qui n'affectent pas la structure de l'image (déplacement de la luminance, étirement du contraste...)[7].

Des articles de recherche comme "A comprehensive assessment of the structural similarity index" par Richard Dosselmann et Xue Dong Yang montrent cependant que SSIM est en réalité moins précis qu'annoncé.

De plus, bien que SSIM soit inspiré de la perception visuelle humaine, sa formule montre qu'elle ne contient aucune modélisation élaborée du système visuel humain (SVH) et SSIM se base même sur des calculs non-perceptuels. Par exemple, le système visuel humain ne calcule pas de produit entre les valeurs moyennes des deux images.

Enfin, SSIM est conçu comme une mesure de qualité d'images fixes. SSIM ne contient aucun paramètre lié aux aspects temporels de la perception visuelle humaine et du jugement humain. Pourtant, certainsModèle:Qui utilisent SSIM pour mesurer la qualité de vidéos.

Notes et références

Modèle:Références

Voir aussi

Sources

Article connexe

Liens externes

Modèle:Portail