Analyse canonique des corrélations

De testwiki
Version datée du 16 janvier 2025 à 17:21 par imported>Huguespotter (Liens externes)
(diff) ← Version précédente | Version actuelle (diff) | Version suivante → (diff)
Aller à la navigation Aller à la recherche

Modèle:Ébauche L'analyse canonique des corrélations[i 1], parfois aussi nommé analyse des corrélations canoniques, (canonical-correlation analysis en anglais) permet de comparer deux groupes de variables quantitatives appliqués tous deux sur les mêmes individus. Le but de l'analyse canonique est de comparer ces deux groupes de variables pour savoir s'ils décrivent un même phénomène, auquel cas on pourra se passer d'un des deux groupes de variables.

Un exemple parlant est celui des analyses médicales effectuées sur les mêmes échantillons par deux laboratoires différents[b 1]. L'analyse canonique généralise des méthodes aussi diverses que la régression linéaire multiple, l'analyse discriminante et l'analyse factorielle des correspondances[b 1].

Définition mathématique

Analyse Canonique des Correlations : matrices des corrélations sur les données nutrimouse du package CCA de R d'après l'article d'Ignacio et al. dans Modèle:Citation étrangère[i 2]

Soient deux vecteurs colonnes X et Y de dimensions respectives n et m :

X=(x1,,xn)T

et

Y=(y1,,ym)T

de variables aléatoires ayant un moment d'ordre deux fini. On peut définir la covariance croisée

ΣXY=cov(X,Y)

comme la matrice de taille n × m dont l'élément (i,j) est la covariance de xi et yj. En pratique, cette covariance est souvent estimée à partir d'un échantillon de X et Y, c'est-à-dire d'après deux matrices dont chaque colonne est une réalisation de X et Y.

L'analyse canonique des corrélations recherche deux vecteurs a et b de dimensions respectives n et m qui maximisent la corrélation entre les produits scalaires (a·X) et (b·Y). En d'autres termes :

(a*,b*)=argmax(a,b)corr(aTX,bTY)

Pour avoir une solution unique, on peut rajouter une contrainte sur les variances tel que : var(aTX)=var(bTY)=1.

Les variables aléatoires U = a·X et V = b·Y sont la première paire de variables canoniques. On peut alors répéter la procédure pour obtenir une seconde paire de variables non corrélée à la première et ainsi de suite : (ak,bk)=argmax(a,b)corr(aTX,bTY)sous contrainte que cov(aTX,ajTX)=cov(bTY,bjTY)=0 for j=1,,k1.

Analyse Canonique des Correlations : représentation des variables et des individus dans le plan des deux premières variables canoniques sur les données nutrimouse du package CCA de R d'après l'article d'Ignacio et al. dans Modèle:Citation étrangère[i 2]

Modèle:...

Notes et références

Notes

Modèle:Références

Références

Ouvrages spécialisés

Modèle:Références

Articles publiés sur internet

Modèle:Références

Voir aussi

Bibliographie

Articles connexes

Liens externes


Modèle:Palette Modèle:Portail
Erreur de référence : Des balises <ref> existent pour un groupe nommé « i », mais aucune balise <references group="i"/> correspondante n’a été trouvée
Erreur de référence : Des balises <ref> existent pour un groupe nommé « b », mais aucune balise <references group="b"/> correspondante n’a été trouvée