ACP d’une Matrice de Corrélation dans IBM SPSS

Nous démontrons maintenant une ACP sur une matrice de corrélation au lieu d’une matrice de covariance : Le choix d’analyser l’une plutôt que l’autre peut générer des résultats très différents. Les valeurs propres et les vecteurs propres ne sont pas censés rester les mêmes entre les deux matrices. Si les variables ont des variances très différentes, les chercheurs choisiront souvent d’analyser la matrice de corrélation plutôt que la matrice de covariance. Dans la plupart des cas, vous ne pouvez généralement pas vous tromper en analysant la matrice de corrélation. Donc, comme règle empirique (si nous devions absolument en donner une), c’est l’approche que vous devriez probablement choisir la plupart du temps en l’absence d’autres informations. Considérons la matrice de corrélation suivante sur huit variables différentes tirées de Denis (2016). Chaque variable représente un test psychométrique différent, T1 à T8. La matrice de corrélation représente toutes les corrélations bivariées de Pearson entre les tests. Seule la moitié inférieure de la matrice est affichée, car la moitié supérieure sera un miroir de la partie inférieure. Le long de la diagonale principale de la matrice se trouvent des valeurs de 1, indiquant simplement que les variables sont parfaitement corrélées avec elles-mêmes : 1.00000 .343 1 .00000 .505 .203 1.00000 .308 .400 .398 1.00000 .693 .187 .303 .205 1.00000 .208 .108 .277 .487 .200 1.00000 .400 .386 .286 .385 .311 .432 1.00000 .455 .385 .167 .465 .485 .310 .365 1.00000 Le travail de l’ACP consiste à analyser cette matrice pour voir si, au lieu de huit dimensions (T1 à T8), les données peuvent être exprimées en moins de dimensions, les composantes principales. Nous commençons par entrer la matrice de corrélation dans la fenêtre de syntaxe de SPSS (ci-dessous). Notez qu’en plus de la matrice elle-même, nous avons également spécifié des lignes MATRIX DATA et BEGIN DATA, ainsi que END DATA à la fin de la matrice. Nous avons également spécifié le nombre de cas par variable, égal à 1000. Enfin, avant chaque ligne de la matrice, nous avons inclus CORR : Rappelons que pour cette analyse, il n’y a pas de données dans la vue « Data View » de SPSS. Toutes les données sont contenues dans la matrice de corrélation entrée dans la fenêtre de syntaxe. Pour apprendre les commandes GUI correspondantes. Les commandes de syntaxe requises sont les suivantes (ajoutez la syntaxe suivante immédiatement après la commande END DATA) : Copy Download FACTOR MATRIX = IN (CORR=*) /PRINT = INITIAL EXTRACTION /CRITERIA FACTORS (8) /EXTRACTION = PC /METHOD = CORRELATION. La première ligne FACTOR MATRIX = IN (CORR=*) spécifie que la matrice de corrélation est entrée en entrée. La deuxième ligne /PRINT = INITIAL EXTRACTION demande à SPSS d’afficher les communautés initiales et d’extraction, dont nous discuterons la signification dans la sortie qui suit. La troisième ligne /CRITERIA FACTORS (8) demande d’extraire huit composantes. Notez que pour cet exemple, nous extrayons autant de composantes qu’il y a de variables. L’instruction /EXTRACTION = PC demande à SPSS d’extraire une solution de composantes principales. Lorsque nous ferons une analyse factorielle plus tard, nous ajouterons une extension différente à cette commande au lieu de PC. Enfin, l’instruction /METHOD = CORRELATION demande d’analyser la matrice de corrélation. Nous ne montrons qu’une partie de la sortie ci-dessous. Pour plus de détails, où nous effectuons une analyse factorielle sur les mêmes données au lieu d’une ACP, consultez le chapitre suivant. Pour l’instant, nous interprétons brièvement l’analyse ACP sur ces données : [Espace pour le tableau « Total Variance Explained »] Comme huit variables ont été entrées dans l’analyse, huit composantes seront générées, chacune associée à une valeur propre donnée. Autrement dit, la première composante est associée à une valeur propre de 3,447, la deuxième à une valeur propre de 1,157, et ainsi de suite. Notez que les valeurs propres diminuent à mesure que le nombre de composantes augmente. C’est normal, car nous espérons que les premières composantes expliquent la majorité de la variance des variables. Quel pourcentage de variance la première composante explique-t-elle ? Nous pouvons le calculer simplement en prenant le ratio de 3,447 sur le nombre total de composantes (8) : 3,447/8=0,430883,447/8=0,43088 Notez que le nombre 0,43088 correspond au % de Variance pour la première composante. De même, la deuxième composante explique 1,157/8=14,465%1,157/8=14,465% de la variance. Le % cumulé des deux premières composantes est de 57,554, calculé en additionnant 43,088 + 14,465. Que représentent les « Extraction Sums of Squared Loadings » ? Ceux-ci seront plus pertinents lorsque nous considérerons l’analyse factorielle. Mais pour l’instant, nous notons, comme nous l’avons fait plus tôt, qu’ils sont identiques aux valeurs propres initiales. Rappelons que c’est une caractéristique de l’ACP que, que nous extrayions 1 composante ou 8, ou n’importe quel nombre entre les deux, les sommes des carrés des charges extraites ne changeront pas pour la composante donnée. Par exemple, supposons que nous ayons demandé d’extraire une seule composante au lieu des 8 que nous avons extraites initialement : [Espace pour l’image de la syntaxe modifiée et du tableau correspondant] Notez qu’avec une seule composante extraite, la valeur propre de la composante correspond à celle de la valeur propre initiale. Cela n’est vrai que parce que nous effectuons une ACP. Lorsque nous ferons une analyse factorielle dans le chapitre suivant, nous verrons que, selon le nombre de facteurs que nous extrayons, les valeurs propres changeront généralement. Encore une fois, c’est une différence fondamentale entre l’analyse en composantes principales et l’analyse factorielle, une différence qui est au cœur de nombreuses critiques adressées à l’analyse factorielle, la critique étant que la variance expliquée par un facteur donné dépend souvent du nombre d’autres facteurs extraits avec lui. L’ACP, cependant, n’est pas « indécise » comme cela. Revenons à notre solution à huit composantes. SPSS nous affiche la « Component Matrix » : [Espace pour le tableau « Component Matrix »] La « Component Matrix » révèle les charges des variables sur la composante donnée. Dans le langage de l’ACP, nous disons que des variables comme T1 « chargent » plutôt fortement sur la composante 1 (0,766). Nous remarquons également que la plupart des autres variables chargent plutôt fortement sur la composante 1 également. Comme beaucoup de ce qui est présenté ici est similaire à l’analyse factorielle,

ACP d’une Matrice de Corrélation dans IBM SPSS Lire la suite »