SPSS

Données

Analyse

Graphiques

Utilitaires

Transformation

Extensiosn

data

Gestion des Données dans SPSS

Trier des Cas Parfois, nous souhaitons trier les cas selon les valeurs d’une variable. Par exemple, supposons que nous voulions trier les cas de « pizza » du plus petit au plus grand (c’est-à-dire de 1 à 5 pour notre ensemble de données) . DONNÉES ORIGINALES DONNÉES → TRIER LES OBSERVATIONS Dans la boîte de dialogue « Trier les cas », nous déplaçons « pizza » dans la zone Trier par, et dans Ordre de tri, nous sélectionnons Croissant (ce qui place un « A » à côté de pizza – si nous avions choisi descendant, un « D » serait apparu). Cliquez sur OK. DONNÉES TRIÉES Transposition des Données Transposer des données dans SPSS signifie généralement échanger les colonnes et les lignes. Pour illustrer, prenons nos données originales de QI (10 premiers cas seulement) : Si nous voulions transformer les données pour que « verbal », « quant », « analytic », « group » et « QI » deviennent des lignes au lieu de colonnes : DONNÉES → TRANSPOSER Dans la boîte de dialogue « Transposer », nous déplaçons toutes les variables vers la droite et cliquons sur OK. Voici le résultat : Nous n’affichons que les 10 premières valeurs de chaque variable, mais notez que « verbal » (et toutes les autres variables) est maintenant une variable en ligne. SPSS ne nomme pas encore les colonnes (var001, var002, etc.), mais nous pourrions les renommer si nous le souhaitions.

Gestion des Données dans SPSS Lire la suite »

Recodage de Variables dans SPSS

Recodage de Variables dans la Même Variable ou une Variable Différente Dans le cadre de la recherche, il est souvent nécessaire de recoder une variable. Par exemple, lorsqu’on utilise une échelle de Likert, certains items peuvent être inversés pour éviter que les répondants ne choisissent systématiquement la même réponse sans tenir compte du sens des questions. Ces inversions permettent également de détecter des réponses incohérentes ou négligentes. Lors de l’analyse des données, il est souvent utile de rétablir les codes originaux pour que toutes les valeurs aient la même direction. Exemple Pratique : Recodage dans la Même Variable Prenons l’exemple d’une variable mesurant l’appréciation de la pizza, où 1 = « Pas du tout » et 5 = « Extrêmement ». Voici les données : Pour inverser les codes, procédez comme suit : TRANSFORMER → RECODER DANS LA MÊME VARIABLE Dans la fenêtre « Recodage dans la même variable » : Variables numériques : Sélectionnez « pizza ». Cliquez sur Anciennes et Nouvelles Valeurs. Dans la fenêtre « Anciennes et Nouvelles Valeurs » : Ancienne Valeur : 1 → Nouvelle Valeur : 5, puis cliquez sur Ajouter. Répétez pour toutes les valeurs : 2 → 4 3 → 3 4 → 2 5 → 1 Bien que le recodage « 3 → 3 » ne soit pas nécessaire, il est recommandé pour vérifier votre travail. Cliquez sur Continuer, puis OK. Vérifiez dans la vue des données que la variable a bien été recodée. Recodage dans une Variable Différente Parfois, il est préférable de conserver la variable originale intacte et de créer une nouvelle variable recodée. Voici comment procéder : TRANSFORMER → CREATION DE VARIABLE Dans la fenêtre « Création de variables » : Sélectionnez « pizza » et déplacez-la vers la droite. Nommez la nouvelle variable (par exemple, « pizza_recode ») et ajoutez une étiquette (par exemple, « Préférence pizza recodée »). Cliquez sur Anciennes et Nouvelles Valeurs et répétez les étapes du recodage précédent. Après avoir défini les correspondances : Cliquez sur Continuer. Sélectionnez Changer pour valider la transformation : pizza → pizza_recode. Cliquez sur OK. Vérifiez dans la vue des données que la nouvelle variable a été créée et que l’originale reste inchangée.

Recodage de Variables dans SPSS Lire la suite »

Gestion des Données dans SPSS

Avant d’aborder diverses analyses statistiques dans le reste du livre, il est utile de démontrer brièvement quelques-unes des capacités les plus courantes de gestion des données dans SPSS. SPSS est excellent pour effectuer des tâches de gestion de données, simples ou complexes, et ces compétences sont souvent nécessaires au cours de vos analyses. Nous n’allons en survoler que quelques-unes ici. Pour plus de détails, consultez les manuels SPSS ou explorez l’interface graphique par vous-même. Essayer, faire des erreurs et réessayer est une excellente façon d’apprendre ! Vous ne casserez pas le logiciel ! Soyez patient et persévérant : la gestion des données demande souvent plusieurs tentatives avant d’obtenir le résultat souhaité. Création d’une Nouvelle Variable Prenons l’exemple de notre jeu de données contenant les scores verbaux, quantitatifs et analytiques. Supposons que nous voulions créer une nouvelle variable appelée QI (quotient intellectuel), définie comme la somme de ces scores. Autrement dit, nous voulons définir : QI = verbal + quantitatif + analytique. Cette opération peut être réalisée directement via la syntaxe SPSS TRANSFORMER → CALCULER LA VARIABLE ou l’interface graphique : Étapes de Création : Variable Cible : Saisissez le nom de la nouvelle variable, ici QI. Expression Numérique : Ajoutez les variables à sommer, soit verbal + quant + analytic. Type & Étiquette : Vous pouvez spécifier que la variable est numérique et lui attribuer une étiquette, par exemple « Quotient Intellectuel ». Vérification des Résultats Une fois la variable créée, vérifiez dans la vue Données que les calculs sont corrects : Pour la première observation, le QI est bien calculé comme : 56.00 + 56.00 + 59.00 = 171.00. Cette méthode simple permet d’enrichir vos analyses avec des variables personnalisées, adaptées à vos besoins spécifiques.

Gestion des Données dans SPSS Lire la suite »

Transformations de Données dans SPSS

La plupart des modèles statistiques reposent sur des hypothèses concernant la structure des données. Par exemple, les moindres carrés linéaires supposent notamment la linéarité, la normalité et l’indépendance des erreurs. Cependant, en pratique, ces hypothèses ne sont pas toujours vérifiées. Une solution consiste alors à appliquer une transformation mathématique aux données pour qu’elles se conforment mieux aux hypothèses requises. Par exemple, lorsque les données ne suivent pas une distribution normale, une transformation peut aider à « normaliser » la distribution, facilitant ainsi l’application de tests comme les tests t ou l’ANOVA. Il n’existe pas de règles strictes concernant le moment et la manière de transformer les données, et il est souvent nécessaire d’explorer différentes options pour trouver la transformation la plus adaptée. Nous abordons ici quelques transformations de base et leur mise en œuvre dans SPSS. Pour une discussion approfondie, voir Fox (2016). La Transformation Logarithmique Le logarithme d’un nombre est l’exposant auquel il faut élever une base pour obtenir ce nombre. Par exemple, le logarithme naturel (base e) de 10 est : log⁡e(10)=2.302585093 car e2.302585093=10, où e≈2.7183e≈2.7183. On peut aussi calculer des logarithmes en base 10 : log⁡10(10)=1 Pourquoi les logarithmes aident-ils à normaliser une distribution ? Prenons un exemple avec les données hypothétiques suivantes : 2 4 10 15 20 30 100 1000 Les valeurs plus petites sont plus proches les unes des autres que les valeurs extrêmes. Par exemple, le rapport entre 4 et 2 est de 2, tandis que celui entre 100 et 1000 est de 10. Calculons les logarithmes naturels de ces données : 0.69 1.39 2.30 2.71 2.99 3.40 4.61 6.91 Le rapport entre 1.39 et 0.69 reste proche de 2, mais celui entre 6.91 et 4.61 est réduit à 1.49, contre 10 dans les données originales. La transformation logarithmique a ainsi rapproché les valeurs extrêmes du reste de la distribution, atténuant l’asymétrie. Cela rend souvent la distribution plus proche d’une loi normale, ce qui la rend plus adaptée à des tests paramétriques comme les tests t ou l’ANOVA. Voici un exemple de données avant et après transformation logarithmique : (a)                                          (b)  (a) : Distribution originale des niveaux d’enzymes] Distribution après transformation logarithmique] Autres Transformations D’autres transformations sont possibles, comme la racine carrée ou l’inverse (1/valeur). Voici comment notre petit jeu de données se comporte sous ces transformations : Valeur (Y) LOG_Y SQRT_Y RECIP_Y 2.00 0.69 1.41 0.50 4.00 1.39 2.00 0.25 10.00 2.30 3.16 0.10 15.00 2.71 3.87 0.07 20.00 3.00 4.47 0.05 30.00 3.40 5.48 0.03 100.00 4.61 10.00 0.01 1000.00 6.91 31.62 0.00 Mise en Œuvre dans SPSS Transformation Logarithmique : Dans TRANSFORMER → CALCULER LA VARIABLE, sélectionnez la fonction LN (logarithme naturel) sous Functions and Special Variables (groupe Arithmetic). Déplacez la variable originale Y sous Numeric Expression pour obtenir LN(Y). Autres Transformations : Pour la racine carrée, utilisez SQRT(Y). Pour l’inverse, utilisez 1/Y. Quand Utiliser Quelle Transformation ? Asymétrie négative : Essayez une transformation par élévation au carré. Asymétrie positive : Commencez par une racine carrée ou un logarithme. Il est souvent utile d’essayer plusieurs transformations pour voir laquelle convient le mieux à vos données. Vous pouvez comparer les résultats des analyses avec et sans transformation pour évaluer son impact. Un Mot sur les Transformations Bien que certaines analyses puissent bénéficier de transformations, de nombreuses méthodes paramétriques restent robustes face à de légères déviations par rapport à la normalité. Si une transformation ne change pas significativement les résultats, elle peut être omise. Cependant, une distribution fortement asymétrique peut indiquer la nécessité d’un modèle alternatif (par exemple, une régression de Poisson pour des données de comptage). Dans de tels cas, il peut être judicieux de consulter un expert pour choisir la meilleure approche. Ne transformez pas systématiquement toutes vos données sans réflexion.

Transformations de Données dans SPSS Lire la suite »

La Fonction Explore dans SPSS

Une fonction très utile dans SPSS pour obtenir des statistiques descriptives ainsi qu’un ensemble de graphiques de synthèse est la fonction EXPLORE : ANALYSE → STATISTIQUES DESCRIPTIVES → EXPLORE Déplacez la variable verbal dans la liste Variable dépendante et la variable group dans la liste des Facteurs. Étant donné que group est une variable catégorielle (facteur), SPSS fournira des statistiques de synthèse et des graphiques pour chaque modalité de la variable de regroupement. Dans Statistiques, sélectionnez Descriptives, Valeurs extrêmes et Percentiles. Puis, dans Tracer, choisissez Niveaux de facteur dans Boîtes à moustaches, ainsi que  tiges et feuilles et Histogramme dans Caracteristiques . Sélectionnez également Tracer de repartition gaussiens avec tests Résumé du traitement des cas SPSS génère le tableau suivant : Ce tableau indique simplement que la variable analysée est verbal, avec les effectifs correspondants pour chaque niveau de group (0, 1, 2). On confirme que le fichier de données est bien lu : N = 10 par groupe. Statistiques descriptives Le résumé descriptif fournit les statistiques de verbal par niveau de group : Pour verbal = 0.00, on observe : La moyenne arithmétique est de 59,2, avec une erreur standard de 2,44. L’intervalle de confiance à 95 % pour la moyenne va de 53,67 à 64,73. La moyenne tronquée à 5 % ajuste la moyenne en supprimant les 5 % les plus élevés et les plus bas. La médiane est de 57,5, ce qui indique que la moitié des valeurs se situent en dessous et l’autre au-dessus. La variance est de 59,73, indiquant la dispersion des données. L’écart-type est de 7,73, soit la racine carrée de la variance. Les valeurs minimale et maximale sont respectivement 49,00 et 74,00. L’étendue est de 25,00 (74 – 49). L’étendue interquartile (IQR) est de 11,00. L’asymétrie (skewness) de 0,656 suggère une légère asymétrie positive. La kurtose de -0,025 indique une distribution légèrement aplatie. Valeurs extrêmes SPSS indique les 5 valeurs les plus basses et 5 plus hautes pour chaque niveau de group : Par exemple : Pour group = 0, la valeur la plus haute est 74,00 (cas n°4), la plus basse 49,00 (cas n°10). Pour group = 1, la 3e valeur la plus élevée est 75,00 (cas n°17). Pour group = 2, la 4e valeur la plus basse est 85,00 (cas n°30). Tests de normalité SPSS fournit les tests de normalité de Kolmogorov–Smirnov et de Shapiro–Wilk : Ces tests examinent si les données proviennent d’une population normalement distribuée. On souhaite ne pas rejeter l’hypothèse nulle (p > 0,05). Résultats : Pour group = 0 : p = 0,200 et 0,789 Pour group = 1 : p = 0,200 et 0,639 Pour group = 2 : p = 0,197 et 0,809 Les distributions semblent donc relativement normales. Histogrammes SPSS produit des histogrammes de verbal pour chaque niveau de group, avec les statistiques associées (moyenne, écart-type, N) : Ces graphiques montrent qu’il existe une certaine variabilité dans chaque groupe, ce qui est essentiel pour les analyses statistiques. Diagrammes en tiges-et-feuilles Ces graphiques, similaires aux histogrammes (mais couchés), montrent chaque valeur de la distribution : Par exemple, pour group = 0 : Le score 49 est affiché comme stem = 4 et leaf = 9 D’autres valeurs comme 51, 54, 56, 56, 59 apparaissent sur la ligne stem = 5 Graphiques Q–Q Les Q–Q plots comparent les valeurs observées aux valeurs attendues sous une distribution normale : Si les points suivent approximativement la ligne, la distribution est considérée comme normale. C’est le cas ici, même si les effectifs sont faibles. Boîtes à moustaches (Boxplots) Ces graphiques résument la distribution par niveau de group : On observe une augmentation des médianes de group = 0 à group = 2, suggérant que plus la formation est importante, meilleurs sont les scores verbaux. Comment lire une boîte à moustaches La médiane divise les données en deux moitiés. Q1 et Q3 sont les 25e et 75e percentiles. L’IQR (interquartile range) = Q3 – Q1. Les fences (barrières internes) = Q1 – 1.5 × IQR et Q3 + 1.5 × IQR. Les valeurs au-delà peuvent être des valeurs aberrantes. Les moustaches s’étendent jusqu’aux observations les plus extrêmes à l’intérieur des fences.

La Fonction Explore dans SPSS Lire la suite »

Fréquences et Statistiques Descriptives dans SPSS

Avant de réaliser des analyses statistiques inférentielles formelles, il est toujours judicieux de se familiariser avec les données en effectuant des analyses exploratoires. Ces analyses permettent également de vérifier que les données ont été saisies correctement. Quelle que soit leur finalité, il est essentiel de bien connaître ses données avant de les analyser en profondeur. Il ne faut jamais se contenter de saisir des données et de réaliser des analyses formelles sans avoir préalablement exploré toutes les variables, vérifié les hypothèses des analyses et confirmé l’exactitude des données. SPSS propose plusieurs options pour résumer les données. Par exemple, pour observer les fréquences des différentes valeurs d’une variable, on peut utiliser la fonction Fréquences : ANALYSE → STATISTIQUES DESCRIPTIVES → FRÉQUENCES (séquence de sélection dans le menu graphique, comme indiqué à gauche). À titre d’exemple, nous allons obtenir les fréquences pour la variable **verbal**, ainsi que d’autres statistiques descriptives. Sélectionnez **Statistiques** et choisissez les options suivantes : Nous avons sélectionné Quartiles sous Valeurs de pourcentage, ainsi que Moyenne, Médiane, Mode et Somme sous Tendance centrale. Nous avons également demandé des statistiques de dispersion : Écart-type, Variance, Étendue, Minimum et Maximum, ainsi que des statistiques de distribution : Asymétrie et Aplatissement. Cliquez sur Continuer puis OK pour afficher les résultats (voici la syntaxe correspondante, que vous n’êtes pas obligé d’utiliser) : FREQUENCIES VARIABLES=verbal /NTILES=4 /STATISTICS=STDDEV VARIANCE RANGE MINIMUM MAXIMUM MEAN MEDIAN MODE SUM SKEWNESS SESKEW KURTOSIS SEKURT /ORDER=ANALYSIS. Tableau des fréquences pour la variable verbal : Plusieurs modes existent. La plus petite valeur est affichée. Remarques sur les résultats : – Il y a 30 observations (N = 30) sans valeurs manquantes. – La moyenne est de 72.87 et la médiane de 73.50. Le mode (valeur la plus fréquente) est 56.00 (mais il existe plusieurs modes pour cette variable). – L’écart-type est de 12.97, ce qui indique une dispersion modérée des données. – La distribution est légèrement négativement asymétrique (asymétrie = -0.048), car la moyenne est légèrement inférieure à la médiane. – L’aplatissement est de -0.693, ce qui suggère une distribution plus plate qu’une distribution normale (platikurtique). – L’étendue est de 49.00 (98.00 – 49.00). – La somme des données est de 2186.00. – Les percentiles 25, 50 et 75 sont respectivement 62.75, 73.50 et 84.25. Le percentile 50 correspond à la médiane. On peut également obtenir des statistiques descriptives de base via la fonction Descriptives :  ANALYSE → STATISTIQUES DESCRIPTIVES → DESCRIPTIVES Après avoir déplacé la variable verbal dans la fenêtre des variables, sélectionnez Options et choisissez les statistiques souhaitées. Cliquez sur Continuer puis OK.

Fréquences et Statistiques Descriptives dans SPSS Lire la suite »