SPSS

Données

Analyse

Graphiques

Utilitaires

Transformation

Extensiosn

Moyo Nya

Test Binomial dans IBM SPSS

Tests Binomiaux Un test binomial peut être utilisé pour évaluer une hypothèse concernant la probabilité d’un événement pouvant avoir deux résultats mutuellement exclusifs, et dont la probabilité de « succès » est la même d’un essai à l’autre (ce qu’on appelle parfois l’hypothèse de « stationnarité »). Prenons un exemple simple : supposons que vous souhaitiez évaluer l’hypothèse nulle selon laquelle une pièce de monnaie est équilibrée, c’est-à-dire que la probabilité d’obtenir « pile » est égale à 0,5 et celle d’obtenir « face » est également égale à 0,5. Pour tester cette théorie, vous lancez la pièce cinq fois et obtenez deux « pile ». La question que vous vous posez est : Quelle est la probabilité d’obtenir deux « pile » sur cinq lancers avec une pièce équilibrée ? Si cette probabilité est relativement élevée sous l’hypothèse que la pièce est équilibrée, alors vous conviendrez probablement que cela ne remet pas en cause l’hypothèse nulle. En revanche, si cette probabilité est très faible sous l’hypothèse nulle, cela pourrait nous amener à douter de l’équilibre de la pièce. Nous enregistrons nos lancers dans un fichier de données SPSS, où « 1 » représente « pile » et « 0 » représente « face » : Remarquons que dans cette séquence de lancers, nous avons obtenu deux « face » d’abord, suivis de deux « pile », puis d’un « face ». L’ordre d’apparition des « pile » n’a pas d’importance. Ce qui compte, c’est que nous avons obtenu deux « pile ». Nous voulons connaître la probabilité d’obtenir deux « pile » sur cinq lancers avec une pièce équilibrée. Commençons par vérifier les fréquences dans SPSS : ANALYSE → STATISTIQUES DESCRIPTIVES → FRÉQUENCES Nous confirmons ci-dessus que SPSS lit correctement notre fichier de données, puisqu’il indique trois « face » (0) et deux « pile » (1). Pour plus de clarté, nous trions ensuite les cas par ordre décroissant de valeurs, afin que nos événements « pile » apparaissent en premier : DONNÉES → TRIER LES OBSERVATIONS Nous effectuons maintenant le test binomial : ANALYSE → TESTS NON PARAMÉTRIQUES → DIALOGUES ANCIENNES VERSIONS → BINOMIAL Nous déplaçons « lancers_piece » dans la liste des variables à tester. Nous définissons la proportion testée à 0,50 car c’est la valeur hypothétique sous l’hypothèse nulle. Ensuite, nous cliquons sur Options et sélectionnons Exact : Un test binomial a été réalisé pour évaluer la validité de l’hypothèse selon laquelle une pièce est équilibrée, après avoir obtenu deux « pile » sur cinq lancers. La probabilité d’obtenir un tel résultat sous l’hypothèse nulle d’équilibre (p = 0,5) était égale à 0,312, ce qui suggère qu’un tel résultat (deux « pile » sur cinq lancers) n’est pas rare avec une pièce équilibrée. Par conséquent, nous n’avons aucune raison de rejeter l’hypothèse nulle selon laquelle la pièce est équilibrée. Nous notons que la proportion observée est égale à 0,40 (soit deux « pile » sur cinq lancers). La probabilité ponctuelle est égale à 0,312. Nous interprétons cela comme suit : la probabilité d’obtenir deux « pile » sur cinq lancers avec une pièce équilibrée (p = 0,50) est de 0,312. Comme cette probabilité est relativement élevée, nous n’avons aucune raison de douter que la pièce soit équilibrée. Autrement dit, le test binomial nous indique qu’avec une pièce équilibrée, nous avons une chance assez importante d’obtenir deux « pile » sur cinq lancers, ce qui correspond également à notre intuition. Notons que nous n’avons pas « prouvé » ni « confirmé » que la pièce est équilibrée. Nous n’avons simplement pas de preuve pour remettre en cause son équilibre. Rappelons que le test binomial présenté ici n’est approprié que pour des données pouvant aboutir à l’un de deux résultats mutuellement exclusifs. Si l’événement en question peut avoir plus de deux résultats, le test binomial n’est pas adapté. S’il peut aboutir à plus de deux résultats (par exemple trois ou quatre), alors la distribution multinomiale serait appropriée. Pour plus de détails, voir Hays (1994).

Test Binomial dans IBM SPSS Lire la suite »

Une mesure de fiabilité : Le Kappa de Cohen dans IBM SPSS

Une autre mesure parfois utile est celle du Kappa de Cohen. Le Kappa est utilisé comme une mesure d’accord interjuge. Par exemple, supposons que deux internes en psychologie aient été chargés d’évaluer les symptômes d’un trouble comme étant d’origine psychologique, biologique ou « autre ». Imaginons que les fréquences obtenues soient les suivantes : Interne B Psychologique (1) Interne A Psychologique (1) Biologique (2) Autre (3) 20 5 3 Biologique (2) 7 8 4 Autre (3) 7 3 5 Dans ce tableau, nous voyons que les internes ont classé le trouble comme psychologique 20 fois, biologique 8 fois, etc. Nous avons organisé le fichier de données dans SPSS comme suit : Pour calculer le Kappa, nous sélectionnons DONNÉES → PONDÉRER LES CAS : Le Kappa de Cohen a été calculé comme une mesure d’accord entre les évaluations des internes sur l’étiologie des troubles, qu’elle soit d’origine psychologique, biologique ou autre. Le Kappa obtenu de 0,253 s’est avéré statistiquement significatif (p=0,005p=0,005), ce qui suggère que les internes sont en accord plus que ce à quoi on pourrait s’attendre par hasard. ANALYSE → STATISTIQUES DESCRIPTIVES → TABLES DE CONTINGENCE (puis déplacez « Interne A » dans Ligne(s) et « Interne B » dans Colonne(s), et sous Statistiques, cochez Kappa) : Le Kappa est statistiquement significatif (p=0,005p=0,005), ce qui indique que les internes sont en accord plus que ce qui serait attendu par le hasard.

Une mesure de fiabilité : Le Kappa de Cohen dans IBM SPSS Lire la suite »

Sauvegarde et copie des résultats dans SPSS

L’analyse statistique de nos données est contenue dans les fichiers de résultats d’IBM SPSS®. Ces résultats doivent être sauvegardés et souvent copiés dans des rapports ou d’autres documents. Dans ce chapitre, nous expliquons comment accomplir ces opérations. Sauvegarde d’un fichier de résultats au format IBM SPSS La procédure standard de sauvegarde dans IBM SPSS enregistrera le fichier de résultats dans le format .spv. Pour sauvegarder un fichier de résultats nouvellement généré, sélectionnez Fichier → Enregistrer sous ou cliquez sur l’icône Enregistrer le fichier. Cela ouvre une boîte de dialogue standard de sauvegarde dans le système d’exploitation (par exemple, Windows 7, Mac OS X). Naviguez jusqu’à l’emplacement souhaité (par exemple, une clé USB personnelle), nommez le fichier et enregistrez-le. Il est possible d’ouvrir directement le fichier de résultats ultérieurement. Un double-clic sur l’icône du fichier dans le répertoire l’ouvrira, à condition que l’ordinateur dispose de la même version d’IBM SPSS (ou d’une version plus récente) que celle utilisée pour créer le fichier. Notez que si, pour une raison quelconque, vous utilisez un ordinateur sans IBM SPSS (par exemple, un ordinateur personnel) ou une version antérieure du logiciel, il ne sera pas possible d’ouvrir le fichier de résultats. Sauvegarde d’un fichier de résultats dans d’autres formats IBM SPSS permet de sauvegarder un fichier de résultats dans une multitude de formats, notamment HTML, Excel, PowerPoint, Microsoft Word/RTF et PDF. Nous expliquons comment procéder pour le format PDF, mais cette description peut également s’appliquer aux autres formats. Un document PDF est un type de fichier au format Portable Document Format. Il s’agit d’une copie fidèle de l’original, mais il n’est pas modifiable à moins d’être ouvert dans la version complète d’Adobe Acrobat ou d’une application comparable. Lorsque les documents PDF sont imprimés ou affichés à l’écran, ils reflètent ce qui était affiché à l’origine, même si l’ordinateur actuel ne dispose pas des polices utilisées dans le document. C’est ce qui les rend portables : le PDF contient toutes les informations nécessaires pour afficher le document à l’écran ou l’imprimer. IBM SPSS permet de sauvegarder une version PDF du fichier de résultats. C’est une méthode idéale pour visualiser l’ensemble des résultats (consulter une copie du fichier de résultats) lorsque vous ne pouvez pas ou ne souhaitez pas accéder à IBM SPSS. Pour demander à IBM SPSS de sauvegarder un fichier de résultats au format PDF, assurez-vous que le fichier est la fenêtre active (cliquez sur sa bannière pour vérifier). Ensuite, sélectionnez dans le menu principal Fichier → Exporter. Cela ouvre l’écran Exporter les résultats illustré dans la figure suivante. Sélectionnez Portable Document Format (*.pdf) dans le menu déroulant Type de fichier, comme indiqué dans la figure suivante. Une fois le type de fichier spécifié comme PDF, cliquez sur Parcourir et naviguez jusqu’à l’emplacement où le fichier doit être sauvegardé. Nommez le fichier. La figure suivante montre le résultat de cette étape de navigation et de nommage. Cliquez ensuite sur Enregistrer. Cela nous ramène à l’écran Exporter les résultats. Cliquez sur OK et attendez que le processus de création soit terminé. Utilisation des utilitaires du système d’exploitation pour copier un tableau IBM SPSS dans un document de traitement de texte Une grande partie des résultats d’IBM SPSS est présentée sous forme de tableaux. Il est courant que les utilisateurs sauvegardent (copient) uniquement certains tableaux de résultats dans un logiciel de traitement de texte (par exemple, Microsoft Word). Les deux formats les plus utiles pour sauvegarder ces copies sont les captures d’écran (images) et les tableaux de traitement de texte. Les PC et les Mac disposent de programmes utilitaires intégrés à leur système d’exploitation pour générer de telles copies. Captures d’écran de la fenêtre active sur un PC Windows Les systèmes d’exploitation Windows disposent d’utilitaires permettant aux utilisateurs de prendre des captures d’écran de fenêtres. La méthode la plus rapide pour capturer l’ensemble de l’écran sur la plupart des versions de Windows est d’appuyer sur la touche Impr écran (sur certains claviers, cette touche peut être désignée par Print Scrn). Pour capturer uniquement la fenêtre active, maintenez la touche Alt enfoncée tout en appuyant sur Impr écran. La capture d’écran est placée dans le presse-papiers et peut être collée dans n’importe quel document de traitement de texte. Windows disposent également d’un utilitaire convivial appelé Outil Capture, accessible via le chemin Bouton Démarrer → Tous les programmes → Accessoires → Outil Capture. Ouvrez l’Outil Capture. Cliquez sur le bouton Options pour vérifier que Copier toujours les captures dans le Presse-papiers est coché. Dans le menu déroulant accessible via le bouton Nouveau, sélectionnez Capture rectangulaire ; d’autres options incluent Capture libre, Capture de fenêtre (pour la fenêtre active) et Capture plein écran. Avec l’Outil Capture actif (sa fenêtre est visible à l’écran), l’écran s’éclaircit pour indiquer qu’il est prêt pour la capture. Faites glisser le curseur autour du tableau de résultats ou de toute autre zone de l’écran à copier, puis relâchez le curseur. L’image apparaîtra dans une nouvelle fenêtre (qui peut être sauvegardée), mais elle sera également placée dans le presse-papiers. Collez simplement l’image à l’emplacement souhaité dans le document de traitement de texte. Captures d’écran de n’importe quelle partie des résultats sur un Mac Pour les utilisateurs de Mac, il est également possible de capturer une section sélectionnée de l’écran, une fenêtre ouverte visible à l’écran ou l’ensemble de l’écran. Mac OS X dispose d’un utilitaire appelé Grab (situé dans le dossier Utilitaires du dossier Applications). Ouvrez Grab et sélectionnez dans son menu Capture les options Sélection, Fenêtre ou Écran. Suivez ensuite ces instructions : Si Sélection a été choisi, cliquez et faites glisser pour créer un rectangle autour de la partie de l’écran à capturer. Si Fenêtre a été choisi, cliquez à l’intérieur de la fenêtre à capturer. Si Écran a été choisi, cliquez sur l’écran. Après avoir fait une sélection, l’image capturée apparaîtra dans sa propre fenêtre. Sauvegardez la capture d’écran (le Bureau peut être l’emplacement le plus pratique) et faites glisser son icône dans le document de traitement de texte. Une alternative encore

Sauvegarde et copie des résultats dans SPSS Lire la suite »

Modification des résultats dans SPSS

Une grande partie des résultats dans IBM SPSS est présentée sous forme de tableaux. Ces tableaux générés par IBM SPSS sont souvent génériques et peuvent être moins bien formatés que nous le souhaiterions, surtout s’ils doivent être inclus dans un rapport. Cependant, il est possible de les modifier dans une certaine mesure avant de les copier dans un document de traitement de texte ou de les enregistrer au format PDF (Portable Document Format). Pour illustrer ces modifications, nous avons réalisé une analyse de Corrélations bivariées avec quatre variables et obtenu le tableau des Statistiques descriptives présenté dans la figure suivante. Supposons que nous souhaitons afficher ce tableau dans une présentation et que nous déterminons que : (a) la colonne Écart type est disproportionnellement large, et (b) nous préférons écrire le mot « Écart type (Standard) ». Pour modifier ce tableau, nous double-cliquons dessus. Le résultat est illustré dans la figure suivante. Nous pouvons déterminer qu’il est modifiable grâce à trois indices visuels : Il est entouré d’un contour en pointillés. Une flèche rouge apparaît à sa gauche. Le titre du tableau change pour un texte blanc sur fond noir. Modification du libellé d’un en-tête de colonne En double-cliquant sur l’en-tête Écart-type, nous pouvons le modifier. Nous remplaçons ensuite l’abréviation par le terme complet, comme illustré dans la figure suivante. Modification de la largeur d’une colonne Nous pouvons également ajuster la largeur des colonnes. En double-cliquant sur le tableau et en plaçant le curseur sur l’une des bordures verticales de la colonne Écart-type, un curseur en forme de double flèche horizontale apparaît. En cliquant et en glissant cette bordure vers la gauche, nous réduisons la largeur de la colonne. Cliquer à l’extérieur du tableau le fait sortir du mode édition. Après ces modifications, nous enregistrons le fichier.  Affichage de plus de décimales IBM SPSS effectue ses calculs avec une précision de 16 décimales, mais ces valeurs ne sont presque jamais affichées en totalité dans les tableaux, ce qui est généralement judicieux compte tenu de la précision des instruments de mesure utilisés en recherche. Cependant, ces décimales sont bien présentes, bien que cachées. Pour afficher toutes les décimales, nous double-cliquons sur le tableau pour le mettre en mode édition, puis double-cliquons sur l’entrée numérique souhaitée. Il est courant que SPSS affiche une valeur sig. (probabilité que la statistique soit due au hasard si l’hypothèse nulle est vraie) pour tester la significativité statistique d’un résultat (par exemple, une corrélation de Pearson). Souvent, cette valeur est donnée avec trois décimales. Certaines probabilités peuvent être si faibles qu’elles dépassent cette limite de trois décimales. Par exemple, une probabilité calculée de 0.000316 pourrait être affichée comme 0.000. Dans un rapport, il ne faut jamais indiquer une probabilité comme 0.000, mais plutôt comme p < 0.001 (selon les normes de l’American Psychological Association, 2009), car la probabilité n’est jamais nulle, juste très faible. Double-cliquer sur la valeur 0.000 affichera la valeur exacte. Certaines probabilités peuvent être affichées en notation exponentielle. Par exemple, 0.000316 pourrait être écrit 3.16E–4. Cette notation se lit comme suit : 3.16 est le nombre de base. E indique une notation exponentielle. Le signe – signifie que la virgule doit être déplacée vers la gauche. 4 indique le nombre de décimales à déplacer. Ainsi, 3.16E–4 équivaut à déplacer la virgule de 3.16 de quatre rangs vers la gauche, ce qui donne 0.000316.

Modification des résultats dans SPSS Lire la suite »

Réalisation de Procédures Statistiques dans IBM SPSS

Le menu Analyse situé dans la barre de menu principale d’IBM SPSS donne accès à une gamme de procédures statistiques (par exemple, l’analyse de variance, la régression linéaire). Nous l’utiliserons abondamment, mais nous travaillerons également avec d’autres menus de la barre principale (par exemple, Données, Transformation). Ces manipulations impliqueront principalement des interactions avec des fenêtres de dialogue et, dans la plupart des cas, la génération de résultats. La réalisation d’analyses statistiques se déroule en deux étapes : la configuration de l’analyse et la visualisation/interprétation des résultats. Ici, nous abordons ces processus de manière générique, sans nous préoccuper des détails de la configuration ou de l’interprétation des résultats. Notre objectif est de présenter le processus général applicable à la plupart des analyses. Utilisation des fenêtres de dialogue pour configurer l’analyse Pour configurer une analyse, il est nécessaire d’avoir un fichier de données ouvert, car l’analyse sera effectuée sur le fichier de données actif. Nous utiliserons le fichier de données nommé ventes créé pour illustrer la configuration de l’analyse. Nous utiliserons la procédure Corrélations bivariées par commodité (nous aurions pu choisir toute autre procédure, car elles sont toutes structurées de manière similaire) pour montrer comment réaliser une analyse statistique. Avec le fichier de données comme fenêtre active, sélectionnez dans le menu IBM SPSS : Analyse → Corrélation → Bivariée pour accéder à la fenêtre de dialogue principale des Corrélations bivariées illustrée dans la figure suivante. La fenêtre principale d’une procédure statistique est celle où nous identifions les variables à inclure dans l’analyse ; c’est presque toujours la fenêtre qui s’ouvre lorsque nous invoquons la plupart des procédures. Bien que ces fenêtres de dialogue principales contiennent de nombreux éléments, leur utilisation est assez intuitive. Voici les principaux éléments d’une fenêtre de dialogue principale, en prenant comme exemple la procédure Corrélations bivariées : La bannière de la fenêtre indique le nom de la procédure. Le panneau sans nom dans le quadrant supérieur gauche, que nous appellerons le panneau de liste des variables, contient les noms des variables du fichier de données. Elles sont listées dans l’ordre où elles apparaissent dans le fichier, mais il est possible de les afficher par ordre alphabétique (par exemple, sélectionnez Édition → Options → Onglet Général et cliquez sur Alphabétique sous Liste des variables, comme illustré dans la figure. Le panneau Variables identifie les variables à inclure dans l’analyse. Les variables peuvent être déplacées dans ce panneau en les sélectionnant dans le panneau de liste des variables et en cliquant sur le bouton fléché ou en double-cliquant sur le nom de la variable. Les boutons situés à l’extrême droite de la fenêtre principale ouvrent généralement des fenêtres de dialogue secondaires pour personnaliser certains aspects de l’analyse statistique ou pour demander à IBM SPSS d’afficher certaines informations dans les résultats. Les boutons en bas de la fenêtre permettent d’effectuer certaines actions. Ils doivent être actifs pour être sélectionnables. Par exemple, le bouton OK (qui lance l’analyse) n’est pas actif tant qu’aucune variable n’a été déplacée dans le panneau Variables. La figure suivante montre les deux variables extraversion et ventes après leur déplacement dans le panneau Variables. Notez que le bouton OK est maintenant actif, mais nous allons ouvrir une fenêtre secondaire pour illustrer cette étape avant de cliquer sur OK. Depuis la fenêtre principale, sélectionnez le bouton Options. Cela ouvre l’écran de dialogue des Options illustré dans la figure suivante. À titre d’exemple, nous avons coché Moyennes et écarts-types et conservé la sélection par défaut Exclure les cas par paire (nous expliquerons ces options et d’autres dans le contexte des différentes analyses). Cliquez sur Poursuivre pour revenir à la fenêtre principale, puis sur OK pour lancer l’analyse. 4.3 Les résultats La figure suivante affiche les résultats (généralement appelés « output ») de l’analyse. Il est typique dans les résultats d’IBM SPSS que la plupart des informations soient présentées sous forme de tableaux. Chaque tableau est précédé d’un titre. Dans la procédure Corrélations bivariées, le premier tableau présente les moyennes et les écarts-types des variables ; ces statistiques descriptives sont affichées car nous avons demandé leur inclusion dans l’écran des Options. Le deuxième tableau montre la corrélation de Pearson entre extraversion et sales (une valeur assez élevée de 0,936). Dans la procédure Corrélations bivariées, IBM SPSS utilise des astérisques pour indiquer différents niveaux de probabilité. Ici, il n’y a qu’une seule corrélation. Le tableau affiche également Sig. (bilatéral), qui représente la probabilité exacte d’obtenir une corrélation de Pearson de 0,936 pour un échantillon de 6 cas, en supposant que l’hypothèse nulle (corrélation nulle dans la population) soit vraie. La réalisation d’analyses statistiques se déroule en deux étapes : Configuration de l’analyse Visualisation et interprétation des résultats Ce tutoriel présente ces processus de manière générique, sans entrer dans les détails spécifiques à chaque analyse. Configuration de l’Analyse via les Fenêtres de Dialogue Pour configurer une analyse, un fichier de données doit être ouvert, car l’analyse sera effectuée sur ce fichier actif. Nous utilisons ici le fichier ventes.csv  pour illustrer la configuration, en prenant comme exemple la procédure Corrélations Bivariées. Étapes : Ouvrir le fichier de données. Sélectionner Analyse → Corréler → Bivariée pour accéder à la fenêtre principale. Éléments clés de la fenêtre de dialogue : Bannière : Nom de la procédure. Panneau des Variables : Liste des variables du fichier (ordre d’apparition ou alphabétique). Panneau Variables : Variables sélectionnées pour l’analyse (à déplacer via les flèches ou un double-clic). Boutons (droite et bas) : Options : Personnalisation de l’analyse (par exemple, afficher moyennes et écarts-types). OK : Active uniquement si des variables sont sélectionnées. Exemple : Sélectionner extraversion et sales (Figure 4.4). Cliquer sur Options pour demander les statistiques descriptives (Figure 4.5). Valider avec OK pour lancer l’analyse. 4.3 Résultats de l’Analyse Les résultats (ou sortie) sont affichés sous forme de tableaux (Figure 4.6). Exemple de sortie : Statistiques Descriptives : Moyennes et écarts-types des variables (si demandés). Exemple : Extraversion : Moyenne = 6.33, Écart-type = 2.160 (N=6). Ventes : Moyenne = 38.33, Écart-type = 8.042 (N=6). Corrélations : Matrice de

Réalisation de Procédures Statistiques dans IBM SPSS Lire la suite »

Importation de données d’Excel vers IBM SPSS

En plus de saisir directement des données dans IBM SPSS, il est possible d’importer des données qui ont été entrées dans une feuille de calcul d’un autre logiciel. Nous illustrons ce processus en utilisant Excel. Nous allons importer ce jeu de données dans IBM SPSS. Le processus d’importation Ouvrez IBM SPSS et accédez à l’affichage Vue des données d’un nouveau fichier de données vide. Sélectionnez Fichier → Ouvrir → Données pour accéder à la fenêtre de dialogue Ouvrir des données illustrées dans la figure suivante. Dans le menu déroulant Fichiers de type, sélectionnez Excel ; ces fichiers ont généralement l’extension .xls, avec des variantes selon la version d’Excel (par exemple, .xlsx, .xlsm). Naviguez ensuite dans les lecteurs de stockage pour localiser le fichier Excel contenant les données (ventes.xls). En cliquant sur son nom dans le panneau, le nom du fichier apparaîtra dans le champ Nom de fichier, comme le montre la figure. Une fois le nom et le type de fichier identifiés, cliquez sur Ouvrir. Cela affiche la fenêtre Ouvrir une source de données Excel illustrée dans la figure suivante. La case à cocher Lire les noms de variables dans la première ligne de données est déjà cochée par défaut. Nous la conservons ainsi car notre feuille de calcul Excel contient les noms de variables dans un format compatible avec SPSS. Si un nom de variable dans le fichier Excel n’est pas dans un format acceptable pour SPSS, celui-ci attribuera automatiquement des noms tels que VAR0001, VAR0002, etc. Cliquez sur OK pour lancer le processus d’importation, dont le résultat est affiché dans la figure suivante. Le processus d’importation a généré un fichier de données IBM SPSS. Celui-ci est actuellement sans nom, car il vient d’être créé. Ce fichier doit être enregistré. Une fois enregistré, nous pouvons passer en Vue de Variables, modifier les spécifications par défaut pour les adapter à nos données (en remplaçant les paramètres par défaut d’IBM SPSS), puis enregistrer à nouveau la version modifiée du fichier de données. IBM SPSS fournit toujours un accusé de réception de ses actions ; l’accusé de réception du processus d’importation est illustré dans la figure suivante. Il s’agit de la syntaxe qui a permis l’importation du fichier Excel. Bien que cette syntaxe contienne des informations détaillées, le message général indique simplement qu’un fichier au format .xls a été traité via le chemin spécifié et que tous les champs de données avec leurs noms ont été capturés. Il n’est pas nécessaire d’enregistrer cette fenêtre (une invite vous demandera confirmation lorsque vous tenterez de la fermer).  

Importation de données d’Excel vers IBM SPSS Lire la suite »

Saisie des Données dans IBM SPSS

Lorsque nous ouvrons le logiciel IBM SPSS, nous sommes accueillis par l’écran illustré dans la figure suivante. Nous pouvons naviguer vers un fichier existant, lancer le tutoriel, saisir des données, etc. En sélectionnant l’option Saisir des données ou en cliquant sur Annuler, nous accédons à la feuille de calcul IBM SPSS. Nous choisirons Annuler. LES DEUX TYPES D’AFFICHAGE La feuille de calcul initialement affichée est présentée dans la figure suivante. Cette vue, qui est l’affichage par défaut, est appelée Vue de données par IBM SPSS, car c’est littéralement là où nous saisissons et visualisons nos données. Mais comme le montre la figure précédente, il est également possible d’afficher la Vue des variables. Que nous saisissions nos propres données ou importions un ensemble de données déjà construit, nous devrons travailler à la fois dans les écrans Vue de données et Vue des variables. Bien que nous puissions traiter ces écrans dans n’importe quel ordre, nous encourageons fortement les nouveaux utilisateurs d’IBM SPSS à commencer par l’écran Vue des variables lors de la saisie d’un nouvel ensemble de données. UN EXEMPLE DE JEU DE DONNÉES La figure suivante montre un ensemble fictif très simple de résultats d’une étude de recherche, illustrant les étapes de saisie des données. Les variables et leur signification sont les suivantes : ID: Un code d’identification arbitraire associé à chaque participant (cas). L’ID anonymise les participants, garantissant ainsi leur confidentialité. Il permet également de revoir les données originales en cas d’erreurs de saisie. Genre: Indique le genre du participant ; dans la Figure 2.3, M représente masculin et F représente féminin. Extraversion: Une caractéristique de personnalité indiquant, grosso modo, à quel point la personne est sociable. Dans cette étude, elle est représentée par une échelle de 10 points, où 1 signifie très faible et 10 très élevé. Ventes en Milliers de Dollars: Montant des ventes réalisées par chaque participant (vendeur) pendant un mois donné dans un département d’une grande chaîne de vente au détail. ID Genre Extraversion Ventes en Milliers de Dollars 1 M 9 50 2 F 3 26 3 F 7 40 4 M 5 38 5 M 6 34 6 F 8 42   L’AFFICHAGE VUE DES VARIABLES En sélectionnant Vue de Variable au bas de la feuille de calcul (vierge), nous accédons à l’écran illustré dans la figure suivante. Cet affichage est modifiable et nous permet de spécifier les propriétés des variables dans le fichier de données. Les colonnes correspondent aux spécifications suivantes : Nom : Un nom court mais descriptif de la variable. Le maximum est de 64 caractères en anglais, mais nous préférons des noms beaucoup plus courts. Les espaces et caractères spéciaux ne sont pas autorisés, mais les underscores peuvent être utilisés. Nous suggérons d’utiliser uniquement des lettres et des chiffres. Type : IBM SPSS peut lire plusieurs types de données (notation scientifique, date, chaîne de caractères, etc.), mais dans cet exemple, nous nous limitons au type Numérique (par défaut). Largeur : Nombre d’espaces occupés par les données. La valeur par défaut est 8. Décimales : Nombre de décimales affichées dans Data View pour cette variable. La valeur par défaut est 2. Notez qu’IBM SPSS calcule les valeurs avec 16 décimales, mais affiche uniquement le nombre spécifié ici. Libellé : Une phrase décrivant la variable. Souvent omise si le nom de la variable est suffisamment descriptif. Valeurs : Pour les variables catégorielles (comme le genre), il est approprié d’utiliser des codes numériques arbitraires pour les catégories. C’est ici que nous pouvons (et devons) spécifier des étiquettes pour chaque code. Manquants : Nous pouvons désigner une valeur manquante en laissant la cellule vide lors de la saisie ou en utilisant un code numérique arbitraire. Les codes numériques sont utiles pour différencier les raisons des valeurs manquantes (par exemple, source illisible, réponse double). Colonnes : Nombre d’espaces alloués aux données. La valeur par défaut est 8. Alignement : Alignement à droite, à gauche ou centré dans Data View. La valeur par défaut est Droite. Mesure : Échelle de mesure de la variable. Les options sont Échelle (données de niveau intervalle ou supérieur), Ordinal (données ordinales) et Nominal (données catégorielles), avec la valeur par défaut initialement définie sur Inconnu. Rôle : Plusieurs rôles peuvent être attribués aux variables, mais nous nous limitons à Entrée, qui est la valeur par défaut (permettant aux variables d’être incluses dans toutes les analyses). SAISIE DES SPÉCIFICATIONS DANS VUE DE VARIABLES Dans la fenêtre Vue de Variables, double-cliquez sur la cellule sous Nom dans la première ligne et saisissez le nom de la première variable (ID). Cliquez ensuite sur la cellule directement en dessous pour qu’IBM SPSS remplisse les valeurs par défaut dans la première ligne. Modifiez les spécifications par défaut comme suit : Cliquez sur la cellule Décimales et définissez la valeur sur 0. Cliquez sur la cellule Mesure et sélectionnez Échelle. La première ligne pour la variable ID est maintenant terminée. Nous répétons ce processus pour les trois autres variables, et les spécifications complètes sont présentées dans la figure suivante. Notez les points suivants : Nous avons utilisé un Nom court pour les ventes (ventes) et ajouté une Libellé pour une description plus complète. La variable genre est catégorielle (nominale), tandis que extraversion et ventes sont des variables quantitatives (Échelle). Il reste à spécifier les étiquettes de valeurs pour la variable genre. Nous utiliserons les codes 1 pour féminin et 2 pour masculin. Pour ce faire : Cliquez sur la cellule sous Valeurs pour la ligne genre. Dans la fenêtre Étiquettes de Valeurs: Saisissez 1 dans Valeur et féminin dans Étiquette, puis cliquez sur Ajouter. Saisissez 2 dans Valeur et masculin dans Étiquette, puis cliquez sur Ajouter. 3. Cliquez sur OK pour enregistrer les étiquettes. Elles apparaissent maintenant dans la cellule Valeurs pour genre. ENREGISTREMENT DU FICHIER DE DONNÉES Nous enregistrons maintenant le fichier de données (une opération à répéter fréquemment après toute modification). Sélectionnez Fichier → Enregistrer sous (ou cliquez sur l’icône Enregistrer dans la figure suivante). Naviguez vers l’emplacement souhaité, nommez le fichier de manière claire et enregistrez-le. Le nom du fichier apparaît dans la bannière de la fenêtre IBM SPSS. SAISIE DES DONNÉES DANS DATA VIEW Une fois les spécifications en place et le fichier enregistré, les noms des variables sont visibles dans Vue de données. Nous saisissons simplement les données dans les cellules, en utilisant les touches fléchées ou la touche Tab pour naviguer. Après la saisie, nous enregistrons à nouveau le fichier. Une icône « grisée » indique que le fichier est enregistré ; une icône « normale » signifie que des modifications non sauvegardées sont présentes. Dans la figure précédente, l’icône est grisée, indiquant que le fichier est

Saisie des Données dans IBM SPSS Lire la suite »

Types de fichiers  et extensions dans IBM SPSS

IBM SPSS Statistics utilise plusieurs types de fichiers pour stocker des données, des résultats, des scripts et des configurations. Chaque type a une extension spécifique qui permis de l’identifiant facilement. Voici une description détaillée des principaux formats de fichiers SPSS: Fichiers de données (.sav) Extension : .sav(fichier de données SPSS) Description : C’est le format natif de SPSS pour stocker les démesurées (variables, appellations, valeurs mobilières, formats, etc.). Peut contenir des métadonnées (labels de variables, niveaux de mesure, valeurs codées). Binaire (non-ligatliste dans un éditeur de texte). Utilisation : Ouvrir/modifier dans SPSS via Fichier – Ouvrir – Données. Exportable vers Excel, CSV, ou d’autres logiciels statistiques. Exemple : enquete_clients.sav Contient les réponses d’une étude. Fichiers de Sortie (.spv / .spo) Extension : .spv (SPSS Viewer File, versions récentes). .spo (anciennes versions). Description : Stocke les d’analyses (tableaux, graphiques, tests statistiques). Structure-lage-matérieur (navigation via le Visionneuse SPSS). Utilisation : Généré générique après une analyseAnalyse). Exportable en PDF, Word, Excel (Dossier et exportation). Exemple : resultats_anova.spv Contient les tableaux ANOVA et les graphiques associés. DATASET ACTIVATE DataSet1. FREQUENCIS VARIABLES – Revenu de l’âge / STATISTIQUES-MEAN STDDEV. Fichiers de Syntaxe (.sps) Extension : .sps(fichier de syntaxe SPSS) Description : Fichier texte contenant des Commandes SPSS (exécutables via l’éditeur de syntaxe). Permet l’automatisation et la reproductibilité des analyses. Utilisation : Édité via Fichier – Nouveaux – Syntaxe. Exécuté avec Run et sélection (ou Ctrl et R). Exemple de code : DATASET ACTIVATE DataSet1. FREQUENCIS VARIABLES – Revenu de l’âge / STATISTIQUES-MEAN STDDEV. Exemple de fichier : recodage_variables.sps Script pour recoder des variables. Fichiers de Script (.sbs ou .py) Extension : .sbs (SPSS Script, base sur SaxBasic). .py (Python, pour les versions récentes). Description : Permet d’automatiser des complexes tâches via des Scénarios (ex. : personnalisateur des graphiques, créer des macros). SBS : Ancien format (franc de l’appel de bravo spa SPSS). Python : Pris en charge depuis SPSS 14 (plus flexibles). Utilisation : Exécuté via Utilitaires et scripts de course. Exemple : custom_chart.sbs – Modifier la couleur des barres dans son togramme. Fichiers de Modèle de Graphique (.sgt) Extension : .sgt(Modèle de la carte SPSS) Description : Stocke des de modèles de graphiques Présins de la Commission (couleurs, polices, styles). Permet une uniformisation . des visualisations. Utilisation : Appliqué via Graphiques et graphiste et concepteur de cartes. Exemple : corporate_style.sgt Template aux couleurs de l’entreprise. Autres Fichiers Associés Prorogation Type Description .por Fichier portable Version légère de .sav (compatible avec d’anciennes versions, moins de métadonnées). .csv Texte à données (Excel/SPSS) Import/export depuis/vers SPSS (attention à la perte de métadonnées). .dat Bogies de données Fichier texte structuré (suite lu par SPSS via Magicien en matière d’importation de texte). .odb Base de données Connexion à des bases externes (ex : MySQL, PostgreSQL). Bonnes Pratiques de Gestion Organisation : Utilisateur des noms clairs (ex. donnees_2024.sav, syntaxe_anova.sps). Séparer les données brutes (.sav), les syntaxes (.sps) et les résultats (.spv). Sauvegarde : Le format .sav Prévoyants les métadonnées (préféré à .csv pour moins sauvegardes SPSS). Exportation : Pour partager avec les non-utilisateurs de SPSS, exportateur en PDF/Excel (File > Export). Comparaison des formats Format Espérer Inconvénients .sav Métadonnées, compression SPSS sans cuisson .csv Universel léger, Pertes d’étiquettes et formats .sps Reproductibilité, automatisation Nécessite des compétences en syntaxe Les fichiers SPSS sont des pays clefs pour couvrir les besoins d’analyse, de la gestion des données (.sav) à la publication (.spv). Le choix du format dépend de l’usage (stockage, partage, automatisation). Si les extensions ne s’affichent pas à l’écran, voici comment les afficher : Sous Windows : Sélectionnez Panneau de configuration → Options des dossiers → Onglet Affichage. Décochez la case Masquer les extensions des fichiers dont le type est connu. Cliquez sur OK. Sous Mac OS X : Sélectionnez Finder → Préférences → Onglet Avancé. Cochez la case Afficher toutes les extensions de fichiers. Fermez la fenêtre.    

Types de fichiers  et extensions dans IBM SPSS Lire la suite »

Analyse des Corrélations avec SPSS

Coefficients de Corrélation Dans SPSS, nous pouvons facilement obtenir plusieurs coefficients de corrélation. Le coefficient de corrélation de Pearson mesure la relation linéaire entre deux variables généralement continues. Par exemple, considérons le nuage de points suivant représentant la relation entre la taille et le poids : Comme le montre le graphique, lorsque la taille augmente, le poids a tendance à augmenter également. Chaque point représente une observation pour une personne donnée sur les deux variables simultanément. La définition mathématique du coefficient de corrélation de Pearson est la suivante : ​ où sx​ et sy​ sont les écarts-types des deux variables. Le numérateur de r est la covariance, notée covxy. Nous divisons la covariance par le produit des écarts-types pour standardiser la covariance et obtenir une mesure sans dimension de la relation linéaire. La valeur de r varie entre −1 et +1, avec −1 indiquant une relation linéaire négative parfaite et +1 une relation linéaire positive parfaite. Une valeur de 0 indique l’absence de relation linéaire. Un test inférentiel sur le rr de Pearson nécessite généralement l’hypothèse de normalité bivariée, qui peut être vérifiée informellement par des graphiques. Pour nos données, nous générons la corrélation de Pearson rr entre les scores verbaux et quantitatifs : Procédure SPSS : ANALYSE → CORRELATION → BIVARIEE Sélectionnez les variables « verbal » et « quantitatif« , cochez Pearson sous Coefficients de Corrélation et Bilateral sous Test de Signification. Cochez également Répérer les corélations significations. Cliquez sur OK. Nous voyons que la corrélation de Pearson entre « quantitatif » et « verbal » est de 0.808 et est statistiquement significative au niveau 0.01. Nous pouvons donc rejeter l’hypothèse nulle d’une corrélation nulle dans la population. Nous pouvons également obtenir un intervalle de confiance pour notre corrélation en utilisant la technique du bootstrap : Bootstrap : ANALYSE → CORRELATION → BIVARIEE→ BOOTSTRAP Cochez Effectuer un bootstrapp avec 1000 échantillons, sélectionnez Bias corrected accelerated (BCa) sous Confidence Intervals. Cliquez sur Continue. L’intervalle de confiance bootstrap à 95% va de 0.650 à 0.913. Le Rho de Spearman Nous pouvons également calculer un coefficient de corrélation non paramétrique appelé Rho de Spearman : Le Rho de Spearman est de 0.820 et est également significatif au niveau 0.01. Ce coefficient est particulièrement utile lorsque la relation entre les variables est monotone mais non linéaire. Comparaison Pearson vs. Spearman Prenons un exemple pour illustrer la différence : [Espace pour le tableau des préférences de films et le graphique des rangs] Dans ce cas, Pearson et Spearman donnent tous deux 0.600 car les données sont des rangs. Spearman est en fait la corrélation de Pearson appliquée aux données rangées. Ici, Spearman donne 1.0 (relation parfaite car les rangs sont parfaitement ordonnés) tandis que Pearson donne 0.955 car il mesure spécifiquement la linéarité. Autres Coefficients de Corrélation Corrélation Bissériale Ponctuelle Utile lorsqu’une variable est dichotomique naturelle. Dans SPSS, on utilise la procédure standard de corrélation de Pearson.   Coefficient Phi Utile lorsque les deux variables sont dichotomiques. On utilise ANALYZE → DESCRIPTIVE STATISTICS → CROSSTABS. [Espace pour l’exemple des notes et position en classe]

Analyse des Corrélations avec SPSS Lire la suite »

Calcul des Z-Scores dans SPSS

Comme les scores z sont fréquemment utilisés dans la recherche, nous montrons comment les calculer et comment identifier les valeurs qui s’écartent des valeurs critiques typiques pour z aux extrémités de la distribution normale. Pour un test bilatéral avec un seuil de signification de 0,05, la région de rejet est répartie entre les deux extrémités de la distribution. Chaque queue contient 0,025 de la surface de rejet, pour un total de 0,05 (soit 0,025 + 0,025 = 0,05). Si notre valeur z obtenue dépasse ±1,96 (les valeurs critiques pour z qui délimitent 0,025 dans chaque queue), nous pouvons considérer ce score comme peu probable, se produisant moins de 5 % du temps. Prenons l’exemple des données hypothétiques de Denis (2016) sur les scores de réussite en fonction de l’enseignant (1 à 4) et du manuel (1 ou 2), où « ac » représente les notes de réussite d’une classe d’élèves, avec une plage possible de 0 à 100 : Supposons que vous soyez un élève de cette classe et que vous souhaitiez connaître votre position relative. Pour cela, nous pouvons calculer les scores z sur les données de réussite, ce qui transforme la distribution brute en une distribution avec une moyenne de 0 et un écart type de 1,0. Dans SPSS, nous utilisons la procédure suivante : ANALYSE → ANALYSE DESCRIPTIVES → EXPLORER Les valeurs standardisées seront enregistrées dans la vue des données de SPSS : Nous pouvons représenter graphiquement les valeurs Znc (transformées en z) : GRAPHISME → BOITES DE DIALOGUE → HISTOGRAMME La distribution des scores z (à gauche) est identique à celle des scores bruts. La transformation en scores z ne normalise pas une distribution ; elle la redimensionne simplement pour avoir une moyenne de 0 et un écart type de 1,0. La seule différence réside dans les valeurs de l’axe des x, qui sont maintenant centrées sur 0. Supposons que vous ayez obtenu un score de 95,00 au test de réussite. Votre score z correspondant est : z=x−μσ=95,00−79,049,65=15,969,65=1,65z=σx−μ​=9,6595,00−79,04​=9,6515,96​=1,65 Cela signifie que vous avez obtenu un score 1,65 écart-type au-dessus de la moyenne. Nous pouvons vérifier que SPSS a généré un score z de 1,65 pour le cas 19 dans les données : Que signifie un score z de 1,65 ? Si la distribution est normale ou approximativement normale, nous pouvons calculer l’aire au-dessus et en dessous de ce score. Vous pouvez obtenir cette aire en consultant les tables de la distribution normale standard ou en utilisant des calculateurs en ligne. L’aire au-dessus de 1,65 est égale à 0,049, tandis que l’aire en dessous est égale à 1−0,049=0,9511−0,049=0,951. Ainsi, si la distribution est normale, vous avez performé mieux qu’environ 95 % de la classe.

Calcul des Z-Scores dans SPSS Lire la suite »