Introduction à IBM SPSS Statistiques

SPSS (Statistical Package for Social Sciences) is a software used for statistical analysis. It is also the name of the company that sells it (SPSS Inc). In 2009, the company decided to change the name of its products to PASW, for Predictive Analytics Software1 and was bought out by IBM for $ 1.24 billion.
SPSS Statistics est un logiciel utilisé pour l'analyse statistique. Produit par SPSS Inc., il a été acquis par IBM en 2009. Les versions actuelles (2017) sont officiellement nommées IBM SPSS Statistics. Les produits d'accompagnement de la même famille sont utilisés pour la création et la mise en œuvre de l'enquête (IBM SPSS Data Collection), l'exploration de données (IBM SPSS Modeler), l'analyse de texte et la collaboration et le déploiement (lots et services de notation automatisée).
Le nom du logiciel était à l'origine de Statistical Package for the Social Sciences (SPSS), reflétant le marché d'origine, bien que le logiciel soit désormais populaire dans d'autres domaines, y compris les sciences de la santé et le marketing.
Dans ce tutoriel, nous allons voir comment utiliser les fonctionnalités disponibles sur SPSS. Il est conçu pour fournir un guide pratique, étape par étape.

SPSS est un programme largement utilisé pour l'analyse statistique en sciences sociales. Il est également utilisé par les chercheurs en marketing, les chercheurs en santé, les entreprises d'enquête, les gouvernements, les chercheurs en éducation, les organismes de commercialisation, et bien sûr d'autres. Le manuel SPSS original a été décrit comme l'un des «livres les plus influents de la sociologie» pour permettre aux chercheurs ordinaires de faire leur propre analyse statistique. En plus de l'analyse statistique, la gestion des données (sélection de cas, remaniement de fichier, création de données dérivées) et la documentation de données (un dictionnaire de métadonnées a été stocké dans le fichier de données) sont des fonctionnalités du logiciel de base.

Statistiques incluses dans le logiciel de base:

Statistiques descriptives: Tableaux croisés, Fréquences, Descriptifs, Explorer, Statistiques de Ratio Descriptif
Statistiques bivariées: Moyens, t-test, ANOVA, Corrélation (bivariée, partielle, distances), Tests non paramétriques
Prévision des résultats numériques: régression linéaire
Prédiction pour identifier les groupes: Analyse des facteurs, analyse par grappes (en deux étapes, K-means, hiérarchique), Discriminant...
Les nombreuses fonctionnalités de SPSS Statistics sont accessibles via des menus déroulants ou peuvent être programmées avec une language de syntaxe de commande 4GL propriétaire. La programmation de la syntaxe de commande présente les avantages de la reproductibilité, la simplification des tâches répétitives et la gestion de manipulations et analyses de données complexes. De plus, certaines applications complexes ne peuvent être programmées qu'en syntaxe et ne sont pas accessibles via la structure du menu. L'interface du menu déroulant génère également la syntaxe de la commande: cela peut être affiché dans la sortie, bien que les paramètres par défaut doivent être modifiés pour rendre la syntaxe visible pour l'utilisateur. Ils peuvent également être collés dans un fichier de syntaxe en utilisant le bouton "coller" présent dans chaque menu. Les programmes peuvent être exécutés de manière interactive ou sans surveillance, en utilisant l'installation de production fournie.
En outre, une langue "macro" peut être utilisée pour écrire des sous-programmes de language de commande. Une extension de programmation Python peut accéder à l'information dans le dictionnaire de données et les données et créer dynamiquement des programmes de syntaxe de commande. L'extension de programmation Python, introduite dans SPSS 14, a remplacé les scripts de base moins fonctionnels de SAX Basic pour la plupart des objectifs, bien que SaxBasic reste disponible. De plus, l'extension Python permet à SPSS d'exécuter l'une des statistiques dans le progiciel gratuit R. À partir de la version 14, SPSS peut être piloté à l'extérieur par un programme Python ou VB.NET à l'aide des "plug-ins" fournis. (À partir de la version 20, ces deux installations de script, ainsi que plusieurs scripts, sont inclus sur le support d'installation et sont normalement installés par défaut).
Les statistiques SPSS imposent des contraintes sur la structure interne des fichiers, les types de données, le traitement des données et les fichiers correspondants, ce qui simplifie considérablement la programmation. Les jeux de données SPSS ont une structure de table bidimensionnelle, où les lignes représentent généralement des cas (comme les individus ou les ménages) et les colonnes représentent des mesures (comme l'âge, le sexe ou le revenu du ménage). Seuls deux types de données sont définis: numeric et text (ou "string"). Tout le traitement des données se produit séquentiellement au cas par cas à travers le fichier (jeu de données). Les fichiers peuvent être adaptés individuellement et un à plusieurs, mais pas beaucoup à plusieurs. En plus de la structure et du traitement des cas par variables, il existe une session Matrix distincte où l'on peut traiter les données en tant que matrices à l'aide d'opérations de matrice et d'algèbre linéaire.
L'interface utilisateur graphique comporte deux vues qui peuvent être basculées en cliquant sur l'un des deux onglets en bas à gauche de la fenêtre Statistiques SPSS. La «Vue des données» montre une vue de table des cas (lignes) et des variables (colonnes). Contrairement aux feuilles de calcul, les cellules de données ne peuvent contenir que des nombres ou du texte, et les formules ne peuvent pas être stockées dans ces cellules. La «Vue variable» affiche le dictionnaire de métadonnées où chaque ligne représente une variable et affiche le nom de la variable, l'étiquette variable, la (des) étiquette (s) de valeur, la largeur d'impression, le type de mesure et diverses autres caractéristiques. Les cellules dans les deux vues peuvent être modifiées manuellement, définissant la structure du fichier et permettant l'entrée de données sans utiliser la syntaxe des commandes. Cela peut être suffisant pour les petits ensembles de données. Des ensembles de données plus larges, comme les enquêtes statistiques, sont plus souvent créés dans le logiciel de saisie de données ou entrés lors d'une entrevue personnelle assistée par ordinateur, en analysant et en utilisant la reconnaissance optique de caractères et le logiciel de reconnaissance optique de marque, ou par capture directe à partir de questionnaires en ligne. Ces jeux de données sont ensuite lus dans SPSS.
SPSS Statistics peut lire et écrire des données à partir de fichiers texte ASCII (y compris les fichiers hiérarchiques), d'autres packages de statistiques, de feuilles de calcul et de bases de données. SPSS Statistics peut lire et écrire sur des tables de bases de données relationnelles externes via ODBC et SQL.

 

Younes Derfoufi
CRMEF OUJDA

Leave a Reply