"Analyse des données à l'aide d'IBM SPSS Statistics" - cours 42 000 RUB. de MSU, formation (2 mois), date du 3 décembre 2023.
Miscellanea / / December 06, 2023
Sous une forme très condensée, ce cours fait partie du cours populaire d'enseignement à distance « Comment faire de la recherche scientifique: méthodologie, outils, méthodes » de l'E. Foundation Open University. Gaidar (environ 2 mille. auditeurs par an). La Faculté d'économie de l'Université d'État de Moscou offre aux étudiants la possibilité d'utiliser une classe informatique équipée avec SPSS installé étudier en détail les méthodes de travail avec les données en face-à-face avec un enseignant, travailler avec le programme de vos propres « mains » SPSS. Il est possible de travailler non seulement avec des bases de données proposées par l'enseignant, mais également avec les données des élèves; l'enseignant vous conseillera sur les méthodes et comment utiliser pour analyser vos données.
Ce cours a été testé à l'Open University de la Fondation E. Gaïdar.
Docteur en économie, professeur à la Faculté d'économie de l'Université d'État de Moscou, spécialiste de la recherche quantitative en sphère sociale, leader de plus de 30 projets de recherche, a de l'expérience dans l'enseignement de cours analytiques à l'Université nationale de recherche HSE, REU im. V.G. Plékhanov.
E-mail: [email protégé]
1 L'essence et les principales orientations des enquêtes par sondage auprès de la population. Possibilités d'utiliser des PPA spéciaux pour le traitement des données d'enquête par sondage
Méthodes de collecte d'informations quantitatives. Exemples d'études. Exemples d'enquêtes sociodémographiques en Russie. Progiciels statistiques de base pour la recherche sociale. Fonctions de logiciels spéciaux (Statistica, SPSS) dans le traitement des données d'études sur échantillons. Structure, modules SPSS. Domaines de traitement des données. Préparation des données. Saisie et sauvegarde des données. Échelles de mesure (quantitative, ordinale, nominale). Propriétés des échelles et leurs transformations admissibles. Types de catégorisation des données.
2 Préparation des données. Sélection et modification des données
Sélection d'observations. Tri des observations. Diviser les observations en groupes. Modification des données. Calcul de nouvelles variables. Calcul de nouvelles variables selon certaines conditions. Formulation des conditions. Agrégation de données. Transformations de rang. Poids des caisses. Raisons et mécanismes pour générer des lacunes dans les données. Possibilité d'ignorer les omissions. Méthodes pour remplir les valeurs manquantes. Méthodes d'identification des valeurs anormales. Application de procédures d’évaluation robustes. Analyse des réponses multiples
3 Statistiques descriptives. Tableaux de contingence
Le rôle des statistiques dans le traitement des résultats des enquêtes par sondage. Micro et métadonnées. Domaines d'application et limites d'applicabilité des méthodes mathématiques et statistiques. Résumé des observations. Statistiques descriptives. Distributions univariées. Indicateurs de variations. Dispersion, plage de variation, écart absolu moyen, plages quantiles. Construction de tableaux de contingence. Représentation graphique des tableaux de contingence.
4 Tests paramétriques et non paramétriques
Analyse de la relation entre les caractéristiques. Indépendance des variables. Caractéristiques de base de la communication. Tests non paramétriques et paramétriques. Test d'indépendance (test d'adéquation χ2). Comparaison de deux et plusieurs échantillons (dépendants et indépendants). test t. Tests statistiques pour tableaux de contingence. Coefficients de corrélation (pour les échelles nominales et de classement). Mesures de l'étroitesse de la relation entre les variables. Les mesures les plus simples de la proximité des connexions (pour les variables dichotomiques). Mesures de relation pour les tables avec des données ordinales. Mesures T de Kendal et leurs propriétés. Mesures D de Somers. Mesure Goodman-Kruskal et ses propriétés. Analyse de variance
5 Analyse de corrélation et de régression
L'essence et les objectifs de l'analyse de corrélation. Nuages de points. Coefficients de corrélation appariés. Mesurer le degré de proximité d'une relation statistique, « débarrassée » de l'influence de caractéristiques étrangères à l'aide de coefficients de corrélation partielle. Vérifier la signification de la relation entre les signes. Intervalles de confiance pour les coefficients de corrélation. Coefficient de corrélation multiple. Coefficient de détermination. Modèle d'analyse de régression bidimensionnelle: modèles de régression linéaire et non linéaire. Courbes de croissance dans les problèmes de prévision, variables « factices » et leurs applications. Modèle de régression linéaire multiple. Régression non linéaire (régression logistique binaire, régression logistique multinomiale, régression ordinale, analyse probit, ajustement de courbe).
6 méthodes de réduction de dimensionnalité
Approche statistique dans la méthode des composantes principales. Calcul des composantes principales et leur interprétation graphique. Contenu informatif de l’espace de fonctionnalités réduit. Régression en composantes principales. Le rôle et la place des méthodes non paramétriques dans la modélisation structurelle. Analyse de cluster hiérarchique. Métriques de l’espace des fonctionnalités. Principes de mesure de la distance entre des groupes d'objets. Algorithmes pour une analyse de cluster rapide, méthode k-means. Analyse groupée en deux étapes. Construire un arbre d'objectifs