Pandas Basics pour débutants - cours 990 RUB. de Stepik, formation 46 leçons, date du 5 novembre 2023.
Miscellanea / / December 04, 2023
Le but du cours n'est pas seulement de vous expliquer, mais de vous apprendre à travailler avec les bibliothèques Numpy et Pandas.
Dans les coulisses, il n’y a pas un conférencier ennuyeux, mais un data scientist qui travaille quotidiennement avec ces bibliothèques. Sous forme de communication en direct (l'auteur semble communiquer avec vous via une caméra), nous apprendrons à travailler dans Pandas.
À propos du cours
1. Information
Les bases de Numpy
1. Pourquoi avez-vous besoin de Numpy pour apprendre Pandas?
2. Pratique: shape, dtype, ndim, zeros, ones, arange
3. Types de données et leur conversion, arithmétique, accès aux éléments
4. Pratique: arithmétique, conversion de types, accès aux éléments
5. Tableaux bidimensionnels et tridimensionnels. Apprendre à utiliser les index
6. Pratique: renforcer le travail avec des index
7. Masquer et découper ensemble, indexer de manière sophistiquée et également remodeler
8. Pratique: apprendre à changer la forme d'un tableau
9. En savoir plus sur les fonctions de remodelage, de transposition, unaires et binaires
10. Pratique: consolider les connaissances sur les fonctions unaires et binaires
11. Fonctions logiques et fonction au sein d'une fonction, ainsi que où et statistiques
12. Pratique: maîtriser les fonctions utiles
13. Fonctions quelconques, toutes, triées, uniques, in1d. Présentation de l'algèbre linéaire
14. Fonctions de permutation et de lecture aléatoire. Enregistrer un tableau dans un fichier
Introduction aux pandas
1. Première connaissance de la série
2. Pratique: tester vos connaissances sur la série
3. En savoir plus sur les séries: indices, addition, vérification de NaN
4. Pratique: subtilités lorsqu'on travaille avec des séries
5. Première connaissance de DataFrame
6. En savoir plus sur DataFrame: index, dictionnaires imbriqués, del et .T
7. Pratique: fonctionnalités d’indexation
8. Fonctions de réindexation, de suppression et d'indexation dans un dataframe
9. Pratique: retirer ce dont vous avez besoin, supprimer ce dont vous n'avez pas besoin
10. Opérateurs loc, iloc, at, iat. Ajout de plusieurs dataframes
11. Ajout de dataframes, tri, arithmétique avec lacunes
12. Statistiques descriptives. Des valeurs uniques
13. Test
14. Test (suite)
Pandas: travailler avec des sources de données
1. Qu'est-ce que le format CSV et comment l'apprivoiser ?
2. En savoir plus sur le traitement des laissez-passer
3. Apprendre à lire des fichiers volumineux par morceaux
4. Qui est JSON et comment se lier d'amitié avec lui?
5. Connaître les formats HTML, XML, PICKLE, HDF5
6. Bon vieux Excel et un peu de bases de données
Pandas: nettoyer et préparer les données pour l'analyse
1. Apprendre à gérer les passes
2. Nous vérifions les données pour les doublons et les supprimons
3. À propos du remplacement des valeurs et de la discrétisation
4. Nous identifions les émissions et les éliminons correctement
5. Création de matrices de variables factices
6. Travailler avec des cordes est plus facile qu’il n’y paraît !
Pandas: jonction de données et transformation de forme
1. Présentation de l'indexation hiérarchique
2. Actions avec multi-index dans les dataframes
3. Apprendre à connecter des dataframes à l'aide de la fusion
4. Analogue à fusionner; concaténation de trames de données à l'aide de concat
5. Combiner la transformation des données et des formulaires