Spécialisation "Data Analyst" - cours 2900 frotter. de Stepik, formation 36 leçons, Date: 29 octobre 2023.
Miscellanea / / December 05, 2023
Analyste de données, analyste produit, analyste de base de clients, analyste CRM, data scientist, tous ces métiers sont liés à l'analyse de données.
🎯 Exigences TOP pour ces professions :
- Connaissance de SQL et expérience de travail avec des bases de données ;
- Connaissance de la syntaxe de base de Python et connaissance de la bibliothèque Pandas ;
- Connaissance des statistiques et capacité à les appliquer dans l'analyse des données ;
- Pensée analytique.
Ce n'est pas une liste complète. Par exemple, les analystes Web doivent connaître Google Analytics et Yandex. Métriques, et pour les data scientists - apprentissage automatique. Mais j'ai donné les exigences de base que l'on retrouve dans 70 à 80 % des postes vacants.
La spécialisation Data Analyst se compose actuellement de deux formations :
1️⃣ SQL pour tous
Pendant le cours, vous maîtriserez SQL jusqu'au niveau d'écriture de requêtes SQL complexes et vous entraînerez à utiliser les données d'une société commerciale dans l'un des systèmes de gestion de bases de données les plus populaires.
Le cours s'adresse aux débutants qui souhaitent maîtriser SQL, ainsi qu'à ceux qui connaissent SQL à un niveau de base, mais souhaitent combler les lacunes et consolider leurs connaissances dans la pratique.
2️⃣ Python: analyse de données avec Pandas
Le cours est consacré aux travaux pratiques avec les Pandas. Vous recevrez la théorie nécessaire et la renforcerez par un grand nombre de problèmes pratiques.
Le cours s'adresse à ceux qui connaissent déjà la syntaxe de base de Python :
- Connaît les types de données de base (y compris les listes et les dictionnaires) et les opérations sur celles-ci ;
- A une compréhension de ce que sont une fonction et une méthode.
Le cours peut être suivi même par des débutants capables de comprendre de manière indépendante comment installer Python et la bibliothèque Pandas. Mais si vous débutez avec Python, vous devrez rattraper votre retard sur certaines choses de base au fur et à mesure de la progression du cours. À propos, vous pouvez acquérir des connaissances de base sur la syntaxe Python dans ce cours. Ensuite, apprendre les Pandas sera beaucoup plus facile.
Le concept des cours repose sur trois principes :
Simplicité
La présentation du matériel est accessible et cohérente - cela vous permettra de constituer étape par étape la base de connaissances nécessaire.
Pratique
Une grande attention est accordée à la pratique - afin que vous puissiez non seulement résoudre les problèmes du cours, mais également pouvoir appliquer vos connaissances à l'avenir, sur des projets réels.
Soutien
N'hésitez pas à poser des questions dans les commentaires, il est important pour moi que toute la matière soit apprise. Je réponds aux commentaires dans la journée.
L'ordre dans lequel les cours sont suivis n'a pas d'importance.
1. SQL pour tous
Opérations sur une table
1. Introduction à la base de données
2. Filtrage des lignes WHERE. Expressions régulières COMME. ET et OU
3. Tri des chaînes ORDER BY
4. Fonctions d'agrégation: COUNT, SUM, MIN, MAX, AVG. Alias
5. Regroupement de lignes GROUP BY et HAVING. Générer des rapports
6. Pratique basée sur les résultats du 1er module
Opérations sur plusieurs tables
1. Notions de clé primaire et de clé étrangère. Types de relations dans la base de données
2. Générer des requêtes à partir de plusieurs tables. INNER JOIN et alias
3. LEFT JOIN et autres types de JOIN
4. Rejoindre plusieurs tables à l'aide de UNION et UNION ALL
5. Sous-requêtes
6. Pratique basée sur les résultats du 2ème module
Sujets importants supplémentaires
1. Expression de CAS
2. Fonctions populaires pour travailler avec des chaînes
Tâches pratiques pour renforcer le matériel de cours
1. Requêtes simples
2. Requêtes complexes
3. Conclusion
2. Python: analyse de données avec Pandas
Analyser les trames de données individuellement
1. Lire des données à partir de fichiers
2. Introduction express aux données
3. Sortie de colonne
4. Types de données
5. Filtrage des lignes
6. Expressions régulières
7. Tri des chaînes
8. Fonctions d'agrégation
9. Regroupement de lignes
Analyse de plusieurs trames de données associées
1. Fusionner un. k. une jointure
2. Enchaînement
Module supplémentaire requis
1. Travailler avec des dates et des heures
2. Tableaux croisés dynamiques
3. De nouvelles façons de créer des dataframes
4. Catégorisation des caractéristiques nominales
5. Remplacer des valeurs dans un dataframe
6. Visualisation chez les pandas
7. Tranchage
8. Conclusion