Big Data et Data Science: passer au niveau supérieur - cours gratuit de Stepik, formation 11 leçons, Date 28 novembre 2023.
Miscellanea / / November 29, 2023
Si vous connaissez déjà un peu la science des données et souhaitez continuer à apprendre, combler vos lacunes et vous entraîner davantage, ce cours est fait pour vous. Dans le cadre du programme, vous approfondirez le domaine de la science des données - faire connaissance avec l'architecture MapReduce et l'écosystème Apache Hadoop, comprenez la conception d'Apache Spark et Apache Parquet, et maîtrisez les bases des réseaux de neurones et de leurs architectures. Vous apprendrez également comment effectuer des analyses commerciales avec Power BI et quelles sont les compétences générales dont un chef de projet a besoin.
Le but du cours est d'attirer votre attention sur le Big Data et la science des données. Tous les supports de cours sont donc destinés à des fins d'information sans plonger dans toutes les subtilités. Si vous êtes intéressé par une plongée approfondie, utilisez le matériel du module supplémentaire.
Le cours se compose de cinq modules qui vous aideront à progresser systématiquement dans le domaine de la science des données et à mettre en pratique en temps opportun la théorie acquise :
1. Plongez dans la science des données.
N'oubliez pas les processus qu'implique l'analyse des données. Apprenez les bases du fonctionnement du stockage à long terme. Vous travaillerez avec SQL en utilisant le SGBD Oracle comme exemple et créerez votre première base de données. Familiarisez-vous avec l'architecture MapReduce et l'écosystème Apache Hadoop.
2. Outils de traitement, d'analyse et de visualisation des données.
Découvrez ce qu'est Power BI et quels problèmes peuvent être résolus avec son aide. Apprenez à obtenir, modéliser, analyser des données et créer des visualisations.
3. Outils pour travailler avec le Big Data.
Vous comprendrez comment fonctionne Apache Spark, un outil pour travailler avec le Big Data. Découvrez le format de stockage de données Apache Parquet et ses fonctionnalités. Consultez également des exemples de travail avec Pyspark dans le notebook Jupyter.
4. Systèmes d'apprentissage automatique.
Vous apprendrez ce qu'est la valeur p, pourquoi les critères statistiques nécessaires sont nécessaires et à quelles tâches ils contribuent. Apprenez le concept des réseaux de neurones, leurs fonctionnalités et leurs architectures de base. Vous comprendrez également comment développer une approche simple et pragmatique de l'utilisation du Big Data.
5. Compétences générales et gestion de projet.
Apprenez les principes et les techniques de gestion de projet. Considérez comment fonctionne le cycle de vie d'un projet géré dans le paradigme Agile. Vous découvrirez également les compétences générales clés dont un expert a besoin pour développer ses compétences en leadership et en gestion de projet.
A qui est destiné ce cours?
Le cours s'adresse à toute personne possédant des connaissances de base en science des données et souhaitant approfondir ses connaissances dans ce domaine. Le cours s'adresse également aux spécialistes de l'informatique et des domaines connexes qui s'intéressent à l'utilisation de l'apprentissage automatique dans entreprises et diplômés du cursus « Big Data et Data Science: repartir de zéro » qui souhaitent poursuivre leurs études.
Exigences initiales
Pour rendre le cours clair et utile, vous devez posséder des compétences avancées en informatique et des connaissances de base en programmation et en SQL. Vous pouvez les obtenir dans le cours précédent de notre projet - « Big Data et Data Science: commencez votre plongée à partir de zéro ».
3
coursData Scientist, chercheur ML/DL, enseignant
Expérience en analytique - 5 ans. A travaillé en tant que Data Scientist chez PJSC Megafon. Donne des cours sur Skillbox, Netology, Yandex. Atelier et autres projets pédagogiques. Conférencier à la conférence Big Data Days 2021.
Data Scientist indépendant, enseignant et chercheur ML/DL, auteur de cours. Il a travaillé comme chercheur dans le domaine de la « théorie de la décision » dans le service militaire. Il a ensuite collaboré avec de grandes et petites entreprises. Ex-DataScientist PJSC Megafon.
1
BienNous contribuons au développement des écoliers et des étudiants des régions russes et des villes en développement pays voisins, nous leur transférons l’expérience et l’expertise des universités métropolitaines, des entreprises et des grands Plateformes informatiques
L'École russe de programmation, en abrégé RSP, opère dans le domaine de l'éducation des enfants et des adultes dans les domaines de l'informatique et du développement. soft skills sous forme de camps d'entraînement, de mouvements de cercle, de master classes, de webinaires, d'ateliers, de cours en ligne et conférences. Nos activités pédagogiques sont basées sur l'intensité et l'immersion profonde dans le sujet, le transfert d'expérience des seniors et expérimentés vers les débutants, le mentorat et le volontariat. Nous servons les idées d’une éducation pratique accessible et formons une nouvelle génération de personnel pour l’économie numérique du pays. Notre mission est d'aider les jeunes à devenir des leaders du changement technologique.
Connaissance
1. Salutations
Plonger
1. Introduction à la science des données
2. Plongez dans SQL
3. Big Data. Introduction à MapReduce. Introduction à l'écosystème Hadoop
Outils de traitement, d’analyse et de visualisation de données
1. Analyser les données dans Power BI
Outils de mégadonnées
1. Cadre Apache Spark
Systèmes d'apprentissage automatique
1. Statistiques pour les débutants
2. L'apprentissage automatique en entreprise
3. Bases du réseau neuronal
Compétences générales et gestion de projet
1. Gestion de projet de données
Achèvement
1. Résumé du cours et résultats