Data Scientist de zéro à PRO - cours 233 640 RUB. de SkillFactory, formation 24 mois, Date 15 août 2023.
Miscellanea / / November 29, 2023
Après le cours de base, vous pourrez choisir une spécialisation plus étroite en science des données - ML Engineer, CV Engineer ou NLP Engineer
Ingénieur ML — Développeur en apprentissage automatique
Développer un modèle de prédiction de la notation de crédit
Résoudre le problème de la classification des messages SMS indésirables
Développer un système de recommandation de produits adaptés lors de l'achat
Construire un modèle pour augmenter les ventes dans le commerce de détail
Créez des images basées sur une description textuelle à l'aide du réseau neuronal DALL-E
Ingénieur CV — Spécialiste de la vision par ordinateur
Apprenez à résoudre tous les problèmes de base dans le domaine de la vision par ordinateur
Vous acquerrez des connaissances sur le flux réel de travail avec des modèles de CV, les approches actuelles et les outils avancés nécessaires à la création de services de CV.
Dans le projet final, créer un coach virtuel capable d'évaluer la justesse des exercices en vidéo
Ingénieur PNL — Spécialiste du traitement du langage naturel
Apprenez à connaître le traitement du langage naturel
Comprendre les tâches de la PNL - classification, résumé et génération de texte, création de systèmes de traduction automatique et de systèmes de réponse aux questions
Dans le projet final, vous développerez indépendamment des outils de recherche automatisée de contextes sur des sujets donnés.
BASE
A ce stade, vous apprendrez les bases de la programmation en Python, apprendrez à prétraiter et analyser les données, et vous familiariserez également avec les principales tâches d'un data scientist.
Introduction - 1 semaine
Vous pourrez formuler vous-même de véritables objectifs d'apprentissage, découvrir quelle est la valeur de DS pour l'entreprise, se familiariser avec les principales tâches d'un data scientist et comprendre comment le développement de tout Projet DS.
INTRO-1. Comment étudier efficacement - intégration en formation
INTRO-2. Aperçu du métier. Types de problèmes en Data Science. Étapes et approches pour développer un projet Data Science
Conception du développement - 5 semaines
Vous apprendrez à travailler avec des types de données de base à l'aide de Python et serez capable d'utiliser des constructions en boucle, des instructions conditionnelles et des fonctions dans votre travail quotidien.
PYTHON-1. Les bases de Python
PYTHON-2. Plonger dans les types de données
PYTHON-3. Expressions conditionnelles
PYTHON-4. Cycles
PYTHON-5. Fonctions et programmation fonctionnelle
PYTHON-6. Pratique
PYTHON-7. Guide de style Python (Bonus)
Mathématiques de base - 7 semaines
MATH-1. Nombres et expressions
MATH-2. Équations et inégalités
MATH-3. Concepts de base de la théorie des fonctions
MATH-4. Bases de la géométrie: planimétrie, trigonométrie et stéréométrie
MATH-5. Ensembles, logique et éléments de statistiques
MATH-6. Combinatoire et bases de la théorie des probabilités
MATH-7. Résolution de problème
Travailler avec des données - 8 semaines
À ce stade, vous maîtriserez les compétences de base en matière de données: comment préparer, nettoyer et transformer les données afin qu'elles soient adaptées à l'analyse. En parlant d'analyse: vous analyserez des données à l'aide des bibliothèques populaires Matplotlib, Seaborn, Plotly.
PYTHON-8. Outils de science des données
PYTHON-9. Bibliothèque NumPy
PYTHON-10. Introduction aux pandas
PYTHON-11. Techniques de base pour travailler avec des données dans Pandas
PYTHON-12. Techniques de données avancées chez Pandas
PYTHON-13. Nettoyage des données
PYTHON-14. Visualisation de données
PYTHON-15. Principes de la POO en Python et code de débogage (module optionnel)
Projet 1. Analyse d'ensembles de données sur des problèmes résolus
Chargement des données - 6 semaines
Vous pourrez télécharger des données à partir de différents formats et sources. Et SQL, un langage de requête structuré, vous y aidera. Vous apprendrez à utiliser les fonctions d'agrégation, les jointures de tables et les jointures complexes.
PYTHON-16. Comment télécharger des données à partir de fichiers de différents formats
PYTHON-17. Récupération de données à partir de sources Web et d'API
SQL-0. Bonjour SQL!
SQL-1. Bases de SQL
SQL-2. Fonctions d'agrégation
SQL-3. Joindre des tables
SQL-4. Jointures complexes
Projet 2. Chargement de nouvelles données. Affiner l'analyse
Analyse des données statistiques - 7 semaines
L'analyse des données de renseignement (EDA) est ce qui sera votre objectif. Vous vous familiariserez avec toutes les étapes d'une telle analyse et apprendrez à la réaliser à l'aide des bibliothèques Statsmodels, Scikit Learn, Seaborn, Matplotlib, SciPy, Pandas. De plus, vous pourrez travailler sur Kaggle, un service populaire pour participer à des compétitions.
EDA-1. Introduction à l'analyse des données de renseignement. Algorithmes et méthodes EDA
EDA-2. Statistiques mathématiques dans le contexte de l'EDA. Types de fonctionnalités
EDA-3. Ingénierie des fonctionnalités
EDA-4. Analyse de données statistiques en Python
EDA-5. Analyse de données statistiques en Python. Partie 2
EDA-6. Conception d'expériences
EDA-7. Plateforme Kaggle
Projet 2
Introduction au Machine Learning - 9 semaines
Vous vous familiariserez avec les bibliothèques ML pour modéliser les dépendances de données. Vous pourrez entraîner les principaux types de modèles ML, effectuer des validations, interpréter les résultats des travaux et sélectionner des fonctionnalités importantes (feature importance).
ML-1. Théorie de l'apprentissage automatique
ML-2. Apprentissage supervisé: régression
ML-3. Apprentissage supervisé: classification
ML-4. Apprentissage non supervisé: techniques de clustering et de réduction de dimensionnalité
ML-5. Validation des données et évaluation du modèle
ML-6. Sélection et sélection de caractères
ML-7. Optimisation des hyperparamètres du modèle
ML-8. Livre de recettes ML
Projet 3. Problème de classement
UNITÉ PRINCIPALE
Algèbre linéaire, analyse mathématique, mathématiques discrètes, cela semble effrayant, mais n'ayez pas peur: nous analyserons tous ces sujets et vous apprendrons à travailler avec eux! Dans la deuxième étape, vous plongerez dans les mathématiques et les bases de l'apprentissage automatique, en apprendrez davantage sur les métiers DS et, grâce à l'orientation professionnelle, sélectionnerez une filière d'études de deuxième année.
Mathématiques et apprentissage automatique. Partie 1 - 6 semaines
Vous serez capable de résoudre des problèmes pratiques en utilisant le calcul manuel et Python (calculs vectoriels et matriciels, travail avec des ensembles, étude de fonctions par analyse différentielle).
MATH&ML-1. Algèbre linéaire dans le contexte des méthodes linéaires. Partie 1
MATH&ML-2. Algèbre linéaire dans le contexte des méthodes linéaires. Partie 2
MATH&ML-3. Analyse mathématique dans le contexte d'un problème d'optimisation Partie 1
MATH&ML-4. Analyse mathématique dans le cadre d'un problème d'optimisation. Partie 2
MATH&ML-5. Analyse mathématique dans le cadre d'un problème d'optimisation. Partie 3
Projet 4. Problème de régression
Mathématiques et apprentissage automatique. Partie 2 - 6 semaines
Vous vous familiariserez avec les concepts de base de la théorie des probabilités et des statistiques mathématiques, des algorithmes clustering, et apprendre également à évaluer la qualité du clustering effectué et à présenter les résultats dans forme graphique.
MATH&ML-6. Théorie des probabilités dans le contexte d'un classificateur Naive Bayes
MATH&ML-7. Algorithmes basés sur des arbres de décision
MATH&ML-8. Booster et empiler
MATH&ML-9. Techniques de clustering et de réduction de dimensionnalité. Partie 1
MATH&ML-10. Techniques de clustering et de réduction de dimensionnalité. Partie 2
Projet 5. Méthodes d'ensemble
Mathématiques discrètes - 4 semaines
MATH&MGU-1 Ensembles et combinatoires
Logique MATH&MGU-2
Graphiques MATH&MGU-3. Partie 1
Graphiques MATH&MGU-4. Partie 2
ML en entreprise - 8 semaines
Vous apprendrez à utiliser les bibliothèques ML pour résoudre des problèmes de séries chronologiques et des systèmes de recommandation. Vous pourrez entraîner un modèle ML et le valider, ainsi que créer un prototype fonctionnel et exécuter le modèle dans l'interface Web. Et acquérez également des compétences en tests A/B afin de pouvoir évaluer le modèle.
MATH&ML-11. Des séries chronologiques. Partie 1
MATH&ML-12. Des séries chronologiques. Partie 2
MATH&ML-13. Systèmes de recommandation. Partie 1
MATH&ML-14. Systèmes de recommandation. Partie 2
PROD-1. Préparation du modèle pour la production
PROD-2. PrototypeStreamlit+Heroku
PROD-3. Compréhension des affaires. Cas
Projet 6. Sujet au choix: séries chronologiques ou systèmes de recommandation
NIVEAU PRO
Dans la troisième étape, vous vous familiariserez avec l'une des méthodes d'apprentissage automatique: l'apprentissage profond (DL). Et aussi un bloc à part entière de la spécialisation choisie vous attend: vous pouvez maîtriser les compétences en apprentissage automatique (ML), se familiariser avec la routine du CV (computer vision) ou se perfectionner en PNL*, traitement naturel langue.
Deuxième année d'études - 3 spécialisations au choix
Orientation professionnelle
ML, CV ou PNL: à ce stade, vous devez enfin choisir la voie à suivre. Nous vous présenterons chaque spécialisation et vous proposerons de résoudre plusieurs problèmes pratiques pour vous faciliter la tâche.
Track ML - ingénieur
Dans la filière ML, vous apprendrez à résoudre des problèmes d'apprentissage automatique approfondis, à maîtriser les compétences d'un ingénieur de données et à perfectionner vos compétences en travaillant avec les bibliothèques Python. Vous apprendrez également comment créer un MVP (version minimale viable d'un produit), découvrirez toutes les subtilités de la sortie d'un modèle ML en production et découvrirez comment les ingénieurs ML travaillent dans la vie réelle.
Introduction à l'apprentissage profond
Bases de l’ingénierie des données
Chapitres supplémentaires sur Python et ML
Évaluation économique des effets et développement du MVP
Du ML à la production
Étude approfondie du développement du ML et projet de fin d'études sur un sujet choisi
Suivre CV - ingénieur
Sur la piste CV, vous apprendrez à résoudre des problèmes de vision par ordinateur tels que la classification d'images, segmentation et détection, génération et stylisation d'images, restauration et amélioration de la qualité photographies. De plus, vous apprendrez à déployer des réseaux de neurones en production.
Introduction à l'apprentissage profond
Bases de l’ingénierie des données
Chapitres supplémentaires sur Python et ML
Évaluation économique des effets et développement du MVP
Du ML à la production
Étude approfondie du développement du ML et projet de fin d'études sur un sujet choisi
Piste PNL - ingénieur
Lors de la formation du parcours PNL, vous apprendrez à résoudre les principaux problèmes de traitement du langage naturel, en y compris la classification, le résumé et la génération de texte, la traduction automatique et la création de dialogues systèmes
Introduction à l'apprentissage profond
Mathématiques des réseaux neuronaux pour la PNL
Matériel et logiciels pour résoudre les problèmes de PNL
Tâches et algorithmes PNL
Réseaux de neurones en production
Etude approfondie du développement de la PNL et projet de fin d'études sur un sujet choisi
Si vous choisissez la spécialisation CV ou ML, vous pouvez suivre gratuitement le cours PNL sans l'aide d'un mentor.
Apprentissage profond et réseaux de neurones
Où sont utilisés les réseaux de neurones? Comment entraîner un réseau de neurones? Qu’est-ce que l’apprentissage profond? Vous découvrirez les réponses à ces questions dans la section bonus de DL.
Introduction à l'ingénierie des données
Vous apprendrez la différence entre les rôles d'un data scientist et d'un data Engineer, quels outils ce dernier utilise dans son travail et quelles tâches il résout au quotidien. Les mots « flocon de neige », « étoile » et « lac » prendront de nouvelles significations :)