Cours « Spécialiste de la science des données » - cours 112 000 roubles. de Yandex Workshop, formation 8 mois, date 30 novembre 2023.
Miscellanea / / November 28, 2023
Que font les Data Scientists ?
Analysez de grandes quantités de données, développez des modèles et appliquez l'apprentissage automatique pour faire des prédictions et identifier des modèles. Ils sont nécessaires dans divers domaines où il est nécessaire de stocker et de traiter des données.
Dans les banques
Analyser les données sur les clients et déterminer quels indicateurs affectent leur solvabilité, prédire la probabilité que le client quitte la banque
Dans l'industrie
Grâce à l’apprentissage automatique, ils prédisent quand l’équipement tombera en panne et dans quels gisements l’exploitation minière apportera le plus grand profit.
En marketing et commerce
Ils aident à trouver des points de croissance en analysant la saisonnalité, les jours de pointe des ventes et créent un système de recommandation
Dans le secteur des transports
Optimiser le fonctionnement des feux de circulation, évaluer la charge sur les routes et aider à ajuster les plans de réparation
Programme de cours complet en Data Science
Nous le mettons régulièrement à jour pour nous assurer qu’il répond aux besoins de l’industrie et des employeurs. En d’autres termes, vous apprenez uniquement ce qui sera certainement utile dans votre travail.
Bases de Python et de l'analyse de données: cours d'introduction gratuit :
Apprenez les concepts de base de l’analyse des données et comprenez ce que font les analystes de données et les data scientists. Résolvez cinq cas de travail avec des données de différents domaines :
- découvrir la raison de la panne massive des gadgets,
- vérifier le retour sur investissement de la publicité sur les applications mobiles,
- trouver le meilleur emplacement pour un nouveau magasin,
- vous aider à choisir une stratégie de développement pour une startup IA,
- évaluer l'efficacité des robots dans le service support.
En résolvant des cas, vous apprendrez les bases de Python et de la bibliothèque pandas, apprendrez à construire des graphiques et à les interpréter correctement.
Introduction au métier de « Data Science Specialist »
Qu'est-ce qu'un spécialiste de la science des données?
Comment nous enseignons.
Python de base :
Plongez plus profondément dans le langage de programmation Python et la bibliothèque pandas.
+1 projet en portefeuille
Comparez les données utilisateur Yandex. Musique par ville et jour de la semaine.
Prétraitement des données :
Apprenez à nettoyer les données des valeurs aberrantes, des omissions et des doublons, ainsi qu'à convertir différents formats de données.
+1 projet en portefeuille
Analysez les données sur les clients de la banque et déterminez la part des clients solvables.
L'analyse exploratoire des données:
Apprenez les bases des probabilités et des statistiques. Utilisez-les pour explorer les propriétés de base des données, en recherchant des modèles, des distributions et des anomalies. Apprenez à connaître les bibliothèques scipy et matplotlib. Dessinez des diagrammes et entraînez-vous à analyser des graphiques.
+1 projet en portefeuille
Explorez les archives des annonces de vente de biens immobiliers à Saint-Pétersbourg et dans la région de Léningrad.
Théorie des probabilités. Cours supplémentaire
Mémoriser ou reconnaître les termes de base de la théorie des probabilités: événements indépendants, opposés, incompatibles, etc. À l’aide d’exemples simples et de problèmes amusants, vous vous entraînerez à travailler avec des chiffres et à construire la logique des solutions.
Il s'agit d'un sprint facultatif. Cela signifie que chaque étudiant choisit lui-même l'une des options :
- Suivez un cours supplémentaire de dix courtes leçons, révisez la théorie et résolvez des problèmes.
- Ouvrez uniquement le bloc avec les tâches d'entretien, rappelez-vous la pratique sans théorie.
- Sautez complètement le cours ou revenez-y lorsque vous en avez le temps et le besoin.
Projet final du premier module
Apprenez à mener des recherches de données préliminaires et à formuler et tester des hypothèses.
+1 projet en portefeuille
Trouvez des modèles qui déterminent le succès du jeu.
Introduction à l'apprentissage automatique :
Maîtrisez les concepts de base de l’apprentissage automatique. Apprenez à connaître la bibliothèque Scikit-Learn et utilisez-la pour créer votre premier projet d'apprentissage automatique.
+1 projet en portefeuille
Développer un système de recommandation tarifaire pour un opérateur mobile.
Formation tutorée :
Plongez plus profondément dans le domaine le plus en vogue de l’apprentissage automatique: l’apprentissage supervisé. Apprenez à gérer les données déséquilibrées.
+1 projet en portefeuille
Prédisez la probabilité qu’un client quitte la banque.
L'apprentissage automatique en entreprise :
Découvrez comment l'apprentissage automatique (abbr. MO) aide l'entreprise sur la manière de collecter des données et sur la manière dont les métriques des produits sont liées aux métriques MO. Apprenez à lancer de nouvelles fonctionnalités de service à l'aide de ML. Découvrez ce que sont les indicateurs commerciaux, les KPI et les tests A/B.
+1 projet en portefeuille
Former un modèle qui permet d'identifier un nouvel emplacement pour la production pétrolière avec le moins de risque de perte.
Projet final du deuxième module :
Préparez les données pour l’apprentissage automatique. À l'aide du modèle, évaluez sa qualité.
+1 projet en portefeuille
Simulez le processus de fusion du minerai d'or pour améliorer le fonctionnement de l'entreprise.
Algèbre linéaire:
Jetez un œil à certains des algorithmes que vous avez appris jusqu’à présent et comprenez mieux comment les utiliser. En pratique, maîtrisez de A à Z les principaux concepts de l'algèbre linéaire: espaces linéaires, opérateurs linéaires, espaces euclidiens.
+1 projet en portefeuille
Utilisez la méthode de conversion des données pour protéger les informations personnelles des clients des compagnies d’assurance.
Méthodes numériques:
Vous analyserez un certain nombre d'algorithmes et les adapterez pour résoudre des problèmes pratiques à l'aide de méthodes numériques. Maîtrisez les calculs approximatifs, les estimations de complexité des algorithmes et la descente de gradient. Découvrez comment les réseaux de neurones sont formés et ce qu'est l'augmentation de gradient.
+1 projet en portefeuille
Développer un modèle pour déterminer le coût d’une voiture d’occasion.
Des séries chronologiques:
Les séries chronologiques décrivent comment des paramètres, tels que la consommation d’électricité ou le nombre de commandes de taxi, évoluent au fil du temps. Vous apprendrez à analyser des séries, à rechercher des tendances et à identifier la saisonnalité. Apprenez à créer des données tabulaires et un problème de régression de séries chronologiques.
+1 projet en portefeuille
Créez un modèle et prédisez les charges de pointe des taxis.
Apprentissage automatique pour les textes :
Apprenez à créer des vecteurs numériques à partir de textes et à résoudre des problèmes de classification et de régression pour ceux-ci. Découvrez comment les fonctionnalités TF-IDF sont calculées et familiarisez-vous avec les représentations en langage word2vec et BERT.
+1 projet en portefeuille
Accélérez la modération des commentaires dans votre communauté en automatisant les évaluations de toxicité.
SQL de base :
Apprenez les bases du langage de requête SQL et de l'algèbre relationnelle pour travailler avec des bases de données. Familiarisez-vous avec les fonctionnalités de travail dans PostgreSQL, un système de gestion de base de données populaire (abbr. SGBD). Apprenez à écrire des requêtes de différents niveaux de complexité et à traduire les problèmes métier en SQL.
Vous travaillerez avec une base de données d'une boutique en ligne spécialisée dans les films et la musique.
+1 projet en portefeuille
Écrivez une série de requêtes de complexité variable dans une base de données qui stocke des données sur les investisseurs en capital-risque, les startups et les investissements dans celles-ci.
Vision par ordinateur:
Apprenez à résoudre des problèmes simples de vision par ordinateur à l'aide de réseaux de neurones prêts à l'emploi et de la bibliothèque Keras. Apprenez à connaître l'apprentissage profond.
+1 projet en portefeuille
Construisez un modèle pour déterminer l’âge approximatif d’une personne à partir d’une photographie.
Apprentissage non supervisé :
L'apprentissage non supervisé est l'une des méthodes d'apprentissage automatique dans laquelle le système résout un problème sans données pré-étiquetées en fonction de ses caractéristiques et de sa structure. Découvrez les problèmes de clustering et de détection d’anomalies.
Projet de diplôme:
Dans le dernier projet, confirmez que vous maîtrisez un nouveau métier. Clarifiez la tâche du client et passez par toutes les étapes d’analyse des données et d’apprentissage automatique. Maintenant, il n'y a plus de cours ni de devoirs - tout se passe comme dans un vrai travail.
+1 projet en portefeuille
Projet au choix :
- Construire un modèle qui prédit le taux de désabonnement des clients d'une entreprise de télécommunications.
- Construire un modèle qui prédit les paramètres du processus technologique dans une usine métallurgique.
D
daryamanannikova
01.10.2020 G.
Exemple de cours en ligne idéaux
Dans Yandex. Pendant l'atelier, j'étudie le métier de DataScience, une direction assez à la mode maintenant, et il s'est avéré qu'il est assez difficile, comme on dit, difficile à apprendre - facile à combattre. (adsbygoogle = window.adsbygoogle || []).push({}); J'ai eu beaucoup de difficultés sur mon chemin, je n'avais pas assez de temps (je passais mon diplôme et je travaillais), la force de comprendre les statistiques me quittait périodiquement, le coronavirus nous enfermait tous à la maison...
S
sergen355
14.07.2021 G.
Un beau projet pédagogique
Avantages: propre simulateur, revues de projets, consultations, communauté dans Slack, aide sur chaque problème. Inconvénients: le seul point négatif est que dans certains sujets, il n'y a pas de matériel complet dans le simulateur, du temps supplémentaire est nécessaire pour rechercher des informations de manière indépendante. J'ai étudié à la Faculté de science des données. Bon format de formation. Certains entrent, d’autres non. Mais pour moi, c'est le maximum...