Apprentissage automatique. Professionnel - cours gratuit d'Otus, formation 5 mois, Date: 2 décembre 2023.
Miscellanea / / December 05, 2023
Vous maîtriserez systématiquement les outils modernes d’analyse de données et serez capable de créer des modèles d’apprentissage automatique à un niveau professionnel. Pour consolider vos compétences avec chaque algorithme, vous réaliserez un pipeline complet de travail depuis la préparation de l'ensemble de données jusqu'à l'analyse des résultats et la préparation de la production. La pratique et les connaissances que vous recevrez seront suffisantes pour résoudre de manière indépendante des problèmes de ML classiques et postuler à des postes Junior+ et Middle Data Scientist.
Projets de portefeuille
Au cours du cours, vous réaliserez plusieurs projets de portfolio et apprendrez à présenter avec compétence les résultats de votre travail afin de passer des entretiens. Pour votre projet final, vous pouvez choisir l'une des options proposées par le professeur ou mettre en œuvre votre propre idée.
A qui est destiné ce cours?
Pour les analystes débutants et les Data Scientists. Le cours vous aidera à systématiser et à approfondir vos connaissances. Vous pourrez expérimenter des approches, analyser des cas de travail et recevoir des retours d'experts de haute qualité.
Pour les développeurs et spécialistes d’autres domaines qui souhaitent changer de métier et évoluer dans le domaine de la Data Science. Le cours vous donnera l'opportunité de constituer un portefeuille solide et de vous immerger dans l'atmosphère des tâches réelles en tant que data scientist.
Pour apprendre, vous aurez besoin d'une expérience Python au niveau de l'écriture de vos propres fonctions, ainsi que de connaissances en analyse mathématique, en algèbre linéaire, en théorie des probabilités et en mathématiques. statistiques.
Caractéristiques du cours
Meilleures pratiques et tendances. À chaque lancement, le programme est mis à jour pour refléter l'évolution rapide des tendances en matière de science des données. Après la formation, vous pourrez immédiatement commencer à travailler sur de vrais projets.
Compétences secondaires importantes. Le cours comprend des sujets généralement négligés, mais nécessaires pour un spécialiste des tâches quotidiennes et très appréciés par les employeurs :
— construire des systèmes de recherche automatique d'anomalies ;
— prévoir des séries chronologiques à l'aide de l'apprentissage automatique ;
— des pipelines de bout en bout pour travailler avec des données, prêts à être mis en œuvre en production.
Ambiance créative et conditions proches des processus de travail réels. L'ensemble du cours est construit comme un simulateur de la vie professionnelle quotidienne d'un data scientist, où vous devrez faire face à données « sales », calculez vos actions à l'avance, expérimentez des solutions et préparez des modèles en production Dans ce cas, vous aurez besoin de curiosité, de persévérance et d’une soif de nouvelles expériences.
3
coursTravaille en tant qu'analyste de données dans l'équipe AGI NLP de la Sberbank. Travaille sur les modèles de langage de réseaux neuronaux et leur application à des problèmes réels. Estime que travailler dans le domaine de la science des données offre une expérience unique...
Travaille en tant qu'analyste de données dans l'équipe AGI NLP de la Sberbank. Travaille sur les modèles de langage de réseaux neuronaux et leur application à des problèmes réels. Il pense que travailler dans le domaine de la science des données offre une opportunité unique de réaliser des choses folles et cool à la pointe de la science qui changent le monde ici et maintenant. Enseigne les matières liées à l'analyse des données, à l'apprentissage automatique et à la science des données à la Higher School of Economics. Maria est diplômée de la Faculté de mécanique et de mathématiques de l'Université d'État de Moscou et de l'École d'analyse de données Yandex. Maria est actuellement étudiante diplômée à l'École supérieure d'économie de la Faculté d'informatique. Ses intérêts de recherche incluent les domaines de la science des données tels que le traitement du langage naturel et la modélisation thématique. Gestionnaire de programme
3
coursPratique du machine learning et de l'analyse de données depuis 2012. Travaille actuellement en tant que responsable R&D chez WeatherWell. Possède de l'expérience dans l'application pratique de l'apprentissage automatique dans le développement de jeux, les opérations bancaires et...
Pratique du machine learning et de l'analyse de données depuis 2012. Travaille actuellement en tant que responsable R&D chez WeatherWell. Possède de l'expérience dans l'application pratique de l'apprentissage automatique dans le développement de jeux, la banque et les technologies de la santé. Il a enseigné l'apprentissage automatique et l'analyse de données au Centre de finance mathématique de l'Université d'État de Moscou et a été conférencier invité à la Faculté d'informatique de l'École supérieure d'économie de l'Université nationale de recherche et dans diverses écoles d'été. Formation: Economie-mathématiques REU im. Plekhanov, Faculté centrale de mathématiques et de mathématiques de l'Université d'État de Moscou, formation professionnelle avancée de la Faculté d'informatique de l'École supérieure d'économie "Analyse pratique des données et apprentissage automatique", MSc Computer Science Aalto Pile universitaire/Intérêts: Python, Machine Learning, Séries temporelles, Détection d'anomalies, Open Data, ML pour les réseaux sociaux bien
Techniques avancées d’apprentissage automatique
-Thème 1. Leçon d'introduction. Revisitez les concepts de base du machine learning avec un exemple pratique
-Thème 2.Arbres de décision
-Thème 3.Python pour ML: pipelines, accélération pandas, multitraitement
-Thème 4.Ensembles modèles
-Sujet 5.Amplification des dégradés
-Sujet 6. Machine à vecteurs de support
-Thème 7. Méthodes de réduction de dimensionnalité
-Thème 8. Apprendre sans professeur. K-moyennes, algorithme EM
-Thème 9. Apprendre sans professeur. Classification hiérarchique. Analyse de base de données
-Thème 10. Trouver des anomalies dans les données
-Thème 11. Leçon pratique - Construction de pipelines de bout en bout et sérialisation de modèles
-Thème 12.Algorithmes sur graphiques
Collecte de données. Analyse des données textuelles.
-Thème 13. Collecte de données
-Thème 14.Analyse des données textuelles. Partie 1: Prétraitement et tokenisation
-Thème 15.Analyse des données textuelles. Partie 2: Représentations vectorielles de mots, travaillant avec des intégrations pré-entraînées
-Thème 16.Analyse des données textuelles. Partie 3: Reconnaissance des entités nommées
-Thème 17.Analyse des données textuelles. Partie 4: Modélisation de sujets
-Sujet 18.Q&A
Analyse des séries chronologiques
-Thème 19. Analyse des séries chronologiques. Partie 1: Énoncé du problème, méthodes les plus simples. Modèle ARIMA
-Thème 20. Analyse des séries chronologiques. Partie 2: Extraction de fonctionnalités et application de modèles d'apprentissage automatique. Prévisions automatiques
-Sujet 21. Analyse des séries chronologiques Partie 3: Regroupement de séries chronologiques (recherche de cotations boursières associées)
Systèmes de recommandation
-Thème 22. Systèmes de recommandation. Partie 1: Énoncé du problème, métriques de qualité. Filtrage collaboratif. Démarrage à froid
-Thème 23. Systèmes de recommandation. Partie 2: Filtrage de contenu, approches hybrides. Règles d'association
-Thème 24. Systèmes de recommandation. Partie 3: Rétroaction implicite
-Thème 25. Leçon pratique sur les systèmes de recommandation. Surprendre
-Sujet 26.Q&A
Sujets supplémentaires
-Thème 27. Formation Kaggle ML n°1
-Thème 28. Formation Kaggle ML n°2
-Sujet 29.ML dans Apache Spark
-Sujet 30.Recherche d'emplois en science des données
Travail de projet
-Thème 31. Sélection du sujet et organisation du travail du projet
-Thème 32. Consultation sur les projets et les devoirs
-Thème 33.Protection des travaux de conception