Machine learning sur le big data - cours gratuit d'Open Education, formation 5 semaines, de 5 à 14 heures par semaine, Date: 3 décembre 2023.
Miscellanea / / December 08, 2023
Poste: Architecte de solutions participatives, Neatsy, Inc.
A commencé à travailler à la Higher School of Economics en 2017. Elle donne des cours sur l'alphabétisation numérique, l'analyse de texte ainsi que sur les outils et techniques permettant de travailler avec de grandes quantités d'informations textuelles. Intérêts professionnels: analyse big data Formation 2018 Licence: Ecole Supérieure d'Economie de l'Université Nationale de Recherche, spécialité « Mathématiques Appliquées et Informatique »
1. Préparation des données pour la formation
Aujourd’hui, l’apprentissage automatique fonctionne efficacement lorsque nous disposons de grandes quantités de données étiquetées. Cette semaine, nous examinerons quels formats de données et balisages existent et comment ce balisage peut être collecté.
2. Entraîner des modèles classiques sur le big data
Cette semaine, nous apprendrons à entraîner des algorithmes classiques (modèles linéaires et arbres de décision) sur le big data.
3. Création de systèmes de recommandation
Nous verrons comment paralléliser les algorithmes classiques utilisés dans les systèmes de recommandation.
4. Analyse de grands volumes d'informations textuelles
Considérons les problèmes d'apprentissage automatique sur les textes. Parlons du prétraitement du texte et de la manière d'obtenir une représentation structurée des données texte à l'aide de modèles tels que word2vec et BERT.
5. Entraîner des réseaux de neurones profonds
Nous apprendrons comment paralléliser la formation des réseaux de neurones modernes, comment Horovod et Parameter Server fonctionnent à l'intérieur, et parlerons de Transfer Learning.