Data Science - cours gratuit de l'Ecole d'Analyse de Données, formation 4 semestres, date du 2 décembre 2023.
Miscellanea / / December 05, 2023
Pour ceux qui souhaitent poser des problèmes en utilisant l'analyse de données, proposer des solutions et évaluer leur efficacité non seulement dans une expérience synthétique, mais aussi en conditions réelles.
Statistiques, apprentissage automatique et travail avec différents types de données.
Les données sont à la base de la plupart des services et produits modernes, des applications de prévisions météorologiques aux voitures autonomes. Un Data Scientist mène des expérimentations, construit des métriques, sait optimiser le fonctionnement des services et comprend où se trouvent leurs points de croissance.
Chaque étudiant doit réussir au moins trois cours au cours du semestre. Par exemple, s'il y en a deux dans le programme principal, vous devez alors choisir l'un des cours spéciaux.
Les connaissances sont testées principalement par le biais de devoirs - les examens et les tests ne sont effectués que dans certaines matières.
Premier semestre
Obligatoire
Algorithmes et structures de données, partie 1
01.Complexité et modèles informatiques. Analyse des valeurs comptables (début)
02.Analyse des valeurs comptables (fin)
03.Algorithmes de tri par fusion et de tri rapide
04. Statistiques ordinales. Tas (début)
05. Tas (fin)
06. Hachage
07.Rechercher des arbres (début)
08.Rechercher des arbres (suite)
09.Rechercher des arbres (fin). Système d'ensembles disjoints
10. Tâches RMQ et ACV
11.Structures de données pour la recherche géométrique
12.Le problème de la connectivité dynamique dans un graphe non orienté
Langage Python
01.Bases de la langue (Partie 1)
02.Bases de la langue (partie 2)
03.Programmation orientée objet
04.Gestion des erreurs
05. Conception et tests du code
06. Travailler avec des chaînes
07.Modèle de mémoire
08Programmation fonctionnelle
09.Revue de la bibliothèque (partie 1)
10.Revue de la bibliothèque (partie 2)
11.Calcul parallèle en Python
12.Travail avancé avec des objets
Apprentissage automatique, partie 1
01.Concepts de base et exemples de problèmes appliqués
02.Méthodes de classification métrique
03.Méthodes de classification logique et arbres de décision
04.Méthodes de classification linéaire des gradients
05. Machine à vecteurs de support
06.Régression linéaire multivariée
07.Régression non linéaire et non paramétrique, fonctions de perte non standard
08.Prévisions de séries chronologiques
09.Méthodes de classification bayésienne
10.Régression logistique
11.Rechercher les règles de l'association
Deuxième mandat
Obligatoire
Fondamentaux des statistiques dans l'apprentissage automatique
01.Introduction
02.Principales tâches et méthodes de la théorie de l'inférence statistique
03. Estimation de la distribution et fonctionnelles statistiques
04.Simulation Monte Carlo, bootstrap
05.Estimation paramétrique
06. Test d'hypothèse
07. Réduire la dimensionnalité des données multidimensionnelles
08.Évaluer la sensibilité du modèle
09.Régression linéaire et logistique
10.Méthodes de conception des expériences
11.Divers types de régularisation en régression linéaire
12. Méthodes non linéaires pour construire des dépendances de régression
13.Estimation non paramétrique
14.Approche bayésienne de l’estimation
15.Approche bayésienne de la régression
16. Approche bayésienne de la régression et de l'optimisation
17.Utilisation du modèle de champ gaussien aléatoire dans les problèmes d'analyse de données
18.Utilisation de modèles et de méthodes statistiques dans les problèmes de modélisation de substitution et d'optimisation
Apprentissage automatique, partie 2
01.Méthodes de classification et de régression des réseaux neuronaux
02.Méthodes compositionnelles de classification et de régression
03.Critères de sélection des modèles et méthodes de sélection des fonctionnalités
04.Classement
05.Apprentissage par renforcement
06.Apprendre sans professeur
07.Problèmes avec une formation partielle
08. Filtrage collaboratif
09. Modélisation de sujets
Troisième semestre
Au choix
Traitement automatique du texte
01Support de cours
ou
Vision par ordinateur
Le cours est consacré aux méthodes et algorithmes de vision par ordinateur, c'est-à-dire extraire des informations à partir d’images et de vidéos. Regardons les bases du traitement d'images, de la classification d'images, de la recherche d'images par contenu, de la reconnaissance faciale, de la segmentation d'images. Nous parlerons ensuite des algorithmes de traitement et d’analyse vidéo. La dernière partie du cours est consacrée à la reconstruction 3D. Pour la plupart des problèmes, nous discuterons des modèles de réseaux neuronaux existants. Au cours du cours, nous essayons de prêter attention uniquement aux méthodes les plus modernes actuellement utilisées pour résoudre les problèmes pratiques et de recherche. Le cours est en grande partie pratique plutôt que théorique. Par conséquent, tous les cours sont équipés de travaux pratiques et de devoirs qui vous permettent d'essayer la plupart des méthodes discutées dans la pratique. Le travail est effectué en Python à l'aide de diverses bibliothèques.
01.Image numérique et correction tonale.
02.Bases du traitement d'image.
03.Combiner des images.
04. Classification des images et recherche d'images similaires.
05. Réseaux de neurones convolutifs pour la classification et la recherche d'images similaires.
06.Détection d'objet.
07. Segmentation sémantique.
08.Transfert de style et synthèse d’images.
09.Reconnaissance vidéo.
10.Reconstruction 3D clairsemée.
11. reconstruction tridimensionnelle Dense.
12.Reconstruction à partir d'une seule image et de nuages de points, modèles paramétriques.
Quatrième semestre
Cours spéciaux recommandés
L'apprentissage en profondeur
01.Matériel de cours
Apprentissage par renforcement
01.Matériel de cours
Voitures autonomes
Le cours couvre les composants essentiels de la technologie de conduite autonome: localisation, perception, prédiction, niveau comportemental et planification des mouvements. Pour chaque composante, les principales approches seront décrites. De plus, les étudiants se familiariseront avec les conditions actuelles du marché et les défis technologiques.
01.Aperçu des principaux composants et capteurs d'un véhicule sans pilote. Niveaux d'autonomie. Conduit par cable. Les voitures autonomes en tant que produit commercial. Moyens d'évaluer les progrès dans la création de drones. Bases de localisation: GNSS, odométrie des roues, filtres bayésiens.
02.Méthodes de localisation lidar: ICP, CND, LOAM. Introduction au SLAM visuel en utilisant ORB-SLAM comme exemple. Énoncé du problème GraphSLAM. Réduire le problème GraphSLAM à une méthode des moindres carrés non linéaires. Sélection du bon paramétrage. Systèmes avec une structure spéciale dans GraphSLAM. Approche architecturale: frontend et backend.
03. Tâche de reconnaissance dans une voiture autonome. Obstacles statiques et dynamiques. Capteurs pour le système de reconnaissance. Représentation d'obstacles statiques. Détection d'obstacles statiques par lidar (VSCAN, méthodes de réseaux de neurones). Utilisation du lidar en conjonction avec des images pour détecter des statiques (segmentation sémantique d'images, complétion en profondeur). Caméra stéréo et obtention de la profondeur d'une image. Monde Stixel.
04.Imaginer des obstacles dynamiques dans une voiture autonome. Méthodes de réseaux de neurones pour détecter des objets en 2D. Détection basée sur la vue à vol d'oiseau de la représentation des nuages lidar. Utilisation du lidar avec des images pour détecter les obstacles dynamiques. Détection de voitures en 3D à partir d'images (montage de caissons 3D, modèles CAO). Détection dynamique d'obstacles basée sur le radar. Suivi d'objets.
05. Modèles de conduite automobile: roue arrière, roue avant. Planification de trajectoire. Le concept d'espace de configuration. Méthodes graphiques pour construire des trajectoires. Trajectoires qui minimisent les à-coups. Méthodes d'optimisation pour la construction de trajectoires.
06.Planification de vitesse dans un environnement dynamique. Planification ST. Prédire le comportement des autres usagers de la route.