Approches modernes de la gestion des données - cours 27 900 RUB. du Centre de Formation IBS, formation 16 heures, Date 26 novembre 2023.
Miscellanea / / December 02, 2023
Lors de la conception d’applications, l’une des décisions importantes concerne le stockage des données. Pendant plusieurs décennies, les SGBD relationnels étaient la première et la seule option; les projets ne différaient que par le degré de normalisation, l'emplacement de la logique métier, etc. Les derniers dix à quinze ans, les systèmes alternatifs ont prospéré rapidement - des SGBD orientés objet et orientés document aux systèmes de fichiers distribués et aux systèmes de traitement de flux données. Le cours examine une gamme de solutions modernes permettant un stockage sécurisé à long terme des données, raisons de l'émergence de solutions de différentes classes, leurs avantages, inconvénients et méthodes préférées utiliser.
Sujets couverts:
1. Evolution des approches de stockage de données (théorie – 2 heures).
Bases de données, entrepôts de données, moteurs de bases de données, architectures massivement parallèles, hyperconvergence.
2. Modèle relationnel (théorie – 2 heures).
Quels problèmes résout-il et à quel prix ?
Réplication, partitionnement, transactions distribuées.
3. Modèle de valeur clé minimale (théorie – 1 heure, pratique – 1 heure).
Options de structure clé, options de structure de valeur, interfaces logicielles.
Efficacité d'utilisation des bases de données non relationnelles: conditions nécessaires et suffisantes [Cassandra, HBase].
4. Modèle orienté document [MongoDB] (théorie – 0,5 heure, pratique – 0,5 heure).
5. Systèmes de fichiers distribués au lieu de modèles de données: architecture de cluster [HDFS] (théorie - 1 heure, pratique - 1 heure).
6. SQL sur les systèmes de fichiers distribués (théorie – 1 heure, pratique – 2 heures).
Options d'architecture, formats de fichiers, restrictions, transactions [Hive, Spark, Spark SQL, Parquet, ORC].
7. Systèmes de stockage de données distribués en RAM [Hazelcast, Ignite, Tarantool] (théorie – 1 heure).
8. Systèmes OLAP distribués [Clickhouse, Druid] (théorie – 1 heure).
9. Traitement des flux de données [Spark Streaming] (théorie – 1 heure).
10. Bases de données autoconfigurables et autonomes (théorie – 1 heure).