Outils et Technologies Big Data : Hadoop, Spark
Durée: 0 h 30 min
Nombre de leçons: 17
Rubrique: Ingénieur IA
1. Introduction à Hadoop
1.1. Qu'est-ce que Hadoop et pourquoi est-il utilisé ?
1.2. Composants principaux de Hadoop : HDFS, MapReduce, YARN
1.3. Installation et configuration de base de Hadoop
2. Utilisation avancée de Hadoop
2.1. Gestion des grands ensembles de données avec HDFS
2.2. Optimisation des tâches MapReduce
3. Introduction à Spark
3.1. Différences et avantages de Spark par rapport à Hadoop
3.2. Architecture et écosystème de Spark
4. Fonctionnalités clés de Spark
4.1. RDD (Resilient Distributed Datasets) : création et opérations
4.2. Spark SQL pour le traitement des données structurées
4.3. Spark Streaming pour le traitement en temps réel
5. Cas pratiques et études de cas
5.1. Applications industrielles de Hadoop et Spark
5.2. Exemples d'optimisation de performance avec Spark