Ce document traite d'Apache Spark, en particulier des RDD (Resilient Distributed Datasets), en abordant leur définition, création, transformations et actions. Il met en avant les avantages de Spark par rapport à d'autres frameworks de big data, ainsi que les prérequis nécessaires pour sa mise en pratique. Le guide détaille également les divers composants de Spark et fournit des exemples d'opérations pour illustrer son utilisation en environnement distribué.