Le document présente une étude sur le traitement de données massives avec Hadoop dans le cadre du projet Sigma d'EDF R&D, soulignant l'importance croissante des données dans le secteur de l'énergie. Il traite des enjeux liés à la gestion de volumes massifs de données, en utilisant des exemples pratiques de traitement avec les outils Rhadoop et Mahout, notamment à travers la méthode k-means. En conclusion, bien que Hadoop offre une solution prometteuse avec des avantages tels que la tolérance aux pannes et la capacité de gestion des données non structurées, il souffre encore de limitations en termes de maturité industrielle et de disponibilité des compétences.