Ce document présente Hive, un entrepôt de données basé sur Hadoop, conçu pour faciliter la manipulation de grandes quantités de données au moyen de requêtes SQL. Il décrit son architecture, incluant des composants comme le metastore, le driver, et les opérations sur les tables, telles que la création, la gestion des partitions et des buckets. Hive permet de gérer des données stockées dans HDFS avec des métadonnées décrivant leurs agencements et supporte divers types de données, incluant des types primitives et complexes.