Este documento describe la arquitectura de Hadoop, incluyendo HDFS para almacenamiento, YARN para gestión de recursos y MapReduce para procesamiento de datos. Explica cómo funcionan estas tecnologías de forma distribuida a gran escala y también introduce herramientas como Pig y Hive que permiten analizar datos a un nivel más alto.