El documento presenta el desarrollo de un sistema web para el manejo de big data utilizando un clúster multinodo basado en Apache Spark y Hadoop, optimizando la consulta y análisis de grandes volúmenes de datos, específicamente de aeropuertos de EE. UU. Se detalla la arquitectura del sistema, que integra backend con Flask y frontend con AngularJS, permitiendo una aplicación escalable y replicable. Además, se discuten conceptos fundamentales de big data, como las 5 Vs, y se describen las metodologías de implementación del clúster y las herramientas utilizadas.