O documento discute o Hadoop, uma plataforma de software de código aberto para processamento de grandes volumes de dados. Apresenta suas principais características como sistema de arquivos distribuído HDFS, modelo de programação MapReduce e framework YARN para gerenciamento de recursos. Também descreve onde é usado na prática por empresas como Yahoo, Facebook e LinkedIn para análises de big data.