Este documento discute a indexação distribuída usando Apache Hadoop. Descreve o Apache Lucene para indexação e pesquisa de texto, e o Hadoop e seu HDFS para armazenamento distribuído de dados e processamento MapReduce. Vários métodos para implementar Lucene distribuído em Hadoop são apresentados, incluindo abordagens baseadas em master-slave e MapReduce.