Este documento describe cómo usar Hadoop para construir un buscador vertical escalable. Explica que Hadoop permite reprocesar periódicamente todos los datos de los feeds para actualizar el índice de búsqueda de forma más eficiente que hacer actualizaciones individuales. Describe la arquitectura propuesta que incluye módulos para obtener los feeds, procesarlos, indexarlos en Solr y reconciliar cambios entre ejecuciones.
Related topics: