Документ описывает распределенный робот Frontera, предназначенный для обхода испанского интернета и сбора статистики о веб-узлах. В нем рассматриваются архитектурные решения, такие как использование Scrapy, Apache Kafka и HBase, а также описываются проблемы, связанные с обработкой большого объема данных. В заключение предоставлены планы на будущее и возможности для соавторства в проекте.