Документ представляет собой презентацию, посвящённую кластеризации поисковых запросов с использованием IPython и методов машинного обучения, таких как k-means и иерархическая кластеризация. Основное внимание уделяется процессу подготовки данных, включая лемматизацию и векторизацию ключевых слов с использованием библиотек scikit-learn и scipy. В качестве практического примера описывается применение кластеризации для анализа 130000 запросов новостного сайта для выявления популярных тем.
Related topics: