Текстовая аналитика Big Data для мобайл решений
и выявления трендов
SEO Conference 2016, Казань
Луценко Елена
РЫНОК BIG DATA И
ТЕКСТОВОЙ АНАЛИТИКИ
Рынок Big Data в мире
Wikibon Big Data Market and Forecast, 2011-2020
Тренды рынка текстовой аналитики
Источник: IDC Digital Universe Study & EMC, 2011
 Объем неструктурированных данных составляет 80-90% от всех данных.
68% неструктурированных данных сгенерированы потребителями
 Глобальный рынок продуктов текстовой аналитики должен составить
$13.4 млрд. к 2020 году при росте в 18.4% по CAGR. Текущая оценка
рынка - $5.8 млрд*
 Европейский рынок текстовой аналитики ожидает рост на 18.3% с 2014
до 2019 года, достигнув $1 223.9 млн к 2019 году. Основные игроки:
Microsoft, IBM, Oracle, SAS, SAP*
 61% ЛПР считают, что анализ неструктурированных (текстовых) данных
крайне важен для определения и корректировки стратегии бизнеса,
однако более половины ЛПР в компаниях используют лишь до 25%
доступной текстовой big data для анализа **
Тренды мирового рынка текстовой аналитики
* По оценке MarketsendMarkets & MicromarketMonitor 2015
** По оценке Forrester Report: Big Data Management Solutions Forecast 2016
 С 2012 года в России число компаний, не заинтересованных в текстовой
аналитике, снизилось с 35 до 18%. Число тех, кто уже использует,
выросло с 20% до 40%*
 70% респондентов в России считают, что анализ данных их компании
поможет принимать более взвешенные решения**
 31% респондентов сообщили, что их компании получили конкурентное
преимущество в результате внедрения технологий больших данных**
 Более половины (51%) респондентов согласны, что технологии анализа
больших данных сыграют решающую роль в выявлении и
предотвращении кибер-атак; это может оказаться решающим фактором,
так как только 67% респондентов в России уверены, что они смогут в
случае необходимости полностью восстановить все свои данные**
Тренды рынка текстовой аналитики в России
* По оценке SAS, 2016 (открытые источники)
** По оценке Dell EMC, 2013. Опрос 678 ИТ-руководителей российских предприятий
Источник: TCS Global Trend Study, 2013
Внешние VS Внутренние
Распределение данных
Структурированные VS
Неструктурированные
52% компаний из разных стран и
отраслей НЕ используют в полной
мере накапливаемые данные, либо
же вовсе «тонут» в объемах
неструктурированной
информации*
Потенциал для роста
* Согласно исследованию Information Generation, проведенному ЕМС и Institute for the Future
Степень удовлетворенности от
использования текстовой аналитики
Источник: Alta Plana, 2014
Очень низкая
Низкая
Нейтральная
Высокая
Очень высокая
КЕЙСЫ
Инструмент высокоскоростного извлечения
коммерчески полезных знаний и определения
тональности через текстовой анализ внутренних и
внешних коммуникаций компании
EurekaEngine для бизнеса
Инструмент извлечения коммерчески полезных знаний и
определения тональности через текстовой анализ внутренних и
внешних коммуникаций компании
 Текстовые сообщения (посты) social media:
Facebook, VK, Twitter, LinkedIn, Одноклассники
 Web-контент: сообщения форумов, отзывы, статьи
СМИ, блоги, чаты
 Внутренние документы: файлы Word, опросы,
почтовые сообщения, презентации, текстовые записи
разговоров (call-center), письменные обращения
клиентов
 Mobile: сообщения SMS, гео-объекты, чаты мобильных
игр, контент и описания приложений
ДАННЫЕ, которые анализирует EurekaEngine
ЗАДАЧА: аналитика информационного поля
бренда
ИНДУСТРИЯ: маркетинг, реклама, СМИ
МОДУЛИ: все лингвистические модули
РЕЗУЛЬТАТ:
 Лидеры рынка в real-time мониторинге
инфо-поля;
 Рост продаж засчет предложения
уникального продукта, разработанного
на основе технологии EurekaEngine;
 Высокая лояльность крупных
корпоративных клиентов;
 Снижение рисков в коммуникациях
клиентов;
 И др.
Brand Analytics занимают 1 место по качеству среди систем мониторинга соцмедиа в рейтинге TECH INDEX 2016 от AdIndex
ЗАДАЧА: рейтинг банков (аналитика
обсуждений соц-медиа 50 крупнейших
российских банков)
ИНДУСТРИЯ: банки
МОДУЛИ: SentiFinder (тональность)
РЕЗУЛЬТАТ (выявленные параметры):
• Лояльность потребителей к банкам;
• Лояльность к банковским
продуктам;
• Информационные всплески
обсуждений;
• Тренды и тенденции в банковском
секторе. Для создания рейтинга было проанализировано более 900 тыс
сообщений от 700 тыс уникальных авторов
ЗАДАЧА: составление актуального
рейтинга медиа-персон
ИНДУСТРИЯ: СМИ
МОДУЛИ: SentiFinder (определение
тональности)
РЕЗУЛЬТАТ:
• Рейтинг медиаперсон занимает
топовые позиции в интернет-
пространстве, повышенная
узнаваемость и авторитет СМИ;
• Долгосрочное сотрудничество (2
года)
ЗАДАЧА: выявление информационных
трендов по видам спорта на русском и
английском языках
ИНДУСТРИЯ: СМИ
МОДУЛИ: SentiFinder (тональность),
морфоанализатор
РЕЗУЛЬТАТ (выявляемые тренды):
 Популярные персоны и виды спорта:
определены среди лидеров роста в
рейтинге популярных слов;
 Пики количества обсуждений;
 Тональность обсуждений.
Ежедневный поток 1-2,5 млн сообщений.
ПРИМЕНЕНИЕ В МОБАЙЛ
Направления
Выявление
похожих
аудиторий и
приложений
(ДМП)
Встраивание в
чаты мобильных
игр и
управление
community
Анализ
структурированных
данных +
неструктурированных
Определение
характеристик
выгодных
клиентов
Тегирование
контента
мобайл
приложения
«Эмоциональное»
сегментирование
(вкл. по гео-
объектам)
Пример: продажи
 ПРОБЛЕМА: неожиданное снижение
продаж
 ЗАДАЧА: найти причину
 РЕШЕНИЕ: структурированные данные
не позволяют выявить контекст
проблемы в поведении пользователей.
Однако есть возможность
проанализировать записи и профайлы
клиентов. Совместив с анализом
структурированных данных, выявить
истинные причины и наиболее
выгодных для бизнеса (уже или
потенциально) клиентов/пользователей
Пример: чаты и community
 Анализ тональности сообщений и степени тональности (как по
объекту, так и безобъектно) позволяет выявлять лидеров
community, персонализировать общение, определять тренд развития
Пример: гео-локация по эмоциям
 Определение эмоционального состояния ЦА в определенной
локации для таргетированного предложения услуг/товаров и push-
уведомлений
Пример: тегирование контента
 Тегирование контента для создания новых продуктов и
направлений
Пример: дополнение к аналитическим
отчетам
 Максимально полный отчет: анализ структурированных
данных и неструктурированных, выявление взаимосвязей и
инсайтов
 Высокая скорость обработки потока документов (десятки
материалов в минуту)
 Качественные возможности анализа русскоязычных сообщений
 Возможность аналитики в режиме онлайн
 Как «коробочное», так и встраиваемое решение
 Обработка не только правильного «книжного» языка (СМИ,
внешний документооборот), но и сообщений социальных сетей,
форумов, блогов
Преимущества EurekaEngine
Уникальная скорость обработки данных – десятки миллионов
документов в сутки на одном сервере, возможно линейное
масштабирование
EurekaEngine
EurekaEngine – резидент Skolkovo 2016
DEMO EurekaEngine: http://eurekaengine.ru/ru/demo/
КОНТАКТЫ:
Луценко Елена
Руководитель по коммуникациям EurekaEngine.ru
lutsenko@palitrumlab.ru
+7 (916) 823 98 28

More Related Content

PDF
Белышева Ирина
PDF
СКАН для PR-специалистов
PPTX
Что такое работающий мониторинг
PPTX
Воронина А.В
PPT
Комплексные решения в области анализа информационного поля
PDF
О компании Медиалогия
PPT
Medialogia
PDF
Объем интернет-рекламы перевалит за миллиард
Белышева Ирина
СКАН для PR-специалистов
Что такое работающий мониторинг
Воронина А.В
Комплексные решения в области анализа информационного поля
О компании Медиалогия
Medialogia
Объем интернет-рекламы перевалит за миллиард

What's hot (18)

PPTX
Учет поведения, мобильности и яндекс.бандит (Optimization-16)Optimization16 t...
PPT
Алексей Волин. Министерство связи
PPT
Конкурентный анализ
PDF
Дата расследования в России.
PDF
Evgeny Popov 21.11.13 Custom
PDF
ADFOX Russian RTB market in 2013 Overview
PPT
Promotion of telecom websites
PDF
Стенина Наталья, Pr news
PDF
PPTX
Аналитика для трафиковых проектов (РИФ 2016)
PPT
Movebо Foxsmart SEO 24/7
PPTX
"Современное SEO" и "Многорукие бандиты", Optimization 2015
PDF
Как делать аудиторные закупки без OpenRTB
PDF
13mar.2.2 -petrova
PPTX
Mobile applications market
PDF
Анализ медиа-активности банков Украины
PDF
Rif13.18apr s34--mizdrikov
PDF
Особенности российского рынка PR-услуг: структура, динамика, специализация 2015
Учет поведения, мобильности и яндекс.бандит (Optimization-16)Optimization16 t...
Алексей Волин. Министерство связи
Конкурентный анализ
Дата расследования в России.
Evgeny Popov 21.11.13 Custom
ADFOX Russian RTB market in 2013 Overview
Promotion of telecom websites
Стенина Наталья, Pr news
Аналитика для трафиковых проектов (РИФ 2016)
Movebо Foxsmart SEO 24/7
"Современное SEO" и "Многорукие бандиты", Optimization 2015
Как делать аудиторные закупки без OpenRTB
13mar.2.2 -petrova
Mobile applications market
Анализ медиа-активности банков Украины
Rif13.18apr s34--mizdrikov
Особенности российского рынка PR-услуг: структура, динамика, специализация 2015
Ad

Similar to Луценко - Big Data в рекламе (20)

PDF
Богдан Хомів "Автоматичний аналіз тексту в соц-медіа. Міфи. Технології. Кейси...
PDF
Черный Василий
PDF
Анализируй это. Тренды Big Data (Серебряный Меркурий 2017)
PDF
Исследование восприятия брендов в соцмедиа
PPTX
Графовый Грааль - в заочный ФРИИ (10.09.2014)
PPTX
Графовый Грааль - Южный ИТ-парк 2015
PDF
Аналитический обзор рынка Больших Данных от IPOboard
PPTX
Brands.i look v5-n6
PPTX
зао «эвентос»
PPTX
Brand Analytics
PPT
Semantic forse presentation
PDF
Arutyunyan Gayane. Big data and socialmedia
PPTX
Brand Analytics
PPTX
Brands.i look iteco
PPT
Brandanalytics1 120920095519-phpapp02
PPTX
Brands.i look v5-n4
PDF
Oracle Big Data. Обзор технологий
PDF
РИФ 2016, Предикативная аналитика
PDF
Choister
PDF
Choister
Богдан Хомів "Автоматичний аналіз тексту в соц-медіа. Міфи. Технології. Кейси...
Черный Василий
Анализируй это. Тренды Big Data (Серебряный Меркурий 2017)
Исследование восприятия брендов в соцмедиа
Графовый Грааль - в заочный ФРИИ (10.09.2014)
Графовый Грааль - Южный ИТ-парк 2015
Аналитический обзор рынка Больших Данных от IPOboard
Brands.i look v5-n6
зао «эвентос»
Brand Analytics
Semantic forse presentation
Arutyunyan Gayane. Big data and socialmedia
Brand Analytics
Brands.i look iteco
Brandanalytics1 120920095519-phpapp02
Brands.i look v5-n4
Oracle Big Data. Обзор технологий
РИФ 2016, Предикативная аналитика
Choister
Choister
Ad

More from SEO Conference (20)

PDF
Лукашов - Успешная работа с You tube
PDF
Шкляр - Создание и монетизация сайтов под США и РФ
PDF
Шахов - Как конкуренты могут повредить вашему SEO
PDF
Чечукевич - Поисковый маркетинг
PPTX
Хизова - Стратегия рекламных кампаний: CPO/CPA или большой охват
PPTX
Харев - Поисковая оптимизация медиапроектов
PPTX
Токуров - Facebook Instant Articles & Google AMP: что это и зачем онлайн-изда...
PDF
Стаин - Лучшие кейсы и практики монетизации мобильноготрафика
PDF
Русаков - Агентство по продвижению или in-house специалист (отдел)
PDF
Рвачев - Стратегия закупки мобильной Facebook&Instagram рекламы с оптимизацие...
PDF
Оганисян - Правильный старт в сфере Mobile
PPTX
Морозов - Поведенческие факторы 7.0
PDF
Куваев - Mobile Programmatic
PPTX
Кравченко - Партизанский маркетинг
PDF
Инсаров - Использование мобильных приложений для оказания массовых услуг насе...
PDF
Земсков - Как обеспечить безопасность клиентских сайтов в процессе оказания у...
PPTX
Губерман - SEO сайта медицинской тематики
PPTX
Вязовская - Мобильное приложение, как канал привлечения новых клиентов
PPTX
Васильев Семен - SEO в мире новостей
PDF
Васильев Дмитрий - Гибридный интернет-магазин
Лукашов - Успешная работа с You tube
Шкляр - Создание и монетизация сайтов под США и РФ
Шахов - Как конкуренты могут повредить вашему SEO
Чечукевич - Поисковый маркетинг
Хизова - Стратегия рекламных кампаний: CPO/CPA или большой охват
Харев - Поисковая оптимизация медиапроектов
Токуров - Facebook Instant Articles & Google AMP: что это и зачем онлайн-изда...
Стаин - Лучшие кейсы и практики монетизации мобильноготрафика
Русаков - Агентство по продвижению или in-house специалист (отдел)
Рвачев - Стратегия закупки мобильной Facebook&Instagram рекламы с оптимизацие...
Оганисян - Правильный старт в сфере Mobile
Морозов - Поведенческие факторы 7.0
Куваев - Mobile Programmatic
Кравченко - Партизанский маркетинг
Инсаров - Использование мобильных приложений для оказания массовых услуг насе...
Земсков - Как обеспечить безопасность клиентских сайтов в процессе оказания у...
Губерман - SEO сайта медицинской тематики
Вязовская - Мобильное приложение, как канал привлечения новых клиентов
Васильев Семен - SEO в мире новостей
Васильев Дмитрий - Гибридный интернет-магазин

Луценко - Big Data в рекламе

  • 1. Текстовая аналитика Big Data для мобайл решений и выявления трендов SEO Conference 2016, Казань Луценко Елена
  • 2. РЫНОК BIG DATA И ТЕКСТОВОЙ АНАЛИТИКИ
  • 3. Рынок Big Data в мире Wikibon Big Data Market and Forecast, 2011-2020
  • 4. Тренды рынка текстовой аналитики Источник: IDC Digital Universe Study & EMC, 2011  Объем неструктурированных данных составляет 80-90% от всех данных. 68% неструктурированных данных сгенерированы потребителями
  • 5.  Глобальный рынок продуктов текстовой аналитики должен составить $13.4 млрд. к 2020 году при росте в 18.4% по CAGR. Текущая оценка рынка - $5.8 млрд*  Европейский рынок текстовой аналитики ожидает рост на 18.3% с 2014 до 2019 года, достигнув $1 223.9 млн к 2019 году. Основные игроки: Microsoft, IBM, Oracle, SAS, SAP*  61% ЛПР считают, что анализ неструктурированных (текстовых) данных крайне важен для определения и корректировки стратегии бизнеса, однако более половины ЛПР в компаниях используют лишь до 25% доступной текстовой big data для анализа ** Тренды мирового рынка текстовой аналитики * По оценке MarketsendMarkets & MicromarketMonitor 2015 ** По оценке Forrester Report: Big Data Management Solutions Forecast 2016
  • 6.  С 2012 года в России число компаний, не заинтересованных в текстовой аналитике, снизилось с 35 до 18%. Число тех, кто уже использует, выросло с 20% до 40%*  70% респондентов в России считают, что анализ данных их компании поможет принимать более взвешенные решения**  31% респондентов сообщили, что их компании получили конкурентное преимущество в результате внедрения технологий больших данных**  Более половины (51%) респондентов согласны, что технологии анализа больших данных сыграют решающую роль в выявлении и предотвращении кибер-атак; это может оказаться решающим фактором, так как только 67% респондентов в России уверены, что они смогут в случае необходимости полностью восстановить все свои данные** Тренды рынка текстовой аналитики в России * По оценке SAS, 2016 (открытые источники) ** По оценке Dell EMC, 2013. Опрос 678 ИТ-руководителей российских предприятий
  • 7. Источник: TCS Global Trend Study, 2013 Внешние VS Внутренние Распределение данных Структурированные VS Неструктурированные
  • 8. 52% компаний из разных стран и отраслей НЕ используют в полной мере накапливаемые данные, либо же вовсе «тонут» в объемах неструктурированной информации* Потенциал для роста * Согласно исследованию Information Generation, проведенному ЕМС и Institute for the Future
  • 9. Степень удовлетворенности от использования текстовой аналитики Источник: Alta Plana, 2014 Очень низкая Низкая Нейтральная Высокая Очень высокая
  • 11. Инструмент высокоскоростного извлечения коммерчески полезных знаний и определения тональности через текстовой анализ внутренних и внешних коммуникаций компании
  • 12. EurekaEngine для бизнеса Инструмент извлечения коммерчески полезных знаний и определения тональности через текстовой анализ внутренних и внешних коммуникаций компании  Текстовые сообщения (посты) social media: Facebook, VK, Twitter, LinkedIn, Одноклассники  Web-контент: сообщения форумов, отзывы, статьи СМИ, блоги, чаты  Внутренние документы: файлы Word, опросы, почтовые сообщения, презентации, текстовые записи разговоров (call-center), письменные обращения клиентов  Mobile: сообщения SMS, гео-объекты, чаты мобильных игр, контент и описания приложений ДАННЫЕ, которые анализирует EurekaEngine
  • 13. ЗАДАЧА: аналитика информационного поля бренда ИНДУСТРИЯ: маркетинг, реклама, СМИ МОДУЛИ: все лингвистические модули РЕЗУЛЬТАТ:  Лидеры рынка в real-time мониторинге инфо-поля;  Рост продаж засчет предложения уникального продукта, разработанного на основе технологии EurekaEngine;  Высокая лояльность крупных корпоративных клиентов;  Снижение рисков в коммуникациях клиентов;  И др. Brand Analytics занимают 1 место по качеству среди систем мониторинга соцмедиа в рейтинге TECH INDEX 2016 от AdIndex
  • 14. ЗАДАЧА: рейтинг банков (аналитика обсуждений соц-медиа 50 крупнейших российских банков) ИНДУСТРИЯ: банки МОДУЛИ: SentiFinder (тональность) РЕЗУЛЬТАТ (выявленные параметры): • Лояльность потребителей к банкам; • Лояльность к банковским продуктам; • Информационные всплески обсуждений; • Тренды и тенденции в банковском секторе. Для создания рейтинга было проанализировано более 900 тыс сообщений от 700 тыс уникальных авторов
  • 15. ЗАДАЧА: составление актуального рейтинга медиа-персон ИНДУСТРИЯ: СМИ МОДУЛИ: SentiFinder (определение тональности) РЕЗУЛЬТАТ: • Рейтинг медиаперсон занимает топовые позиции в интернет- пространстве, повышенная узнаваемость и авторитет СМИ; • Долгосрочное сотрудничество (2 года)
  • 16. ЗАДАЧА: выявление информационных трендов по видам спорта на русском и английском языках ИНДУСТРИЯ: СМИ МОДУЛИ: SentiFinder (тональность), морфоанализатор РЕЗУЛЬТАТ (выявляемые тренды):  Популярные персоны и виды спорта: определены среди лидеров роста в рейтинге популярных слов;  Пики количества обсуждений;  Тональность обсуждений. Ежедневный поток 1-2,5 млн сообщений.
  • 18. Направления Выявление похожих аудиторий и приложений (ДМП) Встраивание в чаты мобильных игр и управление community Анализ структурированных данных + неструктурированных Определение характеристик выгодных клиентов Тегирование контента мобайл приложения «Эмоциональное» сегментирование (вкл. по гео- объектам)
  • 19. Пример: продажи  ПРОБЛЕМА: неожиданное снижение продаж  ЗАДАЧА: найти причину  РЕШЕНИЕ: структурированные данные не позволяют выявить контекст проблемы в поведении пользователей. Однако есть возможность проанализировать записи и профайлы клиентов. Совместив с анализом структурированных данных, выявить истинные причины и наиболее выгодных для бизнеса (уже или потенциально) клиентов/пользователей
  • 20. Пример: чаты и community  Анализ тональности сообщений и степени тональности (как по объекту, так и безобъектно) позволяет выявлять лидеров community, персонализировать общение, определять тренд развития
  • 21. Пример: гео-локация по эмоциям  Определение эмоционального состояния ЦА в определенной локации для таргетированного предложения услуг/товаров и push- уведомлений
  • 22. Пример: тегирование контента  Тегирование контента для создания новых продуктов и направлений
  • 23. Пример: дополнение к аналитическим отчетам  Максимально полный отчет: анализ структурированных данных и неструктурированных, выявление взаимосвязей и инсайтов
  • 24.  Высокая скорость обработки потока документов (десятки материалов в минуту)  Качественные возможности анализа русскоязычных сообщений  Возможность аналитики в режиме онлайн  Как «коробочное», так и встраиваемое решение  Обработка не только правильного «книжного» языка (СМИ, внешний документооборот), но и сообщений социальных сетей, форумов, блогов Преимущества EurekaEngine Уникальная скорость обработки данных – десятки миллионов документов в сутки на одном сервере, возможно линейное масштабирование
  • 26. DEMO EurekaEngine: http://eurekaengine.ru/ru/demo/ КОНТАКТЫ: Луценко Елена Руководитель по коммуникациям EurekaEngine.ru lutsenko@palitrumlab.ru +7 (916) 823 98 28