SlideShare a Scribd company logo
Обзор технологий и подходов для
решения задач связанных с
высокой нагрузкой и обработкой
больших объёмов данных
Анатолий Никулин и
Иван Погудин
Как справиться с возрастающей
нагрузкой
• Вертикальное масштабирование
• Горизонтальное масштабирование
Вертикальное масштабирование
• Утилизация множества ядер (многопоточность)
• Часто не требует изменение приложения
• Малый предел масштабирования
Горизонтальное масштабирование
• Увеличивается количество элементов
• Возрастает вероятность отказа
• Усложняются механизмы взаимодействия
• Дешевле чем вертикальное после достижения
определённого масштаба
CAP теорема (Брюер)
Фреймворки и системы
• Finagle (https://twitter.github.io/finagle/)
• Hadoop (http://hadoop.apache.org/)
• Storm (http://storm.incubator.apache.org)
Finagle
• Scala
• Примитивы: сервера и клиенты
• Thrift, Http, Mux
• Future
• Трекинг запросов
• Мониторинг производительности
• Java-API в планах
Hadoop
• Java
• Map/reduce
• HDFS - распределённая файловая система
• HBase - база данных
• Де-факто стандарт для обработки больших данных
Storm
• Сlojure
• Stream processing
• Топология (Topology)
• Краны (spouts) и изгибы (bolts)
• Java-API и другие языки
Базы данных (NoSQL)
• Memcached (http://memcached.org)
• Redis (http://redis.io)
• Cassandra (http://cassandra.apache.org/)
• MongoDB (http://www.mongodb.org/)
• Aerospike (http://www.aerospike.com/)
Memcached
• Хэш таблица с доступом по ключу
• Распределённый
• Данные только в памяти
• set, add, replace, append, prepend, cas, get, gets,
delete, incr, decr
Redis
• key-value cache and store
• strings, hashes, lists, sets, sorted sets, bitmaps
• persistence (snapshots)
• репликация (master-slave)
• redis cluster в процессе
Cassandra
• Колонко-ориентированная (Column-oriented)
• Log-structured merge-tree
• Очень быстрая запись
• Thrift интерфейс, CQL3
MongoDB
• Master/slave репликация
• Sharding (mongos, mongo configsrv)
• Документ-ориентированная
• JavaScript
• Map/reduce
Aerospike
• SSD + memory
• Сложные структуры данных (списки, хэш таблицы и
т.д.)
• aql
Дьявол в деталях
• Оптимизации (мелкое в рамках одной операции
становится крупным при большом их числе)
• Необходимость поиска компромисса (память, процессор,
диск, сеть)
• Механизмы взаимодействия элементов распределённой
системы
• Отказоустойчивость
• И многое многое другое
BigData
Мир больших массивов
данных
Общее количество данных в мире
2 Zettabyte
это: 1000000000000000000000 bytes
или 1 миллиард терабайт
Закон Мура для данных
Каждые два года количество данных увеличивается в
двое
12 HappyDev-lite-2014. Иван Погудин, Анатолий Никулин. Решение задач, связанных с высокими нагрузками и обработкой больших объемов данных.
Bolid F1 6GB per 90 min
Boeing-787 500 GB per fly*
Large Hadron Collider 40TB per day
Users:
• Количество интернет пользователей: 3 млрд.
• Количество смартфонов: 1.3 млрд.
• Количество СМС в день: 25 млрд.
Hadoop - наше всё
Платформа для:
Хранения и распределенной обработки данных
(распределенных вычислений).
Hadoop is a large-scale distributed batch processing
infrastructure
BigData - а это сколько?
А у вас нет столько данных для
Hadoop
Hadoop сложно разворачивать
Игроки рынка
Наконец Hadoop это целая
экосистема
Скилы
IF
{
компьютерная графика == линейная алгебра
}
THEN
{
большие данные == статистика и теория
вероятности
}
Рынок труда РФ
• Обработка пользовательских данных.
Реклама, банки
• Обработка сенсорных данных
Греют воздух большими данными
И.Погудин и А.Никулин
(ведущие кочегары)

More Related Content

PDF
10 HappyDev-lite'14 Иван Погудин, Анатолий Никулин. Решение задач, связанных...
PDF
High load++2016.highlights (dropbox+clickhouse)
PPTX
Александр Сербул —1С-Битрикс — ICBDA 2015
PDF
Александр Киров — Acronis — ICBDA 2015
PDF
GCP для работы с большими данными
PDF
Что нужно знать об архитектуре ClickHouse / Алексей Зателепин (Яндекс)
ODP
ClickHouse
PDF
Couchbase, что за зверь и на что способен.
10 HappyDev-lite'14 Иван Погудин, Анатолий Никулин. Решение задач, связанных...
High load++2016.highlights (dropbox+clickhouse)
Александр Сербул —1С-Битрикс — ICBDA 2015
Александр Киров — Acronis — ICBDA 2015
GCP для работы с большими данными
Что нужно знать об архитектуре ClickHouse / Алексей Зателепин (Яндекс)
ClickHouse
Couchbase, что за зверь и на что способен.

What's hot (20)

PDF
NoSQL thumbtack experience, Анатолий Никулин
PDF
Построение системы аналитики
PDF
Где сегодня использовать ElasticSearch
PPT
ADD2010: Обработка большого объема данных на платформеApache Hadoop
PDF
Не SQL'ем единым
PDF
Александр Богданов «Lambda - архитектура»
PDF
Как мы строили аналитическую платформу на несколько миллиардов событии в месяц
PDF
«Система развёртывания многокомпонентного сервиса» — Алексей Салов, YaC 2013
PDF
NoSQL и Zend Framework (Никита Грошин)
PDF
Аналитика над петабайтами в реальном времени
PPTX
Использование облачной платформы OpenStack для реализации механизмов обработк...
PDF
Применение в Enterprise-приложении графовой базы данных Neo4j - Антон Максимо...
PPTX
Технологии резервного копирования в Azure
PPT
Lobanov_Cloud-Comput..
PDF
HBase inside
PPTX
СУБД 2013 Лекция №10 "Нереляционное решение в области баз данных — NoSQL"
PPTX
Промышленное ускорение сайтов / Николай Мациевский (Айри.рф)
PDF
С чего начать внедрение Hadoop в компании. Доклад Алексея Еремихина (Badoo).
PDF
Выбор NoSQL базы данных для вашего проекта: "Не в свои сани не садись"
PPTX
Кэширование и куки
NoSQL thumbtack experience, Анатолий Никулин
Построение системы аналитики
Где сегодня использовать ElasticSearch
ADD2010: Обработка большого объема данных на платформеApache Hadoop
Не SQL'ем единым
Александр Богданов «Lambda - архитектура»
Как мы строили аналитическую платформу на несколько миллиардов событии в месяц
«Система развёртывания многокомпонентного сервиса» — Алексей Салов, YaC 2013
NoSQL и Zend Framework (Никита Грошин)
Аналитика над петабайтами в реальном времени
Использование облачной платформы OpenStack для реализации механизмов обработк...
Применение в Enterprise-приложении графовой базы данных Neo4j - Антон Максимо...
Технологии резервного копирования в Azure
Lobanov_Cloud-Comput..
HBase inside
СУБД 2013 Лекция №10 "Нереляционное решение в области баз данных — NoSQL"
Промышленное ускорение сайтов / Николай Мациевский (Айри.рф)
С чего начать внедрение Hadoop в компании. Доклад Алексея Еремихина (Badoo).
Выбор NoSQL базы данных для вашего проекта: "Не в свои сани не садись"
Кэширование и куки
Ad

Viewers also liked (16)

PDF
certifi - berkely - english
DOCX
Reflexión sesión 5
PPTX
01 HappyDev-lite-2015 autumn. Дмитрий Пашкевич. Азбука разработчика, которыи...
PDF
Canon_reference
DOC
Autoestima
PDF
2 a4 22tcn262_2000p3
PPTX
Taking charge-of-your-brain1-141103142620-conversion-gate01
PDF
Curso mei 805 prevención y seguridad básica
PPT
THRS CIED PHYSICIAN TRAINING COURSE
PDF
Offerte scuola 2015-2016
PDF
" కూరగాయ " పంటలకు సంబందించి తరచుగా అడిగే ప్రశ్నలు
PPT
Asp.net gestione della_memoria
DOCX
звіт керівника за 2015 2016 н.р
PDF
36hp engine 2 way bevel gearbox 1500rpm,80hp trencher gearbox input and outpu...
PPT
Planos de ing inst
PPTX
Product design
certifi - berkely - english
Reflexión sesión 5
01 HappyDev-lite-2015 autumn. Дмитрий Пашкевич. Азбука разработчика, которыи...
Canon_reference
Autoestima
2 a4 22tcn262_2000p3
Taking charge-of-your-brain1-141103142620-conversion-gate01
Curso mei 805 prevención y seguridad básica
THRS CIED PHYSICIAN TRAINING COURSE
Offerte scuola 2015-2016
" కూరగాయ " పంటలకు సంబందించి తరచుగా అడిగే ప్రశ్నలు
Asp.net gestione della_memoria
звіт керівника за 2015 2016 н.р
36hp engine 2 way bevel gearbox 1500rpm,80hp trencher gearbox input and outpu...
Planos de ing inst
Product design
Ad

Similar to 12 HappyDev-lite-2014. Иван Погудин, Анатолий Никулин. Решение задач, связанных с высокими нагрузками и обработкой больших объемов данных. (20)

PDF
Лекция 2. Основы Hadoop
PPTX
DBD lection 4. Big Data, NoSQL. In Russian.
PDF
Информационные технологии в эру Больших данных
PPTX
Информационные технологии в эру Больших данных
PDF
Лекция 14. Hadoop в Поиске Mail.Ru
ODP
Apache Hadoop
PDF
HPC vs Big Data (Russian version)
PPTX
2015-12-05 Алексей Зиновьев - Когда все данные станут большими...
PDF
HappyDev'15 Keynote: Когда все данные станут большими...
PPTX
Кирилл Алешин - Big Data и Lambda архитектура на практике
PDF
Introductory Keynote at Hadoop Workshop by Ospcon (2014)
PDF
Rapid Deployment of Hadoop Development Environments
PDF
Cравнительный анализ хранилищ данных (Олег Царев, Кирилл Коринский)
PDF
High Load 2009 Imdg Presentation
PDF
Aлександр Зайцев, LifeStreet
PDF
Мастер-класс по BigData Tools для HappyDev'15
PPT
Top big data architecture patterns by Igor Chub
PDF
ALMADA 2013 (computer science school by Yandex and Microsoft Research)
PDF
Платформа и решения НРЕ для больших данных
PDF
38 - Базы данных. Общее понятие BigData
Лекция 2. Основы Hadoop
DBD lection 4. Big Data, NoSQL. In Russian.
Информационные технологии в эру Больших данных
Информационные технологии в эру Больших данных
Лекция 14. Hadoop в Поиске Mail.Ru
Apache Hadoop
HPC vs Big Data (Russian version)
2015-12-05 Алексей Зиновьев - Когда все данные станут большими...
HappyDev'15 Keynote: Когда все данные станут большими...
Кирилл Алешин - Big Data и Lambda архитектура на практике
Introductory Keynote at Hadoop Workshop by Ospcon (2014)
Rapid Deployment of Hadoop Development Environments
Cравнительный анализ хранилищ данных (Олег Царев, Кирилл Коринский)
High Load 2009 Imdg Presentation
Aлександр Зайцев, LifeStreet
Мастер-класс по BigData Tools для HappyDev'15
Top big data architecture patterns by Igor Chub
ALMADA 2013 (computer science school by Yandex and Microsoft Research)
Платформа и решения НРЕ для больших данных
38 - Базы данных. Общее понятие BigData

More from HappyDev-lite (20)

PDF
2017-03-26 06 Алексей Губарев. Разработка встраиваемого программного обеспеч...
PDF
2017-03-26 05 Дмитрий Козиенко. Оптимизируй это!
PDF
2017-03-26 04 вячеслав виноградов. есть ли жизнь после релиза
PDF
2017-03-26 03 Илья Сиганов. Что такое машинное обучение
PDF
2017-03-26 02 Кирилл Лейфер. Мобильные платформы с точки зрения безопасности
PDF
2017-03-26 01 Григорий Косьяненко. Разработка ПО — это про людей, а не про код
PDF
2017-03-26 06 Виталий Онянов. Разработка ERP-систем
PDF
2017-03-26 05 Алексей Еременко. Проектный менеджер моей мечты
PDF
2017-03-26 04 Екатерина Скорых. Профессия — тестировщик ПО
PDF
2017-03-26 03 Кирилл Лейфер. Прелести и ужасы мобильной разработки
PDF
2017-03-26 01 Анна Тарасенко. Как устроен Web изнутри
PDF
2017-03-26 02 Егор Непомнящих. Что такое web front end, и с чем его едят
PPTX
HappyDev-lite-2016-осень, день 2 12 Сергей Мячин. Как переделывать игру-2
PPTX
HappyDev-lite-2016-осень, день 2 11 Анна Тарасенко. Почему нельзя просто так ...
PDF
HappyDev-lite-2016-осень, день 2 10 Алексей Коровянский. Будущее мобильной...
PPTX
HappyDev-lite-2016-осень, день 2 09 Сергей Савченко. Школа программиста, учи...
PDF
HappyDev-lite-2016-осень, день 2 08 Александр Мишурин. Развитие CTF-движения ...
PPTX
HappyDev-lite-2016-осень, день 2 06 Серик Бейсенов. Время собирать требования
PPTX
HappyDev-lite-2016-осень, день 2 05 Роман Прохоров. Эволюция систем обработки...
PPTX
HappyDev-lite-2016-осень, день 2 04 Михаил Колганов. Интерфейс пользователя ...
2017-03-26 06 Алексей Губарев. Разработка встраиваемого программного обеспеч...
2017-03-26 05 Дмитрий Козиенко. Оптимизируй это!
2017-03-26 04 вячеслав виноградов. есть ли жизнь после релиза
2017-03-26 03 Илья Сиганов. Что такое машинное обучение
2017-03-26 02 Кирилл Лейфер. Мобильные платформы с точки зрения безопасности
2017-03-26 01 Григорий Косьяненко. Разработка ПО — это про людей, а не про код
2017-03-26 06 Виталий Онянов. Разработка ERP-систем
2017-03-26 05 Алексей Еременко. Проектный менеджер моей мечты
2017-03-26 04 Екатерина Скорых. Профессия — тестировщик ПО
2017-03-26 03 Кирилл Лейфер. Прелести и ужасы мобильной разработки
2017-03-26 01 Анна Тарасенко. Как устроен Web изнутри
2017-03-26 02 Егор Непомнящих. Что такое web front end, и с чем его едят
HappyDev-lite-2016-осень, день 2 12 Сергей Мячин. Как переделывать игру-2
HappyDev-lite-2016-осень, день 2 11 Анна Тарасенко. Почему нельзя просто так ...
HappyDev-lite-2016-осень, день 2 10 Алексей Коровянский. Будущее мобильной...
HappyDev-lite-2016-осень, день 2 09 Сергей Савченко. Школа программиста, учи...
HappyDev-lite-2016-осень, день 2 08 Александр Мишурин. Развитие CTF-движения ...
HappyDev-lite-2016-осень, день 2 06 Серик Бейсенов. Время собирать требования
HappyDev-lite-2016-осень, день 2 05 Роман Прохоров. Эволюция систем обработки...
HappyDev-lite-2016-осень, день 2 04 Михаил Колганов. Интерфейс пользователя ...

12 HappyDev-lite-2014. Иван Погудин, Анатолий Никулин. Решение задач, связанных с высокими нагрузками и обработкой больших объемов данных.