SlideShare a Scribd company logo
Online backup: технологии
хранения больших объемов
данных
Белешев Роман
IASO Backup
О компании
Online backup сервис (SaaS)
Сотни тысяч пользователей
Петабайты данных
Партнеры по всему миру
Десятки брендов
И ни одной СУБД
Online backup:
определяющие особенности
Данные хранятся на сервере
Необходимо малое бэкапное окно
Простое копирование файлов – не вариант
Направления борьбы с Big data
Клиент как источник всех бед
Сервер: и куда все это девать
Что делать, когда сервера начинает не хватать
Источники big data на клиенте
Много (мелких) объектов
Структура файлов
История изменений
Порядок – десятки
миллионов

Большие объекты
Базы данных
Порядок - терабайты
Де-дупликация: принцип
Мотивация: данные устроены
«неплохо»
Файлы нарезаются на блоки
Блоки идентифицируются
хэшами
Де-дупликация в действии
«Блочный» состав файла фиксируется
При бэкапе контент файла сравнивается поблочно
На сервер отправляются только новые блоки
1

2

3

4

5

6

7

8

1

1

9

3

4

5

6

7

10

2

1

9

3

11

5

6

7

10

12

3
Backup register
Хранилище для:
Структуры файлов
Версий файлов
Состава файлов из
блоков
Backup register: выбор технологии
БД на сервере?
Встроенная БД на
клиенте?
А так ли надо SQL?
Данные отдельно –
индексы отдельно
Модификация: вперед и
только вперед
Дельта – заливка
Как хранить контент на сервере
Как БЛОБы в БД?
Как файлы в файловой системе?
Объекты должны быть среднего размера
Не класть «яйца» в одну корзину
Кабинеты
Кабинет – это набор
блоков
Блоки сгруппированы
оптимально
Кабинет формируется
на клиенте
Кабинет атомарно
отправляется на
сервер
Организация сервера
Вычислительная
нагрузка минимальна
«Интеллектуальность»
сервера минимальна
Промышленный сетевой
протокол
Большой быстрый диск
с быстрой сетевой
картой
«Безоблачная» юность и проблемы
дальнейшего роста
Много независимых
серверов
Проблемы с
расширяемостью и
надежностью
Отсутствие общей
картины
Неудобство управления
Требования к облаку
Бэкапы должны идти всегда
Прозрачное масштабирование
Централизованное управление и мониторинг
Поиск «облачного» решения
Использовать готовый сервис
Использовать готовое ПО
Создать своё (узкоспециализированное) облако
Поделиться знанием с клиентом
Устройство облака
Много независимых узлов
хранения
Один управляющий узел
Клиент взаимодействует с
управляющим узлом и
«своими» узлами
хранения
Клиент «помнит» где
лежат данные
Управляющий узел
Собственный управляющий процесс
Управление узлами хранения
Мониторинг клиентских агентов
Отсутствие СУБД
Изобретайте велосипеды
Они лучше решают конкретную задачу
Они удерживают систему от «расползания»
Иногда более дешевы (в перспективе)
В конце концов, это интересно
Спасибо за внимание

С удовольствием отвечу на
ваши вопросы
+375 29 502 30 32, roman@iaso.com

More Related Content

PPT
Как снизить нагрузку на высокопосещаемый проект
PPT
Eprasys электронный документооборот
PPT
Audit
PPT
теоретические основы библиотечных инноваций
PDF
7 2011
PPT
компьютер как новое средство обучения
PPTX
140709avv networking prjs
PPT
Веб 2.0 в образовании_Гавриков Д._02.12.09
Как снизить нагрузку на высокопосещаемый проект
Eprasys электронный документооборот
Audit
теоретические основы библиотечных инноваций
7 2011
компьютер как новое средство обучения
140709avv networking prjs
Веб 2.0 в образовании_Гавриков Д._02.12.09

Viewers also liked (7)

PPTX
цифровая школа №73
PPTX
"Data Visualization in Europe" for Open Data School
PPT
первый общий отчет 5с
PDF
3 2012
PPTX
23.09.13сетевые проекты
PDF
9 2012
PPTX
инновационная деятельность педагога
цифровая школа №73
"Data Visualization in Europe" for Open Data School
первый общий отчет 5с
3 2012
23.09.13сетевые проекты
9 2012
инновационная деятельность педагога
Ad

Similar to Роман Белешев - Online backup: технологии хранения больших объемов данных (20)

PDF
Новые возможности распределенной обработки данных в памяти (Coherence)
ODP
Scaling Web Sites By Sharding And Replication Hl2008 Rus
PPTX
Azure for retails
PPT
распределенная архитектура Lamp приложений петр зайцев
PDF
Cохранить замещая. IBS и Huawei // Максим Исаев (IBS) на InterLab Forum 2015
 
PPT
сайфуллин новые технологии резервного копирования
PPT
новые технологии резервного копирования
PDF
Лекция 6: Работа с данными. Django ORM
PPTX
Проектируем облачный веб-сервис "по-взрослому" (Сергей Рыжиков)
PPSX
Data as a service base
PPTX
EMC avalability
PDF
Блеск и нищета распределённых кэшей
PPTX
Распределённый кэш или хранилище данных. Что выбрать?
ODP
Wonderful World Of Mysql Storage Engines Hl2008 Rus
PPT
Интеллектуальное управление системой хранения данных
PDF
Защита баз данных в банке — проблемы и решения
PPTX
Developer Days 2011, Kharkov
PPTX
Презентация технологии веб-кластеров
PDF
Александр Киров — Acronis — ICBDA 2015
Новые возможности распределенной обработки данных в памяти (Coherence)
Scaling Web Sites By Sharding And Replication Hl2008 Rus
Azure for retails
распределенная архитектура Lamp приложений петр зайцев
Cохранить замещая. IBS и Huawei // Максим Исаев (IBS) на InterLab Forum 2015
 
сайфуллин новые технологии резервного копирования
новые технологии резервного копирования
Лекция 6: Работа с данными. Django ORM
Проектируем облачный веб-сервис "по-взрослому" (Сергей Рыжиков)
Data as a service base
EMC avalability
Блеск и нищета распределённых кэшей
Распределённый кэш или хранилище данных. Что выбрать?
Wonderful World Of Mysql Storage Engines Hl2008 Rus
Интеллектуальное управление системой хранения данных
Защита баз данных в банке — проблемы и решения
Developer Days 2011, Kharkov
Презентация технологии веб-кластеров
Александр Киров — Acronis — ICBDA 2015
Ad

More from IT Share (14)

PPTX
Cоветs по оптимизации игр, Александр Дежурко
PDF
Citrus Game Engine, Юрий Шумовский
PDF
Pooling is magic, Максим Клыга
PPT
Святослав Панкратов - Оптимизация арта для браузерных проектов на юнити
PDF
Иван Воронов - Пара вещей, которые упростили бы мою гейм-дизайнерскую жизнь, ...
PPT
Александр Яцукевич - Визуальные эффекты в гейм-дизайне
PPTX
Клевакичев и Кравченко - Игровой баланс, методы его поиска и последующее тира...
PPTX
Сергей Сверчков - Оцениваем решения NoSQL: какая база данных подходит для ваш...
PPTX
Кирилл Алешин - Big Data и Lambda архитектура на практике
PDF
Максим Мельников - Wargaming Web
PDF
Юрий Жлоба - Опыт использования Erlang в разработке многопользовательской игры.
PPT
Никита Вельмаскин - Интерпретатор или думаем над скриптовым движком для Ваше...
PDF
«​Масштабируемый DevOps​» Александр Колесень
PPTX
«От CMS к Highload: работа с backend» Алексей Сазанов, Александр Каскевич
Cоветs по оптимизации игр, Александр Дежурко
Citrus Game Engine, Юрий Шумовский
Pooling is magic, Максим Клыга
Святослав Панкратов - Оптимизация арта для браузерных проектов на юнити
Иван Воронов - Пара вещей, которые упростили бы мою гейм-дизайнерскую жизнь, ...
Александр Яцукевич - Визуальные эффекты в гейм-дизайне
Клевакичев и Кравченко - Игровой баланс, методы его поиска и последующее тира...
Сергей Сверчков - Оцениваем решения NoSQL: какая база данных подходит для ваш...
Кирилл Алешин - Big Data и Lambda архитектура на практике
Максим Мельников - Wargaming Web
Юрий Жлоба - Опыт использования Erlang в разработке многопользовательской игры.
Никита Вельмаскин - Интерпретатор или думаем над скриптовым движком для Ваше...
«​Масштабируемый DevOps​» Александр Колесень
«От CMS к Highload: работа с backend» Алексей Сазанов, Александр Каскевич

Роман Белешев - Online backup: технологии хранения больших объемов данных