ночью через лес Stress-test пяти almost-the-same-functionality shared-nothing-cluster no sql субд

ночью через лес: stress-
test пяти almost-the-
same-functionality
shared-nothing-cluster
NoSQL СУБД

Здравствуйте,
меня зовут Даниил,
я системно администирую уже 20 лет и у
меня проблема

откуда вообще взялась эта идея
1. Данные надо где-то хранить
2. РСУБД работают хорошо.
1. Пока нам не нужна репликация
2. И шардинг
3. Распределенные СУБД
1. Они нам нравятся
1. Потому что мы ленивые
2. Но работают они как-то странно
1. особенно когда нам по-настоящему надо, чтобы они
работали хорошо
3. и нельзя сказать, что нас не предупредили

Чего мы собственно хотим
● У нас есть чтения и записи
● Чтения должны происходить надежно
● Данные должны храниться надежно
● Объем хранилища должен наращиваться
горизонтально
● все это должно быть ДЕШЕВО

Методика тестирования
1. создаем кластер из 5 нод
2. заливаем с максимально возможной скоростью записи в базу
3. запускаем процесс случайного чтения
a. с того же сервера запускаем писателя
4. имитируем сбой одной из нод
5. наблюдаем за поведением кластера, читателей и писателей
6. из ранее удаленной ноды создаем новую и возвращаем ее в кластер
7. наблюдаем за поведением кластера, читателей и писателей до полного восстановления
кластера
8. добавляем в кластер еще одну ноду
9. наблюдаем за поведением кластера, читателей и писателей
10. Узнать мы хотим о сюрпризах, которые готовит нам эксплуатация продукта в
экстремальных условиях
a. а все остальное нас интересует постольку-поскольку
b. некоторые кандидаты закончили тестирование на этапе чтения документации

Отбор кандидатов
● Источник вдохновения: http://nosql-database.org/
● aerospike
● cassandra
● crate.io
● elasticsearch
● orientdb
● rethinkdb
● где RIAK?!
● Но обзор будет анонимным

Тестовая среда
● 5-6 машин для кластера
o RAID0, кеширование записи
● Выделенная машина для клиента записи-чтения
● Выделенная машина для Grafana
● Выделенная гигабитная сеть - и, забегая вперед,
сеть должна бы быть получше
● docker как метод деплоя

Продукт A
● Поначалу все хорошо
● Потом все похуже
● А вот мы выключили ноду - и где же все?!
● А вот кластер проснулся

Продукт B
оказался надстройкой над продуктом A в
смысле технологий репликации и шардинга

Продукт C
● Выглядит многообещающе
● “Думайте обо мне как о массиве дисков”
● Но как делать ребалансинг?!
● И куда попадают новые ноды?!!

Продукт D
● И потом все хорошо
● А вот мы выключили ноду. Пришлось перезапустить
чтение.
● А вот мы вернули ноду в строй
● А вот мы добавили шестую машину
● Похоже, это идеальный кандидат
o но при дефолтных настройках ребалансинг очень
медленный

Продукт Е
● И потом все хорошо
o Но к концу появляются ошибки записи. Их мало, они не видны на
графике
● Вот мы выключили ноду - все, вроде, хорошо
● А вот мы ее включили. Откуда эти ошибки чтения?!
o Прежде, чем включать ноду на том же IP - надо поприседать
вокруг конфигов
o И вообще - ребалансинг представляет собой нетривиальную
задачу

Продукт F
● Какой хороший GUI!
● И поначалу все хорошо
● А потом похуже
● А почему все данные в одном шарде?!
o Ну давайте попробуем использовать SHA1 в качестве primary key
● Стало лучше - теперь данные распределены по двум шардам. Из
пяти…
● Картинки не будет - как только я собрался ее снять, кластер упал
● Совсем упал - запустить его опять не удалось за приемлемлемое
время

Деанонимизация
A - ElasticSearch
B - Crate.IO
C - Aerospike
D - OrientDB
E - Cassandra
F - RethinkDB

Выводы
● Как страшно жить
● Будем делать на Aerospike

ночью через лес Stress-test пяти almost-the-same-functionality shared-nothing-cluster no sql субд

More Related Content

Viewers also liked (20)

Similar to ночью через лес Stress-test пяти almost-the-same-functionality shared-nothing-cluster no sql субд (10)

ночью через лес Stress-test пяти almost-the-same-functionality shared-nothing-cluster no sql субд