SlideShare a Scribd company logo
Использование Tarantool в
качестве платформы
виртуализации данных
Константин Осипов, kostja@tarantool.org
Сергей Мясников, smyasnikov@beeline.ru
Платформа Tarantool
●
in-memory СУБД для высокой
нагрузки
●
создана в Mail.Ru в 2008-2016 гг.
●
технология нового поколения, на
основе последних исследований в
области обработки транзакций
●
полностью бесплатна (BSD)
Участники проекта
●
ПАО “Вымпелком” - заказчик
●
ООО “ЭйТи Консалтинг” - интеграция с системами
ПАО “Вымпелком”
●
ООО “Мэйл.Ру” - решение “под ключ” на платформе
Tarantool
Что такое data virtualization
A solution that sits in front of
multiple data sources and
allows them to be treated as
a single JSON/SQL
database
Применение DV
●
каноническое централизованное представление
данных
●
интегрированное управление бизнес процессами
●
модернизация и поддержка legacy приложений
●
инструмент консолидации данных при M&A –
поглощениях и слияниях
Использование Tarantool в качестве платформы виртуализации данных / Константин Осипов (tarantool.org), Сергей Мясников (Вымпелком)
Проблемы подхода DV
●
производительность, т.к. платформа не является
первоисточником данных
●
дополнительная нагрузка на первоисточники
●
требует дополнительных ресурсов – оборудование,
ПО
●
не заменяет другие инструменты (ETL, BI, CRM,
CSM)
Почему Вымпелком нужна DV
•
растёт сложность услуг и настроек ИТ систем
•
необходима централизация управления услугами
в 90 регионах России
•
рынок требует интерактивной работы с клиентом
•
новым данным нет места в legacy системах
➔
нельзя просто взять и всё сразу переписать с нуля
Базовые требования к решению
●
проекция данных в единую логическую модель
●
хранение мастер-данных внутри самой системы
●
кэширование данных
●
контроль прав доступа
●
отказоустойчивость 3-го уровня и выше
Уникальные требования Вымпелком
●
независимый жизненный цикл поставщиков и
потребителей данных
✔
версионирование схемы
✔
подключаемые источники данных
✔
поддержка старых клиентов
●
контроль нагрузок на источники данных
●
производительность 30 Krps на узел
Обзор рынка
●
Informatica Platform
●
Denodo Platform
●
Cisco Data Virtualization/ex. Composite
software
●
JBOSS Teiid
… всего более 20 enterprise вендоров
(Forrester)
➔
решение под конкретного заказчика на
основе open source технологий
Причины выбора поставщика
●
наличие экспертизы для создания решения под
заказ
●
опыт производства коробочного ПО
●
гарантия доработок основной технологии хранения
(платформы Tarantool) под нас
●
наименьшая общая стоимость владения
Компоненты системы
Как мы “обманули” природу
●
3 операции над данными: чтение, запись, уведомление
●
версионирование схемы данных в Avro Schema
●
общее представление объекта из нескольких источников
●
любой объект – это набор независимых параметров
●
подключаемые источники данных
●
реконфигурация без downtime
●
внешний интерфейс REST
●
постраничное чтение, чтение связанных объектов
●
оптимистичная транзакционная семантика
●
справочник сервисов как БД нагрузочных профилей и профилей
доступа
Результаты
●
снижение затрат на поддержку существующих
систем за счёт выноса общих данных в
обособленную систему
●
снижение удельной стоимости 1 rps
●
сокращение сроков запуска продуктов
Планы
✔
единый профиль клиента
✔
лента сообщений
✔
контроль каналов при общении с пользователем
✔
генератор параметризованных сообщений
✔
однородный мониторинг бизнес-метрик

More Related Content

PPTX
Как FB, Apple и Google разрушают традиции в компьютерном бизнесе, и почему эт...
PDF
Максим Барышников, Что такое типовые проблемы нагруженных проектов и как их р...
PPTX
Стратегия и тактика улучшения производительности BSS систем оператора мобильн...
PPTX
MySQL® и MongoDB® - когда что лучше использовать? / Петр Зайцев (Percona)
PPTX
Пишем свою платформу для управления данными. Это очень просто / Суханов Васил...
PDF
ClickHouse: очень быстро и очень удобно / Виктор Тарнавский, Алексей Миловидо...
PDF
Виртуальный дата-центр КРОК
PPTX
«Секретные» технологии инвестиционных банков / Алексей Рагозин (Дойче Банк)
Как FB, Apple и Google разрушают традиции в компьютерном бизнесе, и почему эт...
Максим Барышников, Что такое типовые проблемы нагруженных проектов и как их р...
Стратегия и тактика улучшения производительности BSS систем оператора мобильн...
MySQL® и MongoDB® - когда что лучше использовать? / Петр Зайцев (Percona)
Пишем свою платформу для управления данными. Это очень просто / Суханов Васил...
ClickHouse: очень быстро и очень удобно / Виктор Тарнавский, Алексей Миловидо...
Виртуальный дата-центр КРОК
«Секретные» технологии инвестиционных банков / Алексей Рагозин (Дойче Банк)

What's hot (20)

PPTX
Настройка и оптимизация высоконагруженных J2EE веб-приложений / Шамим Ахмед (...
PPTX
Мониторинг веб-проектов real-time мониторинг и аналитика, поиск ошибок и боев...
PDF
Виртуализация баз данных с КРОК и Delphix. Кейс Ингосстрах
PPTX
Велосипед уже изобретен. Что умеют промышленные СХД? / Антон Жбанков (Nutanix)
PDF
Дмитрий Дегтярев, "Хабикаса"
PPTX
ClickHouse как решение для бизнес аналитики. Дмитрий Кузьмин
PPTX
Преждевременная оптимизация архитектуры / Евгений Потапов, Антон Баранов (ITS...
PDF
Мониторинг и отладка MySQL: максимум информации при минимальных потерях
PDF
High load++2016.highlights (dropbox+clickhouse)
PDF
Как мы строили аналитическую платформу на несколько миллиардов событии в месяц
ODP
ClickHouse
PDF
Порядок для скорости. Система структурирования фронтендовой части веб-приложе...
PDF
Сергей Аверин "Распространенные ошибки применения баз данных"
PDF
Clickhouse
PDF
Эволюция процесса деплоя в проекте / Денис Яковлев (2ГИС)
PPTX
vi stories: миграция на .NET Core
PPTX
на пути к 100% аптайму - доклад с HighLoad 2015 совместно с Станиславом Осип...
PPTX
TeamPass - управление разграничением доступа к сервисным паролям в команде | ...
PDF
Конференция по программным решениям HPE 2016
PPTX
HighLoad Junior '16 Как сравнить и выбрать хостинг-провайдера
Настройка и оптимизация высоконагруженных J2EE веб-приложений / Шамим Ахмед (...
Мониторинг веб-проектов real-time мониторинг и аналитика, поиск ошибок и боев...
Виртуализация баз данных с КРОК и Delphix. Кейс Ингосстрах
Велосипед уже изобретен. Что умеют промышленные СХД? / Антон Жбанков (Nutanix)
Дмитрий Дегтярев, "Хабикаса"
ClickHouse как решение для бизнес аналитики. Дмитрий Кузьмин
Преждевременная оптимизация архитектуры / Евгений Потапов, Антон Баранов (ITS...
Мониторинг и отладка MySQL: максимум информации при минимальных потерях
High load++2016.highlights (dropbox+clickhouse)
Как мы строили аналитическую платформу на несколько миллиардов событии в месяц
ClickHouse
Порядок для скорости. Система структурирования фронтендовой части веб-приложе...
Сергей Аверин "Распространенные ошибки применения баз данных"
Clickhouse
Эволюция процесса деплоя в проекте / Денис Яковлев (2ГИС)
vi stories: миграция на .NET Core
на пути к 100% аптайму - доклад с HighLoad 2015 совместно с Станиславом Осип...
TeamPass - управление разграничением доступа к сервисным паролям в команде | ...
Конференция по программным решениям HPE 2016
HighLoad Junior '16 Как сравнить и выбрать хостинг-провайдера
Ad

Viewers also liked (20)

PDF
Хранение json-документов в Tarantool / Андрей Дроздов (Mail.ru Group)
PDF
Коэволюция enterprise и open-source / Илья Космодемьянский (PostgreSQL-Consul...
PPTX
Monitoring driven эксплуатация / Николай Сивко (HeadHunter)
PDF
Angular 2 не так уж и плох... А если задуматься, то и просто хорош / Алексей ...
PDF
Что нового и полезного в PostgreSQL 9.5 / Илья Космодемьянский (PostgreSQL-Co...
PPTX
За счет чего Tarantool такой оптимальный / Денис Аникин (Mail.Ru)
PDF
Малоизвестные грабли A/B-тестирования и роль контрольных экспериментов / Рома...
PDF
Практическая трансформация классической корпорации в Web Scale IT на примере ...
PDF
Master-Master Replication and Scaling of an Application Between Each of the I...
PPTX
Секретные техники продаж корпоративным клиентам / Александр Зиза (Алетейя Биз...
PPTX
Построение моделей на примере продаж рекламы / Алексей Праслов
PDF
Олег Анастасьев "Ближе к Cassandra". Выступление на Cassandra Conf 2013
PDF
Cоциальный граф "Одноклассников" в myTarget
PPTX
Data Driven SEO 3 - Николай Чудинов
PDF
Франкенштейнизация Voldemort или key-value данные в Одноклассниках. Роман Ан...
PDF
Genuine web-scale железо. Как FB, Apple и Google разрушают традиции в компьют...
PPTX
Zone to Win – организация в борьбе за лучшие кадры в эпоху разрушительных инн...
PDF
Класс!ная Cassandra
PPTX
Как сравнить и выбрать хостинг-провайдера или О чем умалчивают маркетологи / ...
PDF
"Building data streams" Константин Евтеев (Avito)
Хранение json-документов в Tarantool / Андрей Дроздов (Mail.ru Group)
Коэволюция enterprise и open-source / Илья Космодемьянский (PostgreSQL-Consul...
Monitoring driven эксплуатация / Николай Сивко (HeadHunter)
Angular 2 не так уж и плох... А если задуматься, то и просто хорош / Алексей ...
Что нового и полезного в PostgreSQL 9.5 / Илья Космодемьянский (PostgreSQL-Co...
За счет чего Tarantool такой оптимальный / Денис Аникин (Mail.Ru)
Малоизвестные грабли A/B-тестирования и роль контрольных экспериментов / Рома...
Практическая трансформация классической корпорации в Web Scale IT на примере ...
Master-Master Replication and Scaling of an Application Between Each of the I...
Секретные техники продаж корпоративным клиентам / Александр Зиза (Алетейя Биз...
Построение моделей на примере продаж рекламы / Алексей Праслов
Олег Анастасьев "Ближе к Cassandra". Выступление на Cassandra Conf 2013
Cоциальный граф "Одноклассников" в myTarget
Data Driven SEO 3 - Николай Чудинов
Франкенштейнизация Voldemort или key-value данные в Одноклассниках. Роман Ан...
Genuine web-scale железо. Как FB, Apple и Google разрушают традиции в компьют...
Zone to Win – организация в борьбе за лучшие кадры в эпоху разрушительных инн...
Класс!ная Cassandra
Как сравнить и выбрать хостинг-провайдера или О чем умалчивают маркетологи / ...
"Building data streams" Константин Евтеев (Avito)
Ad

Similar to Использование Tarantool в качестве платформы виртуализации данных / Константин Осипов (tarantool.org), Сергей Мясников (Вымпелком) (16)

PDF
Software Defined Storage
PDF
Виртуализация Данных: Введение
PDF
Знакомство с виртуализацией данных для профессионалов в области данных
PDF
Data line cloud solutions
PPTX
Short enterprise data hub on apache hadoop ru
PDF
E&С_2013_Data_center_ukraine_www.encint.com_demo_version
PDF
Microsoft in discrete manufacturing 2012 (Russ)
PDF
Построение Data Mesh на основе Виртуальных Данных
PDF
Знакомство с виртуализацией данных для профессионалов в области данных
PDF
Продвинутый анализ и машинное обучение с помощью виртуализации данных
PDF
Informatica for Data Warehouse Optimisation and Data Lake Use-cases
PPTX
«Рынок ЦОД: состояние, тенденции, перспективы»
 
PDF
«Быстрый русский» – отечественная платформа автоматизации CITORUS
PPTX
System Сenter - как комплекс управления жизненным циклом облачной информацион...
PPT
ИТЦ-М - системный интегратор, поставщик IT решений
Software Defined Storage
Виртуализация Данных: Введение
Знакомство с виртуализацией данных для профессионалов в области данных
Data line cloud solutions
Short enterprise data hub on apache hadoop ru
E&С_2013_Data_center_ukraine_www.encint.com_demo_version
Microsoft in discrete manufacturing 2012 (Russ)
Построение Data Mesh на основе Виртуальных Данных
Знакомство с виртуализацией данных для профессионалов в области данных
Продвинутый анализ и машинное обучение с помощью виртуализации данных
Informatica for Data Warehouse Optimisation and Data Lake Use-cases
«Рынок ЦОД: состояние, тенденции, перспективы»
 
«Быстрый русский» – отечественная платформа автоматизации CITORUS
System Сenter - как комплекс управления жизненным циклом облачной информацион...
ИТЦ-М - системный интегратор, поставщик IT решений

More from Ontico (20)

PDF
One-cloud — система управления дата-центром в Одноклассниках / Олег Анастасье...
PDF
Масштабируя DNS / Артем Гавриченков (Qrator Labs)
PPTX
Создание BigData-платформы для ФГУП Почта России / Андрей Бащенко (Luxoft)
PDF
Готовим тестовое окружение, или сколько тестовых инстансов вам нужно / Алекса...
PDF
Новые технологии репликации данных в PostgreSQL / Александр Алексеев (Postgre...
PDF
PostgreSQL Configuration for Humans / Alvaro Hernandez (OnGres)
PDF
Inexpensive Datamasking for MySQL with ProxySQL — Data Anonymization for Deve...
PDF
Опыт разработки модуля межсетевого экранирования для MySQL / Олег Брославский...
PPTX
ProxySQL Use Case Scenarios / Alkin Tezuysal (Percona)
PPTX
MySQL Replication — Advanced Features / Петр Зайцев (Percona)
PDF
Внутренний open-source. Как разрабатывать мобильное приложение большим количе...
PPTX
Подробно о том, как Causal Consistency реализовано в MongoDB / Михаил Тюленев...
PPTX
Балансировка на скорости проводов. Без ASIC, без ограничений. Решения NFWare ...
PDF
Перехват трафика — мифы и реальность / Евгений Усков (Qrator Labs)
PPT
И тогда наверняка вдруг запляшут облака! / Алексей Сушков (ПЕТЕР-СЕРВИС)
PPTX
Как мы заставили Druid работать в Одноклассниках / Юрий Невиницин (OK.RU)
PPTX
Разгоняем ASP.NET Core / Илья Вербицкий (WebStoating s.r.o.)
PPTX
100500 способов кэширования в Oracle Database или как достичь максимальной ск...
PPTX
Apache Ignite Persistence: зачем Persistence для In-Memory, и как он работает...
PDF
Механизмы мониторинга баз данных: взгляд изнутри / Дмитрий Еманов (Firebird P...
One-cloud — система управления дата-центром в Одноклассниках / Олег Анастасье...
Масштабируя DNS / Артем Гавриченков (Qrator Labs)
Создание BigData-платформы для ФГУП Почта России / Андрей Бащенко (Luxoft)
Готовим тестовое окружение, или сколько тестовых инстансов вам нужно / Алекса...
Новые технологии репликации данных в PostgreSQL / Александр Алексеев (Postgre...
PostgreSQL Configuration for Humans / Alvaro Hernandez (OnGres)
Inexpensive Datamasking for MySQL with ProxySQL — Data Anonymization for Deve...
Опыт разработки модуля межсетевого экранирования для MySQL / Олег Брославский...
ProxySQL Use Case Scenarios / Alkin Tezuysal (Percona)
MySQL Replication — Advanced Features / Петр Зайцев (Percona)
Внутренний open-source. Как разрабатывать мобильное приложение большим количе...
Подробно о том, как Causal Consistency реализовано в MongoDB / Михаил Тюленев...
Балансировка на скорости проводов. Без ASIC, без ограничений. Решения NFWare ...
Перехват трафика — мифы и реальность / Евгений Усков (Qrator Labs)
И тогда наверняка вдруг запляшут облака! / Алексей Сушков (ПЕТЕР-СЕРВИС)
Как мы заставили Druid работать в Одноклассниках / Юрий Невиницин (OK.RU)
Разгоняем ASP.NET Core / Илья Вербицкий (WebStoating s.r.o.)
100500 способов кэширования в Oracle Database или как достичь максимальной ск...
Apache Ignite Persistence: зачем Persistence для In-Memory, и как он работает...
Механизмы мониторинга баз данных: взгляд изнутри / Дмитрий Еманов (Firebird P...

Использование Tarantool в качестве платформы виртуализации данных / Константин Осипов (tarantool.org), Сергей Мясников (Вымпелком)

  • 1. Использование Tarantool в качестве платформы виртуализации данных Константин Осипов, kostja@tarantool.org Сергей Мясников, smyasnikov@beeline.ru
  • 2. Платформа Tarantool ● in-memory СУБД для высокой нагрузки ● создана в Mail.Ru в 2008-2016 гг. ● технология нового поколения, на основе последних исследований в области обработки транзакций ● полностью бесплатна (BSD)
  • 3. Участники проекта ● ПАО “Вымпелком” - заказчик ● ООО “ЭйТи Консалтинг” - интеграция с системами ПАО “Вымпелком” ● ООО “Мэйл.Ру” - решение “под ключ” на платформе Tarantool
  • 4. Что такое data virtualization A solution that sits in front of multiple data sources and allows them to be treated as a single JSON/SQL database
  • 5. Применение DV ● каноническое централизованное представление данных ● интегрированное управление бизнес процессами ● модернизация и поддержка legacy приложений ● инструмент консолидации данных при M&A – поглощениях и слияниях
  • 7. Проблемы подхода DV ● производительность, т.к. платформа не является первоисточником данных ● дополнительная нагрузка на первоисточники ● требует дополнительных ресурсов – оборудование, ПО ● не заменяет другие инструменты (ETL, BI, CRM, CSM)
  • 8. Почему Вымпелком нужна DV • растёт сложность услуг и настроек ИТ систем • необходима централизация управления услугами в 90 регионах России • рынок требует интерактивной работы с клиентом • новым данным нет места в legacy системах ➔ нельзя просто взять и всё сразу переписать с нуля
  • 9. Базовые требования к решению ● проекция данных в единую логическую модель ● хранение мастер-данных внутри самой системы ● кэширование данных ● контроль прав доступа ● отказоустойчивость 3-го уровня и выше
  • 10. Уникальные требования Вымпелком ● независимый жизненный цикл поставщиков и потребителей данных ✔ версионирование схемы ✔ подключаемые источники данных ✔ поддержка старых клиентов ● контроль нагрузок на источники данных ● производительность 30 Krps на узел
  • 11. Обзор рынка ● Informatica Platform ● Denodo Platform ● Cisco Data Virtualization/ex. Composite software ● JBOSS Teiid … всего более 20 enterprise вендоров (Forrester) ➔ решение под конкретного заказчика на основе open source технологий
  • 12. Причины выбора поставщика ● наличие экспертизы для создания решения под заказ ● опыт производства коробочного ПО ● гарантия доработок основной технологии хранения (платформы Tarantool) под нас ● наименьшая общая стоимость владения
  • 14. Как мы “обманули” природу ● 3 операции над данными: чтение, запись, уведомление ● версионирование схемы данных в Avro Schema ● общее представление объекта из нескольких источников ● любой объект – это набор независимых параметров ● подключаемые источники данных ● реконфигурация без downtime ● внешний интерфейс REST ● постраничное чтение, чтение связанных объектов ● оптимистичная транзакционная семантика ● справочник сервисов как БД нагрузочных профилей и профилей доступа
  • 15. Результаты ● снижение затрат на поддержку существующих систем за счёт выноса общих данных в обособленную систему ● снижение удельной стоимости 1 rps ● сокращение сроков запуска продуктов
  • 16. Планы ✔ единый профиль клиента ✔ лента сообщений ✔ контроль каналов при общении с пользователем ✔ генератор параметризованных сообщений ✔ однородный мониторинг бизнес-метрик