SlideShare a Scribd company logo
Self-healed*
(*Самопочин)
• https://github.com/cognician
Стандартный конвейер
Event-based self-healing monitoring / Кирилл Сотников (Cognician)
Начало
Обычное
состояние
Failover
• Надежно
• Гибко
• Просто
• Не использует существующие ресурсы
• Поддержка большого количества языков
• Дёшево (относительно)
• Event-based
AWS Lambda
Решение
Event-based self-healing monitoring / Кирилл Сотников (Cognician)
Alert Fatigue
Улучшенный конвейер
Сценарий: кончилось место на диске
Общая схема
Решение 1
Решение 2
Сценарий: сервис недоступен
Общая схема
Решение 1
Решение 2
Результат
Сценарий: возросла нагрузка
Общая схема
Решение 1
Решение 2
transmogrifier
Сценарий: поймали исключение
Общая схема
Решение 1
Решение 2
Сценарий: падение региона
Всё пропало
Решение 1
Решение 2
Работа с социалками
• s8tn1kv@gmail.com
• https://github.com/lowl4tency
• hangops.slack.com #hangops_ru
• https://twitter.com/yellow_madops
Спасибо ^_^

More Related Content

PPSX
Мониторинг, когда не тестируешь
PDF
Prometheus мониторинг микросервисных приложений / Виталий Левченко
PDF
Тошнит от колец великая битва систем мониторинга, часть I, Александр Чистяков...
PDF
Bosun современный мониторинг / Дима Медведев (OneTwoTrip)
PDF
Ceph BlueStore - новый тип хранилища в Ceph / Максим Воронцов, (Redsys)
PDF
Путь мониторинга 2.0 всё стало другим / Всеволод Поляков (Grammarly)
PDF
NoSQL - неспроста ли это ЖЖЖ / Даниил Подольский (inCaller.org)
PDF
DC/OS – больше чем PAAS, Никита Борзых (Express 42)
Мониторинг, когда не тестируешь
Prometheus мониторинг микросервисных приложений / Виталий Левченко
Тошнит от колец великая битва систем мониторинга, часть I, Александр Чистяков...
Bosun современный мониторинг / Дима Медведев (OneTwoTrip)
Ceph BlueStore - новый тип хранилища в Ceph / Максим Воронцов, (Redsys)
Путь мониторинга 2.0 всё стало другим / Всеволод Поляков (Grammarly)
NoSQL - неспроста ли это ЖЖЖ / Даниил Подольский (inCaller.org)
DC/OS – больше чем PAAS, Никита Борзых (Express 42)

Viewers also liked (14)

PDF
Лучшие практики Continuous Delivery с Docker / Дмитрий Столяров (Флант)
PPTX
Кирилл Толкачев, Александр Тарасов, Хипстеры в энтерпрайзе. Шагаем в ногу со ...
PDF
Путь мониторинга: модульность, гибкость, devops / Всеволод Поляков (Grammarly)
PPTX
Highload в ВУЗе идеализм, расчётливый менеджмент или пустые надежды / Артем К...
PDF
Масштабирование сервисов с помощью Apache Mesos
PPTX
Amazing threesome, rrr... React. Redux. Real world / Ростислав Галкин (Babo)
PPTX
Как отвечать за продакшн / Андрей Сумин (Mail.ru)
PDF
Принципы автоматического масштабирования приложения в AWS / Антон Регеда (Juno)
PDF
Comparing ZooKeeper and Consul
PPTX
smart balancing with nginx+lua / Андрей Кононов (IPONWEB)
PDF
Consul: Service-oriented at Scale
PDF
Мой маленький уютный PaaS / Илья Беда (bro.agency)
PDF
Чему мы научились, разрабатывая микросервисы / Вадим Мадисон (RuTube)
PPT
Движение по хрупкому дну / Сергей Караткевич (servers.ru)
Лучшие практики Continuous Delivery с Docker / Дмитрий Столяров (Флант)
Кирилл Толкачев, Александр Тарасов, Хипстеры в энтерпрайзе. Шагаем в ногу со ...
Путь мониторинга: модульность, гибкость, devops / Всеволод Поляков (Grammarly)
Highload в ВУЗе идеализм, расчётливый менеджмент или пустые надежды / Артем К...
Масштабирование сервисов с помощью Apache Mesos
Amazing threesome, rrr... React. Redux. Real world / Ростислав Галкин (Babo)
Как отвечать за продакшн / Андрей Сумин (Mail.ru)
Принципы автоматического масштабирования приложения в AWS / Антон Регеда (Juno)
Comparing ZooKeeper and Consul
smart balancing with nginx+lua / Андрей Кононов (IPONWEB)
Consul: Service-oriented at Scale
Мой маленький уютный PaaS / Илья Беда (bro.agency)
Чему мы научились, разрабатывая микросервисы / Вадим Мадисон (RuTube)
Движение по хрупкому дну / Сергей Караткевич (servers.ru)
Ad

More from Ontico (20)

PDF
One-cloud — система управления дата-центром в Одноклассниках / Олег Анастасье...
PDF
Масштабируя DNS / Артем Гавриченков (Qrator Labs)
PPTX
Создание BigData-платформы для ФГУП Почта России / Андрей Бащенко (Luxoft)
PDF
Готовим тестовое окружение, или сколько тестовых инстансов вам нужно / Алекса...
PDF
Новые технологии репликации данных в PostgreSQL / Александр Алексеев (Postgre...
PDF
PostgreSQL Configuration for Humans / Alvaro Hernandez (OnGres)
PDF
Inexpensive Datamasking for MySQL with ProxySQL — Data Anonymization for Deve...
PDF
Опыт разработки модуля межсетевого экранирования для MySQL / Олег Брославский...
PPTX
ProxySQL Use Case Scenarios / Alkin Tezuysal (Percona)
PPTX
MySQL Replication — Advanced Features / Петр Зайцев (Percona)
PDF
Внутренний open-source. Как разрабатывать мобильное приложение большим количе...
PPTX
Подробно о том, как Causal Consistency реализовано в MongoDB / Михаил Тюленев...
PPTX
Балансировка на скорости проводов. Без ASIC, без ограничений. Решения NFWare ...
PDF
Перехват трафика — мифы и реальность / Евгений Усков (Qrator Labs)
PPT
И тогда наверняка вдруг запляшут облака! / Алексей Сушков (ПЕТЕР-СЕРВИС)
PPTX
Как мы заставили Druid работать в Одноклассниках / Юрий Невиницин (OK.RU)
PPTX
Разгоняем ASP.NET Core / Илья Вербицкий (WebStoating s.r.o.)
PPTX
100500 способов кэширования в Oracle Database или как достичь максимальной ск...
PPTX
Apache Ignite Persistence: зачем Persistence для In-Memory, и как он работает...
PDF
Механизмы мониторинга баз данных: взгляд изнутри / Дмитрий Еманов (Firebird P...
One-cloud — система управления дата-центром в Одноклассниках / Олег Анастасье...
Масштабируя DNS / Артем Гавриченков (Qrator Labs)
Создание BigData-платформы для ФГУП Почта России / Андрей Бащенко (Luxoft)
Готовим тестовое окружение, или сколько тестовых инстансов вам нужно / Алекса...
Новые технологии репликации данных в PostgreSQL / Александр Алексеев (Postgre...
PostgreSQL Configuration for Humans / Alvaro Hernandez (OnGres)
Inexpensive Datamasking for MySQL with ProxySQL — Data Anonymization for Deve...
Опыт разработки модуля межсетевого экранирования для MySQL / Олег Брославский...
ProxySQL Use Case Scenarios / Alkin Tezuysal (Percona)
MySQL Replication — Advanced Features / Петр Зайцев (Percona)
Внутренний open-source. Как разрабатывать мобильное приложение большим количе...
Подробно о том, как Causal Consistency реализовано в MongoDB / Михаил Тюленев...
Балансировка на скорости проводов. Без ASIC, без ограничений. Решения NFWare ...
Перехват трафика — мифы и реальность / Евгений Усков (Qrator Labs)
И тогда наверняка вдруг запляшут облака! / Алексей Сушков (ПЕТЕР-СЕРВИС)
Как мы заставили Druid работать в Одноклассниках / Юрий Невиницин (OK.RU)
Разгоняем ASP.NET Core / Илья Вербицкий (WebStoating s.r.o.)
100500 способов кэширования в Oracle Database или как достичь максимальной ск...
Apache Ignite Persistence: зачем Persistence для In-Memory, и как он работает...
Механизмы мониторинга баз данных: взгляд изнутри / Дмитрий Еманов (Firebird P...
Ad

Event-based self-healing monitoring / Кирилл Сотников (Cognician)