SlideShare a Scribd company logo
Программно-технические 
комплексы для работы с G&G 
Всеволод Шабад, «СетьПроект»
Ключевые компоненты инфраструктуры 
Вычислительные кластеры 
Рабочие станции 
Локальная сеть 
Системы хранения данных 
Системы резервного копирования 
Система электропитания 
Система охлаждения 
… 
2
В чем неординарность? 
ОГРОМНЫЕ ОБЪЕМЫ ДАННЫХ! 
Обработка сейсмики: 
•сотни ТБ — море 
•десятки ТБ — суша 
Интерпретация сейсмики: 
•десятки ТБ — море 
•единицы ТБ — суша 
Моделирование месторождений: 
•единицы ТБ, сотни ГБ 
3
Пример: резервное копирование 
Система электронной почты для 5 тыс. 
пользователей: 
•5 тыс. ящиков по 300 МБ = 1,5 ТБ 
•ленточный привод LTO-6 ≈ 150 МБ/c 
•длительность резервного копирования ≈ 10 
тыс. секунд ≈ 3.5 часа (приемлемо!) 
Архив сейсмоданных средней компании: 
•800 ТБ 
•ленточный привод LTO-6 ≈ 150 МБ/c 
•длительность резервного копирования ≈ 5 млн. 
секунд ≈ 1400 час ≈ 2 мес (неприемлемо!) 
4
Типичный вычислительный кластер 
РН-КрасноярскНИПИнефть: 
•56 вычислительных узлов 
•896 вычислительных ядер (16 на узел) 
•7168 ГБ ОЗУ (128 на узел) 
Ключевые сложности: 
•электропитание (1200 Вт на узел) 
•место в стойках 
5
Типичная рабочая станция 
НОВАТЭК НТЦ (Тюмень): 
•E5-2687W (8 ядер, 3.1 ГГц) 
•128 ГБ ОЗУ 
•NVIDIA Quadro 4000 
•2 ГБ видеопамяти 
•256 графических ядер CUDA 
Ключевые сложности: 
•высокая цена (≈ 12 тыс. USD за штуку) 
•организация защиты данных 
6
Типичная локальная сеть 
НОВАТЭК НТЦ (Тюмень): 
•10-Gigabit Ethernet (в ЦОДе) 
•Gigabit Ethernet (к рабочим местам) 
Ключевые сложности: 
•низкая производительность 
(загрузка модели занимает десятки минут) 
7
Типичная система хранения данных 
НПЦ «Геостра» (Уфа): 
•3 ГБ/с пропускная способность 
•500 ТБ (в момент заказа — летом), 1.2 ПБ 
(потребность к концу года) 
Ключевые сложности: 
•масштабируемость 
•по производительности 
•по ёмкости 
•готовность к разнородным нагрузкам 
8
Типичная система РК 
«Газпром Геологоразведка» (Тюмень): 
•10 приводов LTO-6 (расширение до 42) 
•900 картриджей LTO-6 (расширение до 3000) 
Ключевые сложности: 
•производительность резервного копирования 
•надёжность хранения резервных копий 
9
Как правильно выбрать решение? 
10
Вклад «СетьПроекта» 
Помощь в постановке задачи 
•уточнение 
исходных данных 
•выявление 
неочевидных ограничений 
•организация 
тестовых стендов 
Внедрение 
•проектирование 
•поставка 
•развертывание 
Сопровождение 
11
12 
Бежим вместе?

More Related Content

PDF
СХД для обработки сейсмики: сравнительный обзор
PDF
HPC file systems (160761)
PDF
Инфраструктура хранения для KADME Whereoil
PDF
Мощнее или умнее? Возможности оптимизации ИТ-инфраструктуры для сейсмики
PDF
Возможности повышения производительности вычислительных кластеров
PDF
Андрей Николаенко, IBS. NVMf: 5 млн IOPS по сети своими руками
 
PPTX
Технологии хранения для больших проектов / Сергей Платонов (RAIDIX)
PPTX
Максим Исаев, IBS. Практика использования комплекса Veritas NetBackup для мод...
 
СХД для обработки сейсмики: сравнительный обзор
HPC file systems (160761)
Инфраструктура хранения для KADME Whereoil
Мощнее или умнее? Возможности оптимизации ИТ-инфраструктуры для сейсмики
Возможности повышения производительности вычислительных кластеров
Андрей Николаенко, IBS. NVMf: 5 млн IOPS по сети своими руками
 
Технологии хранения для больших проектов / Сергей Платонов (RAIDIX)
Максим Исаев, IBS. Практика использования комплекса Veritas NetBackup для мод...
 

What's hot (20)

PDF
Нереляционный SQL
PPTX
Чем заняться вечером, если я знаю сколько будет ++i + ++i / Андрей Бородин (Y...
PPTX
Как ускорить MySQL Handler Socket в 9 раз / Александр Яковлев (Мамба)
PDF
Использование Hadoop в Badoo, Валерий Старынин (Badoo)
PDF
nginx.CHANGES.2015 / Игорь Сысоев, Валентин Бартенев (Nginx)
PPTX
DataCore case studies
PDF
Хранение данных на виниле / Константин Осипов (tarantool.org)
PDF
Аппаратная и программно-аппаратная дедупликация от EMC
PDF
Обработка спйсмоданных: возможности оптимизации ИТ-инфраструктуры
PDF
Путь от монолита на PHP к микросервисам на Scala / Денис Иванов (2GIS)
PDF
Сага о кластере. Все что вы хотели знать про горизонтальное масштабирование в...
PPTX
Защита данных и датацентров от катастроф. Подход Nutanix / Максим Шапошников ...
PDF
Современная операционная система: что надо знать разработчику / Александр Кри...
PDF
Дмитрий Новиков - Tarantool в Badoo
PDF
Lustre file system for seismic processing (159060)
PPT
Распределенное хранилище Ceph. Обзор и практические способы использования
PDF
Linux API с точки зрения разработчика веб-сервера / Валентин Бартенев (NGINX,...
PPTX
Поиск наизнанку
PDF
Мониторинг ожиданий в PostgreSQL / Курбангалиев Ильдус (Postgres Professional)
PPTX
Эффективное использование спотовых узлов Amazon EC2 / Дмитрий Пушкарев (Molec...
Нереляционный SQL
Чем заняться вечером, если я знаю сколько будет ++i + ++i / Андрей Бородин (Y...
Как ускорить MySQL Handler Socket в 9 раз / Александр Яковлев (Мамба)
Использование Hadoop в Badoo, Валерий Старынин (Badoo)
nginx.CHANGES.2015 / Игорь Сысоев, Валентин Бартенев (Nginx)
DataCore case studies
Хранение данных на виниле / Константин Осипов (tarantool.org)
Аппаратная и программно-аппаратная дедупликация от EMC
Обработка спйсмоданных: возможности оптимизации ИТ-инфраструктуры
Путь от монолита на PHP к микросервисам на Scala / Денис Иванов (2GIS)
Сага о кластере. Все что вы хотели знать про горизонтальное масштабирование в...
Защита данных и датацентров от катастроф. Подход Nutanix / Максим Шапошников ...
Современная операционная система: что надо знать разработчику / Александр Кри...
Дмитрий Новиков - Tarantool в Badoo
Lustre file system for seismic processing (159060)
Распределенное хранилище Ceph. Обзор и практические способы использования
Linux API с точки зрения разработчика веб-сервера / Валентин Бартенев (NGINX,...
Поиск наизнанку
Мониторинг ожиданий в PostgreSQL / Курбангалиев Ильдус (Postgres Professional)
Эффективное использование спотовых узлов Amazon EC2 / Дмитрий Пушкарев (Molec...
Ad

Viewers also liked (6)

PDF
Виртуализация рабочих мест: ЧТО? ЗАЧЕМ? КАК?
PDF
Внедрение систем хранения данных для сейсморазведки и промысловой геофизики
PDF
О компании СетьПроект (краткий обзор)
PDF
2015 Upload Campaigns Calendar - SlideShare
PPTX
What to Upload to SlideShare
PDF
Getting Started With SlideShare
Виртуализация рабочих мест: ЧТО? ЗАЧЕМ? КАК?
Внедрение систем хранения данных для сейсморазведки и промысловой геофизики
О компании СетьПроект (краткий обзор)
2015 Upload Campaigns Calendar - SlideShare
What to Upload to SlideShare
Getting Started With SlideShare
Ad

Similar to Программно-технические комплексы для работы с геолого-геофизическими данными (20)

PPT
Быстрое масштабирование систем
PPT
О высокопроизводительном вычислительном комплексе информационно-вычислительно...
PDF
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, paral...
PPT
Petrov Cloud for corporate customer
PDF
Maksym Bezuglyi "Universal highload patterns on a specific example of a game ...
PDF
Гиперконвергентность в трех измерениях: решения, технологии, эффективность
PDF
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, Paral...
PPSX
Опыт использования инновационных технологий линейки продуктов Autodesk IDS ...
PDF
Инженерная и сетевая инфраструктура ЦОД_2TEST
PPT
Top big data architecture patterns by Igor Chub
PPTX
Суперкомпьютеры сегодня и завтра архитектура, проблемы, перспективы (Андрей С...
PDF
Пилотные зоны для тестирования и апробирования SDN&NFV разработок и решений в...
PDF
Андрей Николаенко, IBS. Гиперконвергентная инфраструктура: миграция, технико-...
 
PDF
Note on hyperconvered infrastructure on CIPR
PDF
Интеллектуальная энергетическая система: подходы к разработке архитектуры
PPTX
Nutanix Acropolis - облако на базе KVM под ключ, Максим Шапошников (Nutanix)
PDF
Развитие сетевой архитектуры для ЦОД Cisco ACI
PPTX
СибирьСофтПроект
PDF
Защита центров обработки данных. Механизмы безопасности для классической фабр...
PPT
Untitled Presentation
Быстрое масштабирование систем
О высокопроизводительном вычислительном комплексе информационно-вычислительно...
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, paral...
Petrov Cloud for corporate customer
Maksym Bezuglyi "Universal highload patterns on a specific example of a game ...
Гиперконвергентность в трех измерениях: решения, технологии, эффективность
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, Paral...
Опыт использования инновационных технологий линейки продуктов Autodesk IDS ...
Инженерная и сетевая инфраструктура ЦОД_2TEST
Top big data architecture patterns by Igor Chub
Суперкомпьютеры сегодня и завтра архитектура, проблемы, перспективы (Андрей С...
Пилотные зоны для тестирования и апробирования SDN&NFV разработок и решений в...
Андрей Николаенко, IBS. Гиперконвергентная инфраструктура: миграция, технико-...
 
Note on hyperconvered infrastructure on CIPR
Интеллектуальная энергетическая система: подходы к разработке архитектуры
Nutanix Acropolis - облако на базе KVM под ключ, Максим Шапошников (Nutanix)
Развитие сетевой архитектуры для ЦОД Cisco ACI
СибирьСофтПроект
Защита центров обработки данных. Механизмы безопасности для классической фабр...
Untitled Presentation

More from Vsevolod Shabad (20)

PDF
AI Safety and Security - the basement of customer trust
PDF
Slash Incident Resolution Time - From 30 Days to 1
PDF
Почему нужно бояться искусственного интеллекта и как это правильно делать
PDF
Опыт разработки стратегии ИБ и киберзащиты производственной инфраструктуры в...
PDF
Agile-подходы в ИБ
PDF
State regulation of information protection in the cloud - international and K...
PDF
How can a successful SOC2-compliant ISMS be built without power, money and a...
PDF
Государственное регулирование защиты данных в облаках - международный и каза...
PDF
Первые шаги нового CISO
PDF
С широко закрытыми глазами - риск-ориентированный подход к миграции в облака
PDF
Public clouds - tasty but scary
PDF
Building a cybersecurity strategy for growing companies (IDC Day 2022 - Tashk...
PDF
Public clouds: to love passionately, to be afraid, or to hate (IDC Security D...
PDF
Как повысить результативность борьбы с фродом: опыт "Халык Банка"
PDF
Как оценить пользу от ИБ и увязать с нею инвестиции в безопасность
PDF
Проекты по обеспечению непрерывности бизнеса: ЧТО, ЗАЧЕМ, КАК и ПОЧЕМУ ТАК ДО...
PDF
ITIL, SCRUM, Kanban in Cybersecurity
PDF
Гидродинамическое моделирование: возможности оптимизации ИТ-инфраструктуры
PDF
Infrastructure optimization for seismic processing (eng)
PDF
About NetProject (brief profile)
AI Safety and Security - the basement of customer trust
Slash Incident Resolution Time - From 30 Days to 1
Почему нужно бояться искусственного интеллекта и как это правильно делать
Опыт разработки стратегии ИБ и киберзащиты производственной инфраструктуры в...
Agile-подходы в ИБ
State regulation of information protection in the cloud - international and K...
How can a successful SOC2-compliant ISMS be built without power, money and a...
Государственное регулирование защиты данных в облаках - международный и каза...
Первые шаги нового CISO
С широко закрытыми глазами - риск-ориентированный подход к миграции в облака
Public clouds - tasty but scary
Building a cybersecurity strategy for growing companies (IDC Day 2022 - Tashk...
Public clouds: to love passionately, to be afraid, or to hate (IDC Security D...
Как повысить результативность борьбы с фродом: опыт "Халык Банка"
Как оценить пользу от ИБ и увязать с нею инвестиции в безопасность
Проекты по обеспечению непрерывности бизнеса: ЧТО, ЗАЧЕМ, КАК и ПОЧЕМУ ТАК ДО...
ITIL, SCRUM, Kanban in Cybersecurity
Гидродинамическое моделирование: возможности оптимизации ИТ-инфраструктуры
Infrastructure optimization for seismic processing (eng)
About NetProject (brief profile)

Программно-технические комплексы для работы с геолого-геофизическими данными

  • 1. Программно-технические комплексы для работы с G&G Всеволод Шабад, «СетьПроект»
  • 2. Ключевые компоненты инфраструктуры Вычислительные кластеры Рабочие станции Локальная сеть Системы хранения данных Системы резервного копирования Система электропитания Система охлаждения … 2
  • 3. В чем неординарность? ОГРОМНЫЕ ОБЪЕМЫ ДАННЫХ! Обработка сейсмики: •сотни ТБ — море •десятки ТБ — суша Интерпретация сейсмики: •десятки ТБ — море •единицы ТБ — суша Моделирование месторождений: •единицы ТБ, сотни ГБ 3
  • 4. Пример: резервное копирование Система электронной почты для 5 тыс. пользователей: •5 тыс. ящиков по 300 МБ = 1,5 ТБ •ленточный привод LTO-6 ≈ 150 МБ/c •длительность резервного копирования ≈ 10 тыс. секунд ≈ 3.5 часа (приемлемо!) Архив сейсмоданных средней компании: •800 ТБ •ленточный привод LTO-6 ≈ 150 МБ/c •длительность резервного копирования ≈ 5 млн. секунд ≈ 1400 час ≈ 2 мес (неприемлемо!) 4
  • 5. Типичный вычислительный кластер РН-КрасноярскНИПИнефть: •56 вычислительных узлов •896 вычислительных ядер (16 на узел) •7168 ГБ ОЗУ (128 на узел) Ключевые сложности: •электропитание (1200 Вт на узел) •место в стойках 5
  • 6. Типичная рабочая станция НОВАТЭК НТЦ (Тюмень): •E5-2687W (8 ядер, 3.1 ГГц) •128 ГБ ОЗУ •NVIDIA Quadro 4000 •2 ГБ видеопамяти •256 графических ядер CUDA Ключевые сложности: •высокая цена (≈ 12 тыс. USD за штуку) •организация защиты данных 6
  • 7. Типичная локальная сеть НОВАТЭК НТЦ (Тюмень): •10-Gigabit Ethernet (в ЦОДе) •Gigabit Ethernet (к рабочим местам) Ключевые сложности: •низкая производительность (загрузка модели занимает десятки минут) 7
  • 8. Типичная система хранения данных НПЦ «Геостра» (Уфа): •3 ГБ/с пропускная способность •500 ТБ (в момент заказа — летом), 1.2 ПБ (потребность к концу года) Ключевые сложности: •масштабируемость •по производительности •по ёмкости •готовность к разнородным нагрузкам 8
  • 9. Типичная система РК «Газпром Геологоразведка» (Тюмень): •10 приводов LTO-6 (расширение до 42) •900 картриджей LTO-6 (расширение до 3000) Ключевые сложности: •производительность резервного копирования •надёжность хранения резервных копий 9
  • 11. Вклад «СетьПроекта» Помощь в постановке задачи •уточнение исходных данных •выявление неочевидных ограничений •организация тестовых стендов Внедрение •проектирование •поставка •развертывание Сопровождение 11