Uniting Data JavaOne2013

Hadoop - через тернии к GPU
Dr. Дмитрий Ширяев
dmitri@unitingdata.com
JavaOne 2013

Hadoop
Большой комплекс Java приложений для аналитики
Больших Данных
Hadoop состоит из двух главных компонент
 Hadoop Distributed File System - HDFS
 Map Reduce

HDFS
 Основана на Google’s GFS (Google File System)
 Обеспечивает избыточное хранилище для
больших массивов данных
 Данные распределены по разным узлам
 Предположения:
 Высокая вероятность выхода из строя компонент
системы
 Умеренное (несколько миллионов) количество огромных
файлов
 Файлы - write once
 Большие потоки входных данных

MapReduce
 Записи из источника данных поступают в функцию
Мap в виде пар ключ/значение. Например (filename,
line).
 На Map-шаге происходит предварительная обработка
входных данных. Для этого один из компьютеров
(называемый главным узлом - master node) получает
входные данные задачи, разделяет их на части и
передает другим компьютерам (рабочим узлам -
worker node) для предварительной обработки.

MapReduce
T h e c a t s a t o n t h e m a t
T h e a a r d v a r k s a t o n t h e s o f a
T h e , 1
c a t , 1
s a t , 1
o n , 1
th e , 1
m a t , 1
T h e , 1
a a r d v a r k , 1
s a t , 1
o n , 1
th e , 1
s o f a , 1
M a p p e r I n p u t
M a p p in g
a a r d v a r k , 1
c a t , 1
m a t, 1
o n , 2
s a t , 2
s o f a , 1
t h e , 4
a a r d v a r k , 1
c a t , 1
m a t, 1
o n , 2
s a t , 2
s o f a , 1
t h e , 4
a a r d v a r k , 1
c a t , 1
m a t , 1
o n [ 1 , 1 ]
s a t [ 1 , 1 ]
s o fa , 1
th e [ 1 , 1 , 1 , 1 ]
S h u f ﬂ in g R e d u c in g
F in a l R e s u lt
• После фазы Map все промежуточные значения для
данного ключа собираются в список
• На Reduce-шаге происходит свёртка предварительно
обработанных данных. Главный узел получает ответы
от рабочих узлов и на их основе формирует результат
— решение задачи, которая изначально
формулировалась.

Hadoop и GPU
Среднего размера гибридный CPU-GPU кластер
 Стоимость оборудования в 10 раз меньше
 Расход энергопотребления в 20 раз меньше
 Скорость обработки повышается до 500 раз.

MapReduce на GPU кластере
 Межпроцессорные связи затруднены т.к. графические
процессоры не могут напрямую взаимодействовать с
сетевым вводом/выводом - трудно поддерживать
динамичное и эффективное взаимодействие между
различными GPU процессорами.
 Графические процессоры не имеют виртуальной
памяти.
 Прямолинейная реализации GPU MapReduce
неэффективно использует вычислительные ресурсы
графического процессора и возможную оптимизацию.
 Mодель MapReduce плохо отображается на
присущую GPU архитектуру системы .
 MapReduce на разных GPUs

MapReduce на GPU кластере
 Обеспечить каждый доступный GPU
достаточным количеством вычислени
 скрыть задержки доступа к памяти
 скрыть задержки доступа к сети.
 Расширение возможностей планировщика задач
YARN для полноценного включения GPU как сервиса
предоставляющего вычислительные ресурсы на
кластерном уровне.

Эффективное использование GPU
 Снижение числа межпроцессорных коммуникаций
 Совмещение стадий межпроцессорных
коммуникаций и вычислений
 Перемещение данных между процессорами
 Управление данными находящимися на разных
процессорах
 Поддержание полного доступа к GPU, а также
изменения основного алгоритма MapReduce для
более эффективного использования GPU.

 Улучшение использования ресурсов GPU с помощью
объединения в блоки шагов Map и Reduce
 Добавление аккумуляции шагов Map
 Добавление шага Частичной Свертки
 Создание конвейера MapReduce для достижения
большой степени перекрытия стадий
межпроцессорных коммуникаций и вычислений

 Перемещение данных между процессорами
 Поддержание полного доступа к GPU, а также
изменения основного алгоритма MapReduce для
более эффективного использования GPU.

Зеленый ЦОД
 Наше решение переводит неактивные сервера в
состояние ожидания для максимально эффективного
использования энергии
 Алгоритмы консолидации нагрузки позволяющие
временно отключать неактивные сервера.

Java & GPU (CUDA)
Для каждой функции разработчик должен сделать:
 Сериализовать состояние в память GPU
 Определить код ядра который будет выполняться
GPU
 Проконтролировать запуск ядра
 Десериализовать состояние обратно память CPU

Rootbeer компилятор (CUDA)
Поддерживает все возможности Java, dynamic method
invocation, reflection and native methods.
Поддерживает:
 single and multi-dimensional arrays of primitive and
reference types
 composite objects
 instance and static fields
 dynamic memory allocation
 inner classes
 synchronized methods and monitors
 strings
 exceptions that are thrown or caught on the GPU.

Проект Apache Bigtop
 Bigtop - построение канонического дистрибутива
Apache Hadoop
 Bigtop - сотрудничество компаний таких как Cloudera,
Hortonworks и EMC по подержки следующей волны
инноваций в Больших Данных
 Bigtop – место появления и стабилизации новейших
разработок дистрибутива Apache Hadoop
 Bigtop – делает для Apache то что Debian сделал для
Free Software Foundation

Платформа Uniting Data
 Энергоэффективная обработка Больших Данных на
гетерогенных многоядерных компьютерных кластерах
 Дистрибутив Hadoop основанный на
 Apache Bigtop (bigtop.apache.org)
 Следующем поколении планировщика Apache
Hadoop YARN
 Использует параллельные вычислительные
мощности GPU нового поколения средствами Java
 Зеленый ЦОД

Uniting Data JavaOne2013

More Related Content

Viewers also liked (6)

Similar to Uniting Data JavaOne2013 (20)

Uniting Data JavaOne2013