Apache Kafka and stream processing peculiarities [ru]

Apache Kafka and
stream processing
peculiarities

Предисловие
– Hadoop?
– Storm?
– Onyx?
– Dryad?..
Нет, не слышал

Kafka
Лог сообщений:
– Хранимый и надёжный
– Распределенный
– Масштабируемый
– ну и всё самое хорошее

Turning database
inside out
Доклад Мартина Клеппмана
на Strange Loop’14:
https://www.youtube.com/watch?v=fU9hR3kiOK0
App State = Processing(log)

Плюсы
– Можно пересчитать заново
– Низкая связанность
(coupling)
– Легко тестировать

Apache Kafka and stream processing peculiarities [ru]

Всё вручную
– WHERE
– Индексы
– JOIN
– Идентификаторы
– Агрегация
– JOIN!!!

JOIN, Aggregate
tweet-idurl
url
url/tidurl
url
sum

А ещё
– Разломанный конвеер - не
беда
– Обработка шага заново

Хочу!
Kafka
Samza – для JVM
http://wiki.apache.org/samza/PapersAndTalks
Pymza – для Python

Apache Kafka and stream processing peculiarities [ru]

More Related Content

What's hot (20)

Similar to Apache Kafka and stream processing peculiarities [ru] (20)

More from Vsevolod Solovyov (6)

Apache Kafka and stream processing peculiarities [ru]