SlideShare a Scribd company logo
10
Most read
3分で作る
ストリーム処理基盤
~Kafka + Flink on Docker編~
ウェブニウム株式会社
取締役 CTO 田中康一
自己紹介
名前 田中 康一
所属 ウェブニウム株式会社
役職 取締役CTO
職能 ソウトウェアエンジニア(TypeScript, JavaScript, PHP, Java, etc...)
インフラエンジニア(ミドルウェア)
Twitter @mugeso
今回作るもの
ストリーム処理基盤
INPUT
OUTPUT
groupId: group1
groupId: group2
Apache Kafka
Producer
Producer
Producer
topicA topicB
Consumer
Consumer
Consumer
Broker
Apache Flink
Low latencyHigh Performance
Stateful and Fault-
tolerant
Large scale
VS Apache Storm
出典: https://flink.apache.org/introduction.html
Dockerでの構築
それぞれのイメージ
● Kafka
○ https://hub.docker.com/r/wurstmeister/kafka/
○ 非公式
● Flink
○ https://hub.docker.com/_/flink/
Kafka構築時の注意点
ローカルでシングルブローカー用のサンプル内の、
environment:
KAFKA_ADVERTISED_HOST_NAME: 192.168.99.100
のIPアドレスはdocker engineが動作しているホストマシンのIPアドレスである必
要があります。

More Related Content

PPTX
活動報告9 laravel5入門-
PDF
コンテナ時代だからこそ要注目! Cloud Foundry
PDF
Cloud Foundry Container-to-Container Networking
PDF
Laravel 5.1 LTSでサービスを作る
PPTX
(ゲームじゃない方の)switchで遊びたい話
PDF
20201127 .NET 5
PPTX
今日から始めるLaravel
PDF
Laravel5.1 Release
活動報告9 laravel5入門-
コンテナ時代だからこそ要注目! Cloud Foundry
Cloud Foundry Container-to-Container Networking
Laravel 5.1 LTSでサービスを作る
(ゲームじゃない方の)switchで遊びたい話
20201127 .NET 5
今日から始めるLaravel
Laravel5.1 Release

What's hot (20)

PPTX
Introduction of skippbox
PPTX
Gitlab-CIを活かして自動化してみよう
PDF
ReactiveSignalR
KEY
Composer による依存管理 と Packagist によるライブラリの公開
PDF
恋に落ちるデプロイツール
PPTX
開発環境をVagrantからdockerに移行してみた
PDF
最新追従 バリバリの NetCommons3 紹介
PDF
Arukas meet Mesos/Marathon
PDF
Net commons3 開発環境
PDF
VSCodeで始めるAzure Static Web Apps開発
PDF
Visual studio 14 CTP2 概要
PDF
VagrantからDockerに開発環境を移行した時の話
PPTX
~Dockerfileの開発を劇的に楽にする~ Dockerfile開発環境 EDGE
PDF
イケてる技術で品質を担保しつつスピード感のある開発を実現する冴えたやり方
PDF
Capistranoで自動デプロイ
PDF
ビルドサーバで使うDocker
PPTX
mocloud カスタムDockerイメージ ハンズオン
PDF
WebAssemblyが切り拓くフロントエンドWeb開発の未来
PPTX
Ansibleを使ってdockerコンテナをプロビジョニングする
PDF
Alibaba Cloud で Docker を動かしてみよう [Hands-on]
Introduction of skippbox
Gitlab-CIを活かして自動化してみよう
ReactiveSignalR
Composer による依存管理 と Packagist によるライブラリの公開
恋に落ちるデプロイツール
開発環境をVagrantからdockerに移行してみた
最新追従 バリバリの NetCommons3 紹介
Arukas meet Mesos/Marathon
Net commons3 開発環境
VSCodeで始めるAzure Static Web Apps開発
Visual studio 14 CTP2 概要
VagrantからDockerに開発環境を移行した時の話
~Dockerfileの開発を劇的に楽にする~ Dockerfile開発環境 EDGE
イケてる技術で品質を担保しつつスピード感のある開発を実現する冴えたやり方
Capistranoで自動デプロイ
ビルドサーバで使うDocker
mocloud カスタムDockerイメージ ハンズオン
WebAssemblyが切り拓くフロントエンドWeb開発の未来
Ansibleを使ってdockerコンテナをプロビジョニングする
Alibaba Cloud で Docker を動かしてみよう [Hands-on]
Ad

Recently uploaded (10)

PDF
世界半導体用酸化ハフニウム市場のサプライチェーン解析:上流、下流、収益モデル分析2025-2031
PDF
Qlik TECH TALK セミナー:What's New In Qlik ~ 2025年7月リリース最新機能のご紹介
PDF
細胞培養用バイオリアクターおよび発酵槽市場規模の成長見通し:2031年には2823百万米ドルに到達へ
PDF
グローバルロープウェイ用スチールワイヤーロープ市場2025:主要企業のシェア、売上動向、競争戦略
PDF
【QYResearch】グローバル農業機械市場の動向分析と成長戦略に関する総合調査報告
PDF
【QYResearch】人形ロボット産業の市場構造と今後の発展方向に関する分析レポート
PDF
限外ろ過膜調査レポート:市場規模、シェア、産業分析データ、最新動向2025-2031 YH Research
PDF
XCMSを用いた質量分析データ処理_BioCAsia2021_yamamoto.pdf
PDF
【QYResearch】グローバルコネクタ市場の動向と将来展望に関する詳細な分析報告
PDF
商用ウェブカメラ市場:世界の産業現状、競合分析、シェア、規模、動向2025-2031年の予測
世界半導体用酸化ハフニウム市場のサプライチェーン解析:上流、下流、収益モデル分析2025-2031
Qlik TECH TALK セミナー:What's New In Qlik ~ 2025年7月リリース最新機能のご紹介
細胞培養用バイオリアクターおよび発酵槽市場規模の成長見通し:2031年には2823百万米ドルに到達へ
グローバルロープウェイ用スチールワイヤーロープ市場2025:主要企業のシェア、売上動向、競争戦略
【QYResearch】グローバル農業機械市場の動向分析と成長戦略に関する総合調査報告
【QYResearch】人形ロボット産業の市場構造と今後の発展方向に関する分析レポート
限外ろ過膜調査レポート:市場規模、シェア、産業分析データ、最新動向2025-2031 YH Research
XCMSを用いた質量分析データ処理_BioCAsia2021_yamamoto.pdf
【QYResearch】グローバルコネクタ市場の動向と将来展望に関する詳細な分析報告
商用ウェブカメラ市場:世界の産業現状、競合分析、シェア、規模、動向2025-2031年の予測
Ad

3分で作るストリーム処理基盤~kafka+flink on docker編~

Editor's Notes

  • #5: 今回構築するのはストリーム処理基盤です。 ストリーム処理基盤は絶えず入力されるデータをリアルタイムに処理し続けるための仕組みです。
  • #6: 今回の構成では、ブロードキャストもできるメッセージキューシステムであるApache Kafkaを利用します。 KafkaではKafka本体をbroker、メッセージ送信元をproducer、受信先をconsumerと呼びます。 Producerはメッセージをtopicに対して送信しすることができ、一つのborkerで複数のtopicを扱うことができます。 ConsumerはgroupIdと呼ばれるIDをもち、同一のグループごとに通常のメッセージキューのような振る舞いをします。 一方で、グループが異なる場合は同じメッセージがグループそれぞれに同時に配信されます。
  • #7: Apache Flinkはリアルタイムストリーム処理を行うプロダクトです。 HaddopやStorm、Sparkなどの処理基盤はバッチ処理から発展しているのに対して、Flinkはストリーム処理を前提に設計開発されているため、 ストリーム処理においてハイパフォーマンスでローレイテンシーを実現しています。また、ステートフルに処理を行うことにより堅牢性も実現しています。 実処理の実装はJavaまたはScalaで行います。
  • #8: こちらは公式サイトに掲載されている、ランダムデータのカウント処理の性能をApache Stromと比較したグラフになります。 FlinkがStormに対して高スループットであることが確認できます。
  • #10: KafkaとFlinkのイメージはdocker hubに用意されています。 また、それぞれを構成する際のdocker-compose.ymlが用意されているので、これをコピペすれば簡単に構築できます。