Submit Search
データ分析基盤として Rancher・k8s で始まるのか調査してみた
0 likes
1,213 views
YASUKAZU NAGATOMI
Rancher Meetup #06 in Osaka LT資料 #rancherjp
Data & Analytics
Read more
1 of 10
1
2
3
4
5
6
7
8
9
10
More Related Content
PDF
RancherとGitOps的な話
YASUKAZU NAGATOMI
PDF
Webアプリ開発向け ゆるふわDocker使いがCloud Naive開発に必要そうなetc.
YASUKAZU NAGATOMI
PPTX
Introduction of Rancher at OSC Tokyo 17 Spring
Go Chiba
PPTX
Kubernetesと暮らすRancherな生活
Go Chiba
PDF
Apache Drill で見る Twitter の世界
Masaru Watanabe
PDF
Clojure の各種React系ラッパーライブラリのサーバーサイドレンダリングの現状について
Kazuhiro Hara
PDF
新しいOpenShiftのしくみを調べてみた
Kazuto Kusama
PPTX
DockerCon '17 Feedback and Introduction of Longhorn at Rancher JP
Go Chiba
RancherとGitOps的な話
YASUKAZU NAGATOMI
Webアプリ開発向け ゆるふわDocker使いがCloud Naive開発に必要そうなetc.
YASUKAZU NAGATOMI
Introduction of Rancher at OSC Tokyo 17 Spring
Go Chiba
Kubernetesと暮らすRancherな生活
Go Chiba
Apache Drill で見る Twitter の世界
Masaru Watanabe
Clojure の各種React系ラッパーライブラリのサーバーサイドレンダリングの現状について
Kazuhiro Hara
新しいOpenShiftのしくみを調べてみた
Kazuto Kusama
DockerCon '17 Feedback and Introduction of Longhorn at Rancher JP
Go Chiba
What's hot
(18)
PDF
Cloudn PaaSチームのChatOps実践
Kazuto Kusama
PDF
Arukas meet Mesos/Marathon
Shuji Yamada
PPTX
DockerCon '17 Feedback at PaaS JP
Go Chiba
PDF
イケてる分析基盤をつくる
Atsushi Hayakawa
PPTX
20190806 Q# Measurements
Takayoshi Tanaka
PDF
kube-system落としてみました
Shuntaro Saiba
PPTX
俺とKubernetes
Masayuki KaToH
PPTX
C#エンジニアのためのdocker kubernetesハンズオン
Takayoshi Tanaka
PPTX
Rancher2.0でkubernetes
cyberblack28 Ichikawa
PDF
AWSをコードで定義する
Sugawara Genki
PPTX
それFluentdで! #fluentd
Atsuko Shibuya
PDF
パフォーマンス計測Ciサービスを作って得た知見を共有したい
zaru sakuraba
PDF
20171122 altair converge2017publish
Hiroshi Tanaka
PDF
JAWS-UG沖縄 AWS Fargateハンズオン 2018年10月
Koichiro Nishijima
PDF
Ohs#7 学習API
祐理 大野
PDF
nginxのログを非スケーラブルに省メモリな方法で蓄積する
Atsushi Hayakawa
PDF
Re-frame and A-Frame
Kazuhiro Hara
PDF
いまさら聞けないRancherの話
Ryotaro Kobayashi
Cloudn PaaSチームのChatOps実践
Kazuto Kusama
Arukas meet Mesos/Marathon
Shuji Yamada
DockerCon '17 Feedback at PaaS JP
Go Chiba
イケてる分析基盤をつくる
Atsushi Hayakawa
20190806 Q# Measurements
Takayoshi Tanaka
kube-system落としてみました
Shuntaro Saiba
俺とKubernetes
Masayuki KaToH
C#エンジニアのためのdocker kubernetesハンズオン
Takayoshi Tanaka
Rancher2.0でkubernetes
cyberblack28 Ichikawa
AWSをコードで定義する
Sugawara Genki
それFluentdで! #fluentd
Atsuko Shibuya
パフォーマンス計測Ciサービスを作って得た知見を共有したい
zaru sakuraba
20171122 altair converge2017publish
Hiroshi Tanaka
JAWS-UG沖縄 AWS Fargateハンズオン 2018年10月
Koichiro Nishijima
Ohs#7 学習API
祐理 大野
nginxのログを非スケーラブルに省メモリな方法で蓄積する
Atsushi Hayakawa
Re-frame and A-Frame
Kazuhiro Hara
いまさら聞けないRancherの話
Ryotaro Kobayashi
Ad
Similar to データ分析基盤として Rancher・k8s で始まるのか調査してみた
(20)
PDF
Hadoop, NoSQL, GlusterFSの概要
日本ヒューレット・パッカード株式会社
PDF
MongoDBを用いたソーシャルアプリのログ解析 〜解析基盤構築からフロントUIまで、MongoDBを最大限に活用する〜
Takahiro Inoue
PDF
Apache Sparkやってみたところ
Tatsunori Nishikori
PDF
Hadoop事始め
You&I
PDF
Kuduを調べてみた #dogenzakalt
Toshihiro Suzuki
PPTX
PythonとRによるデータ分析環境の構築と機械学習によるデータ認識
Katsuhiro Morishita
PDF
Java Clientで入門する Apache Kafka #jjug_ccc #ccc_e2
Yahoo!デベロッパーネットワーク
PPTX
EmbulkとDigdagとデータ分析基盤と
Toru Takahashi
PPTX
EmbulkとDigdagとデータ分析基盤と
Toru Takahashi
PDF
SparkとCassandraの美味しい関係
datastaxjp
PDF
Devfes kyoto2017
Satomi Tsujita
PDF
利用者主体で行う分析のための分析基盤
Sotaro Kimura
PPTX
認証/認可が実現する安全で高速分析可能な分析処理基盤
Masahiro Kiura
PDF
第1回Hadoop関西勉強会参加レポート
You&I
PDF
Hadoop基盤を知る
日本ヒューレット・パッカード株式会社
PDF
データポータルソフトウェア CKAN
Fumihiro Kato
PDF
TokyoWebminig カジュアルなHadoop
Teruo Kawasaki
PDF
Draft: Observability, Service Mesh and Microservices
Taiki
PDF
オープンデータの技術よりな話
Fumihiro Kato
PDF
今注目のSpark SQL、知っておきたいその性能とは 20151209 OSC Enterprise
YusukeKuramata
Hadoop, NoSQL, GlusterFSの概要
日本ヒューレット・パッカード株式会社
MongoDBを用いたソーシャルアプリのログ解析 〜解析基盤構築からフロントUIまで、MongoDBを最大限に活用する〜
Takahiro Inoue
Apache Sparkやってみたところ
Tatsunori Nishikori
Hadoop事始め
You&I
Kuduを調べてみた #dogenzakalt
Toshihiro Suzuki
PythonとRによるデータ分析環境の構築と機械学習によるデータ認識
Katsuhiro Morishita
Java Clientで入門する Apache Kafka #jjug_ccc #ccc_e2
Yahoo!デベロッパーネットワーク
EmbulkとDigdagとデータ分析基盤と
Toru Takahashi
EmbulkとDigdagとデータ分析基盤と
Toru Takahashi
SparkとCassandraの美味しい関係
datastaxjp
Devfes kyoto2017
Satomi Tsujita
利用者主体で行う分析のための分析基盤
Sotaro Kimura
認証/認可が実現する安全で高速分析可能な分析処理基盤
Masahiro Kiura
第1回Hadoop関西勉強会参加レポート
You&I
Hadoop基盤を知る
日本ヒューレット・パッカード株式会社
データポータルソフトウェア CKAN
Fumihiro Kato
TokyoWebminig カジュアルなHadoop
Teruo Kawasaki
Draft: Observability, Service Mesh and Microservices
Taiki
オープンデータの技術よりな話
Fumihiro Kato
今注目のSpark SQL、知っておきたいその性能とは 20151209 OSC Enterprise
YusukeKuramata
Ad
More from YASUKAZU NAGATOMI
(16)
PDF
コンテナ化から始めてKubernetesクラスタ管理にRancherを使うまで〜前編〜
YASUKAZU NAGATOMI
PDF
Cloud Native をやっていくにはどう学んでいくかをみんなで考えてみる
YASUKAZU NAGATOMI
PDF
コンテナイメージの脆弱性スキャンについて
YASUKAZU NAGATOMI
PDF
オンプレ Rancher Server × ML基盤 をはじめます
YASUKAZU NAGATOMI
PDF
オンプレでPrivate Registry使ったDockerイメージの運用について
YASUKAZU NAGATOMI
PDF
ざっくり始めるCloud Native開発
YASUKAZU NAGATOMI
PDF
Webアプリ開発向け ゆるふわDocker使いが Cloud Naive開発に必要なetc.
YASUKAZU NAGATOMI
PPTX
続Rancherで始めるRedmine生活~Redmineのプライベートカタログを作ってみた~
YASUKAZU NAGATOMI
PPTX
Rancherで始めるRedmine生活 ~ Redmineのプライベートカタログを作ってみた~
YASUKAZU NAGATOMI
PPTX
redashのプラベートカタログ作成してつまづいたアレやコレや
YASUKAZU NAGATOMI
PPTX
オンプレ&HTTP Proxyな環境でRancherOS入れてみた話
YASUKAZU NAGATOMI
PPTX
Kichijoji-mini #010:うちの残念な開発環境を正常な状態にするには?
YASUKAZU NAGATOMI
PPTX
PM Beginners #06 : MTGの理想と現実
YASUKAZU NAGATOMI
PPTX
プロジェクトマネジメントと開発を両立したい!
YASUKAZU NAGATOMI
PPTX
PM Beginners #3:メンバの考えていること、共有できてます?
YASUKAZU NAGATOMI
PPTX
技術的負債だらけのチームで技術マネージメントしてみた Kichijoji.pm7[talk2]
YASUKAZU NAGATOMI
コンテナ化から始めてKubernetesクラスタ管理にRancherを使うまで〜前編〜
YASUKAZU NAGATOMI
Cloud Native をやっていくにはどう学んでいくかをみんなで考えてみる
YASUKAZU NAGATOMI
コンテナイメージの脆弱性スキャンについて
YASUKAZU NAGATOMI
オンプレ Rancher Server × ML基盤 をはじめます
YASUKAZU NAGATOMI
オンプレでPrivate Registry使ったDockerイメージの運用について
YASUKAZU NAGATOMI
ざっくり始めるCloud Native開発
YASUKAZU NAGATOMI
Webアプリ開発向け ゆるふわDocker使いが Cloud Naive開発に必要なetc.
YASUKAZU NAGATOMI
続Rancherで始めるRedmine生活~Redmineのプライベートカタログを作ってみた~
YASUKAZU NAGATOMI
Rancherで始めるRedmine生活 ~ Redmineのプライベートカタログを作ってみた~
YASUKAZU NAGATOMI
redashのプラベートカタログ作成してつまづいたアレやコレや
YASUKAZU NAGATOMI
オンプレ&HTTP Proxyな環境でRancherOS入れてみた話
YASUKAZU NAGATOMI
Kichijoji-mini #010:うちの残念な開発環境を正常な状態にするには?
YASUKAZU NAGATOMI
PM Beginners #06 : MTGの理想と現実
YASUKAZU NAGATOMI
プロジェクトマネジメントと開発を両立したい!
YASUKAZU NAGATOMI
PM Beginners #3:メンバの考えていること、共有できてます?
YASUKAZU NAGATOMI
技術的負債だらけのチームで技術マネージメントしてみた Kichijoji.pm7[talk2]
YASUKAZU NAGATOMI
Recently uploaded
(8)
PDF
【QYResearch】グローバルコネクタ市場の動向と将来展望に関する詳細な分析報告
QY Research株式会社
PDF
グローバルロープウェイ用スチールワイヤーロープ市場2025:主要企業のシェア、売上動向、競争戦略
yhresearch
PDF
世界半導体用酸化ハフニウム市場のサプライチェーン解析:上流、下流、収益モデル分析2025-2031
2418867459
PDF
【QYResearch】グローバル磁性材料産業チェーンの構造分析と市場動向の詳細解説
QY Research株式会社
PDF
XCMSを用いた質量分析データ処理_BioCAsia2021_yamamoto.pdf
h_yama2396
PDF
【QYResearch】人形ロボット産業の市場構造と今後の発展方向に関する分析レポート
QY Research株式会社
PDF
【QYResearch】グローバル農業機械市場の動向分析と成長戦略に関する総合調査報告
QY Research株式会社
PDF
【QYResearch】急拡大する医療機器市場における主要企業の動向と競争環境分析
QY Research株式会社
【QYResearch】グローバルコネクタ市場の動向と将来展望に関する詳細な分析報告
QY Research株式会社
グローバルロープウェイ用スチールワイヤーロープ市場2025:主要企業のシェア、売上動向、競争戦略
yhresearch
世界半導体用酸化ハフニウム市場のサプライチェーン解析:上流、下流、収益モデル分析2025-2031
2418867459
【QYResearch】グローバル磁性材料産業チェーンの構造分析と市場動向の詳細解説
QY Research株式会社
XCMSを用いた質量分析データ処理_BioCAsia2021_yamamoto.pdf
h_yama2396
【QYResearch】人形ロボット産業の市場構造と今後の発展方向に関する分析レポート
QY Research株式会社
【QYResearch】グローバル農業機械市場の動向分析と成長戦略に関する総合調査報告
QY Research株式会社
【QYResearch】急拡大する医療機器市場における主要企業の動向と競争環境分析
QY Research株式会社
データ分析基盤として Rancher・k8s で始まるのか調査してみた
1.
データ分析基盤として Rancher ・k8sで始まるのか調査してみた Rancher Meetup
#06 in Osaka やっさん @yassan168
2.
結論 妄想していた様な美味い状態には、まだまだ、遠い世界だった。 ※GCPなどのパブリッククラウドの利用は除く ※オンプレの話です。 パブリッククラウド使うなら、車輪の再発明せずに、 GCPなら、DataprocやDataflow、BigQueryとかマネージドサービス使うと か。
3.
おさらい。
4.
データ分析基盤の対象領域ってなんだっけ? • Data Lake(Scheme
On Read) • HDFS • Data Warehouse(Scheme On Write) • Hive、Presto • BIツール • Redash、SuperSet、Metabase • ETL処理向けツール • DigDag、Kuroko2、Luigi、AirFlow • Flume、Sqoop • Embulk、Fluentd、Kafka • Spark Streaming、NiFi、Flink ※今回は機械学習基盤は除外。kubeflow使うとか?
5.
ログコレクタ方面 • Kafkaもk8sへの対応は進んでいるけど、、 • KubernetesでのKafkaクラスタの管理と運用 •
Apache Kafka on Kubernetes – Could You? Should You? | Confluent • Fluentdもk8sふくめコンテナでは割とよく聞く話 • Kubernetes Logging with Fluentd | Fluentd
6.
データストア方面の流れ Hadoopのストレージオプションにパブリッククラウド対応する流れが増 えた • Cloud Dataproc
FAQ | Cloud Dataproc ドキュメント | Google Cloud • Hadoopエコシステムのデータストア振り返り • Apache Hadoopの新機能Ozoneの現状 ※Ozone:S3の様なオブジェクトストレージをHadoop上で実現する • Cloudera in the Cloud #CWT2017 ただ、まだ、HDFSをk8sで本番利用するのは厳しい cf. kubernetes-HDFS/README.md at master · apache-spark-on-k8s/kubernetes-HDFS
7.
計算リソース方面の流れ Spark v2.3.0からk8sをNativeサポート! k8sがあれば、YARN無くてもk8sがお世話してくれる。 • Apache
Spark on Kubernetesの検証 – Qiita • HDFS on Kubernetesの検証 – Qiita ※一時領域としてHDFSも必要になるので、テンポラリとして割り切って利用 さらにv2.4では以下も対応 Kubernetes Scheduler Backend • [SPARK-23984] PySpark bindings for K8S • [SPARK-24433] R bindings for K8S • [SPARK-23146] Support client mode for Kubernetes cluster backend • [SPARK-23529] Support for mounting K8S volumes
8.
ETLの要。ワークフロー方面について • Airflow が
k8s Executer に対応している Kubernetes Executor — Airflow Documentation • CNCFにある Argo Workflows がk8sを前提としていて面白そう (CI/CDもあり) Kubernetesユーザーは待っていた!?コンテナネイティブなワークフローエンジンArgoを試してみた
9.
今後参考になりそうなもの • kubernetes/community にて各トピックでSIGが存在。 ミーティング議事録とかも残ってるので読むと面白い。 •
Big Data Special Interest Group community/sig-big-data at master · kubernetes/community • Storage Special Interest Group community/sig-storage at master · kubernetes/community
10.
ここはRancher Meetupですが? • RancherにもHadoopのチャートは存在するが使えるかは不明 charts/charts/hadoop/v1.0.7
at master · rancher/charts 現状のデータ分析基盤としてのRancherの出番とは。。。 • 複数のデータ分析基盤の上げ下げとかかも。 → 必要なときだけ構築して、出来たものをDWHやDataMartなどに放り 込むとか。 • BIとかのツールをチャート化して簡単にデプロイ出来るようにすると か?