SlideShare a Scribd company logo
第一回Web技術勉強会
EFKスタック編
田実 誠
EFK• スタック
ElasticSearch•
RDB• のIndex
全文検索• エンジンのIndex(転置Index)
形態素解析•
Fluentd•
Kibana•
デモ•
アジェンダ
EFKスタック
• ElasticSearch, Fluentd, Kibanaによる分析基盤のこと
→手軽に良い感じに導入できるのが人気
• ElasticSearch
→全文検索エンジン
• Fluentd
→ログ収集、集約のOSS
• Kibana
→Webベースのビジュアライゼーションツール(BIツール的な)
• Fluentdを使って任意のデータソースからElasticSearchにデータを集めて、Kibanaでビジュアライズ
する、というアーキテクチャ
ElasticSearch
• 全文検索エンジンのOSS。Javaで作られている。
→Apache Lucene(全文検索ライブラリ)をベースに作られている
• 全文検索?
→複数の文書(ファイル)から特定の文字列を検索。Webの検索やSFDCのグローバル検索
にも使われている。
• スキーマフリー
→JSONを入力値としてデータ型を推測して型定義を自動的に行なってくれる。事前定義も可能。
• HTTP APIベースで操作可能
• 転置Indexによる高速な全文検索
• HerokuのAddonとしては
SearchBox/Bonsaiなどがある。
ElasticSearch RDB
ドキュメント レコード(タプル)
フィールド カラム
インデックス データベース
RDBのIndex
Index• の種類は色々あるが大抵B-tree Index
• B-tree Indexは完全一致検索、前方一致検索で効果を発揮するが、あいまい検索は苦手。
ディレクトリで• 例えると、アルファベット順にドキュメントを並べて管理しているようなイメージ
出展:http://ja.wikipedia.org/wiki/B%2B%E6%9C%A8
転置Index
• 対象のキーワードがどのドキュメント(レコード)に入っているかどうかを検索するためのIndex
• イメージ的には本の索引
1. カツオはサザエの弟 → カツオ、は、サザエ、の、弟
2. サザエはワカメの姉 → サザエ、は、ワカメ、の、姉
3. ワカメはカツオの妹 → ワカメ、は、カツオ、の、妹
1. 「カツオ&弟」で検索
2. 「カツオ」は”1”, “3”にある
3. 「弟」は”1”にある
4. 共通する要素の”1”を返す
カツオ→1, 3
サザエ→1, 2
ワカメ→2, 3
姉→2
妹→3
弟→1
形態素解析
そもそも• 、この単語(=term)分割(analysis)ってどうやる?
• N-gram
→単語単位ではなく文字単位での区切り
カツオはサザエの弟 → カツオ、ツオは、オはサ、はサザ、サザエ、ザエの、エの弟
形態素解析•
→解析用の辞書を使って品詞分解を行う
→英語はスペース区切り+αで大体うまくいくが、日本語は難しい
Fluentd
• ストリーム(リアルタイム)なログコレクタ(転送・集約)※ログ用のETL
• C+RubyなOSS
• Pluggable
• シンプルな設定ファイル(Apacheに似ている)
• Bufferingによる信頼性、Retry処理
• 柔軟なシステム構成
• TreasureDataが担っているOSS
出展:http://www.fluentd.org/architecture 出展:http://www.fluentd.org/architecture
Kibana
• ElasticSearch社が開発するOSSの分析、ビジュアライゼーションツール(Webアプリ)
• 中身はHTML/JS/CSSなので簡単に設置可能
• ElasticSearchがバックエンド
(Luceneクエリが使える)
→JavaScriptでESのAPIを叩いている
• 基本的にはログの解析に利用される
• Tableauや他のBIツールと比べて
無料で手軽に導入出来る点が魅力
出展:https://www.elastic.co/blog/kibana-4-beta-3-now-more-filtery
デモ
Fluentd• の設定ファイル
ElasticSearch• の設定
Kibana• の良い感じなビジュアライゼーション
• EFKスタックは手軽に導入できる便利な分析基盤
→Fluentdを使って任意のデータソースからElasticSearchにデータを集めて、
Kibanaでビジュアライズする、というアーキテクチャ
• ElasticSearchは全文検索エンジン
• Fluentdはログ収集、集約のOSS
• Kibanaを使ってElasticSearchに溜めたデータを手軽にビジュアライズできる
まとめ
• ElasticSearch
https://www.elastic.co/jp/products/elasticsearch
http://www.slideshare.net/JunOhtani/elasticsearch-pyfes-201207
http://www.slideshare.net/AmazonWebServicesJapan/aws-black-belt-tech-webinar-2016-
amazon-cloudsearch-amazon-elasticsearch-service
• Fluentd
http://www.fluentd.org/
• Kibana
https://www.elastic.co/jp/products/kibana
• B-tree Index
http://qiita.com/kiyodori/items/f66a545a47dc59dd8839
• EFK関連
http://www.slideshare.net/keisuke69/aws-night
• 設定参考資料程度に
http://freedom-man.com/blog/fluentd-elasticsearch-kibana-idle/
参考URL

More Related Content

PDF
DockerとPodmanの比較
PDF
高負荷に耐えうるWeb application serverの作り方
PDF
Yoctoで綺麗なkernel configを作る
PDF
分散学習のあれこれ~データパラレルからモデルパラレルまで~
PDF
Linux女子部 systemd徹底入門
PDF
ネットワーク ゲームにおけるTCPとUDPの使い分け
PDF
Dockerfile を書くためのベストプラクティス解説編
PPTX
Linuxのsemaphoreとmutexを見る 
DockerとPodmanの比較
高負荷に耐えうるWeb application serverの作り方
Yoctoで綺麗なkernel configを作る
分散学習のあれこれ~データパラレルからモデルパラレルまで~
Linux女子部 systemd徹底入門
ネットワーク ゲームにおけるTCPとUDPの使い分け
Dockerfile を書くためのベストプラクティス解説編
Linuxのsemaphoreとmutexを見る 

What's hot (20)

PPTX
Keycloakの実際・翻訳プロジェクト紹介
PDF
Kubernetes ControllerをScale-Outさせる方法 / Kubernetes Meetup Tokyo #55
PDF
エンジニアのためのOSSライセンス管理~OSS管理ツールの池の水全部抜く~
PDF
CentOS Linux 8 の EOL と対応策の検討
PPTX
Amazon EKS によるスマホゲームのバックエンド運用事例
PDF
ストリーム処理を支えるキューイングシステムの選び方
PDF
プログラムを高速化する話
PDF
BuildKitの概要と最近の機能
PDF
ソーシャルゲームのためのデータベース設計
PDF
そんなトランザクションマネージャで大丈夫か?
PDF
例外設計における大罪
PDF
UE4のモバイル開発におけるコンテンツアップデートの話 - Chunk IDとの激闘編 -
PDF
Pythonによる黒魔術入門
PDF
PostgreSQLの運用・監視にまつわるエトセトラ
PDF
ゼロトラスト・アーキテクチャを無料で(やれるだけ)実現する
ODP
Goのサーバサイド実装におけるレイヤ設計とレイヤ内実装について考える
PPTX
DevOpsにおけるAnsibleの立ち位置と使い所
KEY
やはりお前らのMVCは間違っている
PPTX
最近のKeycloakのご紹介 ~クライアントポリシーとFAPI~
PDF
PHPからgoへの移行で分かったこと
Keycloakの実際・翻訳プロジェクト紹介
Kubernetes ControllerをScale-Outさせる方法 / Kubernetes Meetup Tokyo #55
エンジニアのためのOSSライセンス管理~OSS管理ツールの池の水全部抜く~
CentOS Linux 8 の EOL と対応策の検討
Amazon EKS によるスマホゲームのバックエンド運用事例
ストリーム処理を支えるキューイングシステムの選び方
プログラムを高速化する話
BuildKitの概要と最近の機能
ソーシャルゲームのためのデータベース設計
そんなトランザクションマネージャで大丈夫か?
例外設計における大罪
UE4のモバイル開発におけるコンテンツアップデートの話 - Chunk IDとの激闘編 -
Pythonによる黒魔術入門
PostgreSQLの運用・監視にまつわるエトセトラ
ゼロトラスト・アーキテクチャを無料で(やれるだけ)実現する
Goのサーバサイド実装におけるレイヤ設計とレイヤ内実装について考える
DevOpsにおけるAnsibleの立ち位置と使い所
やはりお前らのMVCは間違っている
最近のKeycloakのご紹介 ~クライアントポリシーとFAPI~
PHPからgoへの移行で分かったこと
Ad

Viewers also liked (20)

PDF
第二回IoT関連技術勉強会 ログ収集編
PDF
Heroku
PDF
Heroku Changelog in 2013
PDF
第5回web技術勉強会 暗号技術編その3
PDF
Dreamforce '15のお話
PDF
第三回IoT関連技術勉強会 データ通信編
PPTX
Githubでアカウントを晒した事故に対する対処
PDF
第2回Web技術勉強会 webパフォーマンス改善編
PPTX
Analytics CloudとEmbulkを使った社会的データの分析
PPTX
初めてのGemの読み方
PDF
ApexからAWS IoT叩いてみた話
PDF
第4回web技術勉強会 暗号技術編その2
PDF
第一回IoT関連技術勉強会 分散処理編
PDF
第3回web技術勉強会 暗号技術編その1
PDF
プロセスをしょうもないErrorで落とさないように頑張る
PDF
PaaSに適したアプリケーション設計 がもたらすメリット
PDF
ElectronでExactTargetのGUIツールを作ってみた話
PPTX
RDBとNoSQLの上手な付き合い方(勉強会@LIG 2013/11/11)
PDF
Heroku HTTP API Design Guide
PDF
Pythonによるソーシャルデータ分析―わたしはこうやって修士号を取得しました―
第二回IoT関連技術勉強会 ログ収集編
Heroku
Heroku Changelog in 2013
第5回web技術勉強会 暗号技術編その3
Dreamforce '15のお話
第三回IoT関連技術勉強会 データ通信編
Githubでアカウントを晒した事故に対する対処
第2回Web技術勉強会 webパフォーマンス改善編
Analytics CloudとEmbulkを使った社会的データの分析
初めてのGemの読み方
ApexからAWS IoT叩いてみた話
第4回web技術勉強会 暗号技術編その2
第一回IoT関連技術勉強会 分散処理編
第3回web技術勉強会 暗号技術編その1
プロセスをしょうもないErrorで落とさないように頑張る
PaaSに適したアプリケーション設計 がもたらすメリット
ElectronでExactTargetのGUIツールを作ってみた話
RDBとNoSQLの上手な付き合い方(勉強会@LIG 2013/11/11)
Heroku HTTP API Design Guide
Pythonによるソーシャルデータ分析―わたしはこうやって修士号を取得しました―
Ad

Similar to 第一回Web技術勉強会 efkスタック編 (14)

PDF
Elasticsearch入門 pyfes 201207
PDF
Log analysis by using elasticsearch,kibana and fluentd.
PDF
ElasticSearch+Kibanaでログデータの検索と視覚化を実現するテクニックと運用ノウハウ
PDF
ハッカーズチャンプル2014 LT Fluentd + ElasticSearch + Kibana
PDF
Elasticsearch at Makuake
PDF
LastaFluteに移行したFessとElasticsearch+ESFluteによるDBFlute環境
PDF
Elastic searchをrailsから使ってみた
PDF
20200324 ms open-tech-elastic
PDF
Elastichelps fintechenablesdx usingaibasedautomationand anomalydetection
PDF
Elastic Stackの紹介とOpenStackでの活用事例(Searchlightなど) - OpenStack最新情報セミナー 2016年5月
PPTX
Elasticsearch 5.2とJava Clientで戯れる #elasticsearchjp
PDF
ElasticSearchでいろいろやってる話
PDF
Elasticsearch at CrowdWorks
PDF
Integrating elasticsearch with asp dot net core
Elasticsearch入門 pyfes 201207
Log analysis by using elasticsearch,kibana and fluentd.
ElasticSearch+Kibanaでログデータの検索と視覚化を実現するテクニックと運用ノウハウ
ハッカーズチャンプル2014 LT Fluentd + ElasticSearch + Kibana
Elasticsearch at Makuake
LastaFluteに移行したFessとElasticsearch+ESFluteによるDBFlute環境
Elastic searchをrailsから使ってみた
20200324 ms open-tech-elastic
Elastichelps fintechenablesdx usingaibasedautomationand anomalydetection
Elastic Stackの紹介とOpenStackでの活用事例(Searchlightなど) - OpenStack最新情報セミナー 2016年5月
Elasticsearch 5.2とJava Clientで戯れる #elasticsearchjp
ElasticSearchでいろいろやってる話
Elasticsearch at CrowdWorks
Integrating elasticsearch with asp dot net core

第一回Web技術勉強会 efkスタック編