Submit Search
Jubatus Python特徴抽出プラグイン
1 like
402 views
T
Tetsuya Shioda
第5回Jubatusハンズオンで利用した説明資料です。
Technology
Read more
1 of 13
Download now
Downloaded 11 times
1
2
3
4
5
6
7
8
9
10
11
12
13
More Related Content
PPTX
191030 anna-with-python
Takuya Nishimoto
PPTX
210728 mpy
Takuya Nishimoto
PPTX
211120 他人の書いたPythonスクリプトをステップ実行で理解する
Takuya Nishimoto
PPTX
210630 python
Takuya Nishimoto
PPTX
210911 これから始める電子工作とMicroPython
Takuya Nishimoto
PPTX
他人が書いたコードのリファレンスをSphinxで作る方法
Takeshi Sugiyama
PDF
Gnomeとdogtai
Masami Ichikawa
PPTX
Nishimoto 170603-mruby
Takuya Nishimoto
191030 anna-with-python
Takuya Nishimoto
210728 mpy
Takuya Nishimoto
211120 他人の書いたPythonスクリプトをステップ実行で理解する
Takuya Nishimoto
210630 python
Takuya Nishimoto
210911 これから始める電子工作とMicroPython
Takuya Nishimoto
他人が書いたコードのリファレンスをSphinxで作る方法
Takeshi Sugiyama
Gnomeとdogtai
Masami Ichikawa
Nishimoto 170603-mruby
Takuya Nishimoto
What's hot
(20)
PPTX
スクリーンリーダーと点字ディスプレイの話
Takuya Nishimoto
PDF
Python札幌 2012/06/17
Shinya Okano
PPTX
電子工作のためのPython
Takuya Nishimoto
PDF
Pythonのすすめ
Masashi Shibata
PDF
サードパーティパッケージの歩き方
Takesxi Sximada
PDF
The tale of I and python / Python とのはなし
Takanori Suzuki
PDF
スクレイピングとPython
Hironori Sekine
PPTX
MicroPython + ESP32
Takuya Nishimoto
PDF
言語処理するのに Python でいいの? #PyDataTokyo
Shuyo Nakatani
PDF
次世代言語 Python による PyPy を使った次世代の処理系開発
shoma h
PDF
S14 t0 introduction
Takeshi Akutsu
PDF
Effective Python 第2版をオンライン読書会で。
KyutatsuNishiura
PDF
本気でPythonで宛名書きした話
Satoshi Yamada
PDF
S18 t0 introduction
Takeshi Akutsu
PPTX
Pythonスタートアップ勉強会201109 python入門
Takayuki Shimizukawa
PDF
OSS Study#19_LT
NaoY-2501
PDF
Python & PyConJP 2014 Report
gree_tech
PDF
10分でわかるPythonの開発環境
Hisao Soyama
PDF
僕と Python と 時々 NetBeans
Yoshiori Shoji
PPTX
勉強会 Cvml python基礎
真哉 杉野
スクリーンリーダーと点字ディスプレイの話
Takuya Nishimoto
Python札幌 2012/06/17
Shinya Okano
電子工作のためのPython
Takuya Nishimoto
Pythonのすすめ
Masashi Shibata
サードパーティパッケージの歩き方
Takesxi Sximada
The tale of I and python / Python とのはなし
Takanori Suzuki
スクレイピングとPython
Hironori Sekine
MicroPython + ESP32
Takuya Nishimoto
言語処理するのに Python でいいの? #PyDataTokyo
Shuyo Nakatani
次世代言語 Python による PyPy を使った次世代の処理系開発
shoma h
S14 t0 introduction
Takeshi Akutsu
Effective Python 第2版をオンライン読書会で。
KyutatsuNishiura
本気でPythonで宛名書きした話
Satoshi Yamada
S18 t0 introduction
Takeshi Akutsu
Pythonスタートアップ勉強会201109 python入門
Takayuki Shimizukawa
OSS Study#19_LT
NaoY-2501
Python & PyConJP 2014 Report
gree_tech
10分でわかるPythonの開発環境
Hisao Soyama
僕と Python と 時々 NetBeans
Yoshiori Shoji
勉強会 Cvml python基礎
真哉 杉野
Ad
Viewers also liked
(20)
PDF
第1回 Jubatusハンズオン
JubatusOfficial
PPTX
Jubatus: Jubakitでもっと楽をしよう
Tetsuya Shioda
PDF
コンテンツマーケティングでレコメンドエンジンが必要になる背景とその活用
JubatusOfficial
PDF
jubarecommenderの紹介
JubatusOfficial
PDF
Jubaanomalyについて
JubatusOfficial
PDF
JubaQLご紹介
JubatusOfficial
PDF
まだCPUで消耗してるの?Jubatusによる近傍探索のGPUを利用した高速化
JubatusOfficial
PDF
Jubatus解説本の紹介
JubatusOfficial
PPTX
Jubatus 1.0 の紹介
JubatusOfficial
PDF
Jubakitの解説
JubatusOfficial
PPTX
新機能紹介 1.0.6
JubatusOfficial
PDF
Python 特徴抽出プラグイン
JubatusOfficial
PDF
単語コレクター(文章自動校正器)
JubatusOfficial
PPTX
新聞から今年の漢字を予測する
JubatusOfficial
PPTX
かまってちゃん小町
JubatusOfficial
PPTX
発言小町からのプロファイリング
JubatusOfficial
ODP
小町のレス数が予測できるか試してみた
JubatusOfficial
PPTX
銀座のママ
JubatusOfficial
PPTX
小町の溜息
JubatusOfficial
PPTX
JUBARHYME
JubatusOfficial
第1回 Jubatusハンズオン
JubatusOfficial
Jubatus: Jubakitでもっと楽をしよう
Tetsuya Shioda
コンテンツマーケティングでレコメンドエンジンが必要になる背景とその活用
JubatusOfficial
jubarecommenderの紹介
JubatusOfficial
Jubaanomalyについて
JubatusOfficial
JubaQLご紹介
JubatusOfficial
まだCPUで消耗してるの?Jubatusによる近傍探索のGPUを利用した高速化
JubatusOfficial
Jubatus解説本の紹介
JubatusOfficial
Jubatus 1.0 の紹介
JubatusOfficial
Jubakitの解説
JubatusOfficial
新機能紹介 1.0.6
JubatusOfficial
Python 特徴抽出プラグイン
JubatusOfficial
単語コレクター(文章自動校正器)
JubatusOfficial
新聞から今年の漢字を予測する
JubatusOfficial
かまってちゃん小町
JubatusOfficial
発言小町からのプロファイリング
JubatusOfficial
小町のレス数が予測できるか試してみた
JubatusOfficial
銀座のママ
JubatusOfficial
小町の溜息
JubatusOfficial
JUBARHYME
JubatusOfficial
Ad
Similar to Jubatus Python特徴抽出プラグイン
(20)
PPTX
Fluentd1.2 & Fluent Bit
Seiya Mizuno
PPTX
LINEにおける GitHub Enterpriseの活用事例と LINE Notifyについて
LINE Corporation
PDF
PythonのGUI_2018 with NSEG
Jun Okazaki
PDF
Pythonを取り巻く開発環境 #pyconjp
Yoshifumi Yamaguchi
PDF
Python32 pyhackathon-201011
Toru Furukawa
PDF
High performance python computing for data science
Takami Sato
PPTX
PythonとRによるデータ分析環境の構築と機械学習によるデータ認識 第3版
Katsuhiro Morishita
PDF
MQTTとAMQPと.NET
terurou
PDF
Qtではじめるクロスプラットフォームアプリケーション開発 osc2019 hamanako
Kazuo Asano (@kazuo_asa)
PDF
「Python言語」はじめの一歩 / First step of Python
Takanori Suzuki
PPTX
PythonとRによるデータ分析環境の構築と機械学習によるデータ認識
Katsuhiro Morishita
PPTX
Pythonの環境導入 2014年春季版
Katsuhiro Morishita
PPTX
Ossで作成するチーム開発環境
Tadahiro Ishisaka
PDF
ALMツールたべくらべ
Kaoru NAKAMURA
PDF
Cloudn PaaSチームのChatOps実践
Kazuto Kusama
PDF
2018 07-23
Yuji Oshima
PDF
NGK2018B マルチプラットフォームQtと日本Qtユーザー会の紹介
Kazuo Asano (@kazuo_asa)
PPTX
go-apt-cacher/mirror
yutannihilation
PPTX
Gitの基本コマンド
晋 小沼
PDF
EdisonでMQTT
shirou wakayama
Fluentd1.2 & Fluent Bit
Seiya Mizuno
LINEにおける GitHub Enterpriseの活用事例と LINE Notifyについて
LINE Corporation
PythonのGUI_2018 with NSEG
Jun Okazaki
Pythonを取り巻く開発環境 #pyconjp
Yoshifumi Yamaguchi
Python32 pyhackathon-201011
Toru Furukawa
High performance python computing for data science
Takami Sato
PythonとRによるデータ分析環境の構築と機械学習によるデータ認識 第3版
Katsuhiro Morishita
MQTTとAMQPと.NET
terurou
Qtではじめるクロスプラットフォームアプリケーション開発 osc2019 hamanako
Kazuo Asano (@kazuo_asa)
「Python言語」はじめの一歩 / First step of Python
Takanori Suzuki
PythonとRによるデータ分析環境の構築と機械学習によるデータ認識
Katsuhiro Morishita
Pythonの環境導入 2014年春季版
Katsuhiro Morishita
Ossで作成するチーム開発環境
Tadahiro Ishisaka
ALMツールたべくらべ
Kaoru NAKAMURA
Cloudn PaaSチームのChatOps実践
Kazuto Kusama
2018 07-23
Yuji Oshima
NGK2018B マルチプラットフォームQtと日本Qtユーザー会の紹介
Kazuo Asano (@kazuo_asa)
go-apt-cacher/mirror
yutannihilation
Gitの基本コマンド
晋 小沼
EdisonでMQTT
shirou wakayama
Jubatus Python特徴抽出プラグイン
1.
Python 特徴抽出プラグイン Tetsuya Shioda Jubatus
hands-on #5 November 1, 2017
2.
Python 特徴抽出プラグイン とは •
Jubatus で特徴抽出を より簡単に 記述できる Pythonモジュール • 何が嬉しい? • scikit-learn や NTLK など外部ライブラリと連携が可能 • Python で記述できる手軽さ。C++を書かなくてもOK。 • 利用環境: • Python 2.6 以降、Python 3.3 以降をサポート • Jubatus 1.0.5 以降で利用可能 Jubatus hands-on #5 2
3.
今までの特徴抽出プラグインでは • C++実装で、記述量が若干多い。 Jubatus hands-on
#5 3
4.
特徴抽出をもっと簡単に • たった8行で特徴抽出ができるようになります • 数値
/ テキスト / バイナリ特徴量の特徴抽出に対応 • Python外部ライブラリとの連携が可能 Jubatus hands-on #5 4
5.
数値特徴量に対する特徴抽出 Jubatus hands-on #5
5
6.
NLTKによるテキスト特徴量抽出 Jubatus hands-on #5
6 foxes -> fox など原型変換できる 開始位置 文字列データ データ長 スコア 0でもOK0でもOK 通常は1.0でOK トークン化
7.
使い方 1. 特徴抽出プラグインを実装する( .pyファイルを作成) 2.
PYTHONPATHが通っているところに .py ファイルを配置する 3. 設定ファイルを記述、Jubatusサーバを起動すれば利用できる Jubatus hands-on #5 7 .py ファイル名 クラス名 rulesの中で呼ぶ
8.
デモ: Jubatus hands-on #5
8 時系列特徴抽出プラグイン https://github.com/jubatus/events/ hands-on-5th/python-plugin
9.
時系列データ分析 • 時間とともに変化するデータ系列を予測したい • 電力消費量、株価、売上高など •
自己回帰(AR)モデル • 最も単純な時系列データ予測手法の1つ • AR(p)モデル:現在の値が、過去 p 期分のデータに依存する モデル Jubatus hands-on #5 9 𝒚 𝒕 = 𝒄 + 𝒊=𝟏 𝒑 𝒘𝒊 𝒚 𝒕−𝒊 + 𝜺 𝒕 AR(2)系列 321 Jubatus に 一工夫が必要
10.
• Jubatusは受け取ったデータを学習してすぐ捨てる。保存はしない。 • 受け取ったデータを一時的に保存するキャッシュが必要 •
特徴抽出プラグイン側で保存するようにしよう 過去のデータを保存するには Jubatus hands-on #5 10 Cache 必要なくなったら削除する
11.
自己回帰モデルの特徴抽出 Jubatus hands-on #5
11 特徴量ごとにキャッシュを持つ 最新データをキャッシュに格納 一番古いデータを削除 過去p期分の特徴量を全て生成 特徴抽出結果とする
12.
サンプルプラグイン • GitHub の
jubatus リポジトリで以下の4種類のサンプルを提供 • binary_length.py:バイナリデータ長取得 • number_multiplier.py:掛け算 • sentence_stemmer.py:NTLKによるステミング • space_splitter.py:単語のスペース区切り • 各プラグインの利用方法は、公式Webサイトをご覧ください http://jubat.us/ja/fv_convert.html#python-bridge Jubatus hands-on #5 12
13.
さいごに Pull-Request お待ちしてます! https://github.com/jubatus/jubatus Jubatus hands-on
#5 13
Download