PHPでTwitter Bot作った

家計簿ったー(α)の紹介

 里 洋平 (yokkuns)
自己紹介
●
    ID:yokkuns
●
    名前:里 洋平
●
    職業:Webエンジニア
●
    出身:種子島
●
    趣味:プログラミングとか
●
    仕事では、PHPではなく、主にPerl
家計簿ったーとは
●
    支出を投稿すると、自動で分類して記録してく
    れるサービス。
●
    詳しくは、こちら。
    –   http://d.hatena.ne.jp/yokkuns/20090728/1248797834
アジェンダ
●
    背景
●
    全体の流れ
●
    分類の方法
●
    まとめ
背景



皆さん、Twitterって知ってますよね?
背景



自分の周りでは、今Twitterブーム
背景



さらに、言うと
背景



Twitter Botの開発ブーム
背景




こんなやつら
背景



俺も何か作りたい!
背景



でも、何作ろう?
背景



昔作ったは良いけど結局使わなかった

携帯用家計簿サイトのことを思い出す
背景

  家計簿付けるために

ノートを開いて手で書いたり、

Pc立ち上げてエクセル使ったり

そういうのが面倒だから作った
背景



・・・のだが、、、
背景



家計簿のために携帯を出すのも面倒だった。。。
背景



だけど、今ならTwitterがある!
背景



Twitterなら、基本ずっと立ち上げてるので

家計簿のためにわざわざってならない!
背景



ってことで、家計簿BOTになりました。
全体的な流れ
●
    Twitter用のライブラリとか使わずに、普通に
    simplexml
●
    取得したデータを、Chain of Responsibility
    パターンで処理
●
    支出の投稿で不明なフォーマットは、解析して
    分類
分類方法
●
    ベクトル空間モデル使ってる
●
    あらかじめ、項目をベクトル表現
●
    つぶやきをベクトル変換
●
    類似度は両ベクトルの余弦
●
    一番類似度が高い項目に分類
分類方法 - 学習データ生成
                  Web API
         検索 API
         キーフレーズAPI

入力データ
           作成

                学習データ
分類方法 - 分類
               Web API
      検索 API
      キーフレーズAPI



           類似度計算

 検索   登録     学習データ
まとめ
●
    今回自然言語処理を初めてやってみたが、結構
    数学的で面白い
●
    botは、普通のプログラミングと違って速度を
    求められないので、多少重い処理をしても気に
    ならない
●
    Web APIをいっぱい叩ける
●
    なので、簡単に作れる

More Related Content

PPTX
アプリ制作マスターへの道
PPTX
俺とプログラミング教育
PPTX
素人のための機械学習
PPTX
俺と前回敗因から分析するバッドパターン
PPTX
俺とコミュニティ活動のタスク
PDF
PHPを使って3分で作る3キャリア対応ケータイサイト
PPTX
Small Basicをご存じですか?
PDF
ruby、sinatraで作るfacebookアプリ
アプリ制作マスターへの道
俺とプログラミング教育
素人のための機械学習
俺と前回敗因から分析するバッドパターン
俺とコミュニティ活動のタスク
PHPを使って3分で作る3キャリア対応ケータイサイト
Small Basicをご存じですか?
ruby、sinatraで作るfacebookアプリ

Viewers also liked (9)

PDF
20131206 japan r
PDF
Tokyor39 yokkuns
PDF
Tokyor35 人工データの発生
PDF
ドリコムの分析環境とデータサイエンス活用事例
PDF
Tokyo r15 異常検知入門
PPTX
Tokyor42_r_datamining_18
PDF
異常行動検出入門 – 行動データ時系列のデータマイニング –
PDF
Tokyor45 カーネル多変量解析第2章 カーネル多変量解析の仕組み
PDF
時系列分析による異常検知入門
20131206 japan r
Tokyor39 yokkuns
Tokyor35 人工データの発生
ドリコムの分析環境とデータサイエンス活用事例
Tokyo r15 異常検知入門
Tokyor42_r_datamining_18
異常行動検出入門 – 行動データ時系列のデータマイニング –
Tokyor45 カーネル多変量解析第2章 カーネル多変量解析の仕組み
時系列分析による異常検知入門
Ad

Similar to 第45回PHP勉強会(里洋平) (10)

PPT
Tokyowebmining5 yokkuns
PDF
YAPC::Asia 2014 - 半端なPHPDisでPHPerに陰で笑われないためのPerl Monger向け最新PHP事情
PDF
Hypermedia: The Missing Element to Building Adaptable Web APIs in Rails (増補日本語版)
PDF
⑲jQueryをおぼえよう!その5
PPT
1221bot講習会
PPTX
Linebot作ったら売れた話
PDF
魔法少女 Laravel
PDF
RでつくるWebアプリ~rApache編~
PDF
Linked Open Data技術
PPTX
かんたん Twitter アプリをつくろう
Tokyowebmining5 yokkuns
YAPC::Asia 2014 - 半端なPHPDisでPHPerに陰で笑われないためのPerl Monger向け最新PHP事情
Hypermedia: The Missing Element to Building Adaptable Web APIs in Rails (増補日本語版)
⑲jQueryをおぼえよう!その5
1221bot講習会
Linebot作ったら売れた話
魔法少女 Laravel
RでつくるWebアプリ~rApache編~
Linked Open Data技術
かんたん Twitter アプリをつくろう
Ad

More from Yohei Sato (20)

PDF
Tokyor60 r data_science_part1
PDF
Tokyor60 opening
PDF
Tokyor42 ggplot2
PDF
EasyHtmlReportの紹介
PDF
R言語で学ぶマーケティング分析 競争ポジショニング戦略
PDF
Rでレポートメール
PDF
Rで階層ベイズモデル
PDF
Rでピボットテーブル
PDF
第3回Japan rパネルディスカッション
PDF
Tokyor26 data fusion
PDF
Tokyor24 yokkuns
PDF
Tokyowebmining19 data fusion
PDF
傾向スコア解析とUplift Modelling
PDF
Complex network ws_percolation
PDF
異常行動検出入門(改)
PDF
Tokyor22 selection bias
PDF
Uplift Modelling 入門(1)
PDF
エンジニアサポート新年会2012 データマイニングcross 第1部
PDF
Japan r2 lt_yokkuns
PDF
Japan r2 tokyor
Tokyor60 r data_science_part1
Tokyor60 opening
Tokyor42 ggplot2
EasyHtmlReportの紹介
R言語で学ぶマーケティング分析 競争ポジショニング戦略
Rでレポートメール
Rで階層ベイズモデル
Rでピボットテーブル
第3回Japan rパネルディスカッション
Tokyor26 data fusion
Tokyor24 yokkuns
Tokyowebmining19 data fusion
傾向スコア解析とUplift Modelling
Complex network ws_percolation
異常行動検出入門(改)
Tokyor22 selection bias
Uplift Modelling 入門(1)
エンジニアサポート新年会2012 データマイニングcross 第1部
Japan r2 lt_yokkuns
Japan r2 tokyor

第45回PHP勉強会(里洋平)