SlideShare a Scribd company logo
いちばん簡単な
クラスタリング
~レッツゴーデベロッパー2011~

         真幡康徳 - @mahata
アジェンダ
●
  自己紹介
●
  クラスタリングとは
●
  にばんめに簡単な
  クラスタリング
●
  いちばん簡単な
  クラスタリング
自己紹介
真幡康徳 (@mahata)




2011年04月~: 仙台市民
今までの仕事
●
 ブログサービス
●
 レコメンドエンジン
●
 ウェブ検索
●
 ウェブ広告配信
●etc...
クラスタリング
  とは
http://www.flickr.com/photos/tonyjcase/2411318874/




クラスタリング=グルーピング
にばんめに簡単な
 クラスタリング
5分間クラスタリング




 ...正直5分でする話じゃない
データセット例
             リバウンド力   シュート力
桜木 花道 (x1)      5        1
魚住 純 (x2)       4        2
神 宗一郎 (x3)      1        5
河田 雅史 (x4)      5        4
仙道 彰 (x5)       5        5

※ 実在の漫画・キャラクタとは一切関係ありません
リバウンド力 シュート力
x1                 5         1
x2                 4         2
x3                 1         5
x4                 5         4
x5                 5         5

                            非類似度行列
x1とx2の非類似度                  x1 x2 x3 x4 x5
(ユークリッド距離)             x1     0  2 32  9 16
(x1[0] – x2[0])2       x2     2  0 18  5 10
                       x3    32 18  0 16 16
+                      x4     9  5 16  0  1
(x1[1] - x2[1])2       x5    16 10 16  1  0
リバウンド力 シュート力
x1                 5         1
x2                 4         2
x3                 1         5
x4                 5         4
x5                 5         5

                            非類似度行列
x1とx2の非類似度                  x1 x2 x3 x4 x5
(ユークリッド距離)             x1     0  2 32  9 16
(x1[0] – x2[0])2       x2     2  0 18  5 10
                       x3    32 18  0 16 16
+                      x4     9  5 16  0  1
(x1[1] - x2[1])2       x5    16 10 16  1  0
リバウンド力 シュート力
x1                 5         1
x2                 4         2
x3                 1         5
x4                 5         4
x5                 5         5

                            非類似度行列
x1とx2の非類似度                  x1 x2 x3 x4 x5
(ユークリッド距離)             x1     0  2 32  9 16
(x1[0] – x2[0])2       x2     2  0 18  5 10
                       x3    32 18  0 16 16
+
(x1[1] - x2[1])2
                       x4
                              対称行列 0 1
                              9  5 16
                       x5    16 10 16  1  0
非類似度行列
     x1 x2 x3 x4 x5
x1     0  2 32  9 16
x2     2  0 18  5 10
x3    32 18  0 16 16
x4     9  5 16  0  1
x5    16 10 16  1  0
非類似度行列
         x1 x2 x3 x4 x5
    x1     0  2 32  9 16
    x2     2  0 18  5 10
    x3    32 18  0 16 16
    x4     9  5 16  0  1
    x5    16 10 16  1  0   最小

=> x4とx5を併合する(G6)
非類似度行列
     x1 x2 x3 x4 x5
x1     0  2 32  9 16
x2     2  0 18  5 10
x3    32 18  0 16 16
x4     9  5 16  0  1
x5    16 10 16  1  0



                            x1 x2 x3 G6
                       x1     0  2 32  9
                       x2     2  0 18  5
G6の要素はx4とx5の           x3    32 18  0 16
平均を採用(群間平均法)           G6    12  7 16  0
非類似度行列
         x1 x2 x3 G6
    x1     0  2 32  9

                        最小
    x2     2  0 18  5
    x3    32 18  0 16
    G6    12  7 16  0



=> x1とx2を併合する(G7)
繰り返す(略)
樹状図
x1
x2               G8
x4
            G7        G9
x5     G6
x3

     クラスタリングの進行
にばんめに簡単な
 クラスタリング
いちばん簡単な
クラスタリング
ツールを使う




http://www.cs.waikato.ac.nz/ml/weka/
いちばん簡単な
クラスタリング
まとめ
●
    クラスタリングは怖くない
●
  クラスタリングは怖くない
●
  ナイーブな実装は簡単
●
  クラスタリングは怖くない
●
  ナイーブな実装は簡単
●
  ツールを使えばもっと簡単
参考図書
●   [1]データマイニングの基礎
ISBN-10: 4274203484
●   [2]スラムダンク 19巻
ISBN-10: 4088716299
●   [3]魁! 男塾 17巻
ISBN-10: 4088524977
おしまい

More Related Content

PPTX
詳解 ディープラーニング輪読&勉強会 3章後半ニューラルネットワーク
PDF
Trip
PDF
“Sliding right into disaster”の紹介
PDF
kibayos_ov_090922
PPTX
Graph LSTM解説
PDF
サポートベクトルマシン入門
PDF
数学に包まれた生活 - 日曜にゼータ関数を(略 #ロマンティック数学ナイト
PDF
DL勉強会 01ディープボルツマンマシン
詳解 ディープラーニング輪読&勉強会 3章後半ニューラルネットワーク
Trip
“Sliding right into disaster”の紹介
kibayos_ov_090922
Graph LSTM解説
サポートベクトルマシン入門
数学に包まれた生活 - 日曜にゼータ関数を(略 #ロマンティック数学ナイト
DL勉強会 01ディープボルツマンマシン

Similar to Let's Go Developer 2011 - Clustering (20)

PDF
距離まとめられませんでした
PDF
Datamining 5th Knn
PDF
PRML復々習レーン#9 6.3-6.3.1
PDF
Datamining 5th knn
PDF
一般化線形混合モデル isseing333
PPTX
PPTX
わかりやすいパターン認識6章.pptx
PDF
Datamining 8th Hclustering
PDF
競技プログラミングでの線型方程式系
PDF
AtCoder Regular Contest 043 解説
PDF
線形回帰と階層的クラスタリングの実装
PDF
Rで実験計画法 後編
PDF
行列計算を利用したデータ解析技術
PDF
Casual learning machine learning with_excel_no4
PDF
東京都市大学 データ解析入門 8 クラスタリングと分類分析 1
PDF
Rでマンデルブロ集合
PPTX
PRML第6章「カーネル法」
PDF
SSA-SOINN
PDF
Sec15 dynamic programming
距離まとめられませんでした
Datamining 5th Knn
PRML復々習レーン#9 6.3-6.3.1
Datamining 5th knn
一般化線形混合モデル isseing333
わかりやすいパターン認識6章.pptx
Datamining 8th Hclustering
競技プログラミングでの線型方程式系
AtCoder Regular Contest 043 解説
線形回帰と階層的クラスタリングの実装
Rで実験計画法 後編
行列計算を利用したデータ解析技術
Casual learning machine learning with_excel_no4
東京都市大学 データ解析入門 8 クラスタリングと分類分析 1
Rでマンデルブロ集合
PRML第6章「カーネル法」
SSA-SOINN
Sec15 dynamic programming
Ad

Let's Go Developer 2011 - Clustering