本(提案)書に含まれる情報は、貴社内部のご検討、評価の目的のために提供されるものです。貴社内でのご使用、複製、開示はこの目的のために必要な範囲でのみお願いいたします。 貴社との間で
正式な契約が成立した場合には、それに従ってこれをお取り扱い願います。なお、貴社にて既に取得されている情報については、これらの制限は及びません。
Copyright © 2017 ITOCHU Techno-Solutions Corporation
教師なし学習のすすめ
2018年7月17日
Copyright © 2017 ITOCHU Techno-Solutions Corporation
自己紹介
 名前: 後藤仁奈(ごとうにな)。
 所属: 伊藤忠テクノソリューションズ株式会社。
 経歴: AI始めて1年ほど。
文系出身。
 仕事内容: AIフレームワーク「Renom」を用いたPoC支援。
Page 1
Copyright © 2017 ITOCHU Techno-Solutions Corporation
AI分析の思考回路
AIフレームワークを使って、回帰!!予測!!
Page 2
いろいろなアルゴリズムを使って、
一番精度の高いものを見つけてモデルを作ればいい!!
色々やってみたけど、
とりあえず決定係数で比較しよう!
アルゴリズム 決定係数
1月 2月 3月 4月 5月 6月
全結合 0.57 0.86 0.76 0.56 0.78 0.78
LSTM 0.66 0.62 0.89 0.67 0.57 0.65
Copyright © 2017 ITOCHU Techno-Solutions Corporation
DLで言えること
結局、DLだけを使って精度向上を一生懸命やっても、
Page 3
へー
 根拠が説明できない
 具体性がない
「決定係数を見ると、
このアルゴリズムを使った時が
最も精度が高かったです。」
「ただ、日によって
精度にばらつきがありますので、
色々なタイプのデータを
大量に学習させる必要があります。」
 方針がわかりにくい
Copyright © 2017 ITOCHU Techno-Solutions Corporation
教師なし学習とは
Page 4
機
械
学
習
教師あり学習
教師なし学習
データ 教師
データ
データから導き出せる答えが
教師(正解)に近づくよう、
各データのパラメータ(重
み)を学習によって導き出す。
正解は与えず、データ自身で何か
しらの特徴量を見つけ出す。
(データ自身が持つ特徴や傾向を
見つける)
Copyright © 2017 ITOCHU Techno-Solutions Corporation
教師なし学習いろいろ①:次元圧縮
Page 5
主成分分析では、多くのデータ項目(変数)が存在する
場合、それらを1つから3つの合成変数に縮約(置き換
え)することで、データを理解しやすくしています。
• PCA(主成分分析)
非線形のニューラルネットワークを用いるため、主成分
分析よりも特徴をなるべく残して次元圧縮が可能となり
ます。
• オートエンコーダ
Copyright © 2017 ITOCHU Techno-Solutions Corporation
Copyright © 2017 ITOCHU Techno-Solutions Corporation
• K-means法
6
1. 初期状態 2. 重心を計算する 3. 一番近い重心の色に変わる 4. 再度、重心を計算する
5. 再度、色を置き換える 6.また重心を計算する 7. 変化がなくなったら完了
教師なし学習いろいろ②:クラスタリング
教師なし学習の中の、クラスタリングの手法として用いられる。
分類したいクラスタ数を指定し、ランダムに置いたデータの重心の算出をくりかえすことでデータをクラスタリング
する。
Copyright © 2017 ITOCHU Techno-Solutions Corporation
たとえば・・・①
Page 7
 オートエンコーダの結果で考えてみる。
何かしら分類できそうだ
⇒データの中で
傾向が分かれていそう
「0」「6」が
近いところにある
⇒特徴が似ているのかな
「0」と「1」は比較的
距離が遠い
⇒特徴が異なると
判断しているかもしれない
Copyright © 2017 ITOCHU Techno-Solutions Corporation
まとめ
 教師なし学習のおすすめポイント
データそのものの特徴を見つけてくれる
➢ DLにかける前に、ある程度結果が予想できる(仮説を立てやすい)!
➢ DLの結果だけではわからない特徴が把握できる!
-予測精度と合わせて、補足的に裏付けができる
➢ データそのものを扱うため、信憑性がある!
Page 8
Copyright © 2017 ITOCHU Techno-Solutions Corporation
まとめ
 教師なし学習の活用法
➢ 結果の考察
ディープラーニングを行う中で、教師なし学習などの機械学習手法と組み合
わせることで、結果の原因や考察の根拠、新しい見解がみつかりやすい。
➢ 精度の向上
傾向の異なるデータを除外した上で、適したデータに適したモデルを組み合
わせられる。
Page 9
Copyright © 2017 ITOCHU Techno-Solutions Corporation Page 10

More Related Content

PDF
Chainerで知るdeep learning進化の歴史
PDF
20171201_02_idb_security_wg発表_p
PPTX
Deep learningの世界に飛び込む前の命綱
PDF
Chainerのcommunity活動の 今までとこれから
PPTX
シラサギ紹介OSC京都2017
PPTX
Shirasagi20191010
PDF
20180604 株式会社ディー・ディー・エス様
PPTX
SHIRASAGI Introduction OSC nagoya 2016
Chainerで知るdeep learning進化の歴史
20171201_02_idb_security_wg発表_p
Deep learningの世界に飛び込む前の命綱
Chainerのcommunity活動の 今までとこれから
シラサギ紹介OSC京都2017
Shirasagi20191010
20180604 株式会社ディー・ディー・エス様
SHIRASAGI Introduction OSC nagoya 2016

What's hot (17)

PPTX
シラサギ紹介20161119
PDF
オイシックス事例発表・顧客属性推定とレコメンド
PPTX
シラサギ紹介osc京都
PPTX
Shirasagi20190222(OSC TOKYO)
PPTX
シラサギ紹介 OSC島根
PPTX
心理的安全性の高いチームの作り方
PPTX
OSCnagoya2019(Shirasagi20190709)
PPTX
OSC長岡
PPTX
シラサギ紹介(OSC東京)
PPTX
シラサギ紹介20170915
PPTX
Osc広島2017
PPTX
OSC KYOTO 2018
PPTX
OSC Chiba 2017
PPTX
低い判定精度でも業務改善できた事例紹介
PDF
Active Directory とシームレスにマルチに連携する多要素認証基盤の活用方法
PDF
グリーのセキュリティ戦略:組織改革成功の秘訣と新たな課題への取り組み
PDF
ガチのスタートアップがScalaを採用した結果(公開版) #scala_ks
シラサギ紹介20161119
オイシックス事例発表・顧客属性推定とレコメンド
シラサギ紹介osc京都
Shirasagi20190222(OSC TOKYO)
シラサギ紹介 OSC島根
心理的安全性の高いチームの作り方
OSCnagoya2019(Shirasagi20190709)
OSC長岡
シラサギ紹介(OSC東京)
シラサギ紹介20170915
Osc広島2017
OSC KYOTO 2018
OSC Chiba 2017
低い判定精度でも業務改善できた事例紹介
Active Directory とシームレスにマルチに連携する多要素認証基盤の活用方法
グリーのセキュリティ戦略:組織改革成功の秘訣と新たな課題への取り組み
ガチのスタートアップがScalaを採用した結果(公開版) #scala_ks
Ad

Similar to 20180717 unsupervised learning (20)

PDF
JapanTaxiが保有するデータとデータ分析について
PPTX
20171031エンジニア交流会 Google Apps Script ミートアップ「『壁』超える鍵としてのGAS」
PDF
Big Data Analytics Tokyo講演資料
PPTX
アプリエンジニアでもできる閉域網構築のススメ!
PDF
利根川講演 In 香川201708
PDF
難しくないAI
PDF
事例から見る人工知能の現在と、企業における活用方法
PPTX
Ibm watson api サービス
PPTX
自律的なチームを作るために —組織心理学・臨床心理学の応用—
PPTX
みんなのPython勉強会#21 澪標アナリティクス 井原様
PPTX
ロボホンオフ会LT~アプリ開発で感じたロボホンのモーションについて~
PDF
私たち企業がアクセシビリティに取り組む理由 #accfes
PDF
AIがビジネスで今出来ること、5年後出来ること
PDF
JPC2017 [D1-1] MS HoloLens と MS Azure で実現する製造業における経営の意思決定変革
PDF
Blockchain EXE #13:ALISが目指すトークンエコノミーによるビジョンの実現と、サービスローンチ後の兆しについて(安 昌浩 | ALIS)
PDF
【A-2】とあるマーケティング部隊とデータエンジニアのデータドリブンへの道
PDF
開発とテストが一体となったソフトウェア開発
PPTX
【NSP】人材紹介事業_会社紹介資料.pptx
PDF
スタートアップを目指す零細企業のエンジニア採用事情
PPTX
最若手メンバーこそチャンス!チーム改善に取り組んでわかったこと
JapanTaxiが保有するデータとデータ分析について
20171031エンジニア交流会 Google Apps Script ミートアップ「『壁』超える鍵としてのGAS」
Big Data Analytics Tokyo講演資料
アプリエンジニアでもできる閉域網構築のススメ!
利根川講演 In 香川201708
難しくないAI
事例から見る人工知能の現在と、企業における活用方法
Ibm watson api サービス
自律的なチームを作るために —組織心理学・臨床心理学の応用—
みんなのPython勉強会#21 澪標アナリティクス 井原様
ロボホンオフ会LT~アプリ開発で感じたロボホンのモーションについて~
私たち企業がアクセシビリティに取り組む理由 #accfes
AIがビジネスで今出来ること、5年後出来ること
JPC2017 [D1-1] MS HoloLens と MS Azure で実現する製造業における経営の意思決定変革
Blockchain EXE #13:ALISが目指すトークンエコノミーによるビジョンの実現と、サービスローンチ後の兆しについて(安 昌浩 | ALIS)
【A-2】とあるマーケティング部隊とデータエンジニアのデータドリブンへの道
開発とテストが一体となったソフトウェア開発
【NSP】人材紹介事業_会社紹介資料.pptx
スタートアップを目指す零細企業のエンジニア採用事情
最若手メンバーこそチャンス!チーム改善に取り組んでわかったこと
Ad

More from Yutaka Terasawa (14)

PDF
20190306オープニング
PDF
時系列データの扱い方
PDF
転移学習やってみた!
PDF
Google Colaboratoryを使って、MNISTでディープラニング!
PDF
20181114 r
PDF
統計の基礎を楽しく学ぼうー箱ひげ図編ー
PDF
20181114 TDAを使ったタイタニック生存者分析
PDF
20181114_AI×Analytics×女子部 オープニング
PDF
20180717 grid
PDF
20180717 zeal
PDF
20180717 the average
PDF
20180717 opening
PDF
Wg for ai_dev_ops_20180713
PDF
Wg for edu_20180713
20190306オープニング
時系列データの扱い方
転移学習やってみた!
Google Colaboratoryを使って、MNISTでディープラニング!
20181114 r
統計の基礎を楽しく学ぼうー箱ひげ図編ー
20181114 TDAを使ったタイタニック生存者分析
20181114_AI×Analytics×女子部 オープニング
20180717 grid
20180717 zeal
20180717 the average
20180717 opening
Wg for ai_dev_ops_20180713
Wg for edu_20180713

20180717 unsupervised learning

  • 2. Copyright © 2017 ITOCHU Techno-Solutions Corporation 自己紹介  名前: 後藤仁奈(ごとうにな)。  所属: 伊藤忠テクノソリューションズ株式会社。  経歴: AI始めて1年ほど。 文系出身。  仕事内容: AIフレームワーク「Renom」を用いたPoC支援。 Page 1
  • 3. Copyright © 2017 ITOCHU Techno-Solutions Corporation AI分析の思考回路 AIフレームワークを使って、回帰!!予測!! Page 2 いろいろなアルゴリズムを使って、 一番精度の高いものを見つけてモデルを作ればいい!! 色々やってみたけど、 とりあえず決定係数で比較しよう! アルゴリズム 決定係数 1月 2月 3月 4月 5月 6月 全結合 0.57 0.86 0.76 0.56 0.78 0.78 LSTM 0.66 0.62 0.89 0.67 0.57 0.65
  • 4. Copyright © 2017 ITOCHU Techno-Solutions Corporation DLで言えること 結局、DLだけを使って精度向上を一生懸命やっても、 Page 3 へー  根拠が説明できない  具体性がない 「決定係数を見ると、 このアルゴリズムを使った時が 最も精度が高かったです。」 「ただ、日によって 精度にばらつきがありますので、 色々なタイプのデータを 大量に学習させる必要があります。」  方針がわかりにくい
  • 5. Copyright © 2017 ITOCHU Techno-Solutions Corporation 教師なし学習とは Page 4 機 械 学 習 教師あり学習 教師なし学習 データ 教師 データ データから導き出せる答えが 教師(正解)に近づくよう、 各データのパラメータ(重 み)を学習によって導き出す。 正解は与えず、データ自身で何か しらの特徴量を見つけ出す。 (データ自身が持つ特徴や傾向を 見つける)
  • 6. Copyright © 2017 ITOCHU Techno-Solutions Corporation 教師なし学習いろいろ①:次元圧縮 Page 5 主成分分析では、多くのデータ項目(変数)が存在する 場合、それらを1つから3つの合成変数に縮約(置き換 え)することで、データを理解しやすくしています。 • PCA(主成分分析) 非線形のニューラルネットワークを用いるため、主成分 分析よりも特徴をなるべく残して次元圧縮が可能となり ます。 • オートエンコーダ
  • 7. Copyright © 2017 ITOCHU Techno-Solutions Corporation Copyright © 2017 ITOCHU Techno-Solutions Corporation • K-means法 6 1. 初期状態 2. 重心を計算する 3. 一番近い重心の色に変わる 4. 再度、重心を計算する 5. 再度、色を置き換える 6.また重心を計算する 7. 変化がなくなったら完了 教師なし学習いろいろ②:クラスタリング 教師なし学習の中の、クラスタリングの手法として用いられる。 分類したいクラスタ数を指定し、ランダムに置いたデータの重心の算出をくりかえすことでデータをクラスタリング する。
  • 8. Copyright © 2017 ITOCHU Techno-Solutions Corporation たとえば・・・① Page 7  オートエンコーダの結果で考えてみる。 何かしら分類できそうだ ⇒データの中で 傾向が分かれていそう 「0」「6」が 近いところにある ⇒特徴が似ているのかな 「0」と「1」は比較的 距離が遠い ⇒特徴が異なると 判断しているかもしれない
  • 9. Copyright © 2017 ITOCHU Techno-Solutions Corporation まとめ  教師なし学習のおすすめポイント データそのものの特徴を見つけてくれる ➢ DLにかける前に、ある程度結果が予想できる(仮説を立てやすい)! ➢ DLの結果だけではわからない特徴が把握できる! -予測精度と合わせて、補足的に裏付けができる ➢ データそのものを扱うため、信憑性がある! Page 8
  • 10. Copyright © 2017 ITOCHU Techno-Solutions Corporation まとめ  教師なし学習の活用法 ➢ 結果の考察 ディープラーニングを行う中で、教師なし学習などの機械学習手法と組み合 わせることで、結果の原因や考察の根拠、新しい見解がみつかりやすい。 ➢ 精度の向上 傾向の異なるデータを除外した上で、適したデータに適したモデルを組み合 わせられる。 Page 9
  • 11. Copyright © 2017 ITOCHU Techno-Solutions Corporation Page 10