SlideShare a Scribd company logo
実験研究者のための深層学習入門 [第2回] Google Colab
環境で自動機械学習と深層画像生成(AutoML, GAN編)
Techniques for experimental biologists to acquire deep learning
skills(2): Automatic Machine Learning and Generative Adversarial
Networks in Google Colab (AutoML, GAN)
神沼英里
東京医科歯科大学 医療データ科学推進室 特任講師
(兼 理化学研究所 環境資源科学研究センター 客員研究員)
(兼 国立遺伝学研究所 生命情報研究センター 外来研究員)
1
CSRS Seminar [2020/12/15 11:00-11:40]
ZOOM ONLINE
目次
講習回 実習タスク 言語
第1回
(前回)
CNN
畳込みニューラルネット
ワーク
画像分類 R
第2回 AutoML
自動機械学習
画像分類 Python,R
GAN
敵対的生成ネットワーク
画像生成 R
深層ニューラルネットワークとは
深いニューロンの積層
「重み」を学習する
前回復習①
前回復習②
AutoML(自動機械学習) とは?
5
AutoML(Automatic Machine Learning)
■AutoML= 機械学習モデルの開発工程の自動化。
自動機械学習を略してAutoMLと呼ばれる。
画像引用:Microsoft Azure「AutoMLとは」
https://docs.microsoft.com/ja-jp/azure/machine-learning/concept-automated-ml
※一番精度高の条件
を自動で探索する
↓
計算時間が長い!
AutoMLの事例:畳込みニューラルネットワークの最適構造探索
(arXiv:1905.11946)
■AutoMLのモデル開発工程の自動化部分
■AutoMLの特徴
+機械学習モデルの設計知識がなくてもモデル構築が可能になる。
+探索対象(モデル構造、ハイパーパラメータ(学習率etc)、最適化手法など)。
+各パブリッククラウド会社がAutoMLツールを提供中(Google AutoML,
AWS AutoGluon, Microsoft AutomatedML, IBM AutoAI, etc.)。
+難点は計算時間が長い、自動化処理の対象箇所が各社で異なること。
AutoMLの自動化部分
データの
前処理
モデル
構造
設計
ハイパー
パラメータ
設定
モデルの学習
(重み最適化)
と評価
デプ
ロイ
AutoMLの範囲
繰り返し
データ
セットの
準備
課題
設定
AutoMLのハイパーパラメータは、設計者設定ではなく
自動で最適値を探す
■Hyperparameter=機械学習モデルの構築時に、
人間があらかじめ設定しておくべきパラメータ
lrで1e-4をあらかじめ設定している。
lr(学習率)はハイパーパラメータの1つ
前回のRの深層学習モデル
のプログラムより
重要なハイパーパラメータの1つ「学習率」は、
「各層の重みを一度にどの程度変更するか 」を表す
■勾配法=損失関数の値が小さくなるように重みパラメータを探索
■勾配法のアルゴリズム
*「勾配降下法」=最小値を探す
*「勾配上昇法」=最大値を探す
■勾配(傾き)と重みの更新方向
勾配>0 → 重み負の方向へ更新
勾配<0 → 重み正の方向へ更新
■学習率
*ハイパーパラメータの1つ
*値が大きいと、学習が加速
損失Eを小さくする方向に重みwを更新する
https://axa.biopapyrus.jp/deep-learning/gradient_descent_method.html
勾配降下法より(損失関数はLで表記)
AutoMLにおけるCASH戦略とは
■ CASH =Combined Algorithm Selection and
Hyperparameter optimization problem
②ハイパーパラメータ
(Hyperparameter)の最適化
①最適な機械学習モデル
(Algorithm)の選択
■ Grid Searchによるハイパーパラメータの網羅的探索
※全格子点の計算なので時間がかかる
※他にも遺伝的アルゴリズムやベイズ最適化が使われる
ハイパー
パラメー
タAの
探索範囲
ハイパーパラメータBの探索範囲
AutoML(自動機械学習)のFrameworks
ツール名 提供元 CASH戦略、特徴 利用方法
AutoWEKA 2013.3 British Columbia
Univ.
*ベイズ最適化
*最初のAutoML
オープンソース
auto-sklearn 2015.12 Freiburg Univ. *ベイズ最適化+メタ学習
*AutoWEKAの拡張
オープンソース
Cloud AutoML 2018.1 Google *Neural Architecture
Search(NAS)
課金
AutoKeras 2018.6 Texas A&M
University
*NAS オープンソース
Microsoft
AutomatedML
2018.9 Microsoft *? 課金
AWS
AutoGluon
2019.12 Amazon *NAS
*他にSageMaker AutoPilot
課金
*AutoMLは全てPython言語で提供(AutoWEKAはJava,Python)
IBM AutoAI=Watson利用(2019.8)
AutoMLにおけるCASH戦略とは
■ CASH =Combined Algorithm Selection and
Hyperparameter optimization problem
②ハイパーパラメータ
(Hyperparameter)の最適化
①最適な機械学習モデル
(Algorithm)の選択
■ Grid Searchによるハイパーパラメータの網羅的探索
※全格子点の計算なので時間がかかる
※他にも遺伝的アルゴリズムやベイズ最適化が使われる
ハイパー
パラメー
タAの
探索範囲
ハイパーパラメータBの探索範囲
*NAS =強化学習でモデル精度を報酬として、ニューラルネットワークの
モデル構造を最適化する手法
ニューラルネットワークモデル構造の最適化アルゴリズム
Neural Architecture Search(NAS) (arXiv:1611.01578)
画像引用
https://www.ibm.com/blogs/
research/2019/09/neural-
architecture-search-survey/
画像引用:
https://qiita.com/no
rihitoishida/items/9f
73865a0c8f99c203cd
ハイパーパラメータの最適化アルゴリズム
ベイズ最適化(Proc. of IEEE, 104:148-175,2016 )
■ベイズ最適化=形状不明(ブラックボックス)関数の最大値、最小値を求める手法。
機械学習のハイパーパラメータ探索に適用される。
獲得関数の期待値最大の箇所を次の探索点とする→探索回数の減少
画像引用:機械学習における
ハイパパラメータ最適化手法:
概要と特徴、
電子情報通信学会論文誌 D
Vol. J103–D No. 9 pp. 615–631
※最適値の探索には、非常に時間がかかる
※一回モデル作成に課金10万円!
(2019年7月のGoogleML Summit Tokyo
ラーメン次郎AIの作成者談)
https://qiita.com/highno_RQ/it
ems/71595fc402e5b3a55665
AutoMLの課金額比較(表形式データ)
■ 回帰タスク(FIFA 19 complete player datasetの選手賃金予測)
*Keras(Python,R)ライブラリの自動機械学習版
- Rのautokerasは提供されているがColabで動かず(将来的にバグ取れるかも)
- Pythonでもコードは3行のみ
実習(AutoKeras)
■Cifar10 datasetで3回試行で1時間15分
GAN(敵対的生成ネットワーク)
18
GANは深層学習を用いた画像生成技術
*GAN(Generative Adversarial Network): 敵対的生成ネットワーク
- 教師なし画像生成アルゴリズムの1つ
- 2014年にIan Goodfellowが提案
- 互いに競争する2つの深層学習モデルの構成
- LeCun博士は「機械学習分野でこの10年間で
最も興味深いアイデア」と評価
GAN:敵対的生成ネットワーク
教師なし
(Goodfellow et al, arXiv:1406.2661, 2014)
https://stats.stackexchange.com/questio
ns/277756/some-general-questions-on-
generative-adversarial-networks
より画像引用
入力:ノイズ
G:生成モデル
D: 識別モデル
https://ja.stateofaigu
ides.com/20201012-
gans-for-good/
GANは生成画像と手本画像との差分(LOSS)を小さくする
https://poloclub.github.io/ganlab/
■DeepFake =fake(偽物)の
人物画像生成法
GANの有名例:DeepFakeによる動画の顔入れ替え
■ DeepFake検出研究が課題に
→Facebookが「Deepfake Detection Challenge」
(DFDC)コンテストを発表(2019年9月)
*2018年4月にYouTubeにバラクオバマ大統
領の顔入れ替えビデオが投稿され有名に
*xpression camera(EmbodyMe社)は寝起
きパジャマをスーツ姿に合成(2020年9月)
*2020年10月に日本でもDeepFakeを使い
不適切映像の作成容疑で逮捕者が出た
https://qiita.com/jiny2001/items/1a33c0c43230b6468571
https://ai.facebook.com/datasets/dfdc/
GANが出来ること
1).画像鮮明化=低品質画像から
高品質画像を生成
2).モダリティ変換=テキスト文から
画像生成や画像編集
3).画像特徴変換=画像から別画像を生成 4).動画生成=1枚静止画から
動画生成(arXiv:1905.08233 )
https://github.com/thunil/TecoGAN
arXiv:1811.09393
https://zhegan27.github.io/Papers/
StoryGAN_slides.pdf
https://phillipi.github.io/pix2pix/
https://jp.techcrunch.com/2019/05/23/2019-05-
22-mona-lisa-frown-machine-learning-brings-old-
paintings-and-photos-to-life/
画像引用:https://qiita.com/shimopino/items/f096cd92c5107ee02208
■文章から画像生成するGANの種類
毎年大量のGAN研究が発表される
GANの著名アルゴリズム①
pix2pix (arXiv:1611.07004 )
■ pix2pix = Alexei Efros(UC Berkeley)提案のGANの1種。下記では、
ペア画像(地図と航空写真)から任意の地図から航空写真の画像を生成[左]。
GANの著名アルゴリズム②
CycleGAN (arXiv:1703.10593 )
■ CycleGAN =Alexei Efros提案のGANの1種。Pix2pixと異なりペア画像が不要で、
画像変換、彩色変換など多様なアプリケーションに応用。
画像引用:arXiv論文より
*NVIDIAの研究。下はStyleGAN2の実行結果。ランダム数値から顔画像生成
GANの著名アルゴリズム③
StyleGAN:写真並みの高精度画像を生成(arXiv:1812.04948)
*2つの顔画像を
補間する実行結果
(Baby → Old Man)
GANのデモ
・手書き文字画像データセットから特定の文字を選択してGANで学習する。
(RでDiscriminator, Generatorを定義して1から動かす)
学習に用いた画像
■生成結果の例
参考:Pythonで動かしてみたい人に「Tensorflow Tutorial」
https://www.tensorflow.org/tutorials/generative/

More Related Content

PPTX
How Much Position Information Do Convolutional Neural Networks Encode?
PDF
【DL輪読会】How Much Can CLIP Benefit Vision-and-Language Tasks?
PDF
Visual SLAM: Why Bundle Adjust?の解説(第4回3D勉強会@関東)
PPTX
3Dマップを活用したVisual Localization
PPTX
畳み込みニューラルネットワークの高精度化と高速化
PDF
Point net
PPTX
【DL輪読会】The Forward-Forward Algorithm: Some Preliminary
PDF
深層学習の不確実性 - Uncertainty in Deep Neural Networks -
How Much Position Information Do Convolutional Neural Networks Encode?
【DL輪読会】How Much Can CLIP Benefit Vision-and-Language Tasks?
Visual SLAM: Why Bundle Adjust?の解説(第4回3D勉強会@関東)
3Dマップを活用したVisual Localization
畳み込みニューラルネットワークの高精度化と高速化
Point net
【DL輪読会】The Forward-Forward Algorithm: Some Preliminary
深層学習の不確実性 - Uncertainty in Deep Neural Networks -

What's hot (20)

PDF
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
PDF
グラフデータの機械学習における特徴表現の設計と学習
PDF
三次元点群を取り扱うニューラルネットワークのサーベイ
PPTX
モデルアーキテクチャ観点からの高速化2019
PPTX
CNNの可視化手法Grad-CAMの紹介~CNNさん、あなたはどこを見ているの?~ | OHS勉強会#6
PPTX
[DL輪読会]Learning convolutional neural networks for graphs
PPTX
【DL輪読会】SimCSE: Simple Contrastive Learning of Sentence Embeddings (EMNLP 2021)
PPTX
[DL輪読会]PointNet++: Deep Hierarchical Feature Learning on Point Sets in a Metr...
PDF
『機械学習による故障予測・異常検知 事例紹介とデータ分析プロジェクト推進ポイント』
PPTX
[DL輪読会]Attentive neural processes
PDF
SSII2021 [TS3] 機械学習のアノテーションにおける データ収集​ 〜 精度向上のための仕組み・倫理や社会性バイアス 〜
PPTX
2014 3 13(テンソル分解の基礎)
PDF
『自由エネルギー原理入門』勉強会1章&2章前半
PDF
SSII2019企画: 点群深層学習の研究動向
PDF
NLPにおける再現性
PDF
数学で解き明かす深層学習の原理
PDF
[DL輪読会]Wasserstein GAN/Towards Principled Methods for Training Generative Adv...
PDF
深層学習によるHuman Pose Estimationの基礎
PPTX
【DL輪読会】An Image is Worth One Word: Personalizing Text-to-Image Generation usi...
PDF
三次元表現まとめ(深層学習を中心に)
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
グラフデータの機械学習における特徴表現の設計と学習
三次元点群を取り扱うニューラルネットワークのサーベイ
モデルアーキテクチャ観点からの高速化2019
CNNの可視化手法Grad-CAMの紹介~CNNさん、あなたはどこを見ているの?~ | OHS勉強会#6
[DL輪読会]Learning convolutional neural networks for graphs
【DL輪読会】SimCSE: Simple Contrastive Learning of Sentence Embeddings (EMNLP 2021)
[DL輪読会]PointNet++: Deep Hierarchical Feature Learning on Point Sets in a Metr...
『機械学習による故障予測・異常検知 事例紹介とデータ分析プロジェクト推進ポイント』
[DL輪読会]Attentive neural processes
SSII2021 [TS3] 機械学習のアノテーションにおける データ収集​ 〜 精度向上のための仕組み・倫理や社会性バイアス 〜
2014 3 13(テンソル分解の基礎)
『自由エネルギー原理入門』勉強会1章&2章前半
SSII2019企画: 点群深層学習の研究動向
NLPにおける再現性
数学で解き明かす深層学習の原理
[DL輪読会]Wasserstein GAN/Towards Principled Methods for Training Generative Adv...
深層学習によるHuman Pose Estimationの基礎
【DL輪読会】An Image is Worth One Word: Personalizing Text-to-Image Generation usi...
三次元表現まとめ(深層学習を中心に)
Ad

Similar to [2020-12-15] 実験研究者のための深層学習入門 [第2回] Google Colab 環境で自動機械学習と深層画像生成(AutoML, GAN編)  (20)

PDF
Learning Deep Architectures for AI (第 3 回 Deep Learning 勉強会資料; 松尾)
PDF
20150930
PDF
ハンズオン1: DIGITS によるディープラーニング入門
PDF
ハンズオン セッション 1: DIGITS によるディープラーニング入門
PDF
DIGITSによるディープラーニング画像分類
PPTX
AI入門「第4回:ディープラーニングの中身を覗いて、育ちを観察する」
PDF
医療ビッグデータの今後を見通すために知っておきたい機械学習の基礎〜最前線 agains COVID-19
PDF
自習形式で学ぶ「DIGITS による画像分類入門」
PDF
Deep Learning技術の最近の動向とPreferred Networksの取り組み
PDF
チュートリアル:細胞画像を使った初めてのディープラーニング
PDF
Development and Experiment of Deep Learning with Caffe and maf
PPTX
「機械学習とは?」から始める Deep learning実践入門
PDF
Getting Started with Deep Learning using Scala
PDF
サルでもわかるディープラーニング入門 (2017年) (In Japanese)
PDF
Deep Learningの基礎と応用
PPTX
深層学習の基礎と導入
PPTX
令和元年度 実践セミナー - Deep Learning 概論 -
PDF
【参考文献追加】20180115_東大医学部機能生物学セミナー_深層学習の最前線とこれから_岡野原大輔
PDF
20180115_東大医学部機能生物学セミナー_深層学習の最前線とこれから_岡野原大輔
PDF
深層学習(岡本孝之 著) - Deep Learning chap.1 and 2
Learning Deep Architectures for AI (第 3 回 Deep Learning 勉強会資料; 松尾)
20150930
ハンズオン1: DIGITS によるディープラーニング入門
ハンズオン セッション 1: DIGITS によるディープラーニング入門
DIGITSによるディープラーニング画像分類
AI入門「第4回:ディープラーニングの中身を覗いて、育ちを観察する」
医療ビッグデータの今後を見通すために知っておきたい機械学習の基礎〜最前線 agains COVID-19
自習形式で学ぶ「DIGITS による画像分類入門」
Deep Learning技術の最近の動向とPreferred Networksの取り組み
チュートリアル:細胞画像を使った初めてのディープラーニング
Development and Experiment of Deep Learning with Caffe and maf
「機械学習とは?」から始める Deep learning実践入門
Getting Started with Deep Learning using Scala
サルでもわかるディープラーニング入門 (2017年) (In Japanese)
Deep Learningの基礎と応用
深層学習の基礎と導入
令和元年度 実践セミナー - Deep Learning 概論 -
【参考文献追加】20180115_東大医学部機能生物学セミナー_深層学習の最前線とこれから_岡野原大輔
20180115_東大医学部機能生物学セミナー_深層学習の最前線とこれから_岡野原大輔
深層学習(岡本孝之 著) - Deep Learning chap.1 and 2
Ad

More from Eli Kaminuma (14)

PDF
[2021-03-14] 植物表現型画像解析のための手作業注釈加速化手法とActive Learning
PDF
[2020-09-01] IIBMP2020 Generating annotation texts of HLA sequences with anti...
PDF
[2019-11-22] JSAI合同研究会 糖尿病電子カルテを事例としたMeSH Term注釈に基づくアクセス制限研究のオープンデータ類似検索
PDF
[2019-09-02] AI・IoT活用情報とGoogle Colab植物画像注釈
PDF
[2019-03-14] JSPP19 深層学習による植物注釈タスクとPublic Cloud活用法
PDF
[2018-03-29]JSPP18 Oxford Flower Image Datasetを用いた深層学習ハンズオン
PDF
[18-01-26]DSTEP ディープラーニングによる出芽酵母蛍光画像の細胞内タンパク質局在の分類
PDF
[2017-05-29] DNASmartTagger
PDF
[2016-12-01] DDBJデータ解析チャレンジ報告:機械学習コンペティションのタスク設計とルール設定
PDF
[2016-07-06] DDBJデータ解析チャレンジ概要
PDF
[2016-06-06] CrowdR&D:クラウド協働評価のための参加型R&Dプロジェクト情報統合基盤
PDF
[2013-12-05] NGS由来ゲノムワイド多型マーカ構築とそのRDF注釈情報統合化
PDF
[2015-06-10] オンライン・クラウドサイエンス(市民科学)の潮流
PDF
[2015-11-11][DDBJing33] DDBJとNIG Supercomputerの紹介、大量配列情報解析 (第33回 DDBJing 講習会 ...
[2021-03-14] 植物表現型画像解析のための手作業注釈加速化手法とActive Learning
[2020-09-01] IIBMP2020 Generating annotation texts of HLA sequences with anti...
[2019-11-22] JSAI合同研究会 糖尿病電子カルテを事例としたMeSH Term注釈に基づくアクセス制限研究のオープンデータ類似検索
[2019-09-02] AI・IoT活用情報とGoogle Colab植物画像注釈
[2019-03-14] JSPP19 深層学習による植物注釈タスクとPublic Cloud活用法
[2018-03-29]JSPP18 Oxford Flower Image Datasetを用いた深層学習ハンズオン
[18-01-26]DSTEP ディープラーニングによる出芽酵母蛍光画像の細胞内タンパク質局在の分類
[2017-05-29] DNASmartTagger
[2016-12-01] DDBJデータ解析チャレンジ報告:機械学習コンペティションのタスク設計とルール設定
[2016-07-06] DDBJデータ解析チャレンジ概要
[2016-06-06] CrowdR&D:クラウド協働評価のための参加型R&Dプロジェクト情報統合基盤
[2013-12-05] NGS由来ゲノムワイド多型マーカ構築とそのRDF注釈情報統合化
[2015-06-10] オンライン・クラウドサイエンス(市民科学)の潮流
[2015-11-11][DDBJing33] DDBJとNIG Supercomputerの紹介、大量配列情報解析 (第33回 DDBJing 講習会 ...

[2020-12-15] 実験研究者のための深層学習入門 [第2回] Google Colab 環境で自動機械学習と深層画像生成(AutoML, GAN編)