Submit Search
CVPR2016 reading - 特徴量学習とクロスモーダル転移について
12 likes
3,891 views
Akisato Kimura
CVPR2016で発表された,特徴量学習とクロスモーダル転移に関する研究についてまとめてみました.
Technology
Related topics:
Transfer Learning Uses
•
Deep Learning
•
Computer Vision Insights
•
Pattern Recognition
Read more
1 of 41
Download now
Downloaded 37 times
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
More Related Content
PDF
Deeplearning輪読会
正志 坪坂
PDF
ドロネー三角形分割
Yusuke Matsushita
PPTX
[DL輪読会]逆強化学習とGANs
Deep Learning JP
PDF
機械学習と主成分分析
Katsuhiro Morishita
PDF
【DL輪読会】Unbiased Gradient Estimation for Marginal Log-likelihood
Deep Learning JP
PDF
POMDP下での強化学習の基礎と応用
Yasunori Ozaki
PDF
PRML学習者から入る深層生成モデル入門
tmtm otm
PDF
トピックモデルの評価指標 Perplexity とは何なのか?
hoxo_m
Deeplearning輪読会
正志 坪坂
ドロネー三角形分割
Yusuke Matsushita
[DL輪読会]逆強化学習とGANs
Deep Learning JP
機械学習と主成分分析
Katsuhiro Morishita
【DL輪読会】Unbiased Gradient Estimation for Marginal Log-likelihood
Deep Learning JP
POMDP下での強化学習の基礎と応用
Yasunori Ozaki
PRML学習者から入る深層生成モデル入門
tmtm otm
トピックモデルの評価指標 Perplexity とは何なのか?
hoxo_m
What's hot
(20)
PDF
よくわかるフリストンの自由エネルギー原理
Masatoshi Yoshida
PPTX
【論文紹介】How Powerful are Graph Neural Networks?
Masanao Ochi
PDF
GAN(と強化学習との関係)
Masahiro Suzuki
PDF
Word2vecの理論背景
Masato Nakai
PDF
深層学習の不確実性 - Uncertainty in Deep Neural Networks -
tmtm otm
PPTX
【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたい
Takuji Tahara
PDF
【メタサーベイ】Neural Fields
cvpaper. challenge
PDF
RBM、Deep Learningと学習(全脳アーキテクチャ若手の会 第3回DL勉強会発表資料)
Takuma Yagi
PDF
変分推論法(変分ベイズ法)(PRML第10章)
Takao Yamanaka
PDF
計算論的学習理論入門 -PAC学習とかVC次元とか-
sleepy_yoshi
PDF
自己教師学習(Self-Supervised Learning)
cvpaper. challenge
PPTX
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
RyuichiKanoh
PDF
最適化超入門
Takami Sato
PPTX
深層学習の数理
Taiji Suzuki
PDF
DID, Synthetic Control, CausalImpact
Yusuke Kaneko
PDF
Crfと素性テンプレート
Kei Uchiumi
PDF
[DL輪読会]Recent Advances in Autoencoder-Based Representation Learning
Deep Learning JP
PDF
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII
PDF
不均衡データのクラス分類
Shintaro Fukushima
PPTX
CVPR2018 pix2pixHD論文紹介 (CV勉強会@関東)
Tenki Lee
よくわかるフリストンの自由エネルギー原理
Masatoshi Yoshida
【論文紹介】How Powerful are Graph Neural Networks?
Masanao Ochi
GAN(と強化学習との関係)
Masahiro Suzuki
Word2vecの理論背景
Masato Nakai
深層学習の不確実性 - Uncertainty in Deep Neural Networks -
tmtm otm
【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたい
Takuji Tahara
【メタサーベイ】Neural Fields
cvpaper. challenge
RBM、Deep Learningと学習(全脳アーキテクチャ若手の会 第3回DL勉強会発表資料)
Takuma Yagi
変分推論法(変分ベイズ法)(PRML第10章)
Takao Yamanaka
計算論的学習理論入門 -PAC学習とかVC次元とか-
sleepy_yoshi
自己教師学習(Self-Supervised Learning)
cvpaper. challenge
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
RyuichiKanoh
最適化超入門
Takami Sato
深層学習の数理
Taiji Suzuki
DID, Synthetic Control, CausalImpact
Yusuke Kaneko
Crfと素性テンプレート
Kei Uchiumi
[DL輪読会]Recent Advances in Autoencoder-Based Representation Learning
Deep Learning JP
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII
不均衡データのクラス分類
Shintaro Fukushima
CVPR2018 pix2pixHD論文紹介 (CV勉強会@関東)
Tenki Lee
Ad
Similar to CVPR2016 reading - 特徴量学習とクロスモーダル転移について
(20)
PDF
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
SSII
PDF
RUTILEA社内勉強会第1回 「転移学習」
TRUE_RUTILEA
PDF
転移学習やってみた!
Yutaka Terasawa
PDF
深層学習 - 画像認識のための深層学習 ①
Shohei Miyashita
PDF
画像認識モデルを自動的に作る。1日以内に。~Simple And Efficient Architecture Search for Convolutio...
Takahiro Kubo
PPTX
Image net classification with Deep Convolutional Neural Networks
Shingo Horiuchi
PPTX
[DL輪読会]Few-Shot Unsupervised Image-to-Image Translation
Deep Learning JP
PDF
Learning Spatial Common Sense with Geometry-Aware Recurrent Networks
Kento Doi
PDF
【2015.07】(1/2)cvpaper.challenge@CVPR2015
cvpaper. challenge
PPTX
[DL輪読会]Meta-Learning Probabilistic Inference for Prediction
Deep Learning JP
PDF
点群深層学習 Meta-study
Naoya Chiba
PDF
深層学習 - 画像認識のための深層学習 ②
Shohei Miyashita
PDF
点群SegmentationのためのTransformerサーベイ
Takuya Minagawa
PDF
[DL輪読会]Convolutional Conditional Neural Processesと Neural Processes Familyの紹介
Deep Learning JP
PDF
SSII2014 詳細画像識別 (FGVC) @OS2
nlab_utokyo
PDF
大規模画像認識とその周辺
n_hidekey
PPTX
Personalized Fashion Recommendation from Personal Social Media Data An Item t...
harmonylab
PPTX
PRML 5.5.6-5.6 畳み込みネットワーク(CNN)・ソフト重み共有・混合密度ネットワーク
KokiTakamiya
PPTX
MIRU2014 tutorial deeplearning
Takayoshi Yamashita
PDF
Transfer forest(PRMU Jun 2014)
Masamitsu Tsuchiya
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
SSII
RUTILEA社内勉強会第1回 「転移学習」
TRUE_RUTILEA
転移学習やってみた!
Yutaka Terasawa
深層学習 - 画像認識のための深層学習 ①
Shohei Miyashita
画像認識モデルを自動的に作る。1日以内に。~Simple And Efficient Architecture Search for Convolutio...
Takahiro Kubo
Image net classification with Deep Convolutional Neural Networks
Shingo Horiuchi
[DL輪読会]Few-Shot Unsupervised Image-to-Image Translation
Deep Learning JP
Learning Spatial Common Sense with Geometry-Aware Recurrent Networks
Kento Doi
【2015.07】(1/2)cvpaper.challenge@CVPR2015
cvpaper. challenge
[DL輪読会]Meta-Learning Probabilistic Inference for Prediction
Deep Learning JP
点群深層学習 Meta-study
Naoya Chiba
深層学習 - 画像認識のための深層学習 ②
Shohei Miyashita
点群SegmentationのためのTransformerサーベイ
Takuya Minagawa
[DL輪読会]Convolutional Conditional Neural Processesと Neural Processes Familyの紹介
Deep Learning JP
SSII2014 詳細画像識別 (FGVC) @OS2
nlab_utokyo
大規模画像認識とその周辺
n_hidekey
Personalized Fashion Recommendation from Personal Social Media Data An Item t...
harmonylab
PRML 5.5.6-5.6 畳み込みネットワーク(CNN)・ソフト重み共有・混合密度ネットワーク
KokiTakamiya
MIRU2014 tutorial deeplearning
Takayoshi Yamashita
Transfer forest(PRMU Jun 2014)
Masamitsu Tsuchiya
Ad
More from Akisato Kimura
(20)
PPTX
Paper reading - Dropout as a Bayesian Approximation: Representing Model Uncer...
Akisato Kimura
PPTX
Paper reading - Dropout as a Bayesian Approximation: Representing Model Uncer...
Akisato Kimura
PDF
多変量解析の一般化
Akisato Kimura
PDF
NIPS2015 reading - Learning visual biases from human imagination
Akisato Kimura
PDF
CVPR2015 reading "Global refinement of random forest"
Akisato Kimura
PDF
CVPR2015 reading "Understainding image virality" (in Japanese)
Akisato Kimura
PDF
Computational models of human visual attention driven by auditory cues
Akisato Kimura
PDF
NIPS2014 reading - Top rank optimization in linear time
Akisato Kimura
PDF
CVPR2014 reading "Reconstructing storyline graphs for image recommendation fr...
Akisato Kimura
PDF
ICCV2013 reading: Learning to rank using privileged information
Akisato Kimura
PDF
ACMMM 2013 reading: Large-scale visual sentiment ontology and detectors using...
Akisato Kimura
PDF
IJCAI13 Paper review: Large-scale spectral clustering on graphs
Akisato Kimura
PDF
関西CVPR勉強会 2012.10.28
Akisato Kimura
PDF
関西CVPR勉強会 2012.7.29
Akisato Kimura
PDF
ICWSM12 Brief Review
Akisato Kimura
PDF
関西CVPRML勉強会 2012.2.18 (一般物体認識 - データセット)
Akisato Kimura
PDF
関西CVPRML勉強会(特定物体認識) 2012.1.14
Akisato Kimura
PDF
人間の視覚的注意を予測するモデル - 動的ベイジアンネットワークに基づく 最新のアプローチ -
Akisato Kimura
PDF
IBIS2011 企画セッション「CV/PRで独自の進化を遂げる学習・最適化技術」 趣旨説明
Akisato Kimura
PDF
立命館大学 AMLコロキウム 2011.10.20
Akisato Kimura
Paper reading - Dropout as a Bayesian Approximation: Representing Model Uncer...
Akisato Kimura
Paper reading - Dropout as a Bayesian Approximation: Representing Model Uncer...
Akisato Kimura
多変量解析の一般化
Akisato Kimura
NIPS2015 reading - Learning visual biases from human imagination
Akisato Kimura
CVPR2015 reading "Global refinement of random forest"
Akisato Kimura
CVPR2015 reading "Understainding image virality" (in Japanese)
Akisato Kimura
Computational models of human visual attention driven by auditory cues
Akisato Kimura
NIPS2014 reading - Top rank optimization in linear time
Akisato Kimura
CVPR2014 reading "Reconstructing storyline graphs for image recommendation fr...
Akisato Kimura
ICCV2013 reading: Learning to rank using privileged information
Akisato Kimura
ACMMM 2013 reading: Large-scale visual sentiment ontology and detectors using...
Akisato Kimura
IJCAI13 Paper review: Large-scale spectral clustering on graphs
Akisato Kimura
関西CVPR勉強会 2012.10.28
Akisato Kimura
関西CVPR勉強会 2012.7.29
Akisato Kimura
ICWSM12 Brief Review
Akisato Kimura
関西CVPRML勉強会 2012.2.18 (一般物体認識 - データセット)
Akisato Kimura
関西CVPRML勉強会(特定物体認識) 2012.1.14
Akisato Kimura
人間の視覚的注意を予測するモデル - 動的ベイジアンネットワークに基づく 最新のアプローチ -
Akisato Kimura
IBIS2011 企画セッション「CV/PRで独自の進化を遂げる学習・最適化技術」 趣旨説明
Akisato Kimura
立命館大学 AMLコロキウム 2011.10.20
Akisato Kimura
CVPR2016 reading - 特徴量学習とクロスモーダル転移について
1.
Copyright©2014 NTT corp.
All Rights Reserved. CVPR2016 reading 特徴量学習とクロスモーダル転移について Akisato Kimura <akisato@ieee.org> _akisato http://www.kecl.ntt.co.jp/people/kimura.akisato/
2.
1 フルーツジュースはいかがですか?
3.
2 フルーツジュースはいかがですか?
4.
3 ジュースで大事なこと 材料 作り方 飲み方
5.
4 特徴量学習も同じです データセット 学習方法 利用目的
6.
5 特徴量は作るものから学ぶものへ http://www.isi.imi.i.u- tokyo.ac.jp/~harada/pdf/cvim_slide_harada20120315.pdf http://www.cc.gatech.edu/~hays/compvision/proj6/
7.
6 特徴量学習とは 教師付画像データを 機械学習器に与えて 画像特徴量を 抽出する方法を得る
8.
7 特徴量学習の目的 (1) • 次元削減 線形判別分析
Auto-encoder bottleneck features
9.
8 特徴量学習の目的 (1) • 最終タスク込みの特徴量学習
(end-to-end) [LeCun Proc. IEEE98]
10.
9 特徴量学習の目的 (2) • タスク実現のための中間特徴量 [Yu+
CVPR13] http://www.cc.gatech.edu/~hays/compvision/proj6/
11.
10 特徴量学習の問題点 教師付画像データ (畳み込み) ニューラネネットワーク 画像特徴量 深い学習で高い性能を出すほどの 大量の教師付データを作るには, お金か時間が大量に必要です.
12.
11 どうすれば良いか? • 教師なし特徴量学習 ‒ 教師付きデータを作らないで済ます •
クロスモーダル転移 ‒ 別のモーダルから得られる知識を転用する
13.
Copyright©2014 NTT corp.
All Rights Reserved. 教師なし特徴量学習 • Mukuta+ “Kernel approximation via empirical orthogonal decomposition for unsupervised feature learning” • Pathak+ “Context encoders: Feature learning byinpainting” • Zhang+ “Online collaborative learning for open vocabulary visual classifiers” • Yang+ “Joint unsupervised learning of deep representation and image clusters”
14.
13 初期の特徴量学習 教師付画像データ 画像特徴量 多変量解析
15.
14 Kernel PCA 特徴ベクトル 𝒙𝒙
を変換する方法 𝒈𝒈 = 𝚲𝚲−1/2 𝑨𝑨⊤ 𝒌𝒌 𝒌𝒌 = (𝐾𝐾 𝒙𝒙1, 𝒙𝒙 , 𝐾𝐾 𝒙𝒙2, 𝒙𝒙 , … , 𝑘𝑘(𝒙𝒙𝑛𝑛, 𝒙𝒙)), 𝑲𝑲 = 𝐾𝐾 𝒙𝒙1, 𝒙𝒙 𝑖𝑖,𝑗𝑗=1 𝑛𝑛 𝜆𝜆𝑖𝑖, 𝜶𝜶𝑖𝑖 𝑖𝑖=1 𝑛𝑛 : Sorted eigenvalues and normalized eigenvectors of 𝑲𝑲𝑲𝑲 = 𝜆𝜆𝜶𝜶 𝜆𝜆1 ≥ 𝜆𝜆2 ≥ ⋯ ≥ 𝜆𝜆 𝑚𝑚, 𝜶𝜶𝑖𝑖, 𝛼𝛼𝑗𝑗 = 𝛿𝛿𝑖𝑖,𝑗𝑗 𝚲𝚲 = diag(𝜆𝜆1, 𝜆𝜆2, … , 𝜆𝜆 𝑚𝑚), 𝑨𝑨 = (𝜶𝜶1, 𝜶𝜶2, … , 𝜶𝜶 𝑚𝑚) グラム行列が 大きい → 計算量大 小さい → 表現力不足 http://www.kecl.ntt.co.jp/people/kimura.akisato/titech/class.html
16.
15 グラム行列を近似する方法 • Nystrom method ‒
学習サンプルの乱択 + 部分グラム行列の直交展開 ‒ 直交展開に大きな計算量が必要 • Random feature method [Rahini+ NIPS07] ‒ カーネル関数を以下の形で表現 ‒ パラメータ 𝑤𝑤 のサンプリングによる関数近似 ‒ 近似に学習サンプルを用いない → 近似誤差が不十分
17.
16 学習サンプルを用いてカーネル関数を近似 Merserの定理 � 𝑋𝑋 𝑘𝑘 𝑥𝑥, 𝑦𝑦
𝜓𝜓𝑖𝑖 𝑥𝑥 𝑝𝑝 𝑥𝑥 𝑑𝑑𝑑𝑑 = 𝜆𝜆𝑖𝑖 𝜓𝜓𝑖𝑖(𝑥𝑥) 1. 分布 𝑝𝑝(𝑥𝑥) を学習サンプルから予測 2. 固有関数 𝜓𝜓𝑖𝑖(𝑥𝑥) を求める 3. 固有値 𝜆𝜆𝑖𝑖 が大きい固有関数だけ使う (Mukuta and Harada)
18.
17 最近の教師なし特徴量学習 Auto-encoder: 教師は自分 http://journal.frontiersin.org/article/10.3389/f ncom.2015.00032/full ここが特徴量 ここが画像
19.
18 周辺情報から中央部分を予測する特徴量学習 (Pathak, Krahenbuhl, Donahue,
Darrel and Efros) 平均値で埋める 別の欠損方法 でも良い
20.
19 教師なし特徴量学習の別アプローチ 教師のようなものを求められさえすれば良い [Fang+ CVPR15] 「ユーザ 𝑗𝑗
が 画像 𝑖𝑖 を見た」行列 協調フィルタリング
21.
20 Web annotationデータからのラベル予測 (Zhang, Shang,
Yang, Xu, Luan and Chua) ラベルベクトル 𝑦𝑦𝑡𝑡 を 潜在ベクトル 𝑣𝑣𝑡𝑡 に変換(圧縮) 画像特徴ベクトル 𝑥𝑥𝑡𝑡 から 潜在ベクトル 𝑣𝑣𝑡𝑡 を予測
22.
21 クラスタリングと特徴量学習を同時最適化 (Yang, Parikh and
Batra) 教師なし画像集合 CNN特徴抽出 (教師=クラスタ) Recurrent neural network (RNN) で全体をモデル化 クラスタを 徐々に更新 クラスタ
23.
Copyright©2014 NTT corp.
All Rights Reserved. クロスモーダル転移 • “Cross modal distillation for supervision transfer” • “Learning with side information through modality hallucination” • “Image style transfer using convolutional neural networks” • “Large scale semi-supervised object detection using visual and semantic knowledge transfer” • “Synthesized classifiers for zero-shot learning” • “Semi-supervised vocabulary-informed learning”
24.
23 クロスモーダル転移 典型例 - Zero-shot
learning • 画像のラベルを予測する分類問題で, 予測したいラベルの学習データが1つもない. [Frome+ NIPS13] word2vec CNN CNN特徴から単語ベクトルを予測 単語ベクトルが類似する単語を 予測結果として出力
25.
24 クロスモーダル転移が流行る周辺環境 • どのモーダルでもNN特徴表現が利用可能に • マルチモーダルNNの発達 [Silberer+
ACL14] [Srivastava+ JMLR14]
26.
Copyright©2014 NTT corp.
All Rights Reserved. マルチモーダル特徴量学習 • “MDL-CW: A multimodal deep learning framework with cross weights” • “Multi-view deep network for cross-view classification” • “Visual Word2Vec: Learning visually grounded word embeddings using abstract scenes”
27.
26 モーダルごとに学習して最後に統合, という固定観念を捨てる. (Rastegar, Baghshah, Rabiee
and Shojaee) Stacked auto-encoderでpre-training 最終層を結合して fine tuning
28.
27 判別分析規準のマルチモーダル特徴量学習を 全部NNで実現. (Kan, Shan and
Chen) クラスラベル 各モーダルからの入力 判別分析基準で損失を計算
29.
28 画像を介して単語ベクトルの 学習を精緻化 (Kottur, Vedantam, Moura
and Parikh) 単語系列を入力 画像特徴量を予測 画像を介すことでparaphrasingの判定も
30.
Copyright©2014 NTT corp.
All Rights Reserved. クロスモーダル転移 • “Cross modal distillation for supervision transfer” • “Learning with side information through modality hallucination” • “Synthesized classifiers for zero-shot learning” • “Semi-supervised vocabulary-informed learning” • “Latent embeddings for zero-shot classification” • “Image style transfer using convolutional neural networks” • “Learning attributes equals multi-source domain generalization”
31.
30 大量の教師付データで学習済のドメインから, 教師付データがほぼないドメインへモデル転移. (Gupta, Hoffman and
Malik) 転移の方法はあまり詳細に書かれていない
32.
31 Depth networkの出力を模倣する hallucination networkの導入. (Hoffman,
Gupta and Darrell) 灰色四角: 計算する損失 テスト時にdepthがなくても, depthを見ているのと 似た効果が得られる.
33.
32 Semantic空間での幾何関係を維持するように, 分類器のパラメータを多次元埋め込みで構成. (Changpinyo, Chao, Gong
and Sha) 分類器のパラメータ空間Attributes もしくは word2vec 空間 実在クラス仮想クラス実在クラス 仮想クラス
34.
33 予測対象ラベルの学習データがないかもしれない open-vocabulary learningの実現. (Fu and
Sigal) 画像特徴 𝑥𝑥 を単語ベクトル 𝑢𝑢 に変換する 𝑊𝑊 を求めたい. 自分の属するクラスの単語ベクトルが一番近くなるように変換したい.
35.
34 画像特徴と単語ベクトルの関係性を 複数の「観点」から学習することを目指す. (Xian, Akata, Sharma,
Nguyen, Hein and Schiele) 画像特徴 𝑥𝑥 と単語ベクトル 𝑦𝑦 とのfeasibilityが最大になるクラスに分類. 通常: Feasibilityは単一パラメータの双線形変換で記述. 本論文: 複数パラメータによる双線形変換の 混合として記述.
36.
35 (Gatys, Ecker and
Bethge) 白色雑音で駆動 Styleだけ転移したい 中身だけ転移したい Networkは実はどっちも同じ フィルタ応答を そのまま使う フィルタ応答の 相関を使う
37.
36 Attributesを用いた分類問題を 「ドメイン汎化」 [Muandet+ ICML13]
として考え直す. (Gan, Yang, Gong)
38.
Copyright©2014 NTT corp.
All Rights Reserved. まとめ
39.
38 ジュースで一番大事なこと 材料 作り方 飲み方
40.
39 特徴量学習も同じです データセット 学習方法 利用目的 • 目的に合わせたデータセットを用いる必要がある. • 同じ手法を用いても,異なる教師データからは異なる学習結果が出る. •
思うように結果が出ないのは, 本当に学習がうまくいっていないからでしょうか? • データの使い方を工夫すると,今までできなかった ことができるようになるかもしれない.
41.
40
Download