Submit Search
[DL輪読会]Zero-shot Recognition via Semantic Embeddings and Knowledge Graphs (CVPR 2018)
3 likes
1,310 views
Deep Learning JP
2018/08/03 Deep Learning JP: http://deeplearning.jp/seminar-2/
Technology
Related topics:
Deep Learning
Read more
1 of 22
Download now
Download to read offline
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
More Related Content
PDF
【メタサーベイ】Transformerから基盤モデルまでの流れ / From Transformer to Foundation Models
cvpaper. challenge
PPTX
[DL輪読会]Revisiting Deep Learning Models for Tabular Data (NeurIPS 2021) 表形式デー...
Deep Learning JP
PPTX
[DL輪読会]ドメイン転移と不変表現に関するサーベイ
Deep Learning JP
PDF
【DL輪読会】Self-Supervised Learning from Images with a Joint-Embedding Predictive...
Deep Learning JP
PPTX
[DL輪読会]Set Transformer: A Framework for Attention-based Permutation-Invariant...
Deep Learning JP
PPTX
[DL輪読会]逆強化学習とGANs
Deep Learning JP
PDF
【DL輪読会】マルチエージェント強化学習における近年の 協調的方策学習アルゴリズムの発展
Deep Learning JP
PDF
トピックモデルの評価指標 Perplexity とは何なのか?
hoxo_m
【メタサーベイ】Transformerから基盤モデルまでの流れ / From Transformer to Foundation Models
cvpaper. challenge
[DL輪読会]Revisiting Deep Learning Models for Tabular Data (NeurIPS 2021) 表形式デー...
Deep Learning JP
[DL輪読会]ドメイン転移と不変表現に関するサーベイ
Deep Learning JP
【DL輪読会】Self-Supervised Learning from Images with a Joint-Embedding Predictive...
Deep Learning JP
[DL輪読会]Set Transformer: A Framework for Attention-based Permutation-Invariant...
Deep Learning JP
[DL輪読会]逆強化学習とGANs
Deep Learning JP
【DL輪読会】マルチエージェント強化学習における近年の 協調的方策学習アルゴリズムの発展
Deep Learning JP
トピックモデルの評価指標 Perplexity とは何なのか?
hoxo_m
What's hot
(20)
PPTX
深層学習の数理
Taiji Suzuki
PDF
グラフニューラルネットワークとグラフ組合せ問題
joisino
PDF
Deeplearning輪読会
正志 坪坂
PDF
深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで
Yahoo!デベロッパーネットワーク
PDF
[DL輪読会]data2vec: A General Framework for Self-supervised Learning in Speech,...
Deep Learning JP
PPTX
トピックモデルの基礎と応用
Tomonari Masada
PDF
Transformerを用いたAutoEncoderの設計と実験
myxymyxomatosis
PDF
敵対的生成ネットワーク(GAN)
cvpaper. challenge
PDF
Graph Attention Network
Takahiro Kubo
PDF
CVPR2019読み会@関東CV
Takanori Ogata
PDF
Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2
Preferred Networks
PPTX
【論文紹介】How Powerful are Graph Neural Networks?
Masanao Ochi
PDF
自己教師学習(Self-Supervised Learning)
cvpaper. challenge
PPTX
カルマンフィルタ入門
Yasunori Nihei
PDF
トップカンファレンスへの論文採択に向けて(AI研究分野版)/ Toward paper acceptance at top conferences (AI...
JunSuzuki21
PPTX
[DL輪読会]Life-Long Disentangled Representation Learning with Cross-Domain Laten...
Deep Learning JP
PDF
深層学習の不確実性 - Uncertainty in Deep Neural Networks -
tmtm otm
PPTX
Generative Adversarial Imitation Learningの紹介(RLアーキテクチャ勉強会)
Yusuke Nakata
PDF
【メタサーベイ】数式ドリブン教師あり学習
cvpaper. challenge
PDF
【DL輪読会】A Path Towards Autonomous Machine Intelligence
Deep Learning JP
深層学習の数理
Taiji Suzuki
グラフニューラルネットワークとグラフ組合せ問題
joisino
Deeplearning輪読会
正志 坪坂
深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで
Yahoo!デベロッパーネットワーク
[DL輪読会]data2vec: A General Framework for Self-supervised Learning in Speech,...
Deep Learning JP
トピックモデルの基礎と応用
Tomonari Masada
Transformerを用いたAutoEncoderの設計と実験
myxymyxomatosis
敵対的生成ネットワーク(GAN)
cvpaper. challenge
Graph Attention Network
Takahiro Kubo
CVPR2019読み会@関東CV
Takanori Ogata
Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2
Preferred Networks
【論文紹介】How Powerful are Graph Neural Networks?
Masanao Ochi
自己教師学習(Self-Supervised Learning)
cvpaper. challenge
カルマンフィルタ入門
Yasunori Nihei
トップカンファレンスへの論文採択に向けて(AI研究分野版)/ Toward paper acceptance at top conferences (AI...
JunSuzuki21
[DL輪読会]Life-Long Disentangled Representation Learning with Cross-Domain Laten...
Deep Learning JP
深層学習の不確実性 - Uncertainty in Deep Neural Networks -
tmtm otm
Generative Adversarial Imitation Learningの紹介(RLアーキテクチャ勉強会)
Yusuke Nakata
【メタサーベイ】数式ドリブン教師あり学習
cvpaper. challenge
【DL輪読会】A Path Towards Autonomous Machine Intelligence
Deep Learning JP
Ad
Similar to [DL輪読会]Zero-shot Recognition via Semantic Embeddings and Knowledge Graphs (CVPR 2018)
(20)
PDF
Rethinking Knowledge Graph Propagation for Zero-Shot Learinig 論文紹介
YukiK2
PPTX
機械学習を民主化する取り組み
Yoshitaka Ushiku
PDF
Feature Generationg Networks for Zero-Shot Learning 論文紹介
YukiK2
PDF
Japanese Summary; Domain Adaptation for Object Recognition: An Unsupervised A...
Yasunori Ozaki
PPTX
CVPR2018 pix2pixHD論文紹介 (CV勉強会@関東)
Tenki Lee
PPTX
【論文LT資料】 Gait Recognition via Disentangled Representation Learning (CVPR2019)
Takuji Tahara
PDF
Twitterユーザに対するゼロショットタグ付け
Kohei Shinden
PDF
論文紹介:A Survey on Open-Vocabulary Detection and Segmentation: Past, Present, a...
Toru Tamaki
PPTX
[DL輪読会]A closer look at few shot classification
Deep Learning JP
PPTX
A closer look at few shot classification
Kazuki Fujikawa
PPTX
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
harmonylab
PDF
文献紹介:Elaborative Rehearsal for Zero-Shot Action Recognition
Toru Tamaki
PDF
Contrastive learning 20200607
ぱんいち すみもと
PPTX
[DL輪読会] “Asymmetric Tri-training for Unsupervised Domain Adaptation (ICML2017...
Yusuke Iwasawa
PPTX
Zero shot word sense disambiguation using sense definition embeddings
RI
PDF
【ECCV 2018】Zero-Shot Deep Domain Adaptation
cvpaper. challenge
PDF
Domain Adaptive Faster R-CNN for Object Detection in the Wild 論文紹介
Tsukasa Takagi
PDF
ZeroCap: Zero-Shot Image-to-Text Generation for Visual-Semantic Arithmetic
harmonylab
PDF
Neural networks for Graph Data NeurIPS2018読み会@PFN
emakryo
PPTX
Semi supervised, weakly-supervised, unsupervised, and active learning
Yusuke Uchida
Rethinking Knowledge Graph Propagation for Zero-Shot Learinig 論文紹介
YukiK2
機械学習を民主化する取り組み
Yoshitaka Ushiku
Feature Generationg Networks for Zero-Shot Learning 論文紹介
YukiK2
Japanese Summary; Domain Adaptation for Object Recognition: An Unsupervised A...
Yasunori Ozaki
CVPR2018 pix2pixHD論文紹介 (CV勉強会@関東)
Tenki Lee
【論文LT資料】 Gait Recognition via Disentangled Representation Learning (CVPR2019)
Takuji Tahara
Twitterユーザに対するゼロショットタグ付け
Kohei Shinden
論文紹介:A Survey on Open-Vocabulary Detection and Segmentation: Past, Present, a...
Toru Tamaki
[DL輪読会]A closer look at few shot classification
Deep Learning JP
A closer look at few shot classification
Kazuki Fujikawa
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
harmonylab
文献紹介:Elaborative Rehearsal for Zero-Shot Action Recognition
Toru Tamaki
Contrastive learning 20200607
ぱんいち すみもと
[DL輪読会] “Asymmetric Tri-training for Unsupervised Domain Adaptation (ICML2017...
Yusuke Iwasawa
Zero shot word sense disambiguation using sense definition embeddings
RI
【ECCV 2018】Zero-Shot Deep Domain Adaptation
cvpaper. challenge
Domain Adaptive Faster R-CNN for Object Detection in the Wild 論文紹介
Tsukasa Takagi
ZeroCap: Zero-Shot Image-to-Text Generation for Visual-Semantic Arithmetic
harmonylab
Neural networks for Graph Data NeurIPS2018読み会@PFN
emakryo
Semi supervised, weakly-supervised, unsupervised, and active learning
Yusuke Uchida
Ad
More from Deep Learning JP
(20)
PPTX
【DL輪読会】AdaptDiffuser: Diffusion Models as Adaptive Self-evolving Planners
Deep Learning JP
PPTX
【DL輪読会】事前学習用データセットについて
Deep Learning JP
PPTX
【DL輪読会】 "Learning to render novel views from wide-baseline stereo pairs." CVP...
Deep Learning JP
PPTX
【DL輪読会】Zero-Shot Dual-Lens Super-Resolution
Deep Learning JP
PPTX
【DL輪読会】BloombergGPT: A Large Language Model for Finance arxiv
Deep Learning JP
PPTX
【DL輪読会】マルチモーダル LLM
Deep Learning JP
PDF
【 DL輪読会】ToolLLM: Facilitating Large Language Models to Master 16000+ Real-wo...
Deep Learning JP
PPTX
【DL輪読会】AnyLoc: Towards Universal Visual Place Recognition
Deep Learning JP
PDF
【DL輪読会】Can Neural Network Memorization Be Localized?
Deep Learning JP
PPTX
【DL輪読会】Hopfield network 関連研究について
Deep Learning JP
PPTX
【DL輪読会】SimPer: Simple self-supervised learning of periodic targets( ICLR 2023 )
Deep Learning JP
PDF
【DL輪読会】RLCD: Reinforcement Learning from Contrast Distillation for Language M...
Deep Learning JP
PDF
【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"
Deep Learning JP
PPTX
【DL輪読会】"Language Instructed Reinforcement Learning for Human-AI Coordination "
Deep Learning JP
PPTX
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
Deep Learning JP
PDF
【DL輪読会】"Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware"
Deep Learning JP
PPTX
【DL輪読会】Parameter is Not All You Need:Starting from Non-Parametric Networks fo...
Deep Learning JP
PDF
【DL輪読会】Drag Your GAN: Interactive Point-based Manipulation on the Generative ...
Deep Learning JP
PPTX
【DL輪読会】Towards Understanding Ensemble, Knowledge Distillation and Self-Distil...
Deep Learning JP
PPTX
【DL輪読会】VIP: Towards Universal Visual Reward and Representation via Value-Impl...
Deep Learning JP
【DL輪読会】AdaptDiffuser: Diffusion Models as Adaptive Self-evolving Planners
Deep Learning JP
【DL輪読会】事前学習用データセットについて
Deep Learning JP
【DL輪読会】 "Learning to render novel views from wide-baseline stereo pairs." CVP...
Deep Learning JP
【DL輪読会】Zero-Shot Dual-Lens Super-Resolution
Deep Learning JP
【DL輪読会】BloombergGPT: A Large Language Model for Finance arxiv
Deep Learning JP
【DL輪読会】マルチモーダル LLM
Deep Learning JP
【 DL輪読会】ToolLLM: Facilitating Large Language Models to Master 16000+ Real-wo...
Deep Learning JP
【DL輪読会】AnyLoc: Towards Universal Visual Place Recognition
Deep Learning JP
【DL輪読会】Can Neural Network Memorization Be Localized?
Deep Learning JP
【DL輪読会】Hopfield network 関連研究について
Deep Learning JP
【DL輪読会】SimPer: Simple self-supervised learning of periodic targets( ICLR 2023 )
Deep Learning JP
【DL輪読会】RLCD: Reinforcement Learning from Contrast Distillation for Language M...
Deep Learning JP
【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"
Deep Learning JP
【DL輪読会】"Language Instructed Reinforcement Learning for Human-AI Coordination "
Deep Learning JP
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
Deep Learning JP
【DL輪読会】"Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware"
Deep Learning JP
【DL輪読会】Parameter is Not All You Need:Starting from Non-Parametric Networks fo...
Deep Learning JP
【DL輪読会】Drag Your GAN: Interactive Point-based Manipulation on the Generative ...
Deep Learning JP
【DL輪読会】Towards Understanding Ensemble, Knowledge Distillation and Self-Distil...
Deep Learning JP
【DL輪読会】VIP: Towards Universal Visual Reward and Representation via Value-Impl...
Deep Learning JP
[DL輪読会]Zero-shot Recognition via Semantic Embeddings and Knowledge Graphs (CVPR 2018)
1.
Zero-shot Recognition via
Semantic Embeddings and Knowledge Graphs PSI B3 近藤生也
2.
軽く自己紹介 - 工学部シス創C B3 -
(一応)工学部推薦入学 - VTuberにはまってます - ふだん→
3.
アジェンダ ● 書誌情報 ● モチベーション ●
コンセプト ● Zero-shot GCN ● GCN ● 余談:GCNはどう実装するの ● 実験 ● 所感 3
4.
書誌情報 ● Zero-shot Recognition
via Semantic Embeddings and Knowledge Graphs (CVPR 2018) ○ ● The Robotics Institute, Carnegie Mellon University ○ ● ポイント ○ WordNet等、グラフ構造を持つカテゴリ間の関係性のデータを知識としてうまく 活用し、0-shotな認識で大幅に精度向上 ○ ● 選定理由 ○ なんとなくグラフ系に興味 4
5.
モチベーション 5 ● 一般的なNNによる分類モデルでは、新しいカテゴリの追加が困難 ○ 数千のサンプルを収集 ○
出力層を変えて再学習 ● ヒトは初めて見た動物でも(知識があれば)カテゴリの特定は容易 ● ● オカピ:『褐色の胴と鹿のような顔をしたゼブラストライプ4つの脚の動物』
6.
既存手法 ● 画像からカテゴリの単語分散表現へのマッピングを学習する ○ オカピの画像を入力して、オカピの単語分散表現が出るようにする ●
クラス分類の出力の確率分布を使って、単語分散表現の加重平均を取る ○ オカピの分散表現 = 鹿らしさ*鹿の分散表現 + しま馬らしさ*しま馬の分散表現 + ... ● 画像から有限個の形容詞を予測するモデルを作り、すべてのカテゴリを形容詞の 真偽で予測する ○ オカピ ⇐⇒ シマシマ ∧ 4足歩行 ∧ 茶色 ∧ … 色々あったけど、これらと比べて大幅に精度を向上させた 6
7.
コンセプト ● 意味的に近いカテゴリを参考にしたい ○ しかし単語分散表現に頼るのには限界がある ●
形容詞等でカテゴリをいくつかの一般的な要素で記述したい ○ 形容詞に限らず複雑な要素でも記述されるべきである ● 両方使おう - 明示的かつ疎な関係性データ(知識グラフ) - 暗黙的かつ密な知識表現(単語分散表現) 7
8.
コンセプト 8 - 特徴1 - 特徴2 -
特徴2048 ● 事前学習済みのCNNで特徴量を得る [Features]× W_{鹿} = 鹿らしさ [Features]× W_{しま馬} = しま馬らしさ [Features]× W_{オカピ} = オカピらしさ ● となるような、各カテゴリのW(== 各カテゴリのロジスティック回帰パラメータ)を『知 識グラフ』と『単語分散表現』で求める
9.
Zero-shot GCN 9 [Features]× W_{オカピ}
= オカピらしさ カテゴリ『オカピ』についての ロジスティック回帰パラメータ
10.
Zero-shot GCN 10 ● 両方使って各Wを求めよう -
明示的かつ疎な関係性データ(知識グラフ) - 暗黙的かつ密な知識表現(単語分散表現) ● 単語分散表現からロジスティック回帰パラメータを求める ● さらにGCNを使って、暗黙的に関係性の高いカテゴリ同士がより相互作用するよう なモデルを作る ● 両方賢く使えそう
11.
Zero-shot GCN 11 GCN GCNが関係 する部分
12.
GCN 12 ● 今回は下側のタイプで、隣接行列を直接使っている ● GCNは、隣接行列等を使って局所的な要素だけが出力に関係してくるから Convolutionって名前についているのだとい個人的に解釈している(一般的なCNN とは様相が違う) (DL_Hacks東さんのスライドから拝借)
13.
GCN 13 ● GC一層の処理 Z :出力層 A_hat:隣接行列を正規化したもの X’
:前の層の出力 W :パラメータ
14.
GCN 14 ● この論文では ○ ノード:(未知を含む)すべてのカテゴリ ○
エッジ:WordNet等でn-hopまで離れた単語同士をエッジで結ぶ(n=7) ○ 入力:(未知を含む)すべてのカテゴリの単語分散表現 ○ 出力:各カテゴリでのロジスティック回帰パラメータ ● 各ノードの隣接関係は保たれたまま、特徴量の次元数だけ変わっていく
15.
GCN 15 ● この論文では ○ 入力:(未知を含む)すべてのカテゴリの単語分散表現 ○
出力:各カテゴリでのロジスティック回帰パラメータW ○ 損失:既知のカテゴリの最適なW(事前学習時に得られる)との差 Loss
16.
余談:GCNはどう実装するの 16 ● TensorFlow等で書ける
17.
GCN 17 ● 論文では、6層のGCN ● すべてのカテゴリを一括で変換していき、既知のWが正しくなるよう学習 ○
既知のカテゴリのみの損失を最小化すると未知のカテゴリでも精度が上がる (汎化)
18.
GCN 18
19.
実験 19 ● SOTA(ConSE) ○ クラス分類の出力の確率分布を使って 単語分散表現の加重平均(オカピの分 散表現
= 鹿らしさ*鹿の分散表現 + しま 馬らしさ*しま馬の分散表現 + ..) ○ カッコの中は、加重平均に上位何個の カテゴリまで使うか ● 最大+28ポイント
20.
実験 20 ● Embeddingの手法を変 えた実験 ● 異なる手法で埋め込み を行っても問題ない
21.
実験 21 ● 2,3割ランダムにエッジを刈っても問 題ない ○ かなりグラフデータに対してロバ スト ○
刈りすぎると精度が下がってい るので、しっかりグラフ情報を使 えていることがわかる
22.
所感 22 ● GCNの威力は凄い ● 普通の分類に比べたら以前かなり低い精度 ○
(モデルが勝手に賢くggってくれないかな) ● 辞書に乗ってないようなものには GCN使えないし、 逆にグラフの知識で embeddingを修正すればいい んじゃないのかと個人的に思った。 https://www.slideshare.net/ren4yu/ss-84282514
Download