SlideShare a Scribd company logo
R-CNNの原理と
ここ数年の流れ
本橋和貴
CS室AI開発課
(R-)CNN調査報告会 - 2017年6月14日
Agenda
- Introduction
- R-CNNの原理
- 領域分け
- CNN
- 分類器
- R-CNNの問題点
- R-CNNの最近の動向
- SSD (Single Shot multibox Detector) の概要
- まとめ
2
R-CNN (Regions with CNN features)
('n03085013', 'computer_keyboard', 0.78958303)
('n04264628', 'space_bar', 0.13960978)
('n04505470', 'typewriter_keyboard', 0.050729375)
('n03793489', 'mouse', 0.0087937126)
('n04074963', 'remote_control', 0.0026325041)
* 出典:人工知能に関する断創録 - KerasでVGG16を使う (2017)
* http://aidiary.hatenablog.com/entry/20170104/1483535144
CNN (Convolutional Neural Network) 単体では
画像全体から特徴量 (feature) を抽出可能
領域候補
(Region Proposals)
を生成すれば...
Region毎のfeatureを抽出可能
人間が行うような”物体認識”
* 出典:Rich feature hierarchies for accurate object detection and semantic segmentation (2013)
* https://arxiv.org/abs/1311.2524
3
R-CNNの応用例
4* NVIDIA Seminar ディープラーニングによる画像認識と応用事例
* https://www.slideshare.net/Takayosi/nvidia-51814334
すみません、RNNの応用例でした
R-CNNの応用例
5* NVIDIA Seminar ディープラーニングによる画像認識と応用事例
* https://www.slideshare.net/Takayosi/nvidia-51814334
R-CNNの応用例
R-CNNの人認識とクラスタリングを組み合わせた手法
「Deep Learning技術をベースとした異常画像検出」(2016)
https://kaigi.org/jsai/webprogram/2016/pdf/664.pdf
(有限責任監査法人トーマツ デロイトアナリティクス&株式会社リクルート住まいカンパニー)
【不動産ポータルサイトSUUMO】
- 物件管理者側から提供された物件写真をサイトに掲載できるかチェック
NG:人が写っていたらダメ(プライバシーの観点から)
NG:工事中の写真はダメ
NG:拡大しすぎ/縮小しすぎはダメ
Agenda
- Introduction
- R-CNNの原理
- 領域分け
- CNN
- 分類器
- R-CNNの問題点
- R-CNNの最近の動向
- SSD (Single Shot multibox Detector) の概要
- まとめ
7
R-CNNの原点
原論文:
Rich feature hierarchies for accurate object detection
and semantic segmentation (2013)
https://arxiv.org/abs/1311.2524
8
R-CNNの原点
原論文:
Rich feature hierarchies for accurate object detection
and semantic segmentation (2013)
https://arxiv.org/abs/1311.2524
9
1. 入力画像に対して、
2. 物体が写っている領域の候補 (region proposal) を抽出し、
a. CNNのインプットの大きさに合うように領域中の画像をリサ
イズし、
3. それぞれの領域に対してCNNで特徴量 (feature) を計算し
4. それぞれの領域になにが写っているか分類する
R-CNNの原点
原論文:
Rich feature hierarchies for accurate object detection
and semantic segmentation (2013)
https://arxiv.org/abs/1311.2524
10
1. 入力画像に対して、
2. 物体が写っている領域の候補 (region proposal) を約2,000個抽出し、
a. CNNのインプットの大きさに合うように領域中の画像をリサイズし、
3. それぞれの領域に対してCNNで特徴量 (feature) を計算し
4. それぞれの領域になにが写っているか分類する
詳細は後述
R-CNNの原点
原論文:
Rich feature hierarchies for accurate object detection
and semantic segmentation (2013)
https://arxiv.org/abs/1311.2524
11
1. 入力画像に対して、
2. 物体が写っている領域の候補 (region proposal) を約2,000個抽出し、
a. CNNのインプットの大きさに合うようにそれぞれの領域中の画像をリサイズし、
3. それぞれの領域に対してCNNで特徴量 (feature) を計算し
4. それぞれの領域になにが写っているか分類する
詳細は後述
R-CNNの原点
原論文:
Rich feature hierarchies for accurate object detection
and semantic segmentation (2013)
https://arxiv.org/abs/1311.2524
12
1. 入力画像に対して、
2. 物体が写っている領域の候補 (region proposal) を約2,000個抽出し、
a. CNNのインプットの大きさに合うようにそれぞれの領域中の画像をリサイズし、
3. それぞれの領域に対してCNNで特徴量 (feature) を計算し、
4. それぞれの領域になにが写っているか分類する
詳細は後述
R-CNNの原点
原論文:
Rich feature hierarchies for accurate object detection
and semantic segmentation (2013)
https://arxiv.org/abs/1311.2524
13
1. 入力画像に対して、
2. 物体が写っている領域の候補 (region proposal) を約2,000個抽出し、
a. CNNのインプットの大きさに合うようにそれぞれの領域中の画像をリサイズし、
3. それぞれの領域に対してCNNで特徴量 (feature) を計算し、
4. それぞれの領域になにが写っているか分類する
詳細は後述
R-CNNの原理(1):領域分け
色々なアルゴリズムが存在するが、(あくまで先行研究との比較のため)
原論文ではselective searchを用いている
14
R-CNNの原理(1):領域分け
色々なアルゴリズムが存在するが、(あくまで先行研究との比較のため)
原論文ではselective searchを用いている
15
1. 色や濃淡勾配などの特徴が類似する領域に分ける
2. 類似度が高い隣接領域をどんどん結合していく
こうして小さい領域候補から大きな領域候補まで網羅
(参考:領域の大きさのことをスケールと呼ぶ)
“Fast mode”では約2,000個の候補 (VOC @ ~500x300 pix)
時系列 * 出典:Selective Search for Object Recognition
* https://www.koen.me/research/selectivesearch/
現論文で用いたCNNのモデルは”AlexNet” (Alex Krizhevsky et al)
• 2012年の”ImageNet” datasetの1,000クラス分類コンペで圧勝したモデル
• 他の有名なモデル:GoogLeNet (22層), VGG (16/19層), ResNet (18/34/50/...層) など
16
出典:ImageNet Classification with Deep Convolutional Neural Networks (2012)
https://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks.pdf
R-CNNの原理(2) CNNを用いた特徴量抽出R-CNNの原理(2) CNNを用いた特徴量抽出
全8層 = (入力)     畳込み層×5  + 全結合層×2+出力層×1
現論文で用いたCNNのモデルは”AlexNet” (Alex Krizhevsky et al)
• 2012年の”ImageNet” datasetの1,000クラス分類コンペで圧勝したモデル
• 他の有名なモデル:GoogLeNet (22層), VGG (16/19層), ResNet (18/34/50/...層) など
17
出典:ImageNet Classification with Deep Convolutional Neural Networks (2012)
https://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks.pdf
R-CNNの原理(2) CNNを用いた特徴量抽出R-CNNの原理(2) CNNを用いた特徴量抽出
全8層 = (入力)     畳込み層×5  + 全結合層×2+出力層×1
* GoogLeNet in Keras
* https://joelouismarino.github.io/blog_posts/blog_googlenet_keras.html
現論文で用いたCNNのモデルは”AlexNet” (Alex Krizhevsky et al)
• 2012年の”ImageNet” datasetの1,000クラス分類コンペで圧勝したモデル
• 他の有名なモデル:GoogLeNet (22層), VGG (16/19層), ResNet (18/34/50/...層) など
18
出典:ImageNet Classification with Deep Convolutional Neural Networks (2012)
https://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks.pdf
R-CNNの原理(2) CNNを用いた特徴量抽出R-CNNの原理(2) CNNを用いた特徴量抽出
全8層 = (入力)     畳込み層×5  + 全結合層×2+出力層×1
* リアルタイム画風変換とその未来
* https://engineering.linecorp.com/ja/blog/detail/105
Visual Geometry Group
現論文で用いたCNNのモデルは”AlexNet” (Alex Krizhevsky et al)
• 2012年の”ImageNet” datasetの1,000クラス分類コンペで圧勝したモデル
• 他の有名なモデル:GoogLeNet (22層), VGG (16/19層), ResNet (18/34/50/...層) など
19
出典:ImageNet Classification with Deep Convolutional Neural Networks (2012)
https://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks.pdf
R-CNNの原理(2) CNNを用いた特徴量抽出R-CNNの原理(2) CNNを用いた特徴量抽出
全8層 = (入力)     畳込み層×5  + 全結合層×2+出力層×1
* Image Classification
* http://book.paddlepaddle.org/03.image_classification/ Residual Net
現論文で用いたCNNのモデルは”AlexNet” (Alex Krizhevsky et al)
• 2012年の”ImageNet” datasetの1,000クラス分類コンペで圧勝したモデル
• 他の有名なモデル:GoogLeNet (22層), VGG (16/19層), ResNet (18/34/50/...層) など
20
出典:ImageNet Classification with Deep Convolutional Neural Networks (2012)
https://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks.pdf
R-CNNの原理(2) CNNを用いた特徴量抽出R-CNNの原理(2) CNNを用いた特徴量抽出
全8層 = (入力)     畳込み層×5  + 全結合層×2+出力層×1
R-CNNの原理(3) 分類器
R-CNNにおいて「分類がうまくいった」というのはどういう場合か
21
Car
Person
Fuel dispenser
正解ラベル
(ground truth)
例)車の認識
R-CNNの原理(3) 分類器
R-CNNにおいて「分類がうまくいった」というのはどういう場合か
22
Car
Person
Fuel dispenser
正解ラベル
(ground truth)
認識結果
例)車の認識 Car
R-CNNの原理(3) 分類器
R-CNNにおいて「分類がうまくいった」というのはどういう場合か
23
Car
Person
Fuel dispenser
正解ラベル
(ground truth)
認識結果
例)車の認識 Train
R-CNNの原理(3) 分類器
R-CNNにおいて「分類がうまくいった」というのはどういう場合か
24
Car
Person
Fuel dispenser
正解ラベル
(ground truth)
認識結果
例)車の認識
Car
R-CNNの原理(3) 分類器
R-CNNにおいて「分類がうまくいった」というのはどういう場合か
25
Car
Person
Fuel dispenser
正解ラベル
(ground truth)
認識結果
例)車の認識
Car
R-CNNの原理(3) 分類器
R-CNNにおいて「分類がうまくいった」というのはどういう場合か
26
Car
Person
Fuel dispenser
正解ラベル
(ground truth)
認識結果
例)車の認識
Car
?
R-CNNの原理(3) 分類器
R-CNNにおいて「分類がうまくいった」というのはどういう場合か
27
Car
Person
Fuel dispenser
正解ラベル
(ground truth)
認識結果
例)車の認識
Car
?
物体名と領域の位置・大きさが合って初めて正解
領域の一致具合の指標 IoU
IoU (Intersection over Union)
28
* 出典:Intersection over Union (IoU) for object detection - pyimagesearch (2016)
* http://www.pyimagesearch.com/2016/11/07/intersection-over-union-iou-for-object-detection/
原論文では IoU threshold = {0, 0.1, …, 0.5} で認識率をスキャンし、結局 threshold = 0.3 に設定
R-CNNの原理(3) 分類器
29
SVM (Support Vector Machine)
* 出典:SVM を使うと,なにが嬉しいの?
* http://www.neuro.sfc.keio.ac.jp/~masato/study/SVM/SVM_1.htm
識別面から最近傍サンプル点 (support vector) まで
のユークリッド距離 (マージン) を最大化するような識
別面を決めるアルゴリズム
各クラス(車、人など)に対してSVMで
信号・背景を識別する境界を学習
R-CNNの原点
原論文:
Rich feature hierarchies for accurate object detection
and semantic segmentation (2013)
https://arxiv.org/abs/1311.2524
30
1. 入力画像に対して、
2. 物体が写っている領域の候補 (region proposal) を Selective Search で約2,000個抽出し、
a. CNNのインプットの大きさに合うようにそれぞれの領域中の画像をリサイズし、
3. それぞれの領域に対してCNN (AlexNet) で特徴量 (feature) を計算し、
4. それぞれの領域になにが写っているか Support Vector Machine で分類する
Agenda
- Introduction
- R-CNNの原理
- 領域分け
- CNN
- 分類器
- R-CNNの問題点
- R-CNNの最近の動向
- SSD (Single Shot multibox Detector) の概要
- まとめ
31
オリジナルR-CNNの欠点
学習が多段の処理になっていて煩雑
1. まず”ImageNet” dataset(1画像に1物体)でCNNをpretrain
2. “VOC” dataset(1画像に複数物体)でCNNをfine-tuning*
*fine-tuning: 上流の層の重みは固定し、全結合層など下流の層の重みのみを trainingすること
3. CNNの出力側にSVMを載せて学習
4. 矩形回帰の学習
実行時間が遅い
• 領域候補 2,000 個に対してそれぞれCNNを走らせている
• 認識時間 10-45 s/image @ Nvidia Tesla K40 (cf: 最新Tesla P100はThroughput~10倍)
➡ 多数の”進化版”が考案されている 32
(参考)論文紹介:Fast R-CNN & Faster R-CNN
https://www.slideshare.net/takashiabe338/fast-rcnnfaster-rcnn
Agenda
- Introduction
- R-CNNの原理
- 領域分け
- CNN
- 分類器
- R-CNNの問題点
- R-CNNの最近の動向
- SSD (Single Shot multibox Detector) の概要
- まとめ
33
R-CNNの進化版のまとめ
34
著者 初出 (arXiv) オリジナルの実装 二次創作*
R-CNN Ross G. et al 2013/11 MATLAB+Caffe
Fast R-CNN Ross G. 2015/04 Caffe / MATLAB Torch
Faster R-CNN Shaoqing R. et at 2015/06 MATLAB / Caffe Keras / TensorFlow (TF) / Chainer
YOLO
(You Only Look Once)
Joseph R. et al 2015/06 darknet TF / TF / TF / TF on Android / Keras
SSD
(Single Shot Multibox Detector)
Wei L. et al 2015/12 Caffe Keras / TF / Torch / Chainer
YOLOv2 Joseph R. et al 2016/12 darknet Keras / TF
*「R-CNN implementation」等でググって1-2ページ以内にヒットしたもののみ掲載
* 出典:SSD: Single Shot MultiBox Detector
* https://github.com/weiliu89/caffe/tree/ssd
* 出典:YOLO9000: Better, Faster, Stronger
* https://arxiv.org/pdf/1612.08242.pdf
(次ページに拡大図)
R-CNNの進化版のまとめ
35
* 出典:YOLO9000: Better, Faster, Stronger
* https://arxiv.org/pdf/1612.08242.pdf
Agenda
- Introduction
- R-CNNの原理
- 領域分け
- CNN
- 分類器
- R-CNNの問題点
- R-CNNの最近の動向
- SSD (Single Shot multibox Detector) の概要
- まとめ
36
SSDの概要
• Single Shot multibox Detector (SSD)
• Single Shot (ひとつのネットワーク) で複数の物体を認識
• YOLOv1よりも速く、Faster R-CNNと同程度の精度
• Feature mapに対して小さな畳み込みフィルタをかけ、それぞれの領域
で各物体クラスのスコアとボックス位置のオフセットを予測(後述)
• 異なるスケール・アスペクト比で上述の操作を繰り返す
↔ R-CNNは領域候補を出してから、全候補にCNNを走らせる
• 物体認識とボックス位置それぞれの損失関数の和を最小化させる(後述)
• “end-to-end”でtraining可能
↔ R-CNNは多段階のtrainingが必要
37
• Single Shot multibox Detector (SSD)
• Single Shot (ひとつのネットワーク) で複数の物体を認識
• YOLOv1よりも速く、Faster R-CNNと同程度の精度
• Feature mapに対して小さな畳み込みフィルタをかけ、それぞれの領域
で各物体クラスのスコアとボックス位置のオフセットを予測(後述)
• 異なるスケール・アスペクト比で上述の操作を繰り返す
↔ R-CNNは領域候補を出してから、全候補にCNNを走らせる
• 物体認識とボックス位置それぞれの損失関数の和を最小化させる(後述)
• “end-to-end”でtraining可能
↔ R-CNNは多段階のtrainingが必要
SSDの概要
38
SSD300 in Keras @ TiTan X
SSDの原理
39
SSDの原理:特徴抽出
40
*VGGの全結合 (Fully-Connected) 層は畳込み (Convolution) 層に置き換えている
前半のVGGネットで特徴量 (feature) を抽出
SSDの原理:物体の位置と種類の認識
41
Feature mapを小さくしながら、異なるスケールの領域候補と物体認識のスコア(~確率)を出力
領域候補のアスペクト比は
デフォルトの{1, 2, 3, ½, ⅓} で固定
(極端に細長い物体は認識しづらい)
SSDの原理:物体の位置と種類の認識
42
Feature mapを小さくしながら、異なるスケールの領域候補と物体認識のスコア(~確率)を出力
領域候補のアスペクト比は
デフォルトの{1, 2, 3, ½, ⅓} で固定
(極端に細長い物体は認識しづらい?)
出典:https://www.slideshare.net/xavigiro/ssd-single-shot-multibox-detector
SSDの原理:学習
43
物体認識と位置決定の損失関数(loss function)の和を
小さくするようにフィルタの値を調整
SSDの原理:学習
物体認識と位置決定の損失関数(loss function)の和を
小さくするようにフィルタの値を調整
44
Confidence Loss Localization Loss
weight term:
一応フリーパラメータ
としているが、論文では
単純に α=1 と設定
Ground Truthと
位置がマッチした
Bounding Boxの数
SSDの原理:学習
物体認識と位置決定の損失関数(loss function)の和を
小さくするようにフィルタの値を調整
45
Ground Truthと
位置がマッチした
Bounding Boxの数 Confidence Loss
(Softmax Loss)
Localization Loss
マッチしたBox (Cross Entropy)
xp
ij
: i番目のboxが、カテゴリpのj番目の
  ground truthとマッチしたらxp
=1
マッチしなかったBox
カテゴリ0は背景;背景の確率=1なら最小となる
weight term:
一応フリーパラメータ
としているが、論文では
単純に α=1 と設定
SSDの原理:学習
物体認識と位置決定の損失関数(loss function)の和を
小さくするようにフィルタの値を調整
46
Ground Truthと
位置がマッチした
Bounding Boxの数 Confidence Loss
(Softmax Loss)
weight term:
一応フリーパラメータ
としているが、論文では
単純に α=1 と設定
Localization Loss
(Smooth L1 Loss)
lm
i
: Predicted Boxのcenter x, y, width, height
gm
j
: Ground truthのcenter x, y, width, height勾配が大きくなり過ぎない (at most 1)
参考:YOLO (You Only Look Once)
47
● 予め画像全体をグリッド分割
● 各領域ごとに物体のクラスとBounding Boxを求める
参考:SSDとYOLOのモデルの概要
48
https://github.com/rykov8/ssd_keras/blob/master/ssd.py
49
SSD の Keras での実装
https://github.com/rykov8/ssd_keras/blob/master/ssd.py
50
SSD の Keras での実装
https://github.com/rykov8/ssd_keras/blob/master/ssd.py
51
SSD の Keras での実装
“Localizationの特徴量”
“Confidenceの特徴量”
Default Bounding Box
https://github.com/rykov8/ssd_keras/blob/master/ssd.py
52
SSD の Keras での実装
まとめ
• R-CNN (Regions with CNN features) は
 領域分け+CNNの特徴量抽出
を組み合わせて、画像内の複数物体認識を行う
• オリジナルのR-CNNは動作が遅すぎて使い物にならない
• R-CNN改良版のSSDやYOLO
• ひとつのニューラルネットで両方のタスクを担う
• CNNで特徴量を認識してから領域分けを行う
53
Backup
54
【スラング英語の教科書】YOLOの正しい意味と使い方
http://creatorjapan.asia/yolo-meaning/
55
56
Fast R-CNN
https://arxiv.org/abs/1504.08083
R-CNNの応用例
57
R-CNN
R-CNNの人認識とクラスタリングを組み合わせた手法
「Deep Learning技術をベースとした異常画像検出」(2016)
https://kaigi.org/jsai/webprogram/2016/pdf/664.pdf
(有限責任監査法人トーマツ デロイトアナリティクス&株式会社リクルート住まいカンパニー)
- 物件管理者側から提供された物件写真をサイトに掲載できるかチェック
NG:人が写っていたらダメ(プライバシーの観点から)
NG:工事中の写真はダメ
NG:拡大しすぎ/縮小しすぎはダメ
【Python】 KerasのConvolution2Dの引数border_modeについて
‘valid’
出力画像は入力画像よりもサイズが小さくなる。
58
出典:http://ni4muraano.hatenablog.com/entry/2017/02/02/195505
‘same’
ゼロパディングすることで、
出力画像は入力画像と同じサイズになる。
59
Fast R-CNN
https://arxiv.org/abs/1504.08083
60
61
Deep Learning Benchmarks of NVIDIA Tesla P100 PCIe, Tesla K80, and Tesla M40 GPUs
https://www.microway.com/hpc-tech-tips/deep-learning-benchmarks-nvidia-tesla-p100-16gb-pcie-tesla-k80-tesla-m40-gpus/
62
Deep Learning Benchmarks of NVIDIA Tesla P100 PCIe, Tesla K80, and Tesla M40 GPUs
https://www.microway.com/hpc-tech-tips/deep-learning-benchmarks-nvidia-tesla-p100-16gb-pcie-tesla-k80-tesla-m40-gpus/

More Related Content

PDF
Introduction to YOLO detection model
PPTX
Active Convolution, Deformable Convolution ―形状・スケールを学習可能なConvolution―
PDF
Deep Learningと画像認識   ~歴史・理論・実践~
PPTX
物体検出の歴史(R-CNNからSSD・YOLOまで)
PPTX
Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recog...
PDF
(2022年3月版)深層学習によるImage Classificaitonの発展
PDF
三次元表現まとめ(深層学習を中心に)
PDF
局所特徴量と統計学習手法による物体検出
Introduction to YOLO detection model
Active Convolution, Deformable Convolution ―形状・スケールを学習可能なConvolution―
Deep Learningと画像認識   ~歴史・理論・実践~
物体検出の歴史(R-CNNからSSD・YOLOまで)
Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recog...
(2022年3月版)深層学習によるImage Classificaitonの発展
三次元表現まとめ(深層学習を中心に)
局所特徴量と統計学習手法による物体検出

What's hot (20)

PDF
SSD: Single Shot MultiBox Detector (ECCV2016)
PPTX
畳み込みニューラルネットワークの高精度化と高速化
PDF
【メタサーベイ】Neural Fields
PPTX
【DL輪読会】Scaling Laws for Neural Language Models
PDF
[DL輪読会]ICLR2020の分布外検知速報
PDF
自己教師学習(Self-Supervised Learning)
PPTX
近年のHierarchical Vision Transformer
PPTX
[解説スライド] NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
PDF
0から理解するニューラルネットアーキテクチャサーチ(NAS)
PDF
【メタサーベイ】Video Transformer
PDF
ドメイン適応の原理と応用
PPTX
[DL輪読会]Vision Transformer with Deformable Attention (Deformable Attention Tra...
PDF
[第2回3D勉強会 研究紹介] Neural 3D Mesh Renderer (CVPR 2018)
PDF
Attentionの基礎からTransformerの入門まで
PDF
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
PDF
SSII2022 [OS3-02] Federated Learningの基礎と応用
PPTX
[DL輪読会]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
PPTX
[DL輪読会]GQNと関連研究,世界モデルとの関係について
PDF
Visual SLAM: Why Bundle Adjust?の解説(第4回3D勉強会@関東)
PDF
Generating Diverse High-Fidelity Images with VQ-VAE-2
SSD: Single Shot MultiBox Detector (ECCV2016)
畳み込みニューラルネットワークの高精度化と高速化
【メタサーベイ】Neural Fields
【DL輪読会】Scaling Laws for Neural Language Models
[DL輪読会]ICLR2020の分布外検知速報
自己教師学習(Self-Supervised Learning)
近年のHierarchical Vision Transformer
[解説スライド] NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
0から理解するニューラルネットアーキテクチャサーチ(NAS)
【メタサーベイ】Video Transformer
ドメイン適応の原理と応用
[DL輪読会]Vision Transformer with Deformable Attention (Deformable Attention Tra...
[第2回3D勉強会 研究紹介] Neural 3D Mesh Renderer (CVPR 2018)
Attentionの基礎からTransformerの入門まで
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII2022 [OS3-02] Federated Learningの基礎と応用
[DL輪読会]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
[DL輪読会]GQNと関連研究,世界モデルとの関係について
Visual SLAM: Why Bundle Adjust?の解説(第4回3D勉強会@関東)
Generating Diverse High-Fidelity Images with VQ-VAE-2
Ad

Similar to R-CNNの原理とここ数年の流れ (20)

PDF
IEEE ITSS Nagoya Chapter
PDF
DeepLearningDay2016Summer
PPTX
論文紹介: Fast R-CNN&Faster R-CNN
PDF
20140131 R-CNN
PPTX
Region cnn
PDF
MIRU_Preview_JSAI2019
PPTX
関西Cvprml勉強会2017.9資料
PDF
cvpaper.challenge -サーベイの共有と可能性について- (画像応用技術専門委員会研究会 2016年7月)
PDF
深層学習 - 画像認識のための深層学習 ①
PDF
Convolutional Neural Networks のトレンド @WBAFLカジュアルトーク#2
PPTX
Alex net-survey-
PDF
Efficient Det
PDF
cvpaper.challenge@R-CNN
PDF
深層学習 - 画像認識のための深層学習 ②
PPTX
PRML 5.5.6-5.6 畳み込みネットワーク(CNN)・ソフト重み共有・混合密度ネットワーク
PDF
リクルートにおける画像解析事例紹介と周辺技術紹介
PPTX
Densely Connected Convolutional Networks
PPTX
CVPR2018 pix2pixHD論文紹介 (CV勉強会@関東)
PDF
Convolutional Neural Network @ CV勉強会関東
PDF
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
IEEE ITSS Nagoya Chapter
DeepLearningDay2016Summer
論文紹介: Fast R-CNN&Faster R-CNN
20140131 R-CNN
Region cnn
MIRU_Preview_JSAI2019
関西Cvprml勉強会2017.9資料
cvpaper.challenge -サーベイの共有と可能性について- (画像応用技術専門委員会研究会 2016年7月)
深層学習 - 画像認識のための深層学習 ①
Convolutional Neural Networks のトレンド @WBAFLカジュアルトーク#2
Alex net-survey-
Efficient Det
cvpaper.challenge@R-CNN
深層学習 - 画像認識のための深層学習 ②
PRML 5.5.6-5.6 畳み込みネットワーク(CNN)・ソフト重み共有・混合密度ネットワーク
リクルートにおける画像解析事例紹介と周辺技術紹介
Densely Connected Convolutional Networks
CVPR2018 pix2pixHD論文紹介 (CV勉強会@関東)
Convolutional Neural Network @ CV勉強会関東
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
Ad

More from Kazuki Motohashi (6)

PDF
20190619 オートエンコーダーと異常検知入門
PDF
20190407 第7章 事例研究:自然言語処理における素性
PDF
20190324 第6章 テキストデータのための素性
PDF
20190417 畳み込みニューラル ネットワークの基礎と応用
PPTX
深層学習の基礎と導入
PDF
20180110 AI&ロボット勉強会 Deeplearning4J と時系列データの異常検知について
20190619 オートエンコーダーと異常検知入門
20190407 第7章 事例研究:自然言語処理における素性
20190324 第6章 テキストデータのための素性
20190417 畳み込みニューラル ネットワークの基礎と応用
深層学習の基礎と導入
20180110 AI&ロボット勉強会 Deeplearning4J と時系列データの異常検知について

Recently uploaded (8)

PDF
【QYResearch】グローバル磁性材料産業チェーンの構造分析と市場動向の詳細解説
PDF
XCMSを用いた質量分析データ処理_BioCAsia2021_yamamoto.pdf
PDF
世界半導体用酸化ハフニウム市場のサプライチェーン解析:上流、下流、収益モデル分析2025-2031
PDF
【QYResearch】グローバルコネクタ市場の動向と将来展望に関する詳細な分析報告
PDF
【QYResearch】急拡大する医療機器市場における主要企業の動向と競争環境分析
PDF
グローバルロープウェイ用スチールワイヤーロープ市場2025:主要企業のシェア、売上動向、競争戦略
PDF
【QYResearch】人形ロボット産業の市場構造と今後の発展方向に関する分析レポート
PDF
【QYResearch】グローバル農業機械市場の動向分析と成長戦略に関する総合調査報告
【QYResearch】グローバル磁性材料産業チェーンの構造分析と市場動向の詳細解説
XCMSを用いた質量分析データ処理_BioCAsia2021_yamamoto.pdf
世界半導体用酸化ハフニウム市場のサプライチェーン解析:上流、下流、収益モデル分析2025-2031
【QYResearch】グローバルコネクタ市場の動向と将来展望に関する詳細な分析報告
【QYResearch】急拡大する医療機器市場における主要企業の動向と競争環境分析
グローバルロープウェイ用スチールワイヤーロープ市場2025:主要企業のシェア、売上動向、競争戦略
【QYResearch】人形ロボット産業の市場構造と今後の発展方向に関する分析レポート
【QYResearch】グローバル農業機械市場の動向分析と成長戦略に関する総合調査報告

R-CNNの原理とここ数年の流れ