SlideShare a Scribd company logo
cvpaper.challenge
Twitter@CVPaperChalleng
http://www.slideshare.net/cvpaperchallenge
MAILTO: cvpaper.challenge[at]gmail[dot]com
Chuang Gan, Chen Sun, Lixin Duan, Boqing Gong, “Webly-supervised Video Recognition by Mutually
Voting for Relevant Web Images and Web Video Frames”, in ECCV, 2016.
【1】
Keywords: Weakly Supervised Learning, Video Recognition
新規性・差分
概要
Web検索結果の上位サンプルにより学習したデータで動画
に対する認識を行う.サンプルや労力などよりコストの低
い学習フレームワークを提案.検索により抽出した動画像
から関連するフレームのみを抽出する(右図や式より).
・簡易的な学習や関連するフレームのみ抽出するフレーム
ワークにより,UCF101やTRECVID MEDなどのデータで
良好な精度を実現した.教師ありの学習にいかに近づける
かが今後の課題である.
Links
論文
http://crcv.ucf.edu/people/faculty/Gong/P
aper/webly-supervised.pdf
プロジェクト
http://research.google.com/pubs/pub454
93.html
ポスター
http://www.eccv2016.org/files/posters/P-
2B-15.pdf
Endri Dibra, Cengiz Oztireli, Remo Ziegler, Markus Gross, “Shape from Selfies: Human Body Shape
Estimation using CCA Regression Forests”, in ECCV, 2016.
【5】
Keywords: Shape from Selfies, Silhouette
新規性・差分
概要
自撮り画像から3次元人体モデルを復元する研究.シルエ
ットの抽出とView推定,CCAによる投影,Random
Forestsにより3次元のメッシュを再構成する.
・Selfieからのシルエットや3次元メッシュ復元を実行.
・Random Forestsによるビュー推定やCCAによるビュー
ごとの相関を求める
Links
論文
https://graphics.ethz.ch/~edibra/Publications/Shape%20from%
20Selfies%20-
%20Human%20Body%20Shape%20Estimation%20using%20
CCA%20Regression%20Forests.pdf
プロジェクト
Lisa Anne Hendricks, Zeynep Akata, Marcus Rohrbach, Jeff Donahue, Bernt Schiele, Trevor Darrell,
“Generating Visual Explanations”, in ECCV, 2016.
【2】
Keywords: Image Captioning, Explanation
新規性・差分
概要
画像説明文と関連して,画像のより詳細なラベル
(Explanation)を付与する研究.具体的には画像により詳細
な形容詞や詳細ラベルを割振る.右図はExplanationsの詳
細や認識のための画像や言語のフレームワークである.
・画像により詳細な説明を与えるExplanationを提案した.
形容する言葉や詳細ラベルなどを混合したようなモデルで
ある.
Links
論文 https://arxiv.org/pdf/1603.08507v1.pdf
ポスター http://www.eccv2016.org/files/posters/P-2B-17.pdf
Yu Du, Yongkang Wong, Yonghao Liu, Feilin Han, Yilin Gui, Zhen Wang, Mohan Kankanhalli, Weidong
Geng, “Marker-Less 3D Human Motion Capture with Monocular Image Sequence and Height-Maps”, in
ECCV, 2016.
【3】
Keywords: 3D Pose Estimation, Markerless MoCap
新規性・差分
概要
マーカレスモーキャプの問題に対して,可視画像や身長マ
ップにより3次元姿勢推定を実行する(右図).目的関数
の定義により,画像から抽象化,さらに2Dから3D姿勢へ
の投影を行う.
・RGB画像や画像から計算された身長マップを入力として,
Dual-StreamのCNNにより3次元姿勢推定を行い,マーカ
レスモーキャプを実現.
・2D-3Dに変換する目的関数を新規に提案.
Links
論文
https://www.google.co.jp/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&ved=0ahUKEwi7l
drO6dHQAhWHTbwKHc-
PA2cQFggdMAA&url=http%3A%2F%2Fwww.springer.com%2Fcda%2Fcontent%2Fdocu
ment%2Fcda_downloaddocument%2F9783319464923-c2.pdf%3FSGWID%3D0-0-45-
1588730-p180264620&usg=AFQjCNGP7ce8-
COneTrsvajAeOtQ3BHpyA&sig2=V4P1Dl77_nfptTIE8RBWUw&cad=rja
YouTube https://www.youtube.com/watch?v=BJ8e2EMfaQM
Anil Usumezbas, Ricardo Fabbri, Benjamin Kimia, “From Multiview Image Curves to 3D Drawings”, in
ECCV, 2016.
【4】
Keywords: 3D Drawing
新規性・差分
概要
2次元の写真や絵画を入力すると3次元のモデルとして出力
される研究.2次元の複数の写真や,線画の情報を用いて3
次元を復元する.
・右図のモデルにより,2Dから3Dのモデル(主に3次元の
線画)を復元.右下図にその一例を示す.
Links
論文 https://arxiv.org/abs/1609.05561
Supplementary http://multiview-3d-
drawing.sourceforge.net/papers/usumezbas-fabbri-kimia-
ECCV2016-supplementary.pdf
プロジェクト https://vision.lems.brown.edu/3d-drawing
ポスター http://www.eccv2016.org/files/posters/P-2B-21.pdf
Anirban Roy, Sinisa Todorovic, “A Multi-Scale CNN for Affordance Segmentation in RGB Images”, in
ECCV, 2016.
【6】
Keywords: Affordance, Segmentation
新規性・差分
概要
アフォーダンスセグメンテーションを提案.ピクセルレベ
ルでアフォーダンスのラベル付けが可能.距離画像や平面
検出を用いた半自動ラベル付け処理も実装.Multi-scale
CNNによりアフォーダンスを推定する.
・ピクセルレベルでのアフォーダン
ス(機能に関する)セグメンテーシ
ョンを実現した
・Multi-scale CNNによりスケールの
変動に対応したラベル付け
・Affordance Datasetを提案
Links
論文
http://web.engr.oregonstate.edu/~sinisa/res
earch/publications/eccv16_affordance.pdf
ポスター
http://www.eccv2016.org/files/posters/P-
2B-28.pdf
Cheng-Sheng Chan, Shou-Zhong Chen, Pei-Xuan Xie, Chiung-Chih Chang, Min Sun, “Recognition from
Hand Cameras: A Revisit with Deep Learning”, in ECCV, 2016.
【7】
Keywords: First Person View
新規性・差分
概要
ウェアラブルカメラにおいて,頭部に装着するだけでなく,
左右両手に取り付けることで,物体認識や対象行動を認識
しやすくする.これにより,全てのシーンが見やすい位置
で撮影可能,ハンドジェスチャーがエゴモーションとして
取得可能というメリットを取ることができる.また,頭部
カメラの特徴もそのまま統合可能である.
・頭部と両手から3視点のウェアラブルカメラにより一人
称ビジョンを撮影可能である.
・Daily Life Datasetの提案により,効果を実証した.
・さらに,屋内環境の3次元再構成を行った.
Links
論文 https://arxiv.org/abs/1512.01881
ポスター http://www.eccv2016.org/files/posters/P-2B-47.pdf
Georgia Gkioxari, Alexander Toshev, Navdeep Jaitly, “Chained Predictions Using Convolutional Neural
Networks”, in ECCV, 2016.
【8】
Keywords: CNN, Structured Problem, Chain Model
新規性・差分
概要
NLPであるようなChain Modelを導入して,構造的な問題
(e.g. 人物の姿勢,シーンと物体)を解決する.右図がコン
ピュータビジョンにおけるChain Modelの提案である.
Single Image/Videoであっても汎用的に用いることができ
るモデルである.
・Chain Modelをコンピュータビジョンに拡張して構造化
された問題に対して適用した
・MPII Human Pose DatasetやPenn Action Datasetに対し
て用いて,姿勢推定やそれを用いた行動認識の問題に適用
し,良好な性能を実現した.
Links
論文 https://arxiv.org/abs/1605.02346
プロジェクト
http://people.eecs.berkeley.edu/~gkioxari/ChainMode
ls/index.html
ポスター http://www.eccv2016.org/files/posters/P-3A-
13.pdf
Xinchen Yan, Jimei Yang, Kihyuk Sohn, Honglak Lee, “Attribute2Image: Conditional Image Generation
from Visual Attributes”, in ECCV, 2016.
【9】
Keywords: Image Generation, Attribute
新規性・差分
概要
画像生成のための事前情報として属性(アトリビュート)
を用いることを考える.画像生成はVAE(特に,Attribute-
conditional VAEとよぶ)を用い,顔を対象として生成する.
・表に比較結果を示す
・右下図に顔画像の生成結果を示す
Links
論文
https://arxiv.org/pdf/1512.0057
0v2.pdf
プロジェクト
https://sites.google.com/site/at
tribute2image/
ポスター
http://www.eccv2016.org/files/
posters/P-3A-16.pdf
コード
https://github.com/xcyan/eccv1
6_attr2img
Yu Xiang, Wonhui Kim, Wei Chen, Jingwei Ji, Christopher Choy, Hao Su, Roozbeh Mottaghi, Leonidas
Guibas, Silvio Savarese, “ObjectNet3D: A Large Scale Database for 3D Object Recognition”, in ECCV,
2016.
【10】
Keywords: 3D Shape Database
新規性・差分
概要
3次元物体認識のためのデータセットであるObjectNet3D
を提案する.データベースは従来の3D Warehouseや
ShapeNetから抽出したCADデータを参考にして,2次元画
像に対応付けを行う.RGBDデータセットは従来と比較し
て(中央表),カテゴリ数100, インスタンス数200K,3D
Shape 44Kと膨大に増加している.
・RGBと従来の3DデータからCADデータを対応付けて
100クラス分類の問題を設定した
・右下表は物体検出や回転姿勢推定の結果である.
Links
論文 https://yuxng.github.io/xiang_eccv16.pdf
プロジェクト http://cvgl.stanford.edu/projects/objectnet3d/
ポスター http://www.eccv2016.org/files/posters/S-3C-08.pdf
Maxim Tatarchenko, Alexey Dosoivitskiy, Thomas Brox, “Multi-View 3D Models from Single Images with
a Convolutional Network”, in ECCV, 2016.
【11】
Keywords: 3D Models, 2D-3D
新規性・差分
概要
単眼画像を入力として,3次元モデルを復元する研究.2D画像--
ConvNet--Synthetic data--3D--Interpolationという流れである
(右上図).畳み込みネットは右図に示すモデルで,2D画像や
ビューポイントのConvolutionやDeConvolutionを含む.
・従来の手法と比較して3次元モデルの生成を高精細にし
た
・シンプルなアーキテクチャで3次元モデルの復元を行っ
た
Links
論文 http://lmb.informatik.uni-
freiburg.de/Publications/2016/TDB16a/tdb16.pdf
プロジェクト http://lmb.informatik.uni-
freiburg.de/Publications/2016/TDB16a/
YouTube https://www.youtube.com/watch?v=uf4-l6h7iGM
ポスター http://www.eccv2016.org/files/posters/S-3B-09.pdf
Yuta Itoh, Jason Orlosky, Kiyoshi Kiyokawa, Gudrun Klinker, “Laplacian Vision: Augmenting Motion
Prediction via Optical See-Through Head-Mounted Displays”, in SIGGRAPH E-Tech, 2016.
【12】
Keywords: Head-Mounted Display
新規性・差分
概要
HMDによる視覚のアシストを行う研究である.ここでは,
運動を推定することにより物体の挙動を予測してARによ
り動線を描画する.取り扱う範囲としては単純な物理学で
説明される運動である.
・単純な物理学を題材としてHMDによる視覚のアシスト
を行った
・3次元の運動予測を行うことで,HMDにおいても自然な
可視化を実現した
Links
論文 http://campar.in.tum.de/pub/itoh2016ah/itoh2016ah.pdf
プロジェクト
YouTube https://www.youtube.com/watch?v=2GD7KQOHiMs
Takashi Miyaki, Jun Rekimoto, “LiDARMAN: Reprogramming Reality with Egocentric Laser Depth
Scanning”, in SIGGRAPH E-Tech, 2016.
【13】
Keywords: LiDARMAN, First Person Vision
新規性・差分
概要
LiDARMAN (LiDARを用いて3次元空間を再構成して
Oculusにより人間に見せる)により,現実世界を再認識す
るという研究である.LiDARは人間の3次元知覚能力より
も優れている(という話である)ため,その空間を見せる
ことで新たな教示があるかもしれない.
・知覚世界を3次元で置き換えることで新たな認識を想起
させる取り組み
・Reprogramming Realityという概念である
Links
論文 http://delivery.acm.org/10.1145/2930000/2929481/a15-
miyaki.pdf?ip=150.29.147.196&id=2929481&acc=OPENTOC&key=27692522F5DD
4C64%2E27692522F5DD4C64%2E4D4702B0C3E38B35%2E383ADA7593775D6
F&CFID=699409355&CFTOKEN=29514591&__acm__=1480673225_a917e2a18d
205f3ce37a899874b361ac
プロジェクト https://lab.rekimoto.org/projects/lidarman/
YouTube https://www.youtube.com/watch?v=CCmWGYIMleU
Mikhail Matrosov, Olga Volkova, Dzmitry Tsetserukou, “LightAir: a Novel System for Tangible
Communication with Quadcopters using Foot Gestures and Projected Image”, in SIGGRAPH E-Tech,
2016.
【14】
Keywords: Human-Drone Interaction
新規性・差分
概要
クアッドコプターを題材として,Human-Drone Interaction
を提唱した.FootGestureやDronePiano, 3Dポイントクラ
ウドを活用したDroneBallなどがアプリケーションとして
構成されている.
・著者らは特に,世界初の”Human-Drone Bilateral
Tangible Interaction”であると主張
Links
論文 http://delivery.acm.org/10.1145/2940000/2932429/a16-
matrosov.pdf?ip=150.29.147.196&id=2932429&acc=OPENTO
C&key=27692522F5DD4C64%2E27692522F5DD4C64%2E4
D4702B0C3E38B35%2E383ADA7593775D6F&CFID=699409
355&CFTOKEN=29514591&__acm__=1480674841_b75eddb
18c8f66b721daf56173bc055a
プロジェクト
YouTube https://www.youtube.com/watch?v=D9UcGUnWTSg
【15】Takashi Miyazaki, Nobuyuki Shimizu, “Cross-Lingual Image Caption Generation”, in ACL, 2016.
Keywords: 自然言語処理, Image caption generation
概要
・人工知能問題としてimage caption generationの自動化が挙
げられる.image caption generationに関する研究は一般的に
英語が言語として用いられるため他の言語では乏しい.そこ
で,日本語のデータセットを用いて日本語でキャプチャ生成
しキャプションデータセットおよび生成モデルを開発する.
結論
・Yahoo!クラウドソーシングサービスを利用して26,500枚の
画像に対して131,740字のキャプションを収集し、日本語の
画像キャプションデータセットを作成した.Monolingual
learning ,Alternate learning ,Transfer learning の3つの学習
方法で比較されTransfer learning の精度が高かった.
Links
論文 https://www.aclweb.org/anthology/P/P16/P16-1168.pdf
プロジェクト http://research-lab.yahoo.co.jp/ml/20160807_takmiyaz.html
Theodoros Tsiligkaridis, Keith W. Forsythe, “Adaptive Low-Complexity Sequential Inference for Dirichlet
Process Mixture Models”, in NIPS2015, 2015.
【16】
Keywords: Adaptive SUGS(ASUGS), DPMMDirichlet process mixture models (DPMM)
新規性・差分
概要
・クラスタの数が先験的に未知数である場合において,オ
ンラインクラスタリングとパラメータ推定のためのガウス
分布のDirichlet process mixturesを行うための逐次性低複
雑推論手法を開発する.
本論文で濃度パラメータのための新規な低複雑度のデータ
駆動適応設計を提案し,それがクラスの数に対する対数増
殖率を導くことを示した.合成データセットと実データセ
ットの実験を通じて,私たちの方法がより良い性能を達成
し、他の最先端のオンライン学習DPMMメソッドと同じく
らい速いことを示した.
・大規模サンプル漸近論によって動機付けられたαを
適応させるための適応非ベイズ法を提案し,そのアル
ゴリズムをASUGS(Adaptive SUGS)と呼ぶ.
ASUGSの基本的な考え方はSUGSの貪欲なアプロー
チに直接関係してるが,新しいデータが到着したとき
に集中的に濃度パラメータを選択するための低複雑で
安定した方法であり、クラスタリングのパフォーマン
スが大幅に向上する.
Links
論文 http://papers.nips.cc/paper/6035-adaptive-low-complexity-sequential-inference-for-
dirichlet-process-mixture-models.pdf
著者
https://scholar.google.com/citations?user=hVUVOTIAAAAJ&hl=en
(a)合成データセットに対するSVA、SVA-
PM、ASUGS、およびASUGS-PMのクラスタ
リングパフォーマンス
ASUGS-PMは16個のクラスタを正しく識別す
る。
(b)合成データに対する合同対数尤度、反復の
関数
としてのクラス数の平均および分散
ASUGS-PMは最も高い対数尤度を達成し,クラ
ス数に最も近い漸近的分散を有する.
ASUGSPMとSVA-PMを用いて得られたクラス
タの平均画像とテストセットに対する予測対数
尤度
Huitong Qiu, Fang Han, Han Liu, Brian Caffo, “Robust Portfolio Optimization”, in NIPS2015, 2015.
【17】
Keywords: portfolio optimization, Orthogonalized Gnanadesikan-Kettenring (OGK), Tyler's M-estimator
新規性・差分
概要
・分位統計に基づく堅牢なポートフォリオ最適化手法を提案する.提案
手法は資産収益の極端な事象に対して堅牢であり,限られた履歴データ
下で大きなポートフォリオに対応する.高次元での堅牢性を達成し,シリ
アル依存を可能にすることによって既存のものを拡張できた.
・Gnanadesikan-Kettenring(OGK)は高次元で計算上扱いやすいもので
あるが,固定次元が固定されている場合のみ一貫性が保証される.縮小
されたTylorのM-推定量は、大きな行列を反復的に反転することを含む.
また,その整合性は次元がサンプルサイズと同じオーダーにある場合に
のみ保証される.ロバスト推定器は独立したデータ点の下で分析される.
そのため時系列データの下でのそれらの性能は疑わしい本稿では分位値
ベースの散布行列推定器を構築し,堅牢なポートフォリオ最適化手法を
提案する.
Links
論文 http://papers.nips.cc/paper/5714-robust-portfolio-
optimization.pdf
著者
https://www.linkedin.com/in/huitong-qiu-89843440
S&P 500インデックスデータを使用した4つの競合するアプローチの下で
年率換算されたシャープレシオ,リターン,およびリスク
ポートフォリオリスク,選択された株式数,
オラクル最適ポートフォリオに対する合致
率
Qinqing Zheng, John Lafferty, “A Convergent Gradient Descent Algorithm for Rank Minimization and
Semidefinite Programming from Random Linear Measurements”, in NIPS2015, 2015.
【18】
Keywords: gradient descent algorithm, singular value projection(SVP), nuclear norm relaxation
新規性・差分
概要
・本論文では単純で拡張性があり,かつ高速な勾配降下アル
ゴリズムを提案し,ランクの不一致問題と密接に関連する準
正則プログラムに対して最適化する.ランクrと条件数ρの正
の半正定値のn>n行列のランダム測定において,本手法は大
域的最適値に線形収束することが保証される.
・慎重に構成された初期化とステップサイズを使用してワ
イヤーフローによる位相検索とf(Z)を最適化するための勾
配降下アルゴリズムを開発する.提案手法ではO制約を用
いて勾配降下スキームが制約を満たす最小ランクを高い確
率で正確に回復できる.また,線形に収束し,計算コスト
が低く抑えられる.
Links
論文
http://papers.nips.cc/paper/5830-a-convergent-gradient-
descent-algorithm-for-rank-minimization-and-semidefinite-
programming-from-random-linear-measurements.pdf
著者
https://www.cs.uchicago.edu/directory/qinqing-zheng
(a)より密集したケースにおいて,我々の手法は核ノルムアプローチよりも
速く,SVPよりもわずかに優れている.
(b)よりまばらなケースでは、他のアプローチよりもはるかに高速である.
(c)より提案手法のサンプル複雑さもSVPと核ノルムアプローチと同じよ
うにスケーリングすべきであることを示唆している.
Modeling of lung morphogenesis using fractal
geometriesin ECS 1988
T.R. NELSON and D.K. MANCHESTER
概要
フラクタル次元を用いた肺と気管支画像の構築手法の提案.肺の
複雑さをフラクタル次元で表現し,気管支の長さの合計と平均が
相似図形を構成するために必要な部分集合の数と縮尺率に依存し
ていることが示されている.式に条件を与えることで,胎児横隔
膜ヘルニアの肺も表現することができた.
新規性
肺のような複雑な画像も単純な数式のみで表現でき
る.
さらに,左右対称でない肺であっても,式の与え方
次第で表現できる.
LINK
http://ieeexplore.ieee.org/document/14515/?arnumb
er=14515
【19】
Fractal Brownian Motions, Fractional Noises and
Applicationsin SIAM 1968
Benoit B. Mandelbrot and Joohn W. Van
Ness
新規性
複雑なブラウン運動の定式化
非整数次元ブラウン運動は自然界の時
系列データのモデリングに役立つ
LINK
http://epubs.siam.org/doi/abs/10.1137/101009
3
【20】
A Learning Approach with Under- and Over-sampling for Imbalanced
Data Sets in IIAI 2016
Chun-Wu Yeh, Der-Chiang Li, Liang-Sian Lin and Joohn Tung-I Tsai
概要
高精度に物体を識別するために,不均等なデータセットを是
正する.
大量に用意できているクラスのデータを減少させ,
少量しか用意できなかったクラスのデータを増加することで,
偏りを是正する.データの減少は,box-and-whisker plot法で
行われ,データの増加は,合成したサンプルを加えることで
行われる.
新規性
偏りのあるデータセットを物体認識に適したデー
タセットへ修正することが可能
LINK
http://ieeexplore.ieee.org/abstract/document/7557706/
実験とその結果
少数クラスの割合:r
トレーニングデータの数:N
PM:proposed method
NDO:normal distribution-based over-sampling
ACC(Accuracy)
G-MEAN(Geometric mean)
Fl(F-measure)
Result
Test dataset
【21】
RIDE: Reversal Invariant Descriptor
Enhancementin ICCV2015
Xie, L., Wang, J., Lin, W., Zhang, B. and Tian, Q
概要
SIFTに代表されるハンドクラフト記述子は,画像が左右反転して
いる場合,別の画像と判断してしまうことがある.
そこで,RIDE(Reversal Invariant De-scriptor Enhancement)と名付
けた画像の反転に影響されにくい特徴記述子を提案する.
新規性
反転の影響を受けない特徴記述子
LINK
http://research.microsoft.com/en-
us/um/people/jingdw/pubs%5CICCV15-
手法
SIFTと反転させたSIFTを組み合わせた特
徴記述子を提案した.
P-37:Oxford Pet-37 dataset (37 cat/dog breeds, 7349 images)
A-100:Aircraft-100 dataset (100 aircraft models, 100 images for each model)
F-102: Oxford Flower-102 dataset (8189 flower images from 102 categories)
B-200: Caltech-UCSD Bird-200-2011 dataset (11788 bird images over 200 different species)
[1]:A. Angelova and S. Zhu. Efficient Object Detection and Segmentation for Fine-Grained Recognition. CVPR,
2013.
[15]:X. Guo and X. Cao. FIND: A Neat Flip Invariant Descriptor. ICPR, 2010
[22]:R. Ma, J. Chen, and Z. Su. MI-SIFT: Mirror and Inversion Invariant Generalization for SIFT Descriptor. CIVR,
2010.
[23]:S. Maji, E. Rahtu, J. Kannala, M. Blaschko, and A. Vedaldi. Fine-Grained Visual Classification of Aircraft.
Technical Report, 2013.
[25]:N. Murray and F. Perronnin. Generalized Max Pooling. CVPR, 2014.
[28]:M. Paulin, J. Revaud, Z. Harchaoui, F. Perronnin, and C. Schmid. Transformation Pursuit for Image
Classification. CVPR, 2014.
[30]:J. Pu, Y. Jiang, J. Wang, and X. Xue. Which Looks Like Which:
Exploring Inter-class Relationships in Fine-Grained Visual Categorization. ECCV, 2014.
[41]:Z. Wang, J. Feng, and S. Yan. Collaborative Linear Coding for
Robust Image Classification. IJCV, 2014.
[46]:L. Xie, Q. Tian, and B. Zhang. Max-SIFT: Flipping Invariant Descriptors for Web Logo Search. ICIP, 2014.
[55]:W. Zhao and C. Ngo. Flip-Invariant SIFT for Copy and Object
Detection. IEEE TIP, 2013.
結果
【22】
Daisuke Ochi, Akio Kameda, Kosuke Takahashi, Motohiro Makiguchi, Kouta Takeuchi, “VR
Technologies for Rich Sports Experience”, in SIGGRAPH E-Tech, 2016.
【23】
Keywords: VR, Sports
新規性・差分
概要
VRを用いた,より実際のスポーツ体験に近づけようとす
る試みである.右図のようにHMDやスマートフォン,鏡
を用いて構成されている.全方向カメラ (omnidirectional
camera)を用いて撮影された映像をVR空間に投影する.
・スポーツ空間をよりリアルに見せるべく,VRによるス
ポーツ表現方法を構成した
・スマートフォンにて3次元空間をより現実的に見せる
Kirari! for Mobile! (KfM)のシステムを提案した.
Links
論文 http://delivery.acm.org/10.1145/2950000/2949030/a21-
ochi.pdf?ip=218.41.245.155&id=2949030&acc=OPENTOC&key=4D4702B0C3E38B35%2E4D4702
B0C3E38B35%2E4D4702B0C3E38B35%2E383ADA7593775D6F&CFID=871467668&CFTOKEN=
81958465&__acm__=1480768293_f65e846e49d013fb0f2c4133e98f4ebb
YouTube https://www.youtube.com/watch?v=6DioO_NAMAc
Mose Sakashita, Keisuke Kawahara, Amy Koike, Kenta Suzuki, Ippei Suzuki, Yoichi Ochiai, “Yadori:
Mask-Type User Interface for Manipulation of Puppets”, in SIGGRAPH E-Tech, 2016.
【24】
Keywords: Mask-type Interface, Kinect
新規性・差分
概要
「能」の人形劇を題材として,マスク装着型でパペットを
遠隔操作できるようなインターフェイスを開発した.
KinectやHMDを統合したセンシングシステムをパペットに
同期することで自然な一体感を実現する.
・従来は人が直接操っていた能の人形も,デジタルな世界
では遠隔で操作できる.さらに,自分の表情や動作を伝達
することが可能になることが期待される.
Links
論文 http://delivery.acm.org/10.1145/2930000/2929478/a23-
sakashita.pdf?ip=218.41.245.155&id=2929478&acc=OPENTOC&key=4D4702B0C3E38B35%2
E4D4702B0C3E38B35%2E4D4702B0C3E38B35%2E383ADA7593775D6F&CFID=871467668&
CFTOKEN=81958465&__acm__=1480768243_d92c6cf3ade75e4d0f91b395d34fb786
プロジェクト
Shenlong Wang, Min Bai, Gellert Mattyus, Hang Chu, Wenjie Luo, Bin Yang, Juntin Liang, Joel Cheverie,
Sanja Fidler, Raquel Urtasun, “TorontoCity: Seeing the World with a Million Eyes”, in arXiv pre-print
1612.00423, 2016.
【25】
Keywords: 3D Database, TorontoCity Benchmark
新規性・差分
概要
広範に渡るトロント市を3次元で復元したというベンチマークの提案.
712.5km^2,8439kmの道路,400,000の建物を復元した.航空機,ドロー
ン,自動車という異なる視点から撮影されたデータにより再構成を行った
(右図).3次元の地図を生成することが最終目標ではあるが,ベンチマー
ク中には複数のタスク --Building Footprint and Road Segmentation, Building
Hight Estimation, Instance Segmentation, Building Structured Contours,
Road Centerline, Curb Extraction, Semantic Segmentationなど-- を提供する.
2009~2011は10cm/pixel,2012~2013は5~8cm/pixelにてデータをサンプリ
ングした.
・従来のデータセットは少量のセンサーにより撮影(カメラ,LiDAR等)さ
れているが,本論文のデータは多量のセンサにより撮影された.また,広
範に渡る3Dデータを含んでいるとは言えない.
・OpenStreetMapやGoogle Mapと比較するとさらに高精度かつよりリッチ
な3次元データを含んでいると言える.
・セマンティックセグメンテーションの手法において,FCNやResNet-56を
用いて各種タスクの評価を行った.詳細な結果は次ページの表に示すとお
りである.
・今後もさらに,Tree Detection, Road Sign Detection, Building
Reconstructionなどタスクをさらに追加する予定である.
Links
論文 https://arxiv.org/pdf/1612.00423.pdf
著者 http://www.cs.toronto.edu/~slwang/
<= TorontoCity Benchmarkと他のデータの比較
や統計情報.KITTIやRobotCarデータと比較し
てもAerial CoverageやGround Coverageの面で
オーダが2桁増えている.
Debidatta Dwibedi, Tomasz Malisiewicz, Vijay Badrinarayanan, Andrew Rabinovich, “Deep Cuboid
Detection: Beyond 2D Bounding Boxes”, in arXiv pre-print 1611.10010, 2016.
【26】
Keywords: 3D Cuboid Detection
新規性・差分
概要
平面的な検出ではなく,2次元画像から3次元的に立方体を
検出 (3D Cuboid Detection)する研究を行う.右図のように
詳細な立方体の角を検出する.右下図にはVGGNet-
Faster-R-CNNをベースにしたモデルを示す.RPNで通常
通り2Dの候補領域を抽出するが,後段のネットワークで
は3Dのボックスを返却する.
・2Dではなく,3Dで立方体を検出するアルゴリズムを提
案した.
・VGG Faster R-CNNモデルをベースにして,2次元の候
補領域,3次元の立方体検出器を生成した.
Links
論文 https://arxiv.org/pdf/1611.10010.pdf
プロジェクト
Yao Li, Guosheng Lin, Bohan Zhuang, Lingqiao Liu, Chunhua Shen, Anton van den Hengel, “Sequential
Person Recognition in Photo Albums with a Recurrent Network”, in arXiv pre-print 1611.09967, 2016.
【27】
Keywords: Photo Album, Person Recognition
新規性・差分
概要
長期に渡る写真アルバムを入力することで人物間のつなが
りを推定してくれる推定器を構築してくれる.ひとつの写
真に写っているような空間方向や,写真間に現れる時間軸
方向の解析もLSTMの中で推定を行ってくれる.フォトア
ルバムにおける人物認識を行うPeople In Photo Albums
(PIPA) datasetにてstate-of-the-artな性能.
・CNN-LSTMを用いたフォトアルバムにおける人物認識に
おいて最高精度を達成した
・右下表がPIPA datasetにおける性能.オリジナル,
Album, Time, Dayにおいて精度評価.
Links
論文 https://arxiv.org/pdf/1611.09967.pdf
プロジェクト
Carlos Arteta, Victor Lempitsky, Andrew Zisserman, “Counting in the Wild”, in ECCV, 2016.【28】
Keywords: Counting, Crowd Analysis
新規性・差分
概要
クラウドソーシングにより位置づけされたペンギンのカウントを行う.
40箇所,1時間に一回記録,数年にわたりペンギンの数の変動を記録す
る大規模プロジェクトの一環で行われた.マルチタスクのVGGNetの学
習により,弱教師付き学習でもペンギンのカウンティングができるよ
うになった.マルチタスクではセグメンテーションs(p),密度マップ
λ(p),不確実性マップ u(p)と3つの関数を同時に最適化することから
VGGNetを学習する(右図).
・評価はMean Counting Error (MCE)を用いた.正解値と
コンピュータによる推定値の誤差により評価された.
・密度マップのみでなく,セグメンテーションがあった方
が推定地の精度がよくなることがわかった.
Links
論文 https://www.robots.ox.ac.uk/~vgg/publications/2016/Arteta16/arteta16.pdf
プロジェクト http://www.robots.ox.ac.uk/~vgg/publications/2016/Arteta16/
データセット http://www.robots.ox.ac.uk/~vgg/research/penguins/
ポスター http://www.eccv2016.org/files/posters/P-3B-19.pdf
Ziming Zhang, Venkatesh Saligrama, “Zero-Shot Recognition via Structured Prediction”, in ECCV, 2016.【29】
Keywords: Zero-Shot Learning, Zero-Shot Recognition
新規性・差分
概要
従来のZero-Short Learning & Recognitionでは学習したsourceやtarget
ドメインを元に,unseenな潜在空間を推定することであるが,
Projection Domain Shiftという,推定対象クラスのマッピングが中央で
はない問題が生じ,誤認識を引き起こしていた.これを,(1) ラベルな
しのデータに対してクラスタの中心を推定,(2) 推定したクラスタ中心
にてtargetドメインの割り当てを更新,(1)(2)をくりかえすことでクラ
スタとそのインスタンスの割り当てをよくする.
・従来のTargetドメインやインスタンスの割り当てを改善
し,Zero-Shot Learningにおける精度を改善した
・右下の表では各データセットのAveraveがもっとも高い
性能を達成した
Links
論文
https://www.researchgate.net/profile/Venkatesh_Saligrama/publication/308189175_Z
ero-
Shot_Recognition_via_Structured_Prediction/links/580794ee08ae63c48fec6df3.pdf?
origin=publication_list
ポスター http://www.eccv2016.org/files/posters/P-3B-22.pdf
Mohammad Moghimi, Mohammad Saberian, Jian Yang, Li-Jia Li, Nuno Vasconcelos, Serge Belongie,
“Boosted Convolutional Neural Networks”, in BMVC, 2016.
【30】
Keywords: BoosteCNN, Convulutional Neural Networks
新規性・差分
概要
・今までのBoostCNNのメリットとNetworkを組み合わせ
た新規のBoostingアルゴリズムの提案
・深層学習のアーキテクチャにBoostingを行うための重み
を追加するためのアルゴリズムを提案
・具体的に,Boostingのiterate時に,Boostingの重みを近
似するようなネットワークを組む
・また様々なネットワークに対応可
・さらに追加したネットワークを最適化し,手間を省くこ
とが可能
Links
論文
http://www.bmva.org/bmvc/2016/papers/paper024/paper024.p
df
プロジェクト
上式は,提案したアルゴリズムである.
g(x)はネットワーク,w(x)はBoosting重み、Mはクラス数,
Dはトレーニングセットを示す.
Yancheng Bai, Wenjing Ma, Yucheng Li, Liangliang Cao, Wen Guo, Luwei Yang, “Multi-Scale Fully
Convolutional Network for Fast Face Detection”, in BMVC, 2016.
【31】
Keywords: Fully Convolutional Network, FCN,
新規性・差分
概要
・高速顔検出に向けたfully convolutional networkの新規ア
ーキテクチャの提案
・異なるスケールの顔モデルをend to endで同時に学習可
能
・様々なスケールのモデルが同じ畳込み特徴マップを共有
可能
・VGAの画像に対し,GPA上で約100[fps]で処理が可能
・FDDB,AFW,Pascal faces datasetでState of the art な
識別率
Links
論文
http://www.bmva.org/bmvc/2016/papers/paper051/paper051.p
df
プロジェクト
Suman Saha, Gurkirt Singh, Michael Sapienza, Philip H. S. Torr, Fabio Cuzzolin, “Deep Learning for
Detecting Multiple Space-Time Action Tubes in Videos”, in BMVC, 2016.
【32】
Keywords: Detecting Action, Multiple space-time action, action localization
新規性・差分
概要
・時間的にトリミングされていない動画内の人物の時間
的・空間的な位置の特定と複数の同時行動の分類を行うア
プローチの提案
・UCF101, J-HMDB- 21, LIRIS-HARL datasetsで精度の向
上と検出速度の向上を確認
本フレームワーク3つの段階で構成される.
・外観および動作検出ネットワークにより,カラー画像と
オプティカルフローから行動をローカライズする.
・外観ネットワーク検出はカラー画像とオプティカルフロ
ーを動作検出スコアと組み合わせることでBoostingする
・単体の行動例に近いシーケンスであるアクションチュー
ブは,動的プログラミングによって2つのエネルギーを最
大化することで構築される.
Links
論文
http://www.bmva.org/bmvc/2016/papers/paper058/paper058.p
df
プロジェクト
Won-Dong Jang, Chang-Su Kim, “Semi-Supervised Video Object Segmentation Using Multiple Random
Walkers”, in BMVC, 2016.
【33】
Keywords: Video Object Segmentation, semi-supervised, Multiple Random Walkers
新規性・差分
概要
・半教師あり学習による動画中の物体セグメンテーション
アルゴリズムの提案.
・第1フレームでセグメンテーションしたい物体を指定す
ることで,その後の動画内の物体をセグメーテーションす
る.
・前フレームのセグメンテーションに基づいて前景と背景
の初期分布を推定する.
・その2つの初期分布に基づいてmultiple random
walkers(MRW)をシミュレートする(右式).
・SegTrack v2 datasetでパフォーマンスの向上を確認.
Links
論文
プロジェクト
pfは前景,pbは背景エージェントの動きを示す.
rfとrbは再起分布,Acは繊維行列を示す.
Pierre Rolin, Marie-Odile Berger, Frédéric Sur, “Enhancing pose estimation through efficient patch
synthesis”, in BMVC, 2016.
【34】
Keywords: pose estimation, patch, RANSAC,
新規性・差分
概要
・平面部分のシーン画像から仮想視点を配置するアプロー
チの提案.
・実験では,より正確に推定を行い,処理時間の短縮が確
認された.
・シーンの半局所的な平面のパッチを合成,可視性制約を
使用し,この合成パッチからシーンモデルを充実させる中
間的アプローチを導入
・.
Links
論文
http://www.bmva.org/bmvc/2016/papers/paper105/paper105.p
df
プロジェクト
Fig.1はセグメントパッチに対する仮想視点の位置決めの方法を示
す.
Fig.2はパッチ合成による姿勢推定結果の改善例を示す.
Peng Wang, Lingqiao Liu, Chunhua Shen, Zi Huang, Anton van den Hengel, Heng Tao Shen, “What’s
Wrong with that Object? Identifying Images of Unusual Objects by Modelling the Detection Score
Distribution”, CVPR, 2016.
【35】
Keywords: Gaussian Processes (GP), Global SVM, Multi-Instance Learning(MIL)
新規性・差分
概要
・本論文では, 画像から物体を識別するとき, 画像内の物体
が不規則になることに余ってご認識しがちである.この問
題に対処するために通常の物体と不規則な状態の物体を学
習した検出器を用いて, 複数の画像領域での検出スコアの
分布を調べる.私たちが提案したアプローチは大きなデー
タセットに匹敵する方法よりも性能が優れているこ都を示
す.
・
Links
論文 http://www.cv-
foundation.org/openaccess/content_cvpr_2016/papers/Wan
g_Whats_Wrong_With_CVPR_2016_paper.pdf
・従来のアプローチは「通常のオブジェクトの画像, 異例
のオブジェクトの画像」と「他のオブジェクトの画像」の
スコア値の両方の観点および空間分布に異なるレベルのス
コアを示すことある.その為, 同時に単一の場所での検出
スコアと複数の領域間のスコアの依存関係をモデル化する
ために新たな共分散関数を作成する.
Hyun-Koo Kim, Young-Nam Shin, Sa-gong Kuk, Ju H. Park, and Ho-Youl Jung, “Night-Time Traffic Light
Detection Based On SVM with Geometric Moment Features”, WASET, 2011.
【36】
Keywords: Night-time traffic light detection, multi-class classification, driving assistance system.
新規性・差分
概要
・本論文では, 本稿では、夜間における交通信号の検出方
法について述べる.RGBカラー画像から信号光の候補領域
を抽出し, Rutaによって提案された色変換を使用して色領
域で表現し、次に赤と緑の色の優勢領域を候補として選択
し, SVMに 基づくマルチクラス分類器が候補に適用する.
本論文では, BF, BMF, GMFを用いた.提案手法を行った
結果, 平均15ms /フレームの演算時間で検出率の93%に達
した.
・
Links
論文
http://waset.org/publications/8944/night-time-traffic-light-
detection-based-on-svm-with-geometric-moment-features
・昼間に信号の暗い領域や照明ランプの領域などの色や特
徴に基づいて, 信号を検出する.昼間の交通光の検出と認
識に焦点を当てた研究が殆どである.
.しかし, 夜間での信号認識はあまり行われていない.カ
メラでデータセットを取り, RGB画像から, 信号校の情報
を抽出し, ノイズを削除し, SVMで多クラス分類を行い, 信
号機の発行を識別する.本論文では, BF, BMF, GMFを用
いる.
Xianbin Cao, Changxia Wu, Pingkun Yan, Xuelong Li, “DAVE: A Unified Framework for Fast Vehicle
Detection and Annotation”, arXiv:1607.04564v3, 2016.
【37
】
Keywords: Vehicle Detection, Attributes Annotation, Latent Knowledge Guidance, Joint Learning, Deep Networks
新規性・差分
概要
・複雑な背景, 物体などがあるビデオデータから車両認識を行うのは困
難である.本論文では, 車検出と属性注釈を効果的に組み合わせた
DAVE(Detection and Annotation for Vehicles)の高速フレームワーク
を紹介する.従来研究より, 提案手法の方が識別制度, 識別速度が高かっ
た.
・
Links
論文
https://arxiv.org/pdf/1607.04564v3.pdf
・モーションベースのアプローチではフレーム減算, 適応的バックグラウ
ンドモデリング, オプティカルフローを使用する.しかし, 視覚情報が利
用されにくいため車両以外の移動物体が誤って検出される.提案手法で
は, 車両検出と、姿勢、色、種類の注釈を1つのフレームワークに統一す
るDAVEを用いる.DAVEは, 車のような物体抽出のための高速車両提案
ネットワーク(FVPN)と, 各提案を検証し, 各車両の姿勢, 色およびタイ
プを同時に推定することを目的とする属性学習ネットワーク(ALN)の2
つの畳み込みニューラルネットワークからなる..
Xianbin Cao, Changxia Wu, Pingkun Yan, Xuelong Li, “LINEAR SVM CLASSIFICATION USING
BOOSTING HOG FEATURES FOR VEHICLEDETECTION IN LOW-ALTITUDE AIRBORNE VIDEOS”,
IEEE, 2011.
【38】
Keywords: Vehicle detection, boosting HOG feature, linear SVM, urban environment
新規性・差分
概要
・移動車両の検出は照度のばらつきおよびシーンの複雑さのために非常
に困難な作業である.照度の変化に敏感ではなく, オブジェクトの形状
と外観を特徴付ける上で優れた性能を示すHOG特徴を用いて, また, 教
師あり学習を実行するための機械学習メタアルゴリズムの一種であるブ
ースティングを用いて移動車両を識別する.従来手法と比較して, 提案
手法はより高い検出率、より低い誤検出率およびより速い検出速度にお
いてより良い性能を達成した。
・
Links
論文
http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=6116132
・従来では, 移動車や静的車を検出するための車の影を含むいくつかの外
観特徴を組み合わせて, 車を識別する.また, 基準フレームで予測された
車両の位置、向き、スケール情報を使用して車両認識を行ったが, 照度の
ばらつきおよびシーンの複雑さのために非常に困難である.そのため, オ
ブジェクトの形状と外観を特徴付ける上で優れた性能を示すHOG特徴を
用いる. 教師あり学習を実行するための機械学習メタアルゴリズムの一
種であるブースティングを用いる.これらを用いて, 車両分類のための
線形SVM分類器を訓練するために最終的な特徴ベクトルを確立するため
に組み合わされる.
Liliang Zhang, Liang Lin, Xiaodan Liang, Kaiming He “Is Faster R-CNN Doing Well for
PedestrianDetection”,ECCV, 2016.
【39】
Keywords: Faster R-CNN, Pedestrian detection
新規性・差分
手法
結果
概要
・Faster R-CNNを歩行者検出用にチューニング
・歩行者検出用のベンチマーク(caltech, inria, eth, kitti)で
State-of-the-artを達成
・
Links
論文 https://arxiv.org/abs/1607.07032
・Faster R-CNNのRPNを用いて歩行者検出(anchorは単一
のアスペクト比で9種のスケール)
・Boosted Forestをカスケードすることでhard negativeに
も強い識別器
・解像度の低い人物を検出できるようhole algorithmを適
用
Rupesh Kumar Srivastava, et al. "Higway Networks”, in arxiv:1505.00387, 2015.
【40】
Keywords:Highway Networks
新規性・差分
手法
結果
概要
・CNNにtransform gateとcarry gateを持たせることで100
層を超えるモデルの学習に成功
・100層のネットワークでもロスが減少し精度を出すこと
ができた
・tansform gateとcarry gateの二つのゲートをCNNに持たせることで伝播の
度合いを調整する
Links
論文 https://arxiv.org/abs/1505.00387
・入力に対し2分岐構造をもち、一方は畳み込みH(x,W)、一方は恒等写像xで
各出力に対しTransform gate T(x,W)とCarry gate C(x, W)で出力の値を調整
Francois Chollet, “Deep Learning with Separable Convolutions”, in arxiv:1610.02357, 2016.
【41】
Keywords:Inception, Xception
新規性・差分
手法
結果
概要
・Inceptionの改良としてXceptionの提案
・Inception v3を上回る精度を達成
・通常のCNNでは入力チャネル数×出力チャネル数のフィルタが必要となる
が、Xceptionでは入力のチャネルを分割して各チャネルに対し畳み込み最終
的な出力をConcatする
Links
論文 https://arxiv.org/abs/1610.02357v1
Alex Graves et al., “Hybrid computing using a neural network with dynamic external memory”, in nature,
2016.
【42】
Keywords:google, DNC, LSTM
新規性・差分
手法
結果
概要
・Differential Neural Computers(DNC)の提案
・bAbIや経路探索問題などにおいてLSTMを大幅に上回る
精度を達成
・LSTMでは細かなメモリのやり取りが不可能だったが、メモリ行列とwrite
headとread headと呼ばれる書き込みと読み込みを制御する構造を導入する
ことで、必要なメモリの書き込みと読み取りを可能にした。
(数式等はスペースの都合上割愛)
Links
論文
http://www.nature.com/nature/journal/v538/n7626/pdf/nature20101.pdf
・bAbIにおいて、Mean Error Rate 3.8%、2 typeの質問に
答えられなかった(LSTMはMean Error Rate 7.5%、6type
に答えられなかった)
・経路探索においてLSTMでは平均達成率37%に対しDNC
では平均達成率98.8%を達成。さらに学習回数はLSTMの
半分(100万回)
Yoshua Bengio et al., “Curriculum Learning”, in ICML, 2009.
【43】
Keywords:machin learning, curriculum learning
新規性・差分
手法
結果
概要
・Curriculum Leaningの提案
・一般的な学習方法よりも高精度な結果を得た
・モデルの学習を行う際、データの難しさを定義して学習初期段階では簡単
なデータで学習をし、徐々に難しいデータを与えて学習する。
Links
論文
http://ronan.collobert.com/pub/matos/2009_curriculum_icml.pdf
Florian Schroff, “FaceNet: A Unified Embedding for Face Recognition and Clustering”, in
arxiv:1503.03832, 015.
【44】
Keywords:face net, face recognition
新規性・差分
手法
結果
概要
・Triplet Lossを用いたEmbeddingの最適化により顔認識
に適した表現の学習
・顔認識においてState-of-the-artの達成
・対象となる人をanchorとし、それに対しpositiveとnegativeを定義す
る.anchorを基準としたpositiveとnegativeとの距離を学習することでpositive
がanchorの近くに、neativeがanchorの遠くになるようなEmbeddingの学習
Links
論文 https://arxiv.org/abs/1503.03832
Shuochen Su, et al., “Deep Video Deblurring”, in arxiv:1611.08387, 2016.
【45】
Keywords:Deblurring
新規性・差分
手法
結果
概要
・up-convolutionを用いたアーキテクチャでVideoベースの
ボケ除去を行う
・従来手法と比較してPSNR/MSSIMの指標で最も良い結果
・segmentationで用いられるup-convolutionを用いたDeBlurNet(DBN)でボケ
除去を実現
・入力に通常のRGBのみを用いたDBN+singleやOptical Flow画像を追加で入
力するDBN+FLOW、SURFとRANSACを用いたDBN+HOMOGなどの複数の
モデルで精度検証
Links
論文 https://arxiv.org/pdf/1611.08387.pdf
Alexander Kirillov, et al., “InstanceCut: from Edges to Instances with MultiCut”, in arxiv:1611.0272, 2016.
【46】
Keywords:sgmentation, instance
新規性・差分
手法
結果
概要
・semantic segmentationとedge detectionを組み合わせる
ことでinstanceレベルのsemantic segmentationを実現
・CityScapesにおいて従来手法の中で最も高精度
・Fully Convolutional Networksの複数の中間層からfeature mapを取り出して
それらを用いてedge検出を行い、superpixelにより情報の補間をすることで
edge検出を行う
・semantic segmentationは既存のモデルを用いた
Links
論文 https://128.84.21.199/abs/1611.08272
Li Wan, David Eigen, Rob Fergus “End-to-End Integration of a Convolutional Network, Deformable Parts
Model and Non-Maximum Suppression”, CVPR, 2015.
【47】
Keywords: Deformable Parts Model(DPM), CNN, NMS
新規性・差分
概要
・全体とパーツの形状およびパーツの位置ずれ・変形に対するコストで
評価するDeformable Parts Model(DPM)とCNNを用いた物体検出を
行う.
・
Links
論文
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Wan_End-to-
End_Integration_of_2015_CVPR_paper.pdf
・従来研究では, 画像サイズを変更し, 著しい歪みを与え,全体を各領域ご
とに再計算する必要がある.そのために計算量が多い.
・本手法では, CNNで画像ピラミッドからHOG特長を抽出し, 特長マップ
に変形可能な部品モデルに適用し, NMS制御から得られた応答マップに
適用し, 物体を検出する.トレーニングには, 全ての段階で損失関数を使
用する.
Jonathan Huang, Vivek Rathod, Chen Sun, Menglong Zhu, Anoop Korattikara, Alireza Fathi, Ian Fischer,
Zbigniew Wojna, Yang Song, Sergio Guadarrama, Kevin Murphy, “Speed/accuracy trade-offs for modern
convolutional object detectors”, in arXiv, 2016.
【48】
Keywords: Object Detection, Faster R-CNN, R-FCN, SSD
概要
・CNNによる物体検出の精度・速度のトレードオフを調査.
・メタアーキテクチャ(Faster R-CNN, R-FCN, SSD),特徴抽
出器(VGG, Inception, ResNet等),解像度,bounding box候補
数を変更し比較実験.
Links
論文 https://arxiv.org/pdf/1611.10012v1.pdf
新規性・差分
・Tensorflowでの統一された実装で,三種のメタアーキテク
チャの広範な比較実験を実施.
・Faster R-CNNで候補数を減らすと,大きな精度低下無し
に高速化が可能であることを示した(候補数50個で,候補数
300個の場合の96%の精度が得られる).
・SSDは特徴抽出器のclassification精度に影響を受けにくい
を示した.
Zhe Cao, Tomas Simon, Shih-En Wei, Yaser Sheikh, “Realtime Multi-Person 2D Pose Estimation using
Part Affinity Fields”, in CVPR submission, 2017.
【49】
Keywords: 2D Pose Estimation, Part Affinity Fields
新規性・差分
概要
2次元姿勢推定の問題に対して,高精度かつリアルタイム(10fps前後)にて
処理可能なフレームワークであるPart Affinity Fields (PAFs)を提案する.2
次元の人物領域をベクトル場(vector fields)として扱い,各部位やその位置
関係に関して最適化する.時系列方向への拡張により,部位推定の信頼度
向上や複数人物などが居た際に全体の整合性を向上する.
・MSCOCO 2016 keypoints challengeにてstate-of-the-art
な精度を実現した.また,MPII Multi-Person benchmarkに
おいてもトップの精度や処理時間を実現した.
Links
論文 https://arxiv.org/pdf/1611.08050.pdf
スライド http://posefs1.perception.cs.cmu.edu/Users/ZheCao/Multi-
person%20pose%20estimation-CMU.pdf
動画 http://posefs1.perception.cs.cmu.edu/Users/ZheCao/humanpose.mp4
Sanghoon Hong, Byungseok Roh, Kye-Hyeon Kim, Yeongjae Cheon, Minje Park, “PVANet: Lightweight
Deep Neural Networks for Real-time Object Detection”, in NIPS Workshop Efficient Methods for Deep
Neural Networks (EMDNN), 2016.
【50】
Keywords: Object Detection, Faster R-CNN
概要
・CReLU, Inception, HyperNet 等を組み合わせた,軽量・
高速な物体検出用CNNを提案.
・ResNet-101の10%以下の計算で,PASCAL VOC2007,
VOC2012 で順に84.9%, 84.2% mAPを達成.
Links
論文 https://arxiv.org/pdf/1611.08588v1.pdf
コード https://github.com/sanghoon/pva-faster-rcnn
新規性・差分
・現在使用されているネットワークは冗長性が高く,精度を
維持したまま軽量化が可能であることを示した.
Min Bai, Raquel Urtasun, “Deep Watershed Transform for Instance Segmentation”, in arXiv, 2016.
【51】
Keywords: Semantic Segmentation, Instance Level Semantic Segmentation
概要
・watershedアルゴリズムの考えをCNNと組み合わせた
Deep Watershed Tranformを提案し,Cityscapesの
Instance Level Segmentationでstate-of-the-artを75%向上.
Links
論文 https://arxiv.org/pdf/1611.08303v1.pdf
新規性・差分
・watershed transformのエネルギーをCNNで学習すること
で,Instance Segmentationを行った.
・シンプル,高速,高精度,end-to-endでの学習が容易,
RNNや反復的な方法を使用しないため任意の数のインスタ
ンスを扱いやすい,という利点がある.
Jingwei Huang, Huarong Chen, Bin Wang, Stephen Lin, “Automatic Thumbnail Generation Based on
Visual Representativeness and Foreground Recognizability”, in ICCV2015, 2015.
【52】
Keywords: various appearance features, content-based image retrieval (CBIR), object recognition
新規性・差分
概要
・本論文ではどの程度元写真を視覚的に表しているか,サ
ムネイル作成のトリミングと縮小を行った後に前景をどの
程度認識できるかの2つを考慮した自動サムネイル生成手
法を提案する.実験より,提案手法が画像に及ぼす効果と
関連する手法と比べて優れていることを示している.
・本手法では2つの考慮すべき要因をモデル化し,従来手
法よりも優れたサムネイルを生成する.1つ目の要因であ
るサムネイルの視覚的表現をモデル化する.外観フィーチ
ャで画像に対するサムネイルの視覚的表現をモデル化する
ことにより,効率的に画像検索が行える.2つ目の要因で
あるサムネイルにおける前景認識可能性をモデル化する.
トリミングやリスケーリング後は前景の被写体を認識が困
難となるため,サムネイルの有用性が失われる.そこで
content-based image retrieval (CBIR) と物体認識から得ら
れる共通の画像特徴を適応させる.これにより効果的 に
前景認識可能性をモデル化できる.
Links
論文
http://www.cv-
foundation.org/openaccess/content_iccv_2015/papers/Huang_
Automatic_Thumbnail_Generation_ICCV_2015_paper.pdf
著者
http://hjwdzh.github.io/peter/
提案手法による
画像サムネイ例
User studyの結果
提案手法において,サムネイルが元
の写真をどの程度視覚的に表してい
るか,どの程度簡単に前景を認識で
きるかのバランスを取ることを目指
している.
相互検証比較
提案手法は,オフセットとリスケーリング係
数の観点より,真理値に最も近い一致度とな
った.
4つの手法の中で投票を行った結果,
我々の手法が最も多くの票を集めた.
Lap-Fai Yu, Noah Duncan, Sai-Kit Yeung, “Fill and Transfer: A Simple Physics-based Approach for
Containability Reasoning”, in ICCV2015, 2015.
【53】
Keywords: Voxel Representation, Boltzmann Method (LBM)
新規性・差分
概要
・オブジェクトアフォーダンスの視覚的認識は強力なコン
ピュータビジョンとロボットアプリケーションを構築する
ために有効な材料として登場した.本論文では,液体を含
むアフォーダンスである液体収容性の推定について新しい
手法を提案する.我々のアプローチは,液体を注ぐ,移動
させるという2つの単純な物理的プロセスに基づいてコン
テナオブジェクトを分析する.
・コンテナの操作に関して,Brandlらはゆがめさせたパラメ
ータを使用して源物体から目標物体までの移送注ぎ動作を行
った.Kunzeらは物理的なシミュレーションを用いてオブジ
ェクトの操作を推論することを提案した.提案手法ではこれ
らの作業と比較し,アノテーションを必要とせず,一般的な
容器に対する注ぎ方向と移動方向の両方を自動的に推論する
ことに重点を置く.
Links
論文
http://www.cv-
foundation.org/openaccess/content_iccv_2015/papers/Yu_Fill_and_Tran
sfer_ICCV_2015_paper.pdf
著者
http://www.cs.umb.edu/~craigyu/
流体シミュレーション(LBM)との比
較
コンテナの識別精度
転送方向および優先順位について
ユーザーの選択と自動出力の比較
左:傾き軸推定における精度とリコール対角誤差許容値
右:ガウスノイズSDに対するコンテナの識別精度
Ching-Hui Chen, Hui Zhou, and Timo Ahonen, “Blur-aware Disparity Estimation from Defocus Stereo
Images”, in ICCV2015, 2015.
【54】
Keywords: relative blur versus disparity(RBD), stereo matching
新規性・差分
概要
・通常,デフォーカスぼかしはステレオ画像間の視覚的対
応を確立する際に性能低下を引き起こす.そこでステレオ
画像における焦点のミスマッチに対して頑強なぼけ認識視
差推定するためrelative blur versus disparity(RBD)モデルを
提案する.RBDモデルは焦点の不一致を補償するためにマ
ッチングコストと集計ウェイトを更新することにより,視
差推定を改善する.合成データセットと実データセットの
両方を使用した実験より,提案アルゴリズムの有効性が実
証された.
・パラメータまたは各方向から画像より形成した焦点スタッ
クを用いて較正している従来の手法とは対照的に,提案手法
では一対の焦点外れステレオ画像から視差を推定する一般的
な手段を扱う.フォーカス設定,アパーチャの直径を含むデ
フォーカスボケに影響 を与えるカメラパラメータは相対的
なボケを視差の関数として特徴付けるためにRBDモデルの係
数によって簡潔に表される.RBDモデ ルと統合させるため
にステレオマッチングを採用する.
Links
論文
http://www.cv-
foundation.org/openaccess/content_iccv_2015/papers/Chen_Blur-
Aware_Disparity_Estimation_ICCV_2015_paper.pdf
合成データで評価された左側
の画像の不良ピクセルの割合
アパーチャの非対称な直径を持つ
実世界での反復テクスチャの実験
反復時のRBDモデルの加重最小二乗フィッティン
グ
Dongqing Zou, Xiaowu Chen, Guangying Cao, Xiaogang Wang, “Video Matting via Sparse and Low-
Rank Representation”, in ICCV2015, 2015.
【55】
Keywords: Video Matting, Discriminative Dictionary Learning, Temporally matting
新規性・差分
概要
・以前のビデオマッティング手法では,アルファマットを推定
する前に局所的ではないものが導入され,一部のデータで印象
的な結果が得られた.しかし,一方で不十分なサンプルまたは
過剰なサンプルを探すことは良好なサンプルを欠く,ノイズが
出現する可能性がある.他方では,類似の特徴を有するピクセ
ルに対して一貫した非局所構造を構築することは困難であり,
空間的および時間的に不一致のビデオマットを生じる.そこで
本論文では空間的,時間的に一貫性のあるマッティング結果を
得るための新しいビデオマッティング方法を提案する.
・本論文では疎と低位の表現を用いた新しいビデオマッティン
グ手法を提案する.いくつかのキーフレームにいくつかの疎な
入力がある場合,最初に2つのサブディクショナリからなる辞
書を学習する.これらの2つのサブ辞書はそれぞれ既知の前景
領域および背景領域の内容をキーフレームに記述する.学習さ
れた辞書を用いて係数行列を得るために低ランクおよび疎の表
現を追求し,入力ビデオ内のすべてのピクセルを表現する.最
後にアルファ値の局所的な滑らかさを高めるために使用される
マルチフレームラプラシアンと組み合わせて各フレームのアル
ファマットを解決する.
Links
論文
http://www.cv-
foundation.org/openaccess/content_iccv_2015/papers/Zou_Video_Matting_v
5つのビデオに対する異なる方法のエラー率の比
較
我々の方法とKNNマッティングの定量的評価、クローズドフ
ォームマッティングと非ローカルスムース事前ガイド画像マ
ティング
Learning Query and Image Similarities with Ranking Canonical
Correlation Analysis in ICCV2015
Ting Yao, Tao Mei and Chong-Wah Ngo
概要
画像検索の際に問題となることは,クエリ(言
葉)と画像のランキング関数についてである.
様々なランキング関数が提案されているが,ほ
とんどの関数には制限がある.
そこで,それらの制限を低減する,クエリと画
像の類似性を学習する新しいランキング標準相
関関数(RCCA)を提案する.
新規性
クエリデータと画像データの共通部分空間を見
つけて,類似度を学習する.
また,クエリデータと画像データをクリック回
数によって結び付け,嗜好関係を学習する.
LINK
http://www.cv-foundation.org/openaccess/content_iccv_2015/papers/Yao_Learning_Query_and_ICCV_2015_paper.pdf
画像ベースの検索結果キーワードベースの検索結
果
【56】
The analysis of the influence of fractal structure of stimuli on
fractal dynamics in fixational eye movements and EEG signal
in Nature 2016
概要
複雑な視覚刺激がもたらす眼球固定運動の可
塑性を調査する.
その結果,視覚ダイナミクスのフラクタル時
間構造が視覚刺激のフラクタルダイナミクスに
移動することが分かった.
画像のフラクタル性と脳派信号,眼球固定運
動の間に関係があることを示した.
新規性
画像のフラクタル性(複雑さ)が視覚にもたらす
影響を調査した.
LINK
http://www.nature.com/articles/srep26639
Hamidreza Namazi, Vladimir V. Kulish and Amin Akrami
実験に用いたフラクタル画像
Dはフラクタル次元
視覚刺激の違いによる,眼球固定運動,脳波信号のフラクタル解析結果
【57】
Multifractal analysis of weighted networks
by a modified sandbox algorithm in Nature 2015
概要
複雑な加重ネットワークの解析手法として,
マルチフラクタル解析に対して,改良サンドボ
ックスアルゴリズムを提案する.
加重フラクタルネットワーク(WFN)の仲間で
ある,Sierpinski WFNおよび,Cantor dust
WFNのマルチフラクタル特性を調査した.
また,フラクタル次元と一般化フラクタル次
元がWFNのエッジの重みによって,どのように
変化するかを調査した.
新規性
加重ネットワークには,マルチフラクタル性
が含まれていることを解明し,エッジの重み
にも影響を受けていることを解明した.
LINK
http://www.nature.com/articles/srep17628#conclusions
Yu-Qin Song, Jin-Long Liu, Zu-Guo Yu
and Bao-Gen Li
【58】
The suppression of scale-free fMRI brain dynamics across
three different sources of effort: aging,
task novelty and task difficulty in Nature 2016
概要
BOLD fMRI信号のフラクタルスケーリングが,様々
な認知的努力のために,抑制されることを示した.ス
ケールフリー信号を定量化するハースト信号の減少は,
タスクの困難さ,新しさ,そして,老化の影響による.
これらの結果より,フラクタルスケーリングが様々
な認知的努力およびタスク関係の指標となることを示
した.
※認知的努力:思考のリソースを消費して,意識して認識すること
新規性
認知的努力およびタスク関係を表す新しい指標の提案
LINK
http://www.nature.com/articles/srep30895
Nathan W. Churchill, Robyn Spring, Cheryl Grady, Bernadine Cimprich, Mary K. Askren,
Patricia A. Reuter-Lorenz, Mi Sook Jung, Scott Peltier, Stephen C. Strother and Marc G.
Berman
上段の3つの図は,ハースト信号,SDBOLDおよびGconnの被験者間
で計算された平均脳地図.
中段の2つの散発図は,run1(不慣れなタスク)とrun2(慣れたタスク),
若年者と高齢者のハースト信号とSDBOLDの関係を表す.
下段の2つの散発図は,run1とrun2,若年者と高齢者のハースト信号
とGconnの関係を表す.
【59】
Ippei Suzuki, Shuntarou Yoshimitsu, Keisuke Kawahara, Nobutaka Ito, Atsushi Shinoda, Akira Ishii,
Takatoshi Yoshida, Yoichi Ochiai, “Gushed Light Field: Design Method for Aerosol-based Fog Display”,
in SIGGRAPH Asia E-Tech, 2016.
【60】
Keywords: Display, Light Field
新規性・差分
概要
ガスの噴出とプロジェクタの放射により空中にディスプレ
イを生成する技術.ディスプレイのサイズや描画速度や重
量のトレードオフを解決した.冷却用のエアロゾルスプレ
ーを用いて,噴出時のノズルについても形状を変えて施行
を行った.実装としては宙にスプレーを噴出,ウェアラブ
ル,ドローンなどにて行った.
・スプレーの噴出とプロジェクタにより,宙に3次元のデ
ィスプレイを生成することに成功した.
・ウェアラブルやドローンに実装してディスプレイを構築
した.
Links
論文 http://delivery.acm.org/10.1145/2990000/2988244/a9-
suzuki.pdf?ip=150.29.147.176&id=2988244&acc=OPEN&key=27692522F5
DD4C64%2E27692522F5DD4C64%2E4D4702B0C3E38B35%2E6D218144
511F3437&CFID=701046516&CFTOKEN=31117022&__acm__=14810731
65_d59eef7080a0f3103b6589586ef86a03
プロジェクト http://digitalnature.slis.tsukuba.ac.jp/2016/08/glf/
Samy Bengio, et al., “Scheduled Sampling for Sequene Prediction with Recurrent Neural Networks”, in
NIPS, 2015.
【61】
Keywords:
新規性・差分
手法
結果
概要
・Scheduled Samplingによる系列データの予測
・RNNによる系列データの予測のための新たな学習方法の
提案
・系列データ予測では学習の際前段のRNNの出力の真の値を次の入力にする
が、その入力を確率的に予測値にして学習する
Links
論文 https://arxiv.org/abs/1506.03099
R. F. Mansour, “A Robust Approach to Multiple Views Gait Recognition Based on Motion Contours
Analysisn ”, WIAR, 2012.
【62】
Keywords: Biometric, silhouette, Motion analysis Introduction
新規性・差分
概要
・監視カメラの角度によって, 人物認識が困難になることがある.本論
文では,コンピュータビジョン技術によって人間の歩行を分析, 分類する
ための自動歩行認識のアプローチを提案する.
・
Links
論文
http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=6210572
・現在の歩行認識は, 視野角が変更されているために認識するのに困難と
なる.これは、歩容特徴データベースが生成された視野角でのプローブ
データが取得されたときの視野角と同じでない可能性がある.
・本手法では, 視差, 既知の較正パラメータと3次元シルエットをもたらす
輪郭の2次元座標を用いて輪郭の座標。抽出された人間の輪郭のインスタ
ンスに示し, 移動シルエットの変化の法則を分析し、アルゴリズムの複雑
さを低減するために, ステレオシルエットベクター(SSV)を用いて, 人
の方向の変化,腕の振りや足の歩行, 3つの水平セグメントにバイナリシル
エットを細分化する.
Roland Kwitt, Sebastian Hegenbart, Roland Kwitt, Sebastian Hegenbart, “One-Shot Learning of Scene
Locations via Feature Trajectory Transfer”, CVPR, 2016.
【63】
Keywords: appearance of scenes changes, Places-CNN, feature trajectory transfer
新規性・差分
概要
・屋外のシーン外観において, 雨, 晴れなどによって 一時的な属性の強
さによって変化する.本稿では, 属性の変動性を属性の強さの関数とし
てどのように画像表現が変化するかを研究する.本手法では, 表現に基
づいてシーン画像の過渡状態を予測することができる。 第2に、そのよ
うな過渡状態と特徴表現の要素との間の関数依存性を、特徴空間におけ
る軌道としてモデル化することができる。
・従来研究では, 屋外のシーン外観において, 雨, 晴れなどによって 一時
的な属性の強さによって変化する.
・提案手法では, シーンの位置の外観が一時的なシーン属性の状態に応
じてどのように変化するかを教師あり画像から得た情報を取り入れて,
一時的な属性の強さを弱める.
Links
論文 http://wwwx.cs.unc.edu/~mn/sites/default/files/kwitt_cvpr_2016.pdf
Fengfu Li, Bo Zhang, Bin Liu, “Ternary Weight Networks”, in NIPS Workshop Efficient Methods for Deep
Neural Networks (EMDNN), 2016.
【64】
Keywords: Low Precision Network, Ternary Weight Network
概要
・三値(-1, 0, 1)の重みを使用するTernary Weight
Network (TWN)の最適化方法を提案.
・TWNは,binary precision (BinaryNet, XNOR-Net等)の約
38倍の表現力(3×3フィルタの場合。33×3 / 23×3 ≒ 38)が
あり,full precisionよりわずかに低い精度を,高速・省メ
モリで実現可能.
Links
論文 https://arxiv.org/pdf/1605.04711v2.pdf
コード https://github.com/fengfu-chris/caffe-twns
新規性・差分
・full precisionネットワークをTernary Weightで近似するため
の,シンプルで高精度な閾値ベースの近似解法を提案.
Ganesh Venkatesh, Eriko Nurvitadhi, Debbie Marr, “Accelerating Deep Convolutional Networks using
low-precision and sparsity”, in arXiv, 2016.
【65】
Keywords: Low Precision Network, Ternary Weight Network
概要
・2-bit precisionのResnet-152で,ImageNet Top-5 accuracy
93.2%を達成.
・専用のアクセラレータである,Deep Learning Accelerator
Core (DLAC)を開発.
・重みは三値(-1, 0, 1)のいずれかを取り,またReLUを使用す
るため,演算の半数以上がゼロ掛けの演算となる.このような演
算を省略することで,1 TFLOPS/mm2 相当の演算性能を実現.
Links
論文 https://arxiv.org/pdf/1610.00324v1.pdf
新規性・差分
・従来手法では精度を妥協していたのに対し,提案手法では
32-bit precisionの場合とほぼ同等の精度を実現.
・従来のアクセラレータの約4倍の演算性能を実現.
Mitsuru Ambai, Takuya Matsumoto, Takayoshi Yamashita, Hironobu Fujiyoshi, “Ternary Weight
Decomposition and Binary Activation Encoding for Fast and Compact Neural Network”, in ICLR
submission, 2017.
【66】
Keywords: Low Precision Network, Ternary Weight, Integer Decomposition
概要
・整数基底分解を用い,以下の(1),(2)により学習済みネットワー
クの計算量を低減.
(1)重み行列を三値の基底行列と実数値の係数行列の積で近似
(2)activation vectorをbinary vectorの重み付き和で近似
Links
論文 https://openreview.net/pdf?id=ByOK0rwlx
新規性・差分
・XNOR-Net等と異なり学習アルゴリズムの変更が不要.
・Deep CompressionやDistillationのような再学習が不要.
Shunsuke Saito, Lingyu Wei, Jens Fursund, Liwen Hu, Chao Yang, Ronald Yu, Kyle Olszewski, Stephen
Chen, Isabella Benavente, Yen-Chun Chen, Hao Li, “Pinscreen: 3D Avatar from a Single Image”, in
SIGGRAPH Asia E-Tech, 2016.
【67】
Keywords: Avartar, Face
新規性・差分
概要
単眼画像から3次元の顔を捉えてアバターを投影する.
異なる人物間においても顔や顔パーツ認識を行い,ア
バターを設定可能.CVPR2016にて行われていた企業
デモをSIGGRAPH Asiaにおいても発表した.
・単眼カメラからの3Dアバターシステムを提案した.
・単眼画像から人物の顔を認識してアバターを設定する
Links
論文 http://delivery.acm.org/10.1145/3020000/3014572/a15-
li.pdf?ip=150.29.147.176&id=3014572&acc=OPEN&key=27692522F5DD4C64%2
E27692522F5DD4C64%2E4D4702B0C3E38B35%2E6D218144511F3437&CFID
=701046516&CFTOKEN=31117022&__acm__=1481072698_e0fde8d3c2025936
f83c10b13af93ab5
動画 https://www.youtube.com/watch?v=oHEW4WjmI5o
Daniel Onoro-Rubio, Roberto J. Lopez-Sastre, “Towards perspective-free object counting with deep
learning”, in ECCV, 2016.
【68】
Keywords: Counting,
新規性・差分
概要
混雑状況において人物や自動車などをカウントする問題
を取り扱う.提案のモデルはCounting CNN (右図左),
Hydra CNN (右図右)である.Counting CNNは全て畳み込
み層により構成,Hydra CNNはマルチスケールから畳み
込みを行い,全結合層にて全てのマップを統合する.
・混雑状況のカウンティング問題に対してふたつのアーキ
テクチャを構築した.
・結果はデータにより良し悪しがあるが,概ねHydra CNN
の方が良好な精度を出した.
Links
論文
http://agamenon.tsc.uah.es/Personales/rlopez/docs/eccv2016-
onoro.pdf
コード https://github.com/gramuah/ccnn
YouTube https://www.youtube.com/watch?v=juXI2WpS4K0
ポスター http://www.eccv2016.org/files/posters/P-3B-26.pdf
Noah Siegel, Zachary Horvitz, Roie Levin, Santosh Divvala, Ali Farhadi, “FigureSeer: Parsing Result-
Figures in Research Papers”, in ECCV, 2016.
【69】
Keywords: Research Paper Analysis
新規性・差分
概要
CNNを用いた,研究論文の解析.論文から図を切り取り図
を解析する.グラフやOCRにより文字を読み取り,グラフ
中からベストな手法や数値を出力する.また,類似してい
る論文をレコメンドすることも可能である.Paper Corpus
をsemanticscholar.orgから,Figureをpdffigures.allenai.org
から取り出した.60Kの論文画像をCNNにより学習して各
種要素を取り出した.
・論文の画像を解析してグラフの結果や各種情報を取り出
すための手法を提案した
・定量的な評価で各種タスクの精度(上表),AlexNet,
ResNetなどによる評価(下表)が記載されている.
Links
論文 http://ai2-website.s3.amazonaws.com/publications/Siegel16eccv.pdf
プロジェクト http://allenai.org/plato/figureseer/
デモ https://docs.google.com/forms/d/e/1FAIpQLSfsqXAyWEogohaexOUzz-
8GfnymdYUnuTvMrAqfrqwbbtWWmg/viewform
コード https://github.com/allenai/figureseer
データセット ai2-website.s3.amazonaws.com/data/FigureSeerDataset.zip
ポスター http://www.eccv2016.org/files/posters/P-3B-29.pdf
Jacob Walker, Carl Doersch, Abhinav Gupta, Martial Hebert, “An Uncetain Future: Forecasting from
Variational Autoencoders”, in ECCV, 2016.
【70】
Keywords: Forecasting Flow, Variational Autoencoders (VAE)
新規性・差分
概要
生成的にフローを予測する研究.VAEを用いてトラジェク
トリの分布や予測を行う.画像における将来のモーション
を推定する.
・右図のように動画の入力からモーションを予測した.オ
プティカルフローとして予測を実行している.
・表にRepresentation learningの評価について記述されて
いる.
Links
論文 http://www.cs.cmu.edu/~jcwalker/DTP/eccv2016.pdf
プロジェクト http://www.cs.cmu.edu/~jcwalker/DTP/DTP.html
ポスター http://www.eccv2016.org/files/posters/P-3B-39.pdf
Satoshi Iizuka, Edgar Simo-Serra and Hiroshi Ishikawa,“Let there be Color!: Joint End-to-end Learning
of Global and Local Image Priors for Automatic Image Colorization with Simultaneous Classification ”, in
SIGGRAPH, 2016.
【71】
Keywords: CNN, Colorization
新規性・差分
概要
白黒画像からカラー画像への自動変換手法である.
4種類のネットワークを用いる.異なるスケールから大域
的特徴と局所的特徴を抽出し,Fusion layerにて領域とそ
のラベルが結合し,de concolutionより色画像を生成する.
この彩度画像と輝度画像をアップサンプリングし復元画像
を生成する.
Links
Project:http://hi.cs.waseda.ac.jp/~iizuka/projects/colorization/ja/
Paper :http://www.bmva.org/bmvc/2015/papers/paper119/paper119.pdf
入力画像のサイズに制限がない.またモデルの学習に大規模デ
ータセットを用いたことから,色とラベルをともに学習してい
ることにより自然な色付けを可能にした.
Edgar Simo-Serra, Sanja Fidler, Francesc Moreno-Noguera and Raquel Urtasun,“Neuroaesthetics in
Fashion: Modeling the Perception of Fashionability”, in CVPR, 2015.
【72】
Keywords: Fashionability,conditional random field, Linear regression
新規性・差分
概要 ファッション推奨システムの提案.SNSにアップロードされる
画像より抽出ッする特徴と,画像のタグといったメタデータを
条件付き確率場(下)によりFashionabilityを学習し,線形回帰よ
り評価している.また,SNS上にアップロードされた大規模・
長期間Fashionabilityを学習することにより背景および,アイテ
ムの推奨が可能である.
Links Project:http://hi.cs.waseda.ac.jp/~esimo/ja/research/fashio
nability/
Paper:
http://hi.cs.waseda.ac.jp/~esimo/publications/SimoSerraCV
PR2015.pdf
Fashionabilityという,いわゆる「お洒落度」のような感
性を数値化し,14万枚からなるFashion 144k データセッ
トを公開した.さらにファション性とGDPの関連性解析
といった社会学的側面からの考察も行っている. (上) ファ
ッション
推奨シス
テムの概
要
(左)Fashi
onability
の採点要
素
Yedid Hoshen, Shmuel Peleg, “An Egocentric Look at Video Photographer Identity”, CVPR, 2016.【73】
Keywords: Egocentric cameras, CNN, LPC, Optical Flow
新規性・差分
概要
・一人称視点のカメラから撮影した風景を認識し, 撮影している人を特定
する.これにより, その人のアイデンティティを特定することができる.
手法として, 物理的に動機付けされた手書きの記述子と畳み込みニューラ
ルネットワークで認識する.認識制度は約90%である.
・従来研究では, 写真のスタイルと写真の場所は写真家の認
識の手がかりとして使用しているが, どちらの方法もデフォ
ルト設定と同じ場所でカメラを使用する写真家を区別して
いない.
提案手法では, 一人称視点のカメラ映像の撮影者を認識する
手法を用いる.
Links
論文 http://www.cs.huji.ac.il/~peleg/papers/cvpr16-biometric.pdf
Jan Schluter, “Learning to Pinpoint Singing Voice From Weakly Labeled Examples”, in ISMIR, 2016.【74】
Keywords: Singing Voice Detector
新規性・差分
概要
楽器に関する音楽の検出は容易にできるようになってきた
が,一方で歌声の検出はばらつきが大きいため困難な問題
として扱われてきた.本論文では歌声の検索を題材として
その学習方法を提案する.Convolutional Neural Networks
(CNN)を用いるだけでなく,Multiple Instance Learning
(MIL)や顕著性マップを用いている.30秒単位のアノテー
ションされた音楽のシーケンスを10,000サンプル用意し,
CNNにより学習する.
・MILや顕著性マップによる精度向上がメインの貢
献である
・ピンポイントで楽曲から歌声位置を特定するこ
とに成功した
Links
論文 https://18798-presscdn-pagely.netdna-
ssl.com/ismir2016/wp-
content/uploads/sites/2294/2016/07/315_Paper.pdf
関連研究 http://www.ofai.at/~jan.schlueter/pubs/2015_ismir.pdf
H. Chen, A. Gallagher, and B. Girod,“Describing Clothing by Semantic Attributes”, in ECCV, 2012.
【75】
Keywords: Attributes,conditional random field
新規性・差分
概要
イベントに合わせたファッション解析,性別分類をといった
アプリケーション開発を念頭に置いた,姿勢に基づいた複数の
属性およびファッション推定手法の提案である.
Links
Paper:
http://chenlab.ece.cornell.edu/people/Andy/publications/ECCV2012_
ClothingAttributes.pdf
特徴抽出段階の間に人間の姿勢モデルを組み込み,条件付き確
率場の最適化によって属性間の共起性を評価することで制約のな
い画像中においても精度の良いファッション推定を可能にした.
(上)提案アプリケーション
(Dressing Style Analysis)の出
力例
(左)属性の分類手法の比較結果.
赤色が提案手法(姿勢推定+特
徴連結)を用いた手法で,推定
精度が最も高かった属性の個
数が多い.
姿勢推定より推定した胴体より40種類の特徴を抽出する.属性ご
とにSVMより所属確率を算出し,条件付き確率モデルの最適化に
より属性間の依存性を評価し,画像中に含まれる属性のリストを
Eddy Ilg, Nikolaus Mayer, Tonmoy Saikia, Margret Keuper, Alexey Dosovitskiy, Thomas Brox, “FlowNet
2.0: Evolution of Optical Flow Estimation with Deep Networks”, in arXiv, 2016.
【76】
Keywords: Optical Flow, FlowNet
概要
・オプティカルフローを推定するCNNであるFlowNetを改良し精
度・速度を向上.Sintel, KITTIでstate-of-the-artと同程度の精度を
高速(8fps)に得られる.
・元のFlowNetと同等の精度は140fpsで得られる.
・motion segmentation, action recognitionでの有効性を示す.
Links
論文 https://arxiv.org/pdf/1612.01925v1.pdf
プロジェクト・動画 http://lmb.informatik.uni-
freiburg.de/Publications/2016/IMKDB16/
FlowNet関連まとめ資料
http://www.slideshare.net/cvpaperchallenge/20
1607cvpaperchallenge2016/51
http://www.slideshare.net/cvpaperchallenge/20
1607cvpaperchallenge2016/52
新規性・差分
・学習データの与え方が重要であることを示した(Chairsデータセ
ットで学習後,Things3Dでファインチューニングすると良い).
・中間層のオプティカルフローでwarpingを行うスタック型アーキ
テクチャを開発.
・小さな変位に特化したサブネットワークを導入し,小さな変位
に対応.小さな変位用にデータセット(ChairsSDHom)も作成.
Random Features for Sparse Signal Classification,Jen-Hao Rick Chang, Aswin C. Sankaranarayanan, B. V. K. Vijaya
Kumar; The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016, pp. 5404-5412
【77】
Keywords: Ramdon Feature
新規性・差分
概要
本稿では、画像のように、疎な表現を楽しむ信号のランダムな特徴に対
する性能保証を導出し、カーネル類似度行列の所望の近似を達成するた
めに必要とされるランダムな特徴の数が疎信号に対して著しく小さくな
ることを示す。これに基づいて、データセットの低次元投影を最初に取
得し、続いて低次元投影上のランダム特徴を導出する圧縮ランダム特徴
と呼ばれる方式を提案している。
推論性能を達成するための同様の理論的保証を享受しながら,
従来のランダムな特徴よりも信号次元,計算時間,およびス
トレージコストの大幅な改善があった.
Links
論文 :
http://www.cv-
foundation.org/openaccess/content_cvpr_2016/papers/C
hang_Random_Features_for_CVPR_2016_paper.pdf
”Discriminative Invariant Kernel Features: A Bells-and-Whistles-Free Approach to Unsupervised Face Recognition and Pose
Estimation”,Dipan K. Pal, Felix Juefei-Xu, Marios Savvides; The IEEE Conference on Computer Vision and Pattern
Recognition (CVPR), 2016, pp. 5590-5599
【78】
Keywords:
新規性・差分
概要
単一性としてモデル化されたnuisance transformationsへの不変性を生
成するために,明示的に区別して「単純な」アプローチを提案する.実
際には、このアプローチでは,非ユニタリ変換も同様に処理できます.
理論的結果は,不変の最近の理論が単一カーネルに基づいた差別的およ
び核化された特徴にまで及ぶ範囲を拡大できる.特殊なケースとして、
単一の共通フレームワークを使用して、顔認識のための対象固有の姿勢
不変特徴を生成することができ,その逆もまた同様である
提案手法(DIKF)は,非常に難しい大規模な半合成フェースマッチン
グや,ランドマークを使用しないアライメントされていない顔を用い
た姿勢推定プロトコルの下でうまく機能することを示した,CMU
MPIEでベンチマークを行い、オフアングル・フェース・マッチングの
ほとんどすべてのケースで前の作業よりも優れています.
Links
論文 :
http://www.cv-
foundation.org/openaccess/content_cvpr_2016/paper
s/Pal_Discriminative_Invariant_Kernel_CVPR_2016_
paper.pdf
“Deep Saliency with Encoded Low level Distance Map and High Level Features”,Gayoung Lee, Yu-Wing Tai, Junmo Kim,
The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016
【79】
Keywords: low level feature,high level feature
新規性・差分
概要
顕著性検出の最近の進歩はシーン内の顕著な領域を検出するための高
レベルの特徴を得るために深い学習を利用してきた.これらの進歩は,
顕著性検出のために手作りの低レベルの特徴を利用する以前の研究よ
り優れた結果を示している.ハンドクラフト特徴が高度な特徴のみを
使用する顕著性検出のパフォーマンスを向上させる補完的な情報を提
供できることを示します.
エンコードされた低レベルの距離マップと高レベルのフィー
チャを連結し、それらを完全に接続されたニューラルネット
ワーク分類器に接続して、クエリ領域の顕著性を評価する。
実験より、深層学習に基づく顕著性検出方法の性能をさらに
改善できることを示した。
Links
論文 :
https://arxiv.org/pdf/1604.05495v1.pdf
“VLAD3: Encoding Dynamics of Deep Features for Action Recognition”,Yingwei Li, Weixin Li, Vijay Mahadevan, Nuno
Vasconcelos; The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016, pp. 1951-1960
【80】
Keywords: action recognition,VLAD for Deep Dynamics
新規性・差分
概要
Deep Featureを用いた動作認識への以前のアプローチは、小さな時間
領域内でのみビデオフレームを処理する傾向があり、遠距離の動的な
情報を明示的にモデル化しない。しかし、そのような情報は、特にサ
ブアクションを共有する複雑な活動の区別や、トリミングされていな
いビデオを扱う場合に、アクションの正確な認識に重要です。ここで
は、さまざまなレベルのビデオでの動作を考慮した、Deep Dynamics
(VLAD^3)の表現を提案します。
Deep Featureとハンドクラフト特徴を組み合わせることで,従来手
法よりも高い精度で,動作認識ができている.
Links
論文 :
http://www.cv-
foundation.org/openaccess/content_cvpr_2016/paper
s/Li_VLAD3_Encoding_Dynamics_CVPR_2016_pap
er.pdf
“Action Recognition in Video Using Sparse Coding and Relative Features”,Anali Alfaro, Domingo Mery, Alvaro Soto The
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016
【81】
Keywords: action recognition,Sparse Coding
新規性・差分
概要
この研究は、スパースコーディングを用いたビデオにおけるカテゴリ
ベースの動作認識へのアプローチを提示している。提案されたアプロ
ーチは主に2つの貢献がある.1つ目は代表的なアトミックアクション
アクションまたはキーシーケンスを縮小されたセットに分解すること
によって、クラス内変動を処理すること,2つ目は新しいビデオ記述
子(ITRA:時系列関係法記述子)を提案している.
提案手法は,いくつかの一般的なベンチマークデータセット
で顕著なアクション認識性能に達し,代替技術を大幅に上回
る性能を発揮している.
Links
論文 :
https://arxiv.org/pdf/1605.03222v1.pdf
Fabrication of Multscale Fractal-Like Structures
by Controlling Fluid Interface Instability in Nature 2016
概要
細胞プレート上の流体界面の不安定性を制御する
ことによって,拡張性のある規則的なフラクタル構
造を製作する.
流体は物質ごとに効率的に流れる.その流れを制
御することで,様々な規則的なフラクタル構造が製
作できる.
その一例として,Caylry treeのフラクタルパター
ンを製作した.
こうして作成したフラクタル構造は,動物の肺内
部の血管の構造や植物の葉脈に類似する特徴がみら
れる.
新規性
・拡張性のある規則的なフラクタル構造の作成方法
・ガス交換や血流などの用途としての
生物の構造を直接的に評価することができる.
LINK
http://www.nature.com/articles/srep37187
Tanveer ul Islam and Prasanna S. Gandhi
Caylry treeの表現
【82】
Aqueous synthesis of LiFePO4 with Fractal Granularity
in Nature 2016
概要
リチウムイオンバッテリーに使用されるLiFePO4の電極
はフラクタル構造を有することができる.フラクタル構造
を持つことにより,水熱法によって,有機溶剤を使わない
にもかかわらず,低コストで環境に優しく不純物を持たな
いように,作成することができる.
一見複雑な構造を持つが,より単純な微細構造を繰り返
すことによって,成っている.
本手法によって,生成されたLiFePO4を用いたリチウム
イオンバッテリーは,従来の高性能バッテリーに匹敵する.
新規性
フラクタル構造を有するLiFePO4の開発手法を提案し
た.
LINK
http://www.nature.com/articles/srep27024
Zahilia Cabán-Huertas, Omar Ayyad, Deepak P. Dubal and Pedro
Gómez-Romero
Fractal LiFePO4
【83】
Unique fractal evaluation and therapeutic implications
of mitochondrial morphology in malignant mesothelioma
in Nature2016
概要
悪性中皮腫の持つミトコンドリアが動的ネットワークを持ち,
細胞分裂に影響を与える.フラクタルの次元数や空隙性を計測
することによって,ミトコンドリアの動的ネットワークを解
析・評価する手法を提案する.
これによって,見分けがつけづらい悪性中皮腫の種類を識別
することができる.
*空隙性:フラクタルがどの程度,空間を満たしているかを表す
指標
新規性
悪性中皮腫の持つミトコンドリアの構造をフラクタル次元や空隙
性によって解析することで,見分けがつけにくい悪性中皮腫の変
化を迅速かつ強固で客観的に識別することができる.
LINK
http://www.nature.com/articles/srep24578
Frances E. Lennon, Gianguido C. Cianci, Rajani Kanteti, Jacob J. Riehm, Qudsia Arif, Valeriy A. Poroyko,
Eitan Lupovitch, Wickii Vigneswaran, Aliya Husain, Phetcharat Chen, James K. Liao, Martin Sattler, Hedy L.
Kindler and Ravi Salgia
【84】
Black carbon radiative forcing at TOA decreased during aging
in Nature 2016
概要
大気エアロゾルの一種である炭素粒子の成長過程を,炭素
粒子を小さな球状の単量体からなるフラクタル凝集体として
シミュレートした.
炭素粒子の放射強制力が,成長過程において,BOA(大気の
底部)で増加し,TOA(大気の上部)で低下することを示した.
また,炭素粒子の放射強制の成長過程は,表面アルベド,
エアロゾル光学深度,太陽天頂角にも影響されることが分か
った.
これらの知見が気候変動の評価に役立つと期待される.
新規性
様々な条件下の出の炭素粒子の成長過程のシミュレ
ート
LINK
http://www.nature.com/articles/srep38592
Yu Wu, Tianhai Cheng, Lijuan Zheng and Hao
Chen
【85】
Box-covering algorithm for fractal dimension of
weighted networks in Nature 2016
概要
重み付けのない複雑なネットワークのフラクタル
次元を測定する古典的手法であるボックスカバーア
ルゴリズムを,重み付けされたネットワークのフラ
クタル次元を測定するために改良した.
提案手法では,重み付きネットワークのフラクタ
ル特性は,ネットワークのトポロジーとエッジ重み
によって決定される.また,エッジ重みに基づいて,
フラクタル次元を変えることができる.
新規性
ボックスカバーアルゴリズムを重み付けされたネッ
トワークに対応させた.
LINK
http://www.nature.com/articles/srep03049
Dai-Jun Wei, Qi Liu, Hai-Xin Zhang, Yong Hu, Yong Deng and Sankaran
Mahadevan
【86】
Jakub Sochor, Adam Herout, Jiˇr´ı Havel, “BoxCars: 3D Boxes as CNN Input for Improved Fine-Grained
Vehicle Recognition ”, CVPR, 2016.
【87】
Keywords: CNN, vehicle recognition, unpacking
新規性・差分
概要
・車両認識において, ビデオストリームから車の画像自体を深い畳み込
みニューラルネットワークを用いて, 認識性能を大幅に向上する手法を
述べる.
・
Links
論文 http://www.cv-
foundation.org/openaccess/content_cvpr_2016/papers/Sochor_BoxCars_3D_Boxes_CVPR_2
016_paper.pdf
・従来研究では, 2Dの正面から撮影した画像から3Dモデルの車両を使用
して, 検出する.提案手法では監視カメラの映像データに基づく, 3D 情報
の抽出, 利用し, 車両認識する.
Xuezhi Wen, Ling Shao, Wei Fang, Yu Xue “Efficient Feature Selection and Classification for Vehicle
Detection”, IEEE, 2015.
【88】
新規性・差分
概要
・Haar-like特徴での車選択, 車両検出の分類を行う.本論文でのアプロー
チは理論的に効率の分析を行う.実験結果は, 提案されたアプローチが
AdaBoostによる特徴選択プロセスをスピードアップするだけでなく、最
先端の方法よりも優れた検出性能を出力した.
・従来研究では, 形状の特徴を取得できるHOG, CNNより深い層
で行われているDNN, AdaBoostとコンパクトな表現を形成し, 構
造情報を符号化し、複数のスケールから情報を取り込み, 特に効
率的に計算するHaarlike特徴を用いる.
提案手法では, Haar-like特徴のプール層が大規模なため,
AdaBoostを使用してサンプルの特徴値をクラスラベルと組み合
わせることで迅速かつ効果的なフィーチャ選択手法を用いる.
Links
論文 http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=6898836
Keywords: — AdaBoost, Haar-like features,SVM, vehicle detection, weak classifier
Michael B. Chang, Tomer Ullman, Antonio Torralba, Joshua B. Tenenbaum, “A Compositional Object-
based Approach to Learning Physical Dynamics”, in ICLR submission, 2017.
【89】
Keywords: Physical Dynamics, Neural Physics Engine (NPE)
新規性・差分
概要
物体の運動を予測するニューラルネット,Neural Physics
Engine (NPE)を提案する.単一の物理モデルを計算するの
みならず,運動モデルと跳ね返りなどを導入することに成
功した.NPE内で物理計算を行い,2次元のアニメーショ
ンの生成を行った.
・簡易的な物理モデルの組み合わせを計算・表現できるニ
ューラルネットNPEを提案した
・可視化例は右下に示す通りである.
Links
論文
https://arxiv.org/pdf/1612.00341v1.pdf
プロジェクト
可視化
https://drive.google.com/drive/folders/0B
xCJLi4FnT_6QW4tcF94d1doLWs
Yusuf Aytar, Lluis Castrejon, Carl Vondrick, Hamed Pirsiavash, Antonio Torralba, “Cross-Modal Scene
Networks”, in arXiv pre-print 1610.09003, 2016.
【90】
Keywords: Cross-Modal Scene Networks
新規性・差分
概要
クリップアートやアート,絵画などあらゆるテクスチャ表現を結びつけ
る枠組みを提案した.Places Databaseに含まれるような自然画像やあ
らゆるテクスチャ表現を結びつけることを本論文ではCross-Modelとよ
び,この対応付けをおこなう手法をCross-Modal Scene Networksとよぶ.
自然画像とあるモダリティの共通の要素を学習して認識ができるように
していると考えられる.右図はそのイメージである.分布には共通特徴
が含まれている.
・クロスモーダル学習をシーン認識の場面に適用した
・Natural Image, Sketches, Clip Art, Spatial Text, Descriptions
と5つの畳み込みマップを学習により生成し,Pool5にて統合,
共有マップを経て認識を行う
・5種類のクロスモーダルを表現した,Cross-Modal Olaces
Datasetを提案した.このデータはPlaces205 datasetをベース
にした
Links
論文 https://arxiv.org/pdf/1610.09003.pdf
プロジェクト http://cmplaces.csail.mit.edu/
E. Simo-Serra, S. Fidler, F. Moreno-Noguer, and R. Urtasun,“A High Performance CRF Model for
Clothes Parsing”, in ACCV, 2014.
【91】
Keywords: Attributes,conditional random field
新規性・差分
概要
意味的な服装の領域分割手法の提案.提案手法では,CPMCアルゴリズ
ムにより領域分割を行い,著者らが提案するパラメータ(下表)を用いた条件
付き確率問題としてラベルを推定している.
Links
Paper:
https://pdfs.semanticscholar.org/a361/d7073638d8c4b7b33acde65e
a47c5e5e2a73.pdf
従来手法よりもセグメンテーションの精度および,属性間の共
起性の再現率が向上した.
(上)提案手法と従来手法によるセマンティックなセグメンテーショ
ン結果(中央)セグメンテーションの精度
(下)属性間のJaccard係数(依存関係のある属性X,Yに対する
X∩Y/X∪Y)
Zezhi Chen, Tim Ellis, “Vehicle Detection, Tracking and Classification in Urban Traffic”, IEEE, 2012.【92】
Keywords: — Gaussian Mixture Model (GMM), HOG, background subtraction
新規性・差分
概要
・監視カメラによる道路の車両の検出, 追跡, 分類のためのシステムを提案する.本
システムでは, システムは車両を数え、車、バン、バス、バイク(自転車を含む)の
4つのカテゴリを分類する.ビデオの評価結果は96.39%の検出率で, 厳しい気象条件
を含む場合でも、分類精度は94.69%である.
・従来手法では, 急激な照明変化, カメラの振動, 車の種類などに対応しなかった.
本手法では, 急激な照明変化やカメラの振動に対処するために、混合ガウスモデ
ル(GMM)と影の除去法を使用する.また, 本手法では背景差分法とHOG特徴を
用いる.
Links
論文 http://www.cs.huji.ac.il/~peleg/papers/cvpr16-biometric.pdf
Zoya Bylinskii, Adria Recasens, Ali, Borji, Aude Oliva, Antonio Torralba, Fredo Durand, “Where should
saliency models look next”, in ECCV, 2016.
【93】
Keywords: Saliency
新規性・差分
概要
顕著性は次にどうなっていなくてはいけないかを問うた論文.顕著性マップ
の再実験を行う.現在のstate-of-the-artなモデルを画像タイプ認識,画像認
識,画像領域推定などのタスクで再検証する.今後も人間レベルのパフォー
マンスに向けて向上し続けるためにはよりハイレベルコンセプトを学習する
必要があることを突き止めた.より詳細なデータベースを作成した.Action,
Face, Important Objectなどタスクや注視領域を対応付けた.また,関連する
姿勢や周囲の物体などより高次なモデルを組み合わせる必要が
あるとした.
・Finer-grained なデータセットを生成し,DeepFix,
SALICON, Gaze MapなどState-of-the-artなモデルを比較
した
・今後の顕著性マップはより高次なモデルを統合する必要
があると位置付けた
Links
論文
https://pdfs.semanticscholar.org/379a/26a63dd0d94bec0d8b7
7328f028cfd0e9f2a.pdf
コード http://www.vision.caltech.edu/~harel/share/gbvs.php
ポスター http://www.eccv2016.org/files/posters/P-4B-23.pdf
K. Yamaguchi, T. Okatani, K. Sudo, K. Murasaki, and Y. Taniguchi,“Mix and Match: Joint Model for
Clothing and Attribute Recognition”, in BMVC, 2015.
【94】
Keywords: Attributes, CNN, conditional random field
新規性・差分
概要 CNNの中間層より抽出した特徴と,条件付き確率を用いて属
性間の共起性の強弱も表現するような属性推定手法の提案.属性
推定では,属性と位置をともに学習することで推定精度を向上さ
せている.
Links
Paper:
http://vision.is.tohoku.ac.jp/~kyamagu/papers/yamaguchi2015mixma
tch.pdf
(1) 条件付き確率に基づくラベル間相関の検出
(2) boundary boxと平均画像を用いた属性推定
(3) CNNの中間層とCRFによる属性間の共起性によって属性認識にすること
により汎用性が向上した
(上左)属性ごとの平均画像
(上右)提案手法と従来手法による画像中に含まれているであろ
う属性のリスト(赤は間違い)
(下)手法ごとの属性の推定精度
JiaJun Wu, Tianfan Xue, Joseph J. Lim, Yuandong Tian, Joshua B. Tenenbaum, Antonio Torralba,
William T. Freeman, “Single Image 3D Interpreter Network”, in ECCV, 2016.
【95】
Keywords: 3D from 2D, CNN
新規性・差分
概要
2次元画像から3次元の構造を復元する問題において,2D-3Dを行
うネットワークを構築した.3D Interpreter Network (3D-INN)と
呼ばれるモデルは,キーポイントを検出し3次元に投影して最終
的には3次元構造を復元する(右図).3次元のアノテーションは
手に入れるのが困難であるが,3DCADから取り入れることでコ
ントロール可能である.3Dのレンダリングが難しいが,キーポ
イントベースで描画する.さらに,2D-3Dの誤差伝播が難しいが,
3D-to-2D Projection Layerを導入してFine-tuningを行った.
・各コンポーネント(Keypoint Estimation, 3D Interpreter)について評価を行った.キーポイン
ト検出においてはMdshift (PCP: 69.1, AE: 1.39),提案手法(PCP: 66.7, AE: 1.35)@CUB-200-
2011であった.下のグラフは3D Interpreterに関する検討であり,横軸がRMSE,縦軸が
Recallであり,従来手法と比較すると格段に向上が見られ,Fine-tuningを行ったほうが若干
良いことがわかった.
・研究の成果として,画像検索や物体グラフ(t-SNE)を作成するに至った.
Links
論文 https://jiajunwu.com/papers/3dinn_eccv.pdf
プロジェクト http://3dinterpreter.csail.mit.edu/
著者 https://jiajunwu.com/
ポスター http://www.eccv2016.org/files/posters/O-4A-02.pdf
Lichtsteiner, Posch, Delbruck, “A 128x128 120 dB 15μs Latency Asynchronous Temporal Contrast
Vision Sensor”, in IEEE Journal of Solid-State Circuits(JSSC), 2008.
【96】
Keywords: Event Camera
新規性・差分
概要
ETH/UZHのグループがイベントカメラを開発した.時間
解像度は1μs,ダイナミックレンジは120dB,
Transmission bandwidthは~200Kb/s,電力は20mWである.
現在,コンピュータビジョンにおいてもイベントカメラが
用いられるようになってきた.
・イベントカメラを開発した
・通常のカメラが固定長の記録なのに対して,イベントカ
メラでは非同期なイベントに対応してミリ秒オーダの時間
解像度で撮像する.ピクセル単位の変化で画像を生成する
ことができる.
Links
論文
https://www.google.co.jp/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&ved=0ahUKEwjI0ZjHiOvQAhUIhbwKHV7
kB6wQFggcMAA&url=http%3A%2F%2Fwww.ini.uzh.ch%2Fadmin%2Fextras%2Fdoc_get.php%3Fid%3D42506&u
sg=AFQjCNGdg5jzo1j_pdFOKFO34iHXnNDwYw&sig2=N1-vaKqEYmpQWHV7YETcWQ
スライド http://www.rit.edu/kgcoe/iros15workshop/papers/IROS2015-WASRoP-Invited-04-slides.pdf
Hanme Kim, Stefan Leutenegger, Andrew Davison, “Real-Time 3D Reconstruction and 6-DoF Tracking
with an Event Camera”, in ECCV, 2016.
【97】
Keywords: Event Camera, 6DoF, Visual SLAM
新規性・差分
概要
イベントカメラを用いたVisual SLAMのための6-DoFのカメラトラッ
キングを行う.通常のカメラが固定長の記録なのに対して,イベント
カメラでは非同期なイベントに対応してミリ秒オーダの時間解像度で
撮像する.イベントカメラはリアルタイムかつ高ダイナミックレンジ
であるという特徴も保有するため,SLAM問題に有利であるとして適
用した.右図が提案の枠組みであり,勾配計算・再構成・距離計算の
結果を用いてEKFにより6DoFのカメラ追跡を行う.
・イベントカメラの特性を用いてSLAMを行った
・ミリ秒オーダで撮像できるという点,変化位置のみを記
録するという特性がSLAMにマッチし,リアルタイムでの
Visual SLAMを実現した
Links
論文 https://www.doc.ic.ac.uk/~ajd/Publications/kim_etal_eccv2016.pdf
ポスター http://www.eccv2016.org/files/posters/O-4A-01.pdf
YouTube https://www.youtube.com/watch?v=yHLyhdMSw7w
著者 http://www.hanmekim.com/
Jian Wang, Aswin C. Sankaranarayanan, Mohit Gupta, Srinivasa G. Narasimhan, “Dual Structured Light
3D using a 1D Sensor”, in ECCV, 2016.
【98】
Keywords: 3D reconstruction, Line Sensor
新規性・差分
概要
2Dから1Dののラインセンサーに置き換えることでローコ
ストなシステムになると主張.また,非同期のDynamic
Vision Sensor (DVS)になるとも主張した.ここから,
Projectorや1D Line-sensorを用いた3次元再構成を行う
(右図).ハードウェアの構成も右下図に示す.
・ラインセンサを用いてコストを抑えた撮像系を
構成するとともに,非同期のDVSを作成するこ
とに成功した
・同センサを用いて3次元再構成を行った(結果
は図示されているとおり)
Links
論文
http://imagesci.ece.cmu.edu/files/paper/2016/DualSL_ECCV16
.pdf
プロジェクト
ポスター http://www.eccv2016.org/files/posters/O-4A-03.pdf
YouTube https://www.youtube.com/watch?v=QayhDr66lAs
Rohit Girdhar, David Fouhey, Mikel Rodriguez, Abhinav Gupta, “Learning a Predictable and Generative
Representation for Objects”, in ECCV, 2016.
【99】
Keywords: Generative Vector Representation, Object Generation
新規性・差分
概要
物体生成に関するベクトル表現の検討.3次元空間の生成・表現方
法の検討のみならず,そのフレキシブルな変換に対しても行った.
下に示す図は生成のアーキテクチャである.VoxelのAutoEncoder
と画像の識別モデルを組み合わせたようなモデルである.3D-2Dの
64 Fully Connected Layerはユークリッド誤差,3DのAutoEncoder
はシグモイドのクロスエントロピー誤差.学習はまずAutoEncoder
単体,次に画像ネットワーク,最後に統合モデルを最適化.
・オートエンコーダや画像識別モデルを統合したモデルに
より3次元の物体生成を行った.ベクトル表現についても
検討.
・右下図のように,物体の足し算引き算のようなベクトル
表現も行えるようになった
Links
論文 https://arxiv.org/pdf/1603.08637v2.pdf
プロジェクト https://rohitgirdhar.github.io/GenerativePredictableVoxels/
ポスター http://www.eccv2016.org/files/posters/S-4A-09.pdf
コード https://github.com/rohitgirdhar/GenerativePredictableVoxels
Hang Chu, Shenlong Wang, Raquel Urtasun, Sanja Fidler, “HouseCraft: Building Houses from Rental
Ads and Stree Views”, in ECCV, 2016.
【100】
Keywords: 3D Reconstruction, Building Houses
新規性・差分
概要
広告とGoogle Street Viewから3次元の家を再構成するという
研究.ストリートビューは動かした複数の視点から同じ建物
が移るという特性から3次元再構成を行う.二つの表は物体
検出精度や誤差に関する検討,最後の図は定性的な評価であ
り,入力や2次元画像上での検出結果,3次元再構成の結果で
ある.
・広告やストリートビューの複数視点から3次元構成を行
い,家を再構成するという研究である
・既存のデータやアイディアで2次元マップを3次元に復元
するという研究
Links
論文 http://chuhang.github.io/files/publications/ECCV_16.pdf
プロジェクト http://www.cs.toronto.edu/housecraft/
ポスター http://www.eccv2016.org/files/posters/P-4A-10.pdf
コード https://github.com/tfwu/HouseCraft/blob/master/readme.md
ビデオ https://vimeo.com/174261051
Li Niu, Jianfei Cai, Dong Xu, “Domain Adaptive Fisher Vector for Visual Recognition”, in ECCV, 2016.
【101】
Keywords: Fisher Vector, Domain Adaptation
新規性・差分
概要
ドメイン変換が行えるようなFisher Vectorを提案する.
ドメインに依存しないコンポーネントを選択するように
学習する.ここではMaximum Mean Discrepancy
(MMD)の最小化による.回帰行列や重みを同時に学習す
る.
・画像認識や行動認識に適用した結果,有意な差が見られ
た
・右表参照
Links
論文 http://link.springer.com/chapter/10.1007/978-3-319-46466-4_33
ポスター http://www.eccv2016.org/files/posters/P-4A-13.pdf
著者 http://www.ntu.edu.sg/home/asjfcai/
Yuqiu Kong, Lijun Wang, Xiuping Liu, Huchuan Lu, Xiang Ruan, “Pattern Mining Saliency”, in ECCV,
2016.
【102】
Keywords: Pattern Mining, Saliency
新規性・差分
概要
顕著性マップを生成するためのシードを探索する問題である.
パターンマイニングを最初に行い顕著性マップを行ったほうが
ハイレベルな推定になるとした.提案のExternal Random Walk
(ERW)は最初のシードの散布を行うためのランダムウォークを
ベースとした手法である.
・顕著性を行う前にパターンマイニングを行ったほうがよ
いと位置付けた
・右図は顕著性マップのためのMSRA,SODデータセット
に対して顕著性を推定した結果である
Links
論文 http://202.118.75.4/lu/Paper/ECCV2016/1231.pdf
ポスター http://www.eccv2016.org/files/posters/P-4A-15.pdf
Mohammadreza Mostajabi, Nicholas Kolkin, Gregory Shakhnarovich, “Diverse Sampling for Self-
Supervised Learning of Semantic Segmentation”, in arXiv pre-print 1612.01991, 2016.
【103】
Keywords: Self-supervision, Semantic Segmentation
新規性・差分
概要
カテゴリーベースのセマンティックセグメンテーションにおいて,パラメ
ータを特に設定することなく学習を行う”Self-Supervision”を実現するフ
レームワークを提案する.この枠組みを実行するためにModular,とても
高速で3分以内で学習を終了する.このフレームワークは[Hariharan+,
CVPR15]のHypercolumnsや[Mostajabi+, CVPR15]のzoomout表現をベー
スにした自己学習手法である.右図に示すように,画像の入力からマルチ
スケールに特徴を抽出して,スコア値から物体ごとや背景にシードを20点
散布して,この位置がセマンティックセグメンテーションのための学習入
力となる.
・物体認識のスコア値を元にしてセマンティックセグ
メンテーションを実行するためのシードを抽出,学習
のための入力とした
・Supervisedなモデルには及ばなかったが,一部の手
法よりも精度が高く,今後も向上が期待される
Links
論文 https://arxiv.org/pdf/1612.01991v1.pdf
プロジェクト
Hyun Oh Song, Stefanie Jegelka, Vivek Rathod, Kevin Murphy, “Learnable Structured Clustering
Framework for Deep Metric Learning”, in arXiv pre-print 1612.01213, 2016.
【104】
Keywords: Metric Learning, Deep Learning
新規性・差分
概要
画像の距離計算において類似する特徴を空間的に近くに配置するMetric
Learningがあるが,それをDeep Learningの枠組みで,さらに構造化学
習にて解くアルゴリズムを考案する.右は本論文におけるフレームワ
ークである.CNNの学習(ランキングロス)により近い画像はよりラ
ンクが高くなるようにする.結果的に近い画像は出力値が類似するよ
うになる.FaceNetのようなTriplet学習に対してはsemi-hard negative
mining,lifted structured embedding, n-pairs embeddingを追加した.
・CUB200-2011, Cars196, Stanford online productsのデー
タにおいてstate-of-the-artな精度を実現.指標にはNMIや
R@Kを用いた(右表)
・t-SNEにてDeep Metric Learningによる画像プロットの空
間を可視化した(右下図)
Links
論文 https://arxiv.org/pdf/1612.01213v1.pdf
著者 https://www.cs.ubc.ca/~murphyk/mypapers.html
Hengshuang Zhao, Jianping Shi, Xiaojuan Qi, Xiaogang Wang, Jiaya Jia, “Pyramid Scene Parsing
Network”, in arXiv pre-print 1612.01105, 2016.
【105】
Keywords: Scene Parsing
新規性・差分
概要
ADE20K datasetを対象としたシーン解析(@ILSVRC2016)に対
してトップの成績を収めた.モデルにResNet-101, -269やピラ
ミッド構造を適用して特徴マップの統合を行いセグメンテーシ
ョン結果を復元している.その他にはデータ拡張,最終層にて
ドロップアウト,Dilated Conv,繰り返し回数の増加,バッチ
正規化などのチューニングを行った.
・結果的に綺麗なセグメンテーションを実現し,
ILSVRC2016のScene Parsingタスクにて優勝した
・ベースライン(FCN ADE20K pre-trained model)がが44%
に対して,提案の手法は57%を記録した
Links
論文 https://arxiv.org/pdf/1612.01105v1.pdf
プロジェクト
http://appsrv.cse.cuhk.edu.hk/~hszhao/projects/pspnet/index.
html
コード https://github.com/hszhao/PSPNet
スライド http://image-
net.org/challenges/talks/2016/SenseCUSceneParsing.pdf
Xiaofang Wang, Kris M. Kitani and Martial Hebert ,“Contextual Visual Similarity”, in arXiv:1612.02534,
2016.
【106】
Keywords: Attributes, CNN, Image Retrival, Triplet Loss
新規性・差分
概要 色や行動といった視覚的類似性を考慮できる属性ベースの
画像検索手法の提案.(例:「黒い犬」は,犬という点では「白
い犬」に近いが,色の点では「黒い馬」との類似性の方が高
い)文脈上の視覚的類似性を符号化するために,3枚の画像を
入力し(クエリ画像,正例画像,負例画像)を入力し,VGGNet
の重みを学習している.
Links Paper: https://arxiv.org/pdf/1612.02534v1.pdf
Tripletを用いた属性ベースの画像検索手法である.検索精度がベ
ースラインより向上している.また,ラベル付されていない属
性のTripletを出力
Wei Yang, Ping Luo and Liang Lin,“Clothing Co-Parsing by Joint Image Segmentation and Labeling”, in
CVPR, 2014.
【107】
Keywords: Attributes, Semantic Segmentation,
新規性・差分
概要 衣服の共同解析システムを開発を念頭に置いた,タグ付けのみがされて
いる衣服画像を意味的領域分割する手法の提案.Step 1.では画像上の前景
領域を抽出する.分割した領域をexemplar-SVMより統合する.Step 2.で
は分割された領域を頂点とした服装構成にコンテキスト情報(例:アイテム
の位置および相互関係)を組み込んだグラフィカルモデルを構築し,グラ
フカットによりラベルの共同割り当てを行う.
Links Paper:
http://ss.sysu.edu.cn/~ll/files/clothingparsing_cvpr2014.pdf
2098枚のストリートファッション写真からなるCCPデータセットの提案.
従来手法(Fashionista)と比較し,セグメンテーション・ラベルの認識率が向上
Satoshi Iizuka, Yuki Endo, Yoshihiro Kanamori and Jun Mitani,“Single Image Weathering via Exemplar
Propagation”, in Eurographics, 2016.
【108】
Keywords: Weathering
新規性・差分
概要 複雑な特徴変動を伴う風化効果の生成手法を提案した.提
案手法では,材質ごとの放射既定関数より生成される風化
度マップによって導かれるパッチを合成し,画像全体で最
適化する.視覚的に自然な風化効果を生成するために、グ
ラフカットを使用して顕著な風化特徴を含む”“weathering
exemplar”を作成し,それからサンプリングされたパッチを
合成し一貫性を維持する.
Links
Paper: http://hi.cs.waseda.ac.jp/~iizuka/projects/weathering/data/weathering.pdf
Project: http://hi.cs.waseda.ac.jp/~iizuka/projects/weathering/weathering_eng.html
従来手法とは異なり,風化度分布によって導出されるシームレ
スなパッチベースの合成によって材質ごとの自然な風化を表現さ
せている.これにより,従来手法と比較して自然な風化表現が可
能になった.
Lukas Bossard, Matthias Dantone and Christian Leistner,“Apparel Classification with Style ”, in ACCV,
2012.
【109】
Keywords: Attribute, Random foreset, SVM
新規性・差分
概要 画像中の自動属性推定手法の提案.まず上半身を検出する.
次に複数の特徴を密に抽出する.抽出された特徴に対するヒス
トグラムはランダムフォレストよってタイプ分類,SVMによっ
て属性分類に使用する.
Links
Paper:http://people.ee.ethz.ch/~lbossard/projects/accv12/accv12_apparel-
classification-with-style.pdf
Project: http://people.ee.ethz.ch/~lbossard/projects/accv12/index.html
ベンチマークデータセットの提案.さらに属性の分類性能につ
いて,従来手法が35.07%であるのに対し,提案手法では41.38%
であり精度向上を確認した.
Peng Wang et al., “What’s Wrong with that Object? Identifying Images of Unusual Objects by Modelling
the Detection Score Distribution∗ ”, in CVPR, 2016.
【110】
Keywords: Identification
新規性・差分
概要
シーン内の既知のオブジェクトに含まれる,そのオブジェクト以外の
箇所を特定する.そのクラスに属しはするがそのクラスに特有でない
ものを特定することで,検出をより良いものにする.複数の画像領域
におけるスコアの分布を計算して異常な物体を識別する.独自のデー
タセットも提案.
・通常の物体画像と異常物体の画像が、スコア値および空
間分布の両方で異なる領域レベルのスコアを示すことに着
目している。これらの分布をモデル化するためにGPを使
用して、それぞれについて2つの生成モデルを作成する。
具体的には、単一の場所における検出スコアと複数の領域
間のスコア依存性を同時にモデル化するため共分散関数を
計算している。
Links
論文 http://www.cv-
foundation.org/openaccess/content_cvpr
_2016/papers/Wang_Whats_Wrong_Wit
h_CVPR_2016_paper.pdf
Zhe Zhu et al., “Traffic-Sign Detection and Classification in the Wild∗ ”, in CVPR, 2016.
【111】
Keywords: Traffic-Sign Detection, Dataset
新規性・差分
概要
交通標識の検出と分類をより現実世界に近い画像で,高精度に行う.
照度や気象条件のバリエーションを考慮した,10万枚規模の新しい
データセットを公開.GrundTruthとして,bounding boxと標識のマ
スクを提供.また,End-to-EndのCNNを認識手法として提案.
・従来の交通標識ベンチマークの111倍の枚数,32倍の解
像度.
Links
論文 http://www.cv-
foundation.org/openaccess/content_cvpr
_2016/papers/Zhu_Traffic-
Sign_Detection_and_CVPR_2016_pape
r.pdf
Yuxing Tang et al., “Large Scale Semi-supervised Object Detection using Visual and Semantic
Knowledge Transfer ∗ ”, in CVPR, 2016.
【112】
Keywords: Object Detection
新規性・差分
概要
視覚と意味の両方から,物体の類似性に関する知識を利用.視覚的に
も意味的にも類似したカテゴリーは、異なるカテゴリーに比べてより
一般的な伝達可能な特性を示すはずであるという直感に基づく.2つ
の画像について,カテゴリ違いとbounding boxの違いをモデル化し
この情報を転送して分類器を検出器に変換する.
・ILSVRC2013の100クラス分類で,これまでよりmAPが
3.88向上.類似度の計算はAlexNetの全結合層から.
Links
論文 http://www.cv-
foundation.org/openaccess/content_cvpr
_2016/papers/Tang_Large_Scale_Semi-
Supervised_CVPR_2016_paper.pdf
Radu Tudor Ionescu et al., “How hard can it be? Estimating the difficulty of visual search in an image∗ ”,
in CVPR, 2016.
【113】
Keywords: Obeject Detection
新規性・差分
概要
人間が思う画像の難しさが機械による認識の難しさにどのような影響
を及ぼすか,そしてそれらの特性がどれほど正確であるかを分析する.
CNNの回帰モデルにより計算したこの難易度のスコアは,物体の検
出や認識の精度の向上に役立つことを示した.
・難易度スコアは,含まれるアノテーションされた物体の数や,
遮蔽具合など,10ほどの項目から計算している.VGGNetをベー
スにした実験では,検出と分類でそれぞれ8%,1%と,計算した"
難しさ"は少なからず精度を向上させることを示した.
Links
論文 http://www.cv-
foundation.org/openaccess/content_cvpr
_2016/papers/Ionescu_How_Hard_Can
_CVPR_2016_paper.pdf
Nitipat Sirikuntamat , Shin'ichi Satoh, Thanarat H. Chalidabhongse“Vehicle Tracking in Low Hue Contrast
Based on CAMShift and Background Subtraction”, JCCSSE, 2012.
【114】
Keywords: — vehicle tracking, CAMShift, vehicle detection,
新規性・差分
概要
・本論文では, CAMShiftに基づく方法を用いて高速道路で車両を追跡する方法を提案
する.
Continuously Adaptive Mean Shift(CAMShift)は, 物体追跡でよく知られているアル
ゴリズムである.しかし, CAMShiftには計算量, 識別精度に問題がある.そのため,
CAMShiftに基づく新しい手法を用いて, これらの問題を解決する.
・従来研究では, Continuously Adaptive Mean Shift (CAMShift)を用いて, 車両を追
跡する方法があるが, 車の色, 背景の差が大きい為, 車両追跡がしにくい.また, 追
跡する際に見失うと, 大量の計算が必要である.
・提案手法では, 移動する前景オブジェクトと陰影背景を区別できる計算モデル
を用いて, 背景の差におけるデメリット, 計算量を改善する.
Links
論文:http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=7219770
Yang Ji, Ming Yang, Zhengchen Lu, Chunxiang Wang, “Pedestrian Detection aided by Deep Learning
Semantic Tasks”, IEEE, 2015.
【115】
Keywords: — traffic light, VSA, spectral residual, HOG, SVM
新規性・差分
概要
・本論文では, 信号機の検出と認識を行う論文である. 複雑な都市環境での交通信号
の検出と認識の問題を解決するためにVisual Selective Attention(VSA)モデルと
HOG機能を統合する方法を提案する.実験結果より, 従来手法より, 提案手法のほう
が識別精度, 処理時間は高い.
・従来研究では, 多くの事前作業が行う必要がある.そのため, 地図情報が正確で
最新野茂を使わないといけないので, 計算量のコストが高くなる.
・提案手法では, VSAモデルを使用して、信号機の候補領域を取得し, これらの候
補領域にHOG特徴とSVM分類器を使用して、信号機の正確な領域を取得する.
これらの領域内では, グレースケール画像の情報に基づいて信号光の色が認識さ
れる
Links
論文:http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=7225699
Michael Weber, Peter Wolf and J. Marius Zollner, “DeepTLR: A single Deep Convolutional Network for
Detection and Classification of Traffic Lights”, IEEE, 2016.
【116】
Keywords: — traffic light, DeepTLR, Bounding Box, DeepTLR
新規性・差分
概要
・本論文では,リアルタイムで交通信号の検出に関する手法を
述べる.リアルタイムでの信号検出と分類のためのカメラベ
ースのシステムであるDeepTLRを提案します.また, 時間的
情報を用いるため, フレーム検出を行い, 信号の検出を行う.
リアルタイムアプリケーションに必要なフレームレートで動
作し, 信号機を検出する.
・従来研究では, 信号機認識に用いる地域提案の数に大きく依存
する.そのため, 提案の数が増えるつれて, 信号を検出するのが
困難になる.
・提案手法では, フレーム単位で信号機を検出する.検出および
状態分類には, 各細かいピクセル領域の分類し, バウンディング
ボックスによって, 信号機があるところに候補領域を抽出し, 単
一のディープニューラルネットワークを用いて, 信号機を検出す
る.
Links
http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=7535408
K.V. Arya, Shailendra Tiwari, Saurabh Behwal, “Real-time Vehicle Detection and Tracking”, IEEE, 2016.【117】
Keywords: Vehicle detection and tracking, Foreground mask
新規性・差分
概要
・本論文では, 物体の動きの軌跡に焦点を当てた車両の検出お
よび追跡のための効率的な方法を述べる.本論文の手法は車
両候補ではないオブジェクトを選択的に削除し, 同時に候補車
両を統合する.
・従来研究では, 車両監視は, 複雑な環境でオブジェクトのを移
動させているため, 車両検出が困難になる.そのため, 車両検出
には生成された前景マスクの品質に依存する.
・提案手法では, 入力動画として低解像度ビデオと高解像度ビデ
オの両方を使用する.最後のフレームに達するまで, すべてのフ
レームで繰り返し検出と追跡のタスクを実行する.
Links
http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=7561327
Basin entropy: a new tool to analyze uncertainty in dynamical systems in Nature2016
概要
流域エントロピーによって,引力流域の最終状態を判別可能か判断す
る手法を提案する.
非線形動力学において引力流域の初期状態が,
どのように最終状態につながるかを解析することは重要な問題である.
しかし,引力流域の性質によっては,推定が難しい場合もあるため,
予測可能か否かを判別する必要がある.
また,フラクタル流域境界が存在するか否かを判断することができる.
境界の流域エントロピーがlog2よりも大きい場合,その流域はフラクタ
ル性を持つ.これによって,境界のフラクタル性の判別にも使用できる.
新規性
非線形ダイナミクスの不確定性の探索のための手法として,流域
エントロピーを提案した.
LINK
http://www.nature.com/articles/srep31416
Alvar Daza, Alexandre Wagemakers, Bertrand Georgeot, David Guéry-Odelin and Miguel A. F. Sanjuán
予測が困難な引力流域(a)と
予測できる引力流域(b)
【118】
Strongly enhanced light trapping in a two-dimensional silicon nanowire random fractal array in Nature
2016
概要
Siナノワイヤ(SiNW)の光学特性について報告.
提案したナノワイヤアレイのランダムフラクタル構造が,
材料の屈折率によって,ラマン錯乱と光ルミネセンスを大きく
向上させるので,内面に強力な多重散乱が発生することを示した.
新規性
• 光学特性とフラクタル性の間に強い相関があることを解明
• ランダムフラクタル構造を持ったSiNWの工業的に互換性のある安
価な製造手法の提案
LINK
http://www.nature.com/lsa/journal/v5/n4/full/lsa201662a.html
Barbara Fazio, Pietro Artoni, Maria Antonia Iatì, Cristiano D'Andrea, Maria Josè Lo Faro, Salvatore Del Sorbo,
Stefano Pirotta, Pietro Giuseppe Gucciardi, Paolo Musumeci, Cirino Salvatore Vasi1, Rosalba Saija, Matteo
Galli, Francesco Priolo and Alessia Irrera
SiNWのSEM像の断面図(a,b)
フラクタル次元を示すグラフ(c)
フラクタルの空隙性を示すグラフ(d)
【119】
Temporal fractals in seabird foraging behaviour: diving through the scales of time in Nature 2013
概要
動物の行動と環境との関係が持つフラクタル性を
コガタペンギンの飼育と観察を通して分析した.
4つのフラクタルの解析法で分析を行った結果,
そのフラクタル構造はペンギンの潜水距離と餌接種行動時間との間に相
関を示した.また,個体差の影響がほとんどないことを
示した.
ペンギンの潜水行動は餌接種行動の中の1行動であるが,
フラクタル時間がその基本的な特徴を示すことが分かった.
新規性
動物と環境間の相互作用を分析する手法の提案
LINK
http://www.nature.com/articles/srep01884
Andrew J. J. MacIntosh, Laure Pelletier, Andre Chiaradia, Akiko Kato and Yan Ropert-
Coudert
Frequencyベースでの解析結果(a)と
Fractalベースでの解析結果(b)
DFA: Detrended Fluctuation Analysis
DFAb: Bridge-detrended Fluctuation Analysis
HAV: Hurst absolute value method
【120】
Fractal Based Analysis of the Influence of Odorants on Heart Activity in Nature
2016
概要
心拍数と嗅覚刺激の関係を調査した.心臓の研究において,外部刺激が心臓へ与える影響を調査することは重要である.外
部刺激の中でも,嗅覚刺激は心電図信号にマッピングされた心臓活動に影響を及ぼすことが分かっているが,その間の関係
性の調査はいまだなされていなかった.
調査の結果,構造的で複雑な付臭剤がフラクタル心拍数の減少を起こしたことから,心拍数の複雑さが付臭剤の分子構造
の複雑さに影響されていることが示された.また,より高いエントロピーを有する付臭剤はより低い近似エントロピーを有
する心拍数を引き起こすことも示された.
新規性
心拍数と臭覚刺激の関係性の解明
LINK
http://www.nature.com/articles/srep3855
5
Hamidreza Namazi and Vladimir V. Kulish
付臭剤の臭いの違い(左)と分子構造の複雑さ(右)による時系列のフラクタル次元
【121】
Fractal features of soil particle size distribution in newly formed wetlands in the Yellow River Delta in Nature
2015
概要
海岸の新たに形成された湿地における土壌粒怪分布特性をフラクタルスケーリング理論を適用して,解析した.
その結果,フラクタル次元とエントロピー寸法は126um未満の微粒子に敏感に反応し,容量次元は126-2000umの粒子に敏感に反応した.
乾季と雨季を比べたとき,土壌のフラクタル次元は雨季で増加した.また,植物の根が張っているときも植物の種類によって影響は異
なるがフラクタル次元は増加した.
これらの結果から,植生管理は土壌の品質を
向上するための最も有効な方法であることが判明した.
新規性
土壌粒径分布特性のフラクタルスケーリング理論を用いた解析
LINK
http://www.nature.com/articles/srep10540
Junbao Yu, Xiaofei Lv, Ma Bin, Huifeng Wu, Siyao Du, Mo Zhou, Yanming Yang and
Guangxuan Han
黄河三角州における新たに形成された湿地の土壌粒径分布のフラクタル特
性
【122】
Noninvasive, label-free, three-dimensional imaging of melanoma with confocal photothermal
microscopy: Differentiate malignant melanoma from benign tumor tissue in Nature 2016
概要
皮膚癌における悪性黒色腫は皮膚癌患者の2%未満に過ぎないが,死亡者の大多数を占
める.悪性黒色腫の発見のため,患部の3D画像に対して,古典的形態計測法(メラニン密度
及びサイズ分布)とフラクタル解析を用いて解析した.フラクタル解析により,悪性黒色腫
の成長中にメラニン分布がよりカオスとなり,組織化が不十分になることが分かった.
その結果,3Dフラクタル解析は悪性黒色腫診断において,従来手法や2Dフラクタル解
析よりも有効であることが分かった.
新規性
従来方法では見分けづらい悪性黒色腫のフラクタル解析を用いた識別
LINK
http://www.nature.com/articles/srep30209
Jinping He, Nan Wang, Hiromichi Tsurui, Masashi Kato, Machiko Iida and Takayoshi Kobayashi
悪性黒色腫 良性黒色腫
【123】
Optimization of hierarchical structure and nanoscale-enabled plasmonic refraction for window
electrodes in photovoltaics in Nature2016
概要
準フラクタル構造を持った金属ネットワークによって,理想的な電極をほぼ完璧
に実現できる.
リーフ・ベネレーション・ネットワークは最適構造の重要な特徴を有しており,
他のネットワークよりも優れている. 階層トポロジの要素がネットワークを最適化
しており,5つの階層ネットワークに対して,実証した.
また,この構造だけでなく,ナノワイヤを含むネットワークがプラズモン屈折に
よって,幾何学的な制約を抑えて透明性を獲得できることを示した.
新規性
・電極に最適な金属ネットワークの構造の提案
・幾何学的な制約を抑えた透明性の獲得手法の提案
LINK
http://www.nature.com/articles/ncomms12825
Bing Han, Qiang Peng, Ruopeng Li, Qikun Rong, Yang Ding, Eser Metin Akinoglu, Xueyuan Wu, Xin Wang,
Xubing Lu, Qianming Wang, Guofu Zhou, Jun-Ming Liu, Zhifeng Ren, Michael Giersig, Andrzej Herczynski,
Krzysztof Kempa and Jinwei Gao
電極のネットワーク
【124】
The size-distribution of Earth’s lakes in Nature 2016
概要
パーコレーション理論に基づいて,地球上の湖の面積分布を予測し,この
期待値を実際の湖沼センサスデータから評価する.
主要な生態系パターンと過程は湖の大きさに比例しており,湖の面積と個
数の非対称性(大きな湖は少ないが,小さな湖は多い)は,湖の生態系の制約
になっている.しかし,湖の面積分布の記述や評価は不十分である.
ここでは,湖の面積をテール指数およびフラクタル次元の累乗積によって,
評価した.それぞれの期待値は,テール指数:2.05,フラクタル次元:4/3と
なり,湖沼センサスデータでは,テール指数:1.97,フラクタル次元:1.38と
なり,類似したことが確認できた.しかし,8.5㎢未満の呼称は類似しなかっ
た.原因として,小さい湖は力学的な影響を受けやすく,地形の挙動がフラ
クタル性を持たないためである.
新規性
地球上の湖の面積分布の記述手法の提案
LINK
http://www.nature.com/articles/srep29633
少数の大きな湖と多数の小さな湖(NASA)
B. B. Cael and D. A. Seekell
【125】
Universality in boundary domain growth by sudden bridging in Nature 2016
概要
クラスタ集中における境界領域の変化の際の普遍性について,最大集中
時の限界について報告する.
広範囲のパーコレーションモデルにおいて,幅広く観察可能な普遍的な
スケーリング挙動について,初めて報告する.
最大集中時,境界領域が突発的に変化する.モデルとは無関係に,線形次
元Lの2次元正方格子について,境界の界面幅の最大磁化率xは,万能指数
y=1のとき,スケーリングx~Lyを示すとことが分かった.
パーコレーション閾値による臨界境界の急速な変化は,普遍的なスケー
リングxを強調することが分かった.
新規性
臨界境界の急速な変化における普遍性について調査・報告した.
LINK
http://www.nature.com/articles/srep21110
臨界未満の境界領域
A. A. Saberi, S. H. Ebrahimnazhad Rahbari, H. Dashti-Naserabadi, A. Abbasi, Y. S. Cho and J.
Nagler
【126】
Fractality à la carte: a general particle aggregation model in Nature 2016
概要
フラクタル性は,物理的,科学的,生物学的な特徴を決定づけている.そ
のため,フラクタル性を引き起こすメカニズムの理解は重要な問題である.
メカニズムの解明のために,凝集現象によって成長するクラスタに対し
て,いくつかの単純なモデルはフラクタル性をもたらす基本要素の解明に
貢献した.しかし,実際にこれらの要素がどのようにフラクタル性につなが
っているかは具体的に解明されていない.
ここでは,単純かつ多目的な粒子凝集モデルを提案し,任意のフラクタ
ル次元を有する粒子凝集モデルによって,クラスタのフラクタル性と形態
学へのエントロピー的,エネルギー的な寄与を明らかにした.
新規性
フラクタル性をもたらす要素の解明
LINK
http://www.nature.com/articles/srep19505
フラクタル・ダイアグラム
J. R. Nicolás-Carlock, J. L. Carrillo-Estrada and V. Dossetti
【127】
Scaling in topological properties of brain networks in Nature 2016
概要
脳内ネットワークは,相互間のつながりは弱いが全体として高度にモジ
ュール化されている.
脳の基本的な動作原理はシステムレベルでの位相自己組織化であること
を示唆している.この脳内ネットワークのフラクタル性やスケーリング特性
は,機能的な脳組織に関連するあらゆるレベルの地形学的モジュールやサ
ブモジュールの類似した自己組織を示し,レベル内およびレベル間の情報
伝達におけるエネルギーコストが最小限に抑えられることを示した.
また,まばらに存在するいくつかのハブは,それぞれのモジュールの機
能に干渉するが,脳内ネットワークの様々なレベルで残りのモジュールに
干渉することはできないことを示した.
新規性
脳内ネットワークの解析
LINK
http://www.nature.com/articles/srep24926
線虫,猫,猿の脳内ネットワーク
Soibam Shyamchand Singh, Budhachandra Khundrakpam, Andrew T. Reid, John D. Lewis, Alan C.
Evans, Romana Ishrat, B. Indrajit Sharma and R. K. Brojen Singh
【128】
Heterogeneous Structure of Stem Cells Dynamics: Statistical Models and Quantitative Predictions in
Nature 2014
概要
幹細胞集団動態を理解することは,細胞の振る舞いの予測に役立つ.
ここでは,3種類の幹細胞中の高速もしくは低速分裂亜集団及び休止細胞
の共存を,非ガウス統計学的アプローチを用いて同定する.
数学的に分析した結果,幹細胞が分子及び触覚シグナルによって,相互
作用するとき,時間依存のフラクタル挙動を示す.
これらの結果より,幹細胞ダイナミクスの洗練されたモデルは,2つ以上
の分割サブ母集団の存在と,それらのマルチフラクタル特性を考慮に入れ
て,堂宇質性過程を単純化しないことを示唆した.
新規性
幹細胞集団動態の理解
LINK
http://www.nature.com/articles/srep04826
幹細胞集団の異種性
Paul Bogdan, Bridget M. Deasy, Burhan Gharaibeh, Timo Roehrs and Radu Marculescu
【129】
The role of fivefold symmetry in suppressing crystallization in Nature 2016
概要
結晶化の抑制が動態的または熱力学的性質を持つかを検討する.五角形の
双峰型粒子の配列を優先することで,5重対称性の程度を詳説できるモデル
を用いて,5重対称性が面心立法晶への結晶化に動態的,熱力学的影響を持
つことを示した.
5重対称性の度合いは,結晶成長速度にほとんど影響を与えず,ハード球
体システムにおける流体構造によって,結晶の成長が弱く依存するのみで
あることを示した.また,5重対称性を増加させると,一次秩序が二十面体
の豊富な二次相に転移することが分かった.
新規性
ガラス結晶の結晶抑制における5重対称性の影響の調査
LINK
http://www.nature.com/articles/ncomms13225
二十面体の豊富な位相の核形成
Jade Taffs and C. Patrick Royall
【130】
Resolving Fine-Scale Heterogeneity of Co-seismic Slip and the Relation to Fault Structure in Nature
2016
概要
地震による断層の滑り分布は地震の過程の分析のためには重要である.ここでは,
1992年のLanders地震と1999年のHector Mine地震の断層の滑り分布を解析し,そ
の変動と幾何学的断層構造の間の空間的相関を発見した.
スペクトル解析によって観測された共地震滑りの変動は自己アフィンフラクタル
に従う.Landersのフラクタル次元はHector Mineのフラクタル次元よりも高いこと
が分かった.
断層の複雑さが不均質な応力状態を引き起こし,それが共地震滑りを制御する物
理的原因として説明できることを提案した.
この知見は,断面の構造と地震の破壊動作の間の基本的な関係を示している.
新規性
地震による滑り分布を解析することにより,断面の構造と地震の破壊動作の
間の関係の解明
LINK
http://www.nature.com/articles/srep27201 1992年のLanders地震と1999年のHoector Mine地震の相関図
C. W. D. Milliner, C. Sammis, A. A. Allam, J. F. Dolan, J. Hollingsworth, S. Leprince and F. Ayoub
【131】
Mathematical Modelling and Prediction of the Effect of Chemotherapy on Cancer Cells in Nature 2015
概要
癌細胞への薬物の拡散とDNA歩行のフラクタル性を考慮して,分裂拡散
方程式を用いて化学療法の効果のモデル化と予測を行った.
ここでは,腫瘍内の薬物の拡散とDNA歩行の関係をフラクタル系列とし
て作成するFractal Diffusion Equation(FDE)に基づくモデルを構築した.
また,癌の効果の分析に有用な薬物を提案するだけでなく,異なる薬物,
癌に対する効果も分析することが可能であることを示した.
新規性
抗がん剤の投与時の薬物の伝達,拡散,消費の様子を予測するために,FDE
に基づくモデルを構築した.
LINK
http://www.nature.com/articles/srep13583 腫瘍への薬物の伝達,拡散および消費の様子
Hamidreza Namazi, Vladimir V. Kulish and Albert Wong
【132】
Aerosol influence on energy balance of the middle atmosphere of Jupiter in Nature 2015
概要
NASAの宇宙船VoyagerとCassiniの観測に基づき,太陽熱やガス成分の
赤外冷却だけでは木星の大気中のエネルギーバランスが維持できないこと
を示した.エネルギーバランスを維持するために,光とオーロラの化学反応
によって生成されたフラクタル骨材粒子からなる厚いエアロゾル層が中高
経度での成層圏の輻射加熱を促し,局所的にガス加熱の速度を5-10倍に引
き上げていることを示した.
本論文では,このフラクタル骨材粒子が木星以外の惑星でもエネルギー
バランスを維持する上で重要である可能性を示した.
新規性
木星のエネルギーバランスの解明
LINK
http://www.nature.com/articles/srep13583 木星の加熱と冷却の流れ
Xi Zhang, Robert A. West, Patrick G. J. Irwin, Conor A. Nixon and Yuk L. Yung
【133】
Neurons in the primate dorsal striatum signal the uncertainty of object–reward associations in Nature
2016
概要
人間や動物は生き延びるために,可変な報酬や未知の報酬を観察し,行
動する必要がある.そこで,不確実な対象に関する行動を媒介するニューロ
ン機構を解明する.
霊長類の背側線条体の領域を囲むカプセル内のニューロンが報酬の不確
実性を示していることが判明した.
これらの不確実性の応答は,報酬の不確実性に関連するオブジェクトの
存在に依存しており,霊長類の場合,新規のオブジェクト報酬を学習する
につれて,急速に進化することが判明した.
新規性
不確実な報酬に関するニューロン機構の解明
LINK
http://www.nature.com/articles/ncomms12735 背側線条における選択的報酬と不確実な応答
Xi Zhang, Robert A. West, Patrick G. J. Irwin, Conor A. Nixon and Yuk L. Yung
【134】
Fractal cartography of urban areas in Nature 2012
概要
都市部の関連情報への迅速なアクセスは土地利用の理解と規制,その進化に
不可欠である.しかし,都市部の特徴付けと規制は複雑なプロセスが必要であり,
専門家による介入が必要である.
そこで,大都市圏の時空間フラクタル解析を行い,地図作製表現とビルドア
ップ領域の分類を生成するモデルを開発し,最も近似した計画と規制を必要と
する領域を特定する.
また,提案したモデルによって特定された都市部の対応によって,政策規制
が柔軟かつ適応性があり,時間通りに行動する必要があるかを示す.
新規性
世界中の都市部の自動分類のため,首都圏のフラクタル解析を行っ
た.
LINK
http://www.nature.com/articles/srep00527
リスボンの首都圏のフラクタル解析
Sara Encarnação, Marcos Gaudiano, Francisco C. Santos, José A. Tenedório and Jorge M.
Pacheco
【135】
Yuanqi Su, Yuehu Liu, Bonan Cuan, Nanning Zheng, “Contour Guided Hierarchical Model for Shape
Matching”, in ICCV2015, 2015.
【136】
Keywords: Match based on TwoStage Deformation, Shape Match with Part Variation
新規性・差分
概要
・星型モデルはシンプルさと有効性により形状マッチングで一般的である.
しかしながら部品間の緩やかな幾何学的接続が欠点である.そこで,本論文
ではこれらの接続を再考し相互に関連するローカルマッチングのセットに対
するグローバルマッチングを減少させる新しいアルゴリズムを提案する.
ETHZ形状およびInria Horse データセットの結果より提案手法の有用性が示され
た.
・本論文において,与えられた形状テンプレートに類似した物体境界を探索しようとする 画像側か
らのマッチング問題を考慮する.この方法では,形状マッチングは与えられたテンプレートを説明
するのに最適な輪郭断片のサブセットを選択する方法である.通常,輪郭断片の選択はNP困難な組
合せ最適化プロセスが含まれる.そこで,我々はオ
ブジェクト境界の複数の部分を見つけ出し,それらを閉じた境界に組み立てる手法を
提案する.オブジェクト境界が通常壊れているため,ローカル部分をローカライズする
ことはグローバル部分を検出することより簡単である.したがって我々は形状テンプ
レートを部分に分割し,部分テンプレートはオブジェクトの関与する輪郭断片の選択を
補助できる.選択された輪郭フラグメントがオブジェクト境界であることを保証できない
場合は隣接する部分テンプレートにある領域を共有させる.共有領域は選択されたフ
ラグメント間のギャップを埋めるのに効果的であり最終的に境界にリンクされる.
Links 論文
http://www.cv-
foundation.org/openaccess/content_iccv_2015/papers/Su_
Contour_Guided_Hierarchical_ICCV_2015_paper.pdf
著者
http://dblp.uni-trier.de/pers/hd/s/Su:Yuanqi
ETHZデータセットのFPPI対DR曲
線
比較のための全ての方法として0.2の重複率を使用した. 64はパ
ーツを生成するための正方形のサイズである. wは部品バリエー
ションとの一致,woは部品バリエーションなしのマッチを表す.
【136】
オーバーラップ率0.5未満のときの0.3/0.4 FPPIの検出率の比較
ローカリゼーションの
結果
「R」および「NoR」によって示されるAPの試合
の有無
Xiang Fu, Chien-Yi Wang, Chen Chen, Changhu Wang, C.-C. Jay Kuo, “Robust Image Segmentation
Using Contour-guided Color Palettes”, in ICCV2015, 2015.
【137】
Keywords: contour-guided color palette (CCP), mean-shift (MS), bandwidth (BW) parameters
新規性・差分
概要
・堅牢な画像セグメンテーションのためにcontour-guided
color palette(CCP)が提案されている.それは画像の輪
郭と色の手がかりを効率的に統合する.画像に依存するカ
ラーパレットを達成するためにサンプリングされた色空間
内において画像の代表色を見つけるには, mean-shift
(MS)アルゴリズムが存在する.このカラーパレットは漏れ
回避,偽の境界線除去,小領域合併などの後処理技術によ
ってさらに細かく調整された空間領域における予備のセグ
メンテーションを提供する.そこで我々はCCPとMSのセ
グメンテーション性能を比較し分析する.
・本研究ではCCPと呼ばれる新しい方法が輪郭と色の手が
かりを効果的に統合することを示す.他の方法とは異なり,
イメージ依存のカラーパレットを形成するためのガイダン
スとして輪郭キの手がかりを取る.これは元の画像の色の
複雑さを低減し,特有の領域を分離するのに十分な数の代
表的な色を保持する.
Links
論文
http://www.cv-
foundation.org/openaccess/content_iccv_2015/papers/Fu_
Robust_Image_Segmentation_ICCV_2015_paper.pdf
3つの典型的な画像におけるBWパラメータの下
でのMSおよびCCPによる代表色(上)および
境界F-測定(下)の数の比較
3つの典型的な画像におけるMSおよびCCPの代表
的
な色指数に対する累積ヒストグラムのプロット
BSDS300データセット上のいくつか
の
セグメンテーション方法の性能比較
最良の2つの結果が赤色(最良)と青色
(2番目に良い)で強調表示される.
青色,緑色および赤色の曲線は大,中および
小スペクトルBWパラメータを用いて得られる.
Ran Ju, Tongwei Ren, Gangshan Wu, “StereoSnakes: Contour Based Consistent Object Extraction For
Stereo Images”, in ICCV2015, 2015.
【138】
Keywords: StereoSnakes, Stereo correspondence cost
新規性・差分
概要
・従来手法では,計算が非常に冗長である.また,ステレ
オマッチングアルゴリズムの不完全性のために整合性が損
なわれる可能性がある.そこで本論文では領域の代わりに
一貫性のあるオブジェクト輪郭を探索する輪郭に基づく手
法を提案する.また,いくつかのアプリケーションで、私た
ちの方法をステレオ画像編集の基本ツールとしてどのように
使用できるかを示す.
・ステレオマッチングの従来手法では計算コスト非常に高
い,またはアルゴリズムの不正確さにより一貫性のない抽
出につながる可能性がある.そこで1つのビューから別の
ビューに輪郭を一致させることにより画像全体をマッチン
グさせる.輪郭の探索空間は画像全体の画素よりもはるか
に小さいため抽出コストが大幅に削減される.
Links
論文
http://www.cv-
foundation.org/openaccess/content_iccv_2015/papers/Ju_StereoSnak
es_Contour_Based_ICCV_2015_paper.pdf
Adobeオープンデータセットの評価結
果
Adobeオープンデータセットのステレオ画
像
”Lamppost1”の比較結果
上2行は異なる方法の誤ってラベル付けされたピク
セルの数と割合を示す.最後の行は異なるメソッ
ドの平均処理速度を示す.
Federico Camposeco, Torsten Sattler, Marc Pollefeys, “Non-Parametric Structure-Based Calibration of
Radially Symmetric Cameras”, in ICCV2015, 2015.
【139】
Keywords: Structure from Motion (SfM) model, Wide Field of View (WFOV)
新規性・差分
概要
・我々は非中央システムを含む任意の放射対称カメラの内
因性および外因性較正を推定するための新規な2ステップ
法を提案する.最初のSfMモデルから光軸に沿った平行移
動までの構造を仮定してカメラの姿勢を推定する.第2の
ステップとして発注制約を使用してカメラ中心の平行移動
を求めることにより較正する.
・写真においてシーンの異なる部分を強くつなぎ合わせる
ためにWFOVをSfMモデルに挿入することにより,再構成の
品質を向上させることができる.
Links
論文
http://www.cv-
foundation.org/openaccess/content_iccv_2015/paper
s/Camposeco_Non-Parametric_Structure-
Based_Calibration_ICCV_2015_paper.pdf
中央(aおよびb)および非中央カメラcの合成較正
θ(rd)
中枢および非中枢症例の実際の較正
Runze Zhang, Shiwei Li, Tian Fang, Siyu Zhu, “Joint Camera Clustering and Surface Segmentation for
Large-scale Multi-view Stereo”, in ICCV2015, 2015.
【140】
Keywords: multi-view stereo (MVS), structure from motion (SFM)
新規性・差分
概要
・スパースポイントベースのカメラクラスタリングは不均
一な再構成被覆率と高い冗長性の問題を抱えている.そこ
で最初のまばらな復元から大規模マルチビューステレオに
分解するための手法を提案する.
・従来の手法では再構成領域は3D空間内で均一にサンプ
リングされない,再構成シーンのオクルージョンやイメー
ジフィーチャの不一致のためSFMポイントが疎であるとい
った問題がある.そこで我々は制約付きエネルギー最小化
問題として定式化されるジョイントカメラクラスタリング
および表面セグメンテーションにおいての3つの基準を提
案する.また,カメラのクラスタリング問題を確率モデル
のパラメータ推定問題として定式化することにより
General Expectation-Maximizationアルゴリズムによって解
けるようにする.
Links
論文
http://www.cv-
foundation.org/openaccess/content_iccv_2015/papers/Zhang_
Joint_Camera_Clustering_ICCV_2015_paper.pdf
Ncは使用されているカメラの数,Ucはカメラごとの使用時間, SDdは点とそれに最
も近い10点の平均距離の標準偏差である.Pはすべてのクラスタにおける各ピクセル
の平均再構築時間,CRはカバレッジレシオ,tclusterはクラスタリングアルゴリズム
の時間である.tpmvsはすべてのクラスタのpmvsの合計実行時間, ttotalは合計時間
である.
実験時の統計
(a)はクラスタの密集点(b)は別のクラスタの密集点 (c)は(a),(b)の合成であ
る.
クラスタによる密集
点
【141】
Keywords: 3D reconstruction, backscatter, photometric stereo
新規性・差分
概要
・測光ステレオは3D再構成に広く使用されている.しかし,
散乱媒体において光源および物体の両方からの前方散乱光
と媒体から散乱された後方散乱のために現在まで制限され
ている.そこで希薄媒質の一般的な単一散乱仮定の下で光
の伝播の主要なモードに対処する手法を提案する.
・さまざまな照明下での輝度変化から表面法線を推定する
測光ステレオにおいて散乱媒体では光の伝播は散乱によっ
て影響されるため,測光アルゴリズムの性能が低下する.
そこで我々は単一散乱モデルに基づいて後方散乱である3
つの散乱効果を処理するために物体の距離変化に対して表
面変化が小さいと仮定し,物体の小さな表面変動近似を導
入する.
Links
論文
http://www.cv-
foundation.org/openaccess/content_iccv_2015/papers/Murez_P
hotometric_Stereo_in_ICCV_2015_paper.pdf
玩具のロブスターとマスクの表面再構
成
Zak Murez, Tali Treibitz, Ravi Ramamoorthi, David Kriegman, “Photometric Stereo in a Scattering
Medium”, in ICCV2015, 2015.
【142】
Keywords: local color prior (LC), reverse intensity distribution (RID), stereo matching
新規性・差分
概要
・従来のステレオマッチングアルゴリズムはアナグリフ画
像に対処するときに失敗する.この問題を解決し正確な深
度マップを得るために我々は前の局所的な色および逆強度
分布係数を使用する2つの新規データコストを提案する.
・本論文では視差マップを計算するだけでなくアナグリフ
画像の欠落した色情報を同時に色付けするための反復的な
結合方法を提案する.正確な視差マップはLCおよびRIDに
基づく2つの新規アナグリフデータコストを使用すること
によって推定される.欠落した色を復元するために得られ
た視差を用いて既知の色情報をある画像から別の画像に転
送する.次に拡散ベースのカラー化を使用して、遮蔽され
た領域の残りのピクセルを色付けする.正確なカラー化を
達成するために色の類似性に基づく新規のカーネル関数を
導入する.
Links
論文
http://www.cv-
foundation.org/openaccess/content_iccv_2015/papers/Williem_De
pth_Map_Estimation_ICCV_2015_paper.pdf
Williem, Ramesh Raskar, In Kyu Park, “Depth Map Estimation and Colorization of Anaglyph Images
Using Local Color Prior and Reverse Intensity Distribution”, in ICCV2015, 2015.
彩色結果のPSNR比較
実データセットの視差とカラー化の比較
結果
(a)は左画像,(b)は右画像,(c)は提案された方法の視差マップである.(d)はMIの視差マップ,
(e)はセンサス+ GCの視差マップ,(f)はASIFTフローの視差マップである.(g)提案された方法の
着色結果,(h)提案された方法の差分マップ,(i)はP-Joulinの視差マップ,(j)はASIFT-Joulinの差
分マップ,(k)はLinの差分マップである.
Learning mid-level features for recognition,Y-Lan Boureau, Francis Bach, Yann LeCun, Jean Ponce; The IEEE Conference
on Computer Vision and Pattern Recognition (CVPR), 2010
【143】
Keywords: mid-level features
新規性・差分
概要
シーンやオブジェクトの認識に成功した多くのモデルは,低レ
ベルの記述子(GaborフィルタやSIFT記述子など)を中間の複
雑さのより豊かな表現に変換される.この論文では目標は3つ
あります.いくつかの種類のコーディングモジュール(ハード
およびソフトなベクトル量子化,スパースコーディング)とプ
ーリングスキーム(平均または最大を取ること)の包括的な交
差検証を通じて,中間レベルの特徴抽出の各ステップの相対的
重要性を確立することを目指しています.
複数の認識ベンチマークで高い性能を示している.
Links
論文 :
http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=55
39963
Slow and steady feature analysis: higher order temporal coherence in video, Dinesh Jayaraman, Kristen Grauman, The
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016【144】
Keywords:
新規性・差分
概要
・遅い特徴分析を「安定した」特徴分析に一般化することを提
案している。
・重要な考え方は,学習された特徴空間内の高次導関数が小さ
くなければならないという前提を課していることである.
・目的のために,未ラベルビデオから連続的なフレームのタプ
ル上に正則化器を備えた畳み込みニューラルネットワークを訓
練している.
ラベルのないYouTubeやKITTIのビデオを含む5つのさまざま
なデータセットを使用して,提案手法が物体,シーン,およ
びアクションの認識タスクに及ぼす影響を実証した.
Links
論文 :
https://arxiv.org/pdf/1506.04714v2.pdf
Cross-stitch Networks for Multi-task Learning, Ishan Misra, Abhinav Shrivastava, Abhinav Gupta, Martial Hebert, The IEEE
Conference on Computer Vision and Pattern Recognition (CVPR), 2016【145】
Keywords: multi-task
新規性・差分
概要
・マルチタスク学習を用いたConvNetsの共有表現を学習する
ための原則的なアプローチを提案する.
・新しい共有単位「クロスステッチ」を提案している.クロス
ステッチユニットを有するネットワークは,共有およびタスク
特有の表現の最適な組み合わせを学習することができる.
複数のタスクにまたがって一般化することで,トレーニング例の
少ないカテゴリが,ベースライン方法よりも大幅にパフォーマン
スが改善されている.
Links
論文 :
https://arxiv.org/pdf/1604.03539v1.pdf
Deep Metric Learning via Lifted Structured Feature Embedding, Hyun Oh Song, Yu Xiang, Stefanie Jegelka, Silvio
Savarese; The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016
【146】
Keywords: mid-level features
新規性・差分
概要
・挙げられた問題に新しく構造化された予測目的を最適化する
ことによって,アルゴリズムが人工的な特徴の埋め込まれた状
態を知ることが可能となった.
・CUB-200-2011 [37],CARS196 [19],およびOnline
Productsデータセットの実験では,GoogLeNet[33]を使用し
て実験されたすべての埋め込みサイズについて,既存のDeep
featureの埋め込み方法よりも大幅に改善されている.
・Online Product dataset(メトリック学習のためのオンライ
ン製品の23,000クラスの120,000画像)を収集しました.
Links
論文 :
https://arxiv.org/pdf/1511.06452v1.pdf
TI-POOLING: transformation-invariant pooling for feature learning in Convolutional Neural Networks, Dmitry Laptev, Nikolay
Savinov, Joachim M. Buhmann, Marc Pollefeys; The IEEE Conference on Computer Vision and Pattern Recognition
(CVPR), 2016
【147】
Keywords: transformation-invariant
新規性・差分
概要
・回転や位取りの変更など,データの不規則な変化に関す
る事前知識を効率的に処理できるTI-POOLINGを提案して
いる.
・変形したデータセットを考慮したparallel siamese
architecturesに対して全結合層前に出力にTI-POOLING演
算子を適用することで変形不変を実現している.
・既存のデータセットや,変形を加えたデータセットで高い
性能を示している.
Links
論文 :
https://arxiv.org/pdf/1604.06318v2.pdf
CoMIC: Good features for detection and matching at object boundaries, Swarna Kamlam Ravindran, Anurag Mittal; The
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016
【148】
Keywords: CoMIC
新規性・差分
概要
・等長曲線上の安定部分を特定し,その上の角を検出する.
さらに,コーナーに関連する等光度曲線は,背景から部分
を破棄し,マッチングを改善するために使用する.
・CoMIC(最大の安定した等強度曲線のコーナー)ポイ
ントは,最先端の検出器と比較して物体境界領域で優れた
結果をもたらし,同時に内部領域でも同等に機能する.
・既存の検出器よりも高い性能を示している.
Links
論文 :
https://arxiv.org/pdf/1604.06318v2.pdf
Progressive Feature Matching With Alternate Descriptor Selection and Correspondence Enrichment, Yuan-
Ting Hu, Yen-Yu Lin; The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016, pp.
346-354
【149】
Keywords: feature matching
新規性・差分
概要
・画像マッチングのための正確なシステムを確立する上で
の2つの困難に取り組んでいる.第1に,画像マッチング
は特徴抽出のための記述子に依存するが,最適な記述子は
しばしば画像から画像,またはパッチからパッチで変化す
る.第2に,従来のマッチング手法は効率の懸念から対応
候補の小さなセットに対して幾何学的検査を実行する.そ
のため,リコールではパフォーマンスが制限されることが
ある.よって,適応記述子選択と漸進的候補濃縮を画像マ
ッチングに統合することにより,2つの問題に取り組むこ
とを目指す.
・提案手法が既存手法よりも高い性能を示している.
Links
論文 :
http://www.cv-
foundation.org/openaccess/content_cvpr_2016/papers/H
u_Progressive_Feature_Matching_CVPR_2016_paper.p
df
Structured Feature Similarity With Explicit Feature Map, Takumi Kobayashi; The IEEE Conference on
Computer Vision and Pattern Recognition (CVPR), 2016, pp. 1211-1219
【150】
Keywords:SSIM
新規性・差分
概要
・画質評価の分野では,SSIM [27]は,L2メトリックの代
わりに,画像間の有効な類似性を生成している.本稿では,
SSIMに基づく特徴類似度測定法を提案する.
・従来の手法とは異なり,特徴マッチングの重要な要件で
ある高堅牢性のSSIMベースの類似度測定法を構築するた
めに,ヒストグラム形式ではなく,空間グリッド上などで
抽出された特徴配列のテンソル構造上に構築した.
・様々なタスクの実験において,提案手法は特徴マッチング
と分類の両方において良好な性能を示している.
Links
論文 :
http://www.cv-
foundation.org/openaccess/content_cvpr_2016/papers/K
obayashi_Structured_Feature_Similarity_CVPR_2016_p
aper.pdf
A Deeper Look at Saliency: Feature Contrast, Semantics, and Beyond, Neil D. B. Bruce, Christopher Catton, Sasa Janjic;
The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016, pp. 516-524
【151】
Keywords: FCN
新規性・差分
概要
・人間の注視予測と顕著なオブジェクトセグメンテーショ
ンの両方を含む視覚的顕著性モデリングの問題を考察して
いる.
・この論文の目標は,より洗練された視覚的顕著性モデル
を導出することに関連する高水準の考慮事項を特定するこ
とである.
・人間の視線と顕著な物体との関係を探求しており,FCNの
文脈においてこの点についてさらに検討している.
Links
論文 :
http://www.cv-
foundation.org/openaccess/content_cvpr_2016/papers/B
ruce_A_Deeper_Look_CVPR_2016_paper.pdf
ReD-SFA: Relation Discovery Based Slow Feature Analysis for Trajectory Clustering, Zhang Zhang, Kaiqi Huang, Tieniu Tan, Peipei
Yang, Jun Li; The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016, pp. 752-760
【152】
Keywords: ReD-SFA
新規性・差分
概要
・スペクトル埋め込み/クラスタリングについては,デ
ータ内の固有構造を反映する関係グラフをどのように構
築するかという問題に対して,特徴学習とグラフ構築の
ためにRelation Discoveryに基づくReD-SFA手法を提
案している.
・更新された距離と既存の関係グラフによってそれぞれ
パラメータ化された2つのベルヌーイ分布間の不一致を
減らすために,この問題をクロスエントロピー(CE)
最小化問題として定式化している.
・モーションセグメンテーション,時系列クラスタ
リング,群集検出などの様々な軌道クラスタリング
タスクを用いて広範な実験を行った.
・ReDSFAは信頼性の高いクラスタ内関係を高精度
に発見することができ,従来手法と比較して競争力
のあるクラスタリング性能を達成することができた.
Links
論文 :
http://www.cv-foundation.org/openaccess/content_cvpr_2016/papers/Zhang_ReD-
SFA_Relation_Discovery_CVPR_2016_paper.pdf
Tomislav Pejsa, Daniel Rakita, Bilge Mutlu, Michael Gleicher, “Authoring Directed Gaze for Full-Body
Motion Capture”, in SIGGRAPH Asia, 2016.
【153】
Keywords: Full Body MoCap, Directed Gaze
新規性・差分
概要
身体のモーションキャプチャのみならず,視線についても
キャプチャしてアニメーションに反映させる.目の領域は
非常に小さいが,動きがあると人物の意図が(アニメーシ
ョンにおいても)わかるようになる.視線に合わせてアニ
メーションを微調整することもできるようになった.
・モーションキャプチャによる身体の動作や視線による意
図の把握ができるようになり,グラフィックスのアニメー
ションを生成する際もよりリアルなものができる
Links
論文 http://delivery.acm.org/10.1145/2990000/2982444/a161-
pejsa.pdf?ip=218.41.245.155&id=2982444&acc=OPENTOC&key=4D4702B0C3E38B35%2E4D4702B0C3E38B35%2E4D4702B0C3E38B35%2E383ADA7593775D6F&CFID=7
03437228&CFTOKEN=56619126&__acm__=1481581883_8c9c1b5abff36972b22742eab195fe49
プロジェクト
ビデオ https://vimeo.com/191892437
Helge Rhodin, Christian Richardt, Dan Casas, Eldar Insafutdinov, Mohammad Shafiei, Hans-Peter
Seidel, Bernt Schiele, Christian Theobalt, “EgoCap: Egocentric Marker-less Motion Capture with Two
Fisheye Cameras”, in SIGGRAPH Asia, 2016.
【154】
Keywords: Ecocentric View, Motion Capture
新規性・差分
概要
2台の魚眼カメラから,カメラ装着者のマーカレスモーシ
ョンキャプチャを行う(右図).屋外環境においてもモー
キャプができたり,屋内のデスク周りなど狭い環境でのモ
ーキャプ,VRにリアルなモーションを反映させることが
可能.姿勢推定はResNet-101を使用,MPIIやLeeds
Sports dataにて初期値を学習し,魚眼カメラによる姿勢推
定にファインチューニング.
・魚眼による一人称カメラより,装着者の姿勢を推定しモ
ーキャプやVRへの投影を行うことに成功した
Links
論文 https://gvv.mpi-inf.mpg.de/projects/EgoCap/content/rhodin2016egocap.pdf
プロジェクト https://gvv.mpi-inf.mpg.de/projects/EgoCap/
動画 https://www.youtube.com/watch?v=v-4E-jtOet0
Shu Liu, Xiaojuan Qi, Jianping Shi, Hong Zhang, Jiaya Jia, “Multi-scale Patch Aggregation (MPA)
for Simultaneous Detection and Segmentation”, in CVPR, 2016.
【155】
Keywords segmentation:
新規性・差分
概要
オブジェクトの同時検出,セグメンテーションを行うため
のフレームワークを提案している.mid-levelのパッチを介
することでオブジェクトインスタンスを検出し,セグメン
トする.各パッチ上でネットワークを設計し,オブジェク
トインスタンスを推論するための迅速かつ効果的なpatch
aggregation algorithmを行う.VOC2012 segmentation val
and VOC2012 SDS valのデータセットで62.1% と 61.8%
の結果が得られている.
我々は統一されたエンドツーエンドの訓練可能なネットワ
ークに基づいて新しいSDSシステムを達成しました.生の
画像を入力として取り,パッチを分類して分割します.次に,
ネットワークのパッチ出力からオブジェクトを推測するた
めに,単純な集約プロセスが採用されます.我々は,SDSのた
めのいくつかのデータセットについて我々の方法を評価し
た.
Links
論
文:http://www.cse.cuhk.edu.hk/leojia/pap
ers/mpa_cvpr16.pdf
Sayanan Sivaraman, Mohan Manubhai Trivedi, “Vehicle Detection by Independent Parts for Urban Driver
Assistance”, IEEE, 2013.
【156】
Keywords: detection by parts, machine learning, occlusions, vehicle detection
新規性・差分
概要
・本論文では, 市街地運転者支援のためのVDIP
(Vehicle Detection by Independent Parts)を提案す
る.VDIPとは, 都市部での走行において、対向車、先
行車、側方車、および部分的に遮蔽された車両を検出
するための軽量で堅牢なフレームワークを用いる.シ
ステムは軽量で、リアルタイムで実行されます。現実
世界のオンロードデータセットに関する広範な定量分
析が可能である.
・従来研究では, 車両の視界に問題があり、相対的な位置によっ
て, 車両の外観にばらつきが生じるため, カメラを車両に搭載す
ると, 死角が生じる.
・提案手法では, 部分一致分類を訓練するために使用し, 検出さ
れた部分からサイドビュー車両を形成する.階層的学習プロセ
スにより, 効率的な評価を得られるVDIPを取得する.部品と車
両の追跡にはカルマンフィルタを使用する.
論文:http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=6532394
Links
Bin Tian, Ye Li, Bo Li, Ding Wen, “Rear-View Vehicle Detection and Tracking by Combining Multiple Parts
for Complex Urban Surveillance”, IEEE, 2014.
【157】
Keywords: Kalman filter (KF), Markov random field (MRF), part-based object detection, tracking,
vehicle detection.
新規性・差分
概要
・本論文では, 固定カメラを用いた複数の車両用突状
部に基づく後方視界検出と追尾法を述べる.本手法で
は, リアルタイム性能で車両追跡を実装することがで
きる.
・従来研究では, 複雑な都市環境, 悪天候, 照明の変化, 照
明条件, 車の姿勢, 外観情報によって車両検出するのに困
難となる.
・提案手法では, 車両は、ナンバープレートやリアランプ
など複数の凸部からなる物体として扱い, 位置決めし, マ
ルコフランダムフィールドモデルを用いて確率グラフが
構築する.カルマンフィルタを用いて車両の軌道を推定
し、追跡に基づく検出手法を提案する.
論
文:http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=6
627986
Links
Sayanan Sivaraman, Mohan M. Trivedi, “Real-Time Vehicle Detection Using Parts at Intersections”, IEEE,
2012.
【158】
Keywords: Driver Assistance, Real-time Vision, Machine Learning.
新規性・差分
概要
・本論文では, 車両のパーツを用いて車両のリアルタ
イム検出を行うかつ軽量なアプローチを提案する.部
品による完全な車両検出は、現実世界のデータで評価
され、リアルタイムで実行できる.
・従来研究では,車両がカメラの視界に出入りするときに
発生し, オクルージョンが生じ, 車両検出を複雑にしてし
まう.
・提案手法では, 学習で訓練された分類器を使用して, 自
動車部品を個別に検出する.学習された一致分類を使用
して部分応答に一致する.パーツ構成は、サポートベク
ターマシン分類を使用して評価する.
論
文:http://ieeexplore.ieee.org/stamp/stamp.jsp?arnum
ber=6627986
Links
Zahid Mahmood, Tauseef Ali, Shahid Khattak, Samee U. Khan, Laurence T. Yang, “Automatic Vehicle
Detection and Driver Identification Framework for Secure Vehicle Parking”, IEEE, 2015.
【159】
Keywords: Eigenface, Euclidian distance, Face Recognition, Haar-like, Adaboost.
新規性・差分
概要
・本論文では, 車両の駐車スペースの安全性を高めるた
めに誰が乗っているかを識別する.実験結果より, リ
アルタイムで公共の車両駐車場に使用できる.
・従来手法では, 車両認識を行っているが, セキュリティ
目的のための手法が行われていない.
・提案手法では, 3つのステップに分かれる.1つ目に
Haar-like特徴とAdaBoostを用いて, 車両を矩形領域に抽
出する. 2つ目にEigenfacesベースの顔を抽出する.3つ
目に、顔画像をデータベース内の顔画像と比較すること
によってドライバを識別する.
論文:
http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=742096
7
Links
Huieun Kim, Youngwan Lee, Taekang Woo, and Hakil Kim, ”Integration of Vehicle and Lane detection for
Forward Collision Warning System”, IEEE, 2016.
【160】
Keywords: Eigenface, Euclidian distance, Face Recognition, Haar-like, Adaboost.
新規性・差分
概要
・本論文では, リアルタイムで前方衝突警告システムの
ための車線と車両の検出を提案する.実際の道路を用
いた結果, リアルタイムでも使用できる.
・従来手法では, スマートフォンをベースとした運転手支援
システムは、外的条件および介在接触するためには困難で
ある.また, ステレオカメラの設置などでコストがかかる.
・提案手法では, 車線と車両の検出を統合することにより,
道路の情報を使用して, 運転環境の正確な情報を提供し 誤
報を防ぐことができる.
論文:
http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=768470
3
Links
Maroš Bláha, Christoph Vogel, Audrey Richard, Jan D. Wegner, Thomas Pock, Konrad Schindler,
“Large-Scale Semantic 3D Reconstruction: an Adaptive Multi-Resolution Model for Multi-Class
Volumetric Labeling”, in CVPR, 2016.
【161】
Keywords :
新規性・差分
概要
セマンティック3D再構成のmulti-resolution formulationを
提案している.これまでの方法では計算コストが高く,メ
モリの消費量が多いいため,限られたシーン(small
scenes)small scenesと低解像度に限られている.そこで
マルチ解像度に適応した処理スキームを提案している.
結果の品質を損なうことなく,マルチ解像度に適応した処
理スキームでこれまで手法よりもはるかに大きなシーンを
処理することが可能となっている.
Links
論文:https://www.ethz.ch/content/dam/ethz/special-
interest/baug/igp/photogrammetry-remote-sensing-
dam/documents/pdf/cvpr2016_blaha_vogel_etal.pdf
youtube:https://www.youtube.com/watch?v=Hlbcv0nU-N4
Ravi Kumar Satzoda, Mohan M. Trived, ”IEfficient Lane and Vehicle detection with Integrated Synergies
(ELVIS)”, CVPR, 2014.
【162】
Keywords: vehicle detection, lane detection, integrated
system
新規性・差分
概要
・本論文では, 車載情報を組み込んだELVIS(Efficient
Lane and Vehicle detection with Integrated Synergies)
を用いた効率的な車線と車両の検出を行う.実験結果
より, 既存の技術より35%少ない平均計算コストでよ
り信頼性の高い識別をした.
・従来手法では, 車両・車線検出の両方を行った研究はされ
ていない.理由としては, 両方を行うと, 識別率・処理時間
が従来研究より劣るからである.
・提案手法では, 車載情報を組み込んだELVIS(Efficient
Lane and Vehicle detection with Integrated Synergies)を用
いる.本稿では, 特徴量にはHOG特徴, 識別機にはSVMを用
いる.
論文:http://www.cv-
foundation.org//openaccess/content_cvpr_workshops_2014/W
17/papers/Satzoda_Efficient_Lane_and_2014_CVPR_paper.p
df
Links
Vincent Dumoulin, Jonathon Shlens, Manjunath Kudlur, “A Learned Representation for Artistic Style”, in
ICLR submission, 2017.
【163】
Keywords: Style Transfer, Scalable Deep Network
新規性・差分
概要
・絵画のスタイルトランスファーにおいて,混合度を表現
できるネットワークを表現.
Links
論文 https://arxiv.org/pdf/1610.07629v3.pdf
プロジェクト https://research.googleblog.com/2016/10/supercharging-
style-transfer.html
ビデオ https://www.youtube.com/watch?v=6ZHiARZmiUI
スタイルトランスファーの表現方法の改善を行い、複数のスタイルの
絵画を混ぜ合わせることに成功.DNNによる表現方法をスケーラブ
ルにすることによりスタイルの度合いを調整でき,その混合にも成功
した.右下図にはDNNによるアーキテクチャが示されている.
Content Loss L_cやStyle Loss L_sを最適化.L_cは各層のアクティベ
ーションにより,L_sは各層のアクティベーションから計算されるグ
ラム行列を最適化.
Jonathan Shen, Noranart Vesdapunt, Vishnu N. Boddeti, Kris M. Kitani, “In Teacher We Trust: Learning
Compressed Models for Pedestrian Detection”, in arXiv pre-print 1612.00478, 2016.
【164】
Keywords: Pedestrian Detection, Knowledge Distillation
新規性・差分
概要
歩行者検出において,ResNetやACFをベースにして
Knowledge Distillation (知識の蒸留)を行う.右図のように,
TeacherやStudentにあたる識別器を準備して,Ground
Truthによる誤差関数だけでなく,TeacherとStudentの誤
差も最適化する.正解値との比較がHard Lossなのに対し
てTeacher-Studentの比較をSoft Lossと呼称.
・教師と生徒によるSoft Lossを用いて歩行者検出の識別器
を最適化した.
・State-of-the-artには及ばなかったが,一定の成果を得た
Links
論文 https://arxiv.org/pdf/1612.00478v1.pdf
プロジェクト
C N Dickson, A M Wallace, M Kitchin, B Connor, ”Improving infrared vehicle detection with polarisation”,
IEEE, 2013.
【165】
Keywords: vehicle detection, polarimetric histogram,
新規性・差分
概要
・本論文では, 赤外線偏光画像に基づく記述子によって,
赤外線強度のみに基づくものよりも優れた車両検出性
能を提示する.
・従来手法では, 赤外線画像における車両の検出を行うが,
車両と似たような物体が存在すると識別が困難となる.
・提案手法では, 車両の偏光度および角度から構築された新
しい偏光ヒストグラム記述子を示す.車両用ヒストグラム
は車両の上部と側面に関連する特定の角度での偏光値を用
いる.
論文:
http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=6740492
Links
Chun-Ming Tsai, Jun-Wei Hsieh, Frank Y. Shih, B Connor, ”Motion-Based Vehicle Detection in Hsuehshan
Tunnel”, IEEE, 2016.
【166】
新規性・差分
概要
・本論文では, 雪山トンネルで車両を検出するための動
きに基づく車両検出を提案する.提案された方法が雪
山トンネル内の車両を検出するのに有効であることを
示した。
・従来手法では, 長いトンネルでのカメラビジョンベースの
車両検出, カメラから現れるビデオ品質は, 動的な照明環境,
カメラ解像度, カメラエージング, カメラ位置, カメラ視野
角, 異質および車速によって車両検出が困難となる. さら
に, 車両の色, 形, 大きさ, 外観のため検出しにくい.
・提案手法では, 照明補償、移動に基づく検出、および車両
識別アルゴリズムを使用することによって時間の複雑さを
低減する.
論文:
http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=7449856Links
Keywords: vehicle detection, Hsuehshan tunnel, vehicle
identification
Fractal dendrite-based electrically conductive composites for laser-scribed flexible circuits in Nature 20
概要
3DフラクタルAgマイクロデンドライトの制御可能な合成を実証する.
提案する3Dフラクタルデンドライト(FDs)をエンジニアリングポリマ樹脂に
注入した.そのFDsを銀の体積の0.97%(重量の8%)注入したとき,極めて低いパ
ーコレーション閾値を達成した.
これはFDsのナノサイズの突起に起因することが判明した.低温状態で単純
な焼結過程によって,お互いに融着し,導電ネットワークを形成する.
モンテカルロ法を用いてシミュレートされたパーコレーション閾値は,空間
的広がりと接触確率の両方の観点から実験結果と一致する.
新規性
3Dフラクタルデンドライトを用いた導電性複合材
料の開発
LINK
http://www.nature.com/articles/ncomms9150 複雑な差の異なる銀ベースの3Dフラクタルデンドライトと
それをエンジニアリングポリマ樹脂に導入した結果
Cheng Yang, Xiaoya Cui, Zhexu Zhang, Sum Wai Chiang, Wei Lin, Huan Duan, Jia Li, Feiyu Kang and
Ching-Ping Wong
【167】
Observational evidence confirms modelling of the long-term integrity of CO2-reservoir caprocks in
Nature 2016
概要
大気中のCO2を地底に貯蔵することが考えられているが,貯蔵したCO2 の漏出を防
ぐ第一の封印はキャップロックに依存する.キャップロックとは,天然ガスや石油を含
有する層の上を覆う不透過性の地層のことである.天然のCO2貯蔵層は何百年もCO2を
安全に貯蔵しているが,仮に貯蔵しているものがCO2を含んだ海水の場合,キャップ
ロックが想定外の反応を示す可能性がある.
そこで,地質学的にCO2貯蔵に必要な時間スケールを満足する程度, CO2に曝され
たCO2貯蔵層とキャップロックの鉱物反応を調査した.
鉱物反応の伝播はレドックス感受性の鉱物溶解反応および炭酸塩の沈殿によって遅
延されることが分かった.これは,105年当たり約7cmキャップロックへの浸透を減少
させる.
この距離は予測よりも1桁小さいことが分かった. この結果より, 長期間CO2に
曝されたキャップロックの輸送制限反応を考慮に入れる意味を証明している.
新規性
長期間CO2を含んだ海水に曝されたキャップロックの状態の調査
LINK
http://www.nature.com/articles/ncomms12268
ユタ州グリーン川南部のリトルグランドウォッシュフ
ォールトの北90mを掘削した地層の持つCO2の様子
N. Kampman, A. Busch, P. Bertier, J. Snippe, S. Hangx, V. Pipich, Z. Di, G. Rother, J. F. Harrington, J. P.
Evans, A. Maskell, H. J. Chapman and M. J. Bickle
【168】
Fractal Nature of Metallic and Insulating Domain Configurations in a VO2 Thin Film Revealed by
Kelvin Probe Force Microscopy in Nature 2015
概要
Kelvinプローブ力顕微鏡法を用いて,エピタキシャルによって
成長したVO2 / TiO2薄膜の表面仕事関数および空間分布を調査し
た.
粒界をほとんど含んでいない試料では,金属から絶縁体への転
移を通して,金属と絶縁体の持つ表面仕事関数値の観察が可能で
あった.表面仕事関数マップから推定される金属断片は2次元パー
コレーションモデルに基づいて抵抗の変化を示す.
また, Kelvinプローブ力顕微鏡法の推定値は,ドメイン構成の
フラクタル性を明らかにした.
新規性
・表面仕事関数とVO2 / TiO2薄膜の抵抗値を測定し,
温度依存性ドメイン構成とその金属から絶縁体への転移への
影響を調査
・ドメイン構成がパーコレーションモデルの特徴であるフラク
タル構造を形成することを示唆
LINK
http://www.nature.com/articles/srep10417
TiO2基板上に成長させた厚さ15nmの
VO2薄膜のX線回折パターン
Ahrum Sohn, Teruo Kanki, Kotaro Sakai, Hidekazu Tanaka and Dong-Wook Kim
【169】
【170】
Keywords: light field (LF), depth from light field (DfLF)
新規性・差分
概要
・LF焦点スタックの2つの提案特徴を使用してLFから深さ
を回復させる手法について説明する.1つ目の特徴は非遮
蔽である画素が合焦スライスを中心とする焦点深度寸法に
沿って対称性を示すことである.2つ目は仮定された奥行
きマップとLFからの合成焦点スタックとの間の差異に基づ
くデータ一貫性測定である.この2つの特徴はシーンの深
さを抽出するための反復最適化フレームワークで使用でき
る.
・本手法では焦点スタックの対称解析と分析-合成に基づ
いた新しいデータ一貫性測定の2つの焦点スタックの特徴
を求めてDfLF技術を使用新たな深さを提案する.
Links
論文
http://www.cv-
foundation.org/openaccess/content_iccv_20
15/papers/Lin_Depth_Recovery_From_ICC
V_2015_paper.pdf
Haiting Lin, Can Chen, Sing Bing Kang, Jingyi Yu, “Depth Recovery from Light Field Using Focal Stack
Symmetry”, in ICCV2015, 2015.
ビュー数分
析
ガウス雑音によるデータセットの誤差比
較
屋内と屋外のデータセットにお
ける
視差再構成結果
Using Spatial Order to Boost the Elimination of Incorrect Feature Matches, Lior Talker, Yael Moses, Ilan
Shimshoni; The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016, pp. 1809-
1817
【171】
Keywords:
新規性・差分
概要
・明示的に計算することなく正しい一致の数を推定する効
率的な方法を提案する.また,画像間の重なり領域を推定
している.
・順列と自然な仮定との間のケンドール距離メトリックを
用いて、正しい一致と不正確な一致の分布を推定する方法
を示している.
・Structure from Motionパイプラインの画像マッチングス
テージの実行時間をを正確にマッチングされた特徴点の約
80%を維持しながら,約99%減少させることができる.
・各画像の特徴の空間的順序のみを使用して特徴マッチン
グの分析のための実データセットに対するこの推定の有効
性を実証した.
Links
論文 :
http://www.cv-
foundation.org/openaccess/content_cvpr_2016/papers/Talker_Using
Discriminative Multi-Modal Feature Fusion for RGBD Indoor Scene Recognition, Hongyuan Zhu, Jean-
Baptiste Weibel, Shijian Lu; The IEEE Conference on Computer Vision and Pattern Recognition (CVPR),
2016, pp. 2969-2976
【172】
Keywords:Multi-Modal
新規性・差分
概要
・rgbdシーン認識のための新規な識別的マルチモーダル融合フレ
ームワークを導入し、同時にすべてのサンプルについてモダリテ
ィ間およびモダリティ間の相関を考慮する学習された特徴を弁別
的かつコンパクトに規則化する.
・マルチモーダル層からの結果は、より低いCNN層に逆伝播する
ことができ,したがってCNN層およびマルチモーダル層のパラメ
ータは、収束するまで反復的に更新される.
・大規模なSUN RGB-Dデータセットの実験は,我々の
方法が画像セグメンテーションなしで最先端を達成した
ことを示している.
・SUN-RGBDデータセットにおける精度,長さ,学習の
オーバーヘッドの点で,従来手法を上回った.
Links
論文 :
http://www.cv-
foundation.org/openaccess/content_cvpr_2016/papers/Z
hu_Discriminative_Multi-
Temporal Action Localization With Pyramid of Score Distribution Features, Jun Yuan, Bingbing Ni, Xiaokang
Yang, Ashraf A. Kassim; The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016,
pp. 3093-3102
【173】
Keywords: Action Localization
新規性・差分
概要
・各検出ウィンドウを中心とした複数の解像度で動き
情報を取得するために,PSDF(Pyramid of Score
Distribution Feature)を提案する.この特徴は未知の作
用位置および持続時間の影響を緩和しかつ従来の検出
アプローチよりも有意な性能向上を示す.
・THUMOS'15とMPII Cooking Activities Datasetで
アクションローカリゼーションフレームワークをテ
ストした.両方のデータセットにおいて以前の試み
よりも大幅なパフォーマンス改善を示した.
Links
論文 :
http://www.cv-
foundation.org/openaccess/content_cvpr_2016/pap
ers/Yuan_Temporal_Action_Localization_CVPR_2
Kernel Approximation via Empirical Orthogonal Decomposition for Unsupervised Feature Learning, Yusuke
Mukuta, Tatsuya Harada; The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016,
pp. 5222-5230
【174】
Keywords: Kernel Approximation
新規性・差分
概要
・カーネル近似法について,訓練データから推定された確率分布
を用いて経験的直交分解を用いて、複雑な後処理を行わずに良好
な汎化性能を有する手法を提案している.
・カーネル近似を用いた階層的特徴抽出は,既存の方法よりも優
れた性能を示すことを示している.
・合成されたデータと実際のデータを用いた実験は,本提案
手法がNystrom法に匹敵する.また,ランダム特徴法より優
れた性能をもたらしたことを示した.
Links
論文 :
http://www.cv-
foundation.org/openaccess/content_cvpr_2016/papers/Mukuta_Kernel_Approx
imation_via_CVPR_2016_paper.pdf
Modality and Component Aware Feature Fusion for RGB-D Scene Classification Anran Wang, Jianfei Cai,
Jiwen Lu and Tat-Jen Cham; The IEEE Conference on Computer Vision and Pattern Recognition (CVPR),
2016
【175】
Keywords:
新規性・差分
概要
・畳み込みニューラルネットワーク(CNN)は物体認識には優
れているが,シーン画像の空間的変動が大きいことは,通常,
標準のfull-image CNN特徴がシーン分類に最適でないことを意
味する.よって,広い空間的な柔軟性を可能にするフレームワ
ークを検討し、代わりに、画像ごとに多数の領域提案から得ら
れたローカルCNN特徴のFisherベクトル(FV)符号化分布を考
慮する.
・プロポーザルベースのFV機能とグローバルなCNN機能の両
方について回帰分析を組み合わせて組み合わせることで,
SUNRGBDデータセットとNYU depthデータセットV2におい
て,シーン分類で高いパフォーマンスを達成した.
Links
論文 :
https://www.researchgate.net/profile/Anran_Wang2/publ
ication/299852654_Modality_and_Component_Aware_F
eature_Fusion_for_RGB-
D_Scene_Classification/links/5706490708aecbf68ba9a
提案フレームワーク
Constrained Deep Transfer Feature Learning and its Applications, Yue Wu, Qiang Ji; The IEEE Conference
on Computer Vision and Pattern Recognition (CVPR), 2016
【176】
Keywords:
新規性・差分
概要
・データ不足の対象領域で特徴学習を行うための制約付きの深い伝
達特徴学習フレームワークを提案している.
・固定された特徴空間において転送学習を実行する代わりに,ソー
スドメインとターゲットドメインとの間の意味的ギャップを最小に
するために,より高いレベルの特徴空間において転送と特徴学習を
反復的に同時に実行することを提案している.
・可視領域からの知識を転送することによってサーモアイの検出の
ための熱的特徴学習のための提案された.また,クロスビューの表
情認識に適用した枠組みを適用した.
Links
論文 :
http://homepages.rpi.edu/~wuy9/CVPR16/Constr
ained%20Deep%20Transfer%20Feature%20Lear
ning%20and%20its%20Applications.pdf
Object Tracking via Dual Linear Structured SVM and Explicit Feature Map,Jifeng Ning, Jimei Yang,
Shaojie Jiang, Lei Zhang, Ming-Hsuan Yang; The IEEE Conference on Computer Vision and Pattern
Recognition (CVPR), 2016, pp. 4266-4274
【177】
Keywords:
新規性・差分
概要
・シンプルで効率的なデュアル線形SSVM(DLSSVM)ア
ルゴリズムを導入し,トラッキング中の学習と実行を高速
化している.
・明示的な特徴マップを使用して特徴表現の交差カーネル
を近似し,追跡性能を向上させている.
・提案されたDLSSVMトラッカーが,
ベンチマークデータセットにおいて,
従来手法に対して有利に機能すること
を示した.
Links
論文 :
http://www.cv-
foundation.org/openaccess/content_cvpr_2016/papers/Ning
_Object_Tracking_via_CVPR_2016_paper.pdf
Comparing optimization processes for the Struck [8]
and DLSSVM methods.
Xinchao Wang , Vitaly Ablavsky, Horesh Ben Shitrit, Pascal Fua, ”Take your eyes off the ball: Improving ball-
tracking by focusing on team play”, Computer Vision and Image Understanding, 2014.
【178】
Keywords: Tracking, Video analysis and event recognition, Occlusion , reasoning,Behavior , Sports video, Tracking the invisible
新規性・差分
概要
・本論文では,チームスポーツでの正確なビデオベース
のボールトラッキングには, オクルージョンが生じ, ボ
ールを追跡するのが困難となる.そのため, どのプレー
ヤーがボールを所持しているかを決定するという観点
から追跡を定式化する手法を示す.実験結果より, ロン
グバスケットボールとサッカーの試合に適用した場合
の追跡率が向上した.
・従来手法では, 必要に応じて頻繁にオブジェクトを再検出
し, いくつかのフレームにわたって結果を集約する最新のト
ラッキングは堅牢性を高めますが、オブジェクトが個々の
フレームで検出するのが難しい場合でも失敗する可能性が
ある.
・提案手法では, 最初に選手を追跡し, 誰がボールを持って
いるかを決定し, 次に選手の軌跡を利用して信頼できるボー
ル追跡を達成する.球の占有を明示的に説明する状態空間
を導入することによって, 我々は、CRFとして損失関数を
定義する.
論文:
http://ac.els-cdn.com/S1077314213002300/1-s2.0-S1077314213002300-
main.pdf?_tid=09278e22-c1c5-11e6-94c2-
00000aacb35e&acdnat=1481696448_ee5ddf7d1925c015e47508ca913657e1
Links
Xinchao Wang , Vitaly Ablavsky, Horesh Ben Shitrit, Pascal Fua, ”Take your eyes off the ball: Improving ball-
tracking by focusing on team play”, Computer Vision and Image Understanding, 2014.
【179】
Keywords: vehicle detection, Hsuehshan tunnel, vehicle
identification
新規性・差分
概要
・本論文では,移動, 追跡などが可能な車両検出手法を提案する.
シミュレーション結果は, 提案されたシステムが単純で堅牢であ
り, 高速道路監視システムにリアルタイムで使用可能である.
・従来手法では, 必要に応じて頻繁にオブジェクトを再検出し, オ
ブジェクトが個々のフレームで検出するのが難しい場合でも失敗
する可能性がある.
・提案手法では, 車両検出は状態遷移、すなわち「車両到着」,
「車両移動」, および「車両出発」という逐次プロセスとして考
え, 選択されたAOI内の前景マスクの比率または照明ピクセルの比
率は、提案された状態機械の特徴として使用する.計算上簡単で
あり, 車両の存在を検出するのに有効である.
論文
http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=6485465:
Links
Xinchao Wang , Vitaly Ablavsky, Horesh Ben Shitrit, Pascal Fua, ”Take your eyes off the ball: Improving ball-
tracking by focusing on team play”, Computer Vision and Image Understanding, 2014.
【180】
Keywords: vehicle detection, Hsuehshan tunnel, vehicle
identification
新規性・差分
概要
・本論文では, 形態と色の違いを利用した新しい多地点背景モデ
ルに基づく統合車両検出とカウントアルゴリズムを使用する.
実験結果より, 照明および背景の変化に対してロバストである.
・従来手法では, 昼夜の照明条件が異なるため, 車両を捕捉し昼夜
に統一された方法はない.
・提案手法では, 特徴背景モデルに基づく統合された車両の検
出・カウントを行い, 昼と夜の両方で車両を強調して表示するた
めに形態フィルタの使用し, 捕捉のための色差特徴を用いて, 車両
を検出する.
論文
http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=6727057
Links
Feng Zhou, Yuanqing Lin, “Fine-grained Image Classification by Exploring Bipartite-Graph Labels”, in
CVPR, 2016.
【181】
Keywords :
新規性・差分
概要
食べ物の画像が与えられたとき,fine-grained object recognition engineはど
の料理に属しているか判断できるか?
ultra-fine grained画像認識は,画像検索の際のより多くのアプリケーション
に応用するためのカギとなる.しかし,画像データが少ないと,クラス間の
かすかな違いを識別することが困難となる.ultra-fineは超微細なオブジェク
トクラス間の関係をもたらす.BGL(bipartite-graph labels)による超微細な
オブジェクトクラス間の関係を活用するための新しい手法を提案している.
6つのレストランから収集された37,885の食品画像と合計
975のメニューからなる新しい食品ベンチマークデータセ
ットを作成している.この新しい食品と他の3つのデータ
セットに関する実験結果は,BGLがfine-grainedオブジェ
クト認識での前進を示している.
Links
論文:http://www.cv-
foundation.org/openaccess/content_cvpr
_2016/papers/Zhou_Fine-
Grained_Image_Classification_CVPR_2
016_paper.pdf
Z.Q. Xiang, X.L. Huang and Y.X. Zou, ”An Effective and Robust Multi-view Vehicle Classification Method
Based on Local and Structural Features”,IEEE , 2016.
【182】
Keywords: SIFT, SVM, vehicle classification
新規性・差分
概要
・本論文では, 車両を2つまたは3つのタイプに分類する従来の方
法とは異なり, リアルタイムで交通システムにおける車両分類の
手法を示す.実験結果は, 提案手法が95.95%の平均精度をリア
ルタイムに車両を分類し, 本手法の有効性を示した.
・従来手法では, 固定カメラから1つの視点から撮影した画像のみ
を考慮しており, 視点の変化は考慮していない.
・提案手法では, SIFTを用いて局所特徴を取得し, L2ノルムスパー
ス符号化技術を用いて計算コストを削減し, 車両の建物構造を構
造的特徴として抽出し, SVMを用いて分類する.
論文
http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=7544999
Links
Lukas Bossard, Matthias Dantone and Christian Leistner,“Apparel Classification with Style ”, in ACCV,
2012.
【183】
Keywords: label, Expectation-Maximization algorithm, CNN
新規性・差分
概要 ノイズラベルを含むデータと含まないデータを共に学習することで,
ノイズを多く含むような画像におけるCNNの頑健性を向上させてい
る.ノイズラベルとGTラベルとの差分をEMアルゴリズムより推論
し,ネットワーク全体の重みを最適化する
Links
Paper:http://www.ee.cuhk.edu.hk/~xgwang/papers/xiaoXYHWcvpr15.pdf
ノイズラベルと,ラベルの両方を含む大規模な衣類分類データセ
ットを提案している.また提案手法によりノイズラベルを修正で
き,分類性能が向上している.(右表)
(上) 提案手法概要
(左) ノイズラベルのグラフィカルモデル.2種類の潜在変
数により,入力画像とノイズの多いラベルとの間のギャッ
プを埋める.
Bolei Zhou, Yuandong Tian, Sainbayar Sukhbaatar, Arthur Szlam, and Rob Fergus,“Simple Baseline for
Visual Question Answering”, in arXiv:1512.02167, 2015.
【184】
Keywords: label, Expectation-Maximization algorithm, CNN
新規性・差分
概要 シーン認識に単純な語彙情報を組み合わせた手法をベースラインと
して提案する.問題文からの単語が示すクラスの特徴と画像からの
特徴を連結して予測する.
Links
Paper:https://arxiv.org/pdf/1512.02167v2.pdf
評価実験では,RNNを使用する一般的な従来手法と比較し,同等
の性能を示している.
Christopher Thomas, Adriana Kovashka, “Seeing Behind the Camera: Identifying the Authorship of a
Photograph”, in CVPR, 2016.
【185】
Keywords: Photographers, CNN, PhotographerNet
新規性・差分
概要
・画像から撮影した写真家を推定
・Low-level特徴,High-level特徴を用いてSVMでF値を評
価
・Hybrid-CNNのpool5層が最高の結果を残した
・カメラマンを推定するという新規の問題設定を提案
・41人の有名な写真家によって撮られた180,000枚以上の
データセットを作成した.
Links
論文 http://www.cv-
foundation.org/openaccess/content_cvpr_2016/papers/Thoma
s_Seeing_Behind_the_CVPR_2016_paper.pdf
ポスター
http://people.cs.pitt.edu/~chris/files/2016/cvpr2016_photograph
er_poster.pdf
・Low-level特徴
Color:L*a*b*のヒストグラムでビン数が30
GIST:256×256ピクセルにリサイズしてGIST特徴抽出
SURF:SURF特徴をk-means(k=500)でクラスタリング,
bag-of-wordsでベクトル量子化
・High-level特徴を用いてSVMでF値を評価
Obhect Bank:物体識別の結果を特徴としたもの
CaffeNet:ILSVRC2012 challengeのpre-train
Hybrid-CNN:物体認識とシーン認識の1183分類3.6M枚
の 画像で学習されたネットワーク
PhotographerNET:Hybrid-CNNのアーキテクチャに
・データセットをtest set(10%)とtraining set(90%)で分割
・training setの中でCNN用のtest(10%)とtrain(90%)に分割
・SVMは線形カーネルを使用
・他クラス分類にはone-vs-all法を用いる
Kota Yamaguchi, Takayuki Okatani, Kyoko Sudo, Kazuhiko Murasaki and Yukinobu Taniguchi, “Mix and
Match: Joint Model for Clothing and Attribute Recognition”, in BMVC, 2015.
【186】
Keywords: clothing recognition,attribute recognition
新規性・差分
概要
・衣服にはスカートとドレスを同時に着用しないことやジャケ
ットとシャツが好ましい組み合わせであることなどがあり,そ
の共起性を用いてConditional Random Field(CRF)により衣服属
性推定を行っている.
・Chictopia datasetとDress dataseに対して属性推定
・姿勢推定を行ってから局所特徴を用いて属性推定を行う
という従来の手法に対し,CRFを用いることにより精度向
上
Links
論文
http://www.bmva.org/bmvc/2015/papers/paper051/paper051.p
df
著者
http://vision.is.tohoku.ac.jp/~kyamagu/ja/
Michael Edwards and Xianghua Xie, “Graph Convolutional Neural Network”, in BMVC, 2016.
【187】
Keywords:Graph CNN,MNIST
新規性・差分
概要
・グラフを用いたCNNによる文字認識
・MNISTの識別問題に対して規則的なグリッド
をした場合と不規則なグリッドをした場合対し
てそれぞれ94.23%と94.96%の精度で識別可能
・グラフベースの認識にCNNを適用
・プーリング演算の代わりにAlgebraic Multigridを使用
Links
論文
http://www.bmva.org/bmvc/2016/papers/paper114/paper114.p
df
Qiang Zhang and Abhir Bhalerao, “Loglet SIFT for Part Description in Deformable Part Models:
Application to Face Alignment”, in BMVC, 2016.
【188】
Keywords:
新規性・差分
概要
・Deformable Part Models (DPM)のパーツ表現のための
SIFTアルゴリズムを提案
・提案手法であるloglet gradientフィルタを用いることに
より精度向上
・DPMのためのSIFTアルゴリズム提案
・Loglet SIFTによりDPMベースの識別において精度を大
幅向上
Links
論文
http://www.bmva.org/bmvc/2016/papers/paper031/paper031.p
df
Appendix
http://www.bmva.org/bmvc/2016/papers/paper031/sup031.pdf
Wei Liu, Chaofeng Chen, Kwan-Yee K. Wong, Zhizhong Su and Junyu Han, “STAR-Net: A SpaTial
Attention Residue Network for Scene Text Recognition”, in BMVC, 2016.
【189】
Keywords: STAR-Net, CNN, scene recognition
新規性・差分
概要
・シーンテキストを認識するためのCNNの提
案
・Spatial Attention Mechanismにより,テキス
トの
歪みを除去することにより,歪みのない画像に
対して特徴抽出を行える.
・spatial attention mechanismとresidue
convolutional blocksを用いて特徴を抽出
・シーンテキスト認識のためのCNNであるSpaTial
Attention Residue Network (STAR-Net)を提案
・歪みの少ない場面テキストの最先端の方法に匹敵するパ
フォーマンスを達成し,大きい歪みを伴うシーンテキスト
については,提案手法の方法より優れている.
Links
論文 http://www.bmva.org/bmvc
/2016/papers/paper043/paper043.pdf
Yancheng Bai, Wenjing Ma, Yucheng Li, Liangliang Cao, Wen Guo and Luwei Yang, “Multi-Scale Fully
Convolutional Network for Fast Face Detection”, in BMVC, 2016.
【190】
Keywords: Fully Convolutional Network, Face Detection
新規性・差分
概要
・Fully Convolutional Networknによる高速顔
検出のためのフレームワークの提案
・異なるスケールモデルが同じ畳み込み特徴
マップを共有することにより高速な顔検出を
行う.
・VGA画像用のGPUで約100FPSを実行可能
・FDDB,AFW,Pascal faces datasetで最新の
手法を上回る精度を実現
Links
論文 http://www.bmva.org/bmvc/2016/
papers/paper051/paper051.pdf
Yanan Miao, Xiaoming Tao and Jianhua Lu, “Robust 3D Car Shape Estimation from Landmarks in
Monocular Image”, in BMVC, 2016.
【191】
Keywords: Monocular image, 3D shape
新規性・差分
概要
・単眼画像から3Dオブジェクト形状を再構成.
・3次元形状とカメラ姿勢の両方を推定するロバストなモ
デルを提案
・単眼画像の2次元ランドマークから3次元の車の形状を推
定する際に,観測値の異常値を処理するための堅牢なモデ
ルを提案
・State-of-the-artの手法と比較し,優れた性能を記録
Links
論文
http://www.bmva.org/bmvc/2016/papers/paper099/
paper099.pdf
Suraj Srinivas and Venkatesh Babu, “Learning Neural Network Architectures using Backpropagation”, in
BMVC, 2016.
【192】
Keywords: CNN
新規性・差分
概要
・CNNにおけるニューロンの総数を制限するために使用さ
れる新しい訓練可能なパラメータTri-State ReLUの提案
・小規模ネットワークと大規模ネットワークの両方でこの
手法を実験的に検証し,予測精度に影響を与えることなく,
少ないパラメータでモデルを学習できるに成功
・アーキテクチャ選択を行い,かなり少数のパラメータを
持つモデルを学習
・Tri-State ReLUによるニューロンの総数を少なくするた
めの正則化項の提案
Links
論文 http://www.bmva.org/bmvc/2016/
papers/paper104/paper104.pdf
Tomoki Watanabe, Satoshi Ito and Kentaro Yokoi, “Co-occurrence Histograms of Oriented Gradients for
Pedestrian Detection”, in PSIVT, 2009.
【193】
Keywords: human detect ,pedestrian detect co-occurrence, local feature
新規性・差分
概要
・輝度勾配の共起性を用いた特徴の提案
・人物検出のデータセットであるDaimlerChrysler ,
INRIA datasetによる実験でstate-of-the-artを
上回る精度
・輝度勾配の共起性を用いた特徴であるCo-occurrence
Histograms of Oriented Gradients(CoHOG)の提案
・CoHOGのmiss rateはHOGの半分未満であった.
Links
論文 http://link.springer.com/chapter/10.1007
/978-3-540-92957-4_4
Xiaopeng Zhang, Hongkai Xiong, Wengang Zhou, Weiyao Lin, Qi Tian, “Picking Deep Filter
Responses for Fine-grained Image Recognition”, in CVPR, 2016.
【194】
Keywords :
新規性・差分
概要
鳥や犬などのサブカテゴリまで認識することは,微小な違
いな為に,非常に困難な問題である.学習段階とテスト段
階の両方で,オブジェクト/part level annotationsを使用し
ない自動細分化認識手法を提案する.
特定のパターンに対応する特有のフィルタを見つけ,新し
いpositive sample miningとpart model retrainingを繰り返
し交互に行うことで一連のパーツ検出器を学習する.フィ
ッシャーベクトルの空間的に重み付けされた組み合わせを
介してdeep filter responsesをpoolする.これらの技術をす
べて統合することで,はるかに強力なframe workが生成さ
れ,CUB-200-2011とStanford Dogsで行われた実験では,
提案されたアルゴリズムが既存の方法より優れていること
が示されている.
Links
論文:http://www.cv-
foundation.org/openaccess/content_cvpr
_2016/papers/Zhang_Picking_Deep_Filt
er_CVPR_2016_paper.pdf
Sam Hare, Amir Saffari, Philip H.S.Torr, “Struck:Structured Output Tracking with Kernels”, in ICCV2011.【195】
Keywords:GPU-based tracking, Tracking-by-detection, structured output SVMs, budget maintenance
新規性・差分
手法
結果
概要
・物体追跡手法の提案.主流となっている適応型追跡法の
一つであり,トラッカーの設計時に追跡対象の事前情報を
組み込めないような場合でも高い追跡性能を誇る.オクル
―ジョンや輝度変化に対しても頑健な現在主流な追跡手法
の一つである.
・従来の適応型追跡手法では,追跡問題を分類タスクとし
て扱い,追跡対象のオンライン学習を行う.しかし,更新
にはラベル付されたデータとの対応付けが必要であり,こ
この対応付けが重要となる.本稿では構造化された出力予
測に基づいて追跡対象のラベル付を必要としないフレーム
ワークを設計.
・右側が従来の追跡手法.左が今回提案する手法.
・従来手法と比べて高い追跡性能を誇ることが実証された.
Links
論文:http://www.robots.ox.ac.uk/~tvg/publications/2015/struck-
author.pdf
コード:
http://www.samhare.net/research/struck/code
著者:
http://www.samhare.net/research/struck
Yi Wu, Jongwoo Lim, Ming-Hsuan Yang, “Online Object Tracking: A Benchmark”, in CVPR2013.【196】
Keywords: performance evaluation, Object tracking, benchmark dataset
新規性・差分
手法
結果
概要
・現在の物体追跡手法はオンライン追跡が主流となってお
り,様々な追跡手法が発表されている.ここで本論文は,
同じデータセットに対して代表的なオンライン追跡の手法
を用いてどのアルゴリズムがどのように有効なのかを検証
している.今後の追跡手法の方向性についても提案した論
文である.
・大規模な性能評価のため,29の公式で入手可能な追跡ア
ルゴリズムを統一されたコードライブラリに統合した.こ
ちらはプロジェクトページにて公開されている.
・データセットには,追跡に悪影響を与える隠れや輝度変
化のどの11の要因のアノテーション付けを行った50個のデ
ータを用意している.こちらも公開されている.
・3つの評価方法(OPE,TRE,SREと呼んでいる.詳細は論文を参照)を使
い,29の追跡アルゴリズムを評価した.また,それぞれの評価方法で追跡精
度と成功率の側面を評価している.
・結果は表のようになっており,
それぞれの評価方法では変わるが,
SCM,Struck,ASLAのアルゴリズ
ムが主に優秀な成績をマークした.
Links
論文 :http://www.cv-
foundation.org/openaccess/content_cvpr_2013/papers/Wu_On
line_Object_Tracking_2013_CVPR_paper.pdf
プロジェクト:
https://sites.google.com/site/trackerbenchmark/benchmarks/v1
0
【197】
新規性・差分
結果
概要
・他のスパースモデリングでの手法は追跡対象と背景の区
分が不十分であり,オクル―ジョンに弱くなってしまうと
いう欠点があった.提案手法ではスパース係数を利用して,
オクル―ジョンに強い,より堅牢な追跡方法を提案してい
る.また,適応的なテンプレート更新手法で追跡エラーを
少なくしている.
・MILやVTDなどの代表的な追跡手法と
比べ,エラー率の少なさや追跡精度に提
案手法が優れていることを示している.
Links
論文 :
http://ieeexplore.ieee.org/document/6247880/?arnumber=6247
880
プロジェクト:
http://faculty.ucmerced.edu/mhyang/pubs.html
Xu Jia, Huchuan Lu, Ming-Hsuan Yang, “Visual Tracking via Adaptive Structural Local Sparse
Appearance Model ”, in IEEE2012.
Keywords: performance evaluation, Object tracking, benchmark dataset
・スパースモデリングを用いた追跡手法.オクル―ジョン
や輝度変化に対して頑健な追跡アルゴリズムであり,2016
年現在も主力となる手法である.
【198】
Keywords: Commonality discovery,First-person video
新規性・差分
結果
概要
・FPVでの視点情報解析の研究の一つである.多人数間で
共有される視覚モチーフの発見を目的とする.複数人物に
ウェアラブルカメラを装着し,ビデオ間の類似性,ビデオ
間の視点分散,注意を向ける方向の3つの側面からクラス
タリング問題で視点解析手法の提案を行う.
・教師なし共通性クラスタリングのフレームワークを軸と
して手法を提案した.データの作成には,ある場所に3,4
人を割り当て,それぞれ指定した物体を見るということの
みを指示したデータを取得した.この指示物体がグラウン
ドトゥルースとなる.また全部で44人のデータを取得して
いる.特徴抽出にはSIFT特徴とフィッシャーベクターを用
いたものと,PlaceNetの6層から抽出した特徴を用いた.
・他の注意視点解析手法に比べ早く,そして正確な視覚モチーフの発見を行
うことができることが分かった.
Links
論文 :http://link.springer.com/chapter/10.1007/978-3-319-
46475-6_12
Ryo Yonetani, Kris M. Kitani,Yoichi Sato, “Visual Motif Discovery via First-Person Vision”, in
ECCV2016.
Jia Xu, Lopamudra Mukherjee, Yin Li, Jamieson Warner, James M. Rehg, Vikas Singh, “Gaze-Enabled
Egocentric Video Summarization via Constrained Submodular Maximization”,in CVPR2015.
【199】
Keywords:FPV,Video Summarization
新規性・差分
概要
・FPVでの視点情報解析の研究の一つである.この論文で
は,視点解析による結果から映像の要約を行う.視点追跡
を使用することで,動画の要約タスクが大幅に向上するこ
とを示した.
・提案手法では,視線情報を入力し,時系列ウィンドウに
要約する.データには15時間以上の動画を用いて要約を行
っている.結果として,視点追跡を用いることで注視情報
が要約の関連性が普遍的に改善することを示している.
Links
論文 :
http://www.cv-
foundation.org/openaccess/content_cvpr_2015/papers/Xu_Ga
ze-Enabled_Egocentric_Video_2015_CVPR_paper.pdf
プロジェクト:
http://pages.cs.wisc.edu/~jiaxu/projects/ego-video-sum/
Cheng Li, Kris M. Kitani, “Model Recommendation with Virtual Probes for Egocentric Hand Detection”, in
ICCV2013
【200】
Keywords:Object Detection , Egocentric , FPV
新規性・差分
概要
・FPVの利点の一つである手の詳細な映像の取得を生かし
た研究である.本論文では,ピクセルレベルで手の検出を
行っており,手と指の形状から,精巧な運動や作業技能の
分析やジェスチャーの認識に繋げることが可能である.
・外観特徴と相互相関特徴を用いてピクセル単位の手検出
器を構築している.また,ピクセル単位の手検出を行った
結果から,セグメンテーションを行い,手領域の区分に成
功している.
Links
論文 :
http://www.cv-
foundation.org/openaccess/content_iccv_2013/papers/Li_Mod
el_Recommendation_with_2013_ICCV_paper.pdf
David Liu, Tsuhan Chen, “Unsupervised Image Categorization and Object Localization using Topic
Models and Correspondences between Images”, in ICCV2007
【201】
Keywords:
新規性・差分
結果
概要
・教師なしでの物体のローカリゼーション,画像のカ
テゴリー付けをトピックモデルの応用と画像間対応を
改良することで行う論文.
・トピックモデルの応用としてはトピックをカテゴリ
ーとして捉え,VWsを単語として扱う.トピックモ
デルにはPLSAのモデルを用いている.この時rは文章
の多義性を扱えることが可能になっている.
画像間の対応付けとしては[A spectral technique for
correspondence problems using pairwise constraints]
を参考に行っている.従来の類似性に報酬マップをあ
たえる手法ではオブジェクトの変形が大きい場合に誤
った報酬マップになってしまうが本手法では報酬マッ
プではなく外観情報に依存した学習を行うことで解決
を行っている.
・Caltech-4 とCaltech-backgroundを用いて教師なし物体認識及び物
体ローカリゼーション実験を行った.
Links
論文 :
Gregory Rogez, James S. Supancic III, Deva Ramanan, “First-Person Pose Recognition Using
Egocentric Workspaces”, in CVPR2015
【202】
Keywords:Pose Recognition ,FPV
新規性・差分
結果
概要
・FPVの利点の一つである手の詳細な映像の取得を生かし
た研究である.胸部に取り付けたカメラで腕及び手の姿勢
推定を行う..
・手の外観とワークスペースの位置が相関することを利用
して,胸部のカメラでの作業空間座標から深度特徴を用い
てSVMで手の姿勢認識を行うトレインデータで3D空間座
標を生成する
・手,腕,物体,背景からなる作業空間上においてリアルタイムでの姿勢推
定を行うことが実現できた.Links
論文 :http://www.cv-
foundation.org/openaccess/content_cvpr_2015/papers/Rogez_
First-Person_Pose_Recognition_2015_CVPR_paper.pdf
Ryo Yonetani, Kris M. Kitani, Yoichi Sato, “Recognizing Micro-Actions and Reactions From Paired
Egocentric Videos”, in CVPR2016
【203】
Keywords: FPV,Action Recognition
新規性・差分
結果
概要
・FPVでのインタラクション解析の研究である.本論文で
は,会話をする2人の頭部にカメラを装着し,動作の解析
と反応の解析を行うことで相互の人物のインタラクション
を2人の映像を用いて解析する.
・話し手と聞き手の動作と反応を確認するために一対のデ
ータを使って解析することを提案している.データは全部
で1226組のビデオを取得している.
・FisherVectorを用いた手法や,累積変位を用いた手法,TCNN,IDTなどの
手法で実験を行い,一対のデータを使って解析することで認識精度が向上す
ることを確認した.
Links
論文 :
http://www.cv-
foundation.org/openaccess/content_cvpr_2016/papers/Yoneta
ni_Recognizing_Micro-Actions_and_CVPR_2016_paper.pdf
Zhefan Ye, Yin Li, Yun Liu, Chanel Bridges, Agata Rozga, James M. Rehg, “Detecting bids for eye
contact using a wearable camera”, in IEEE2015
【204】
Keywords:Cameras, Face, Feature extraction, Estimation, Autism, Glass
新規性・差分
概要
・FPV研究の利点である,インタラクション解析の研究を
行っている.本論文では,視点カメラを用いて子供から大
人の目へと向かうアイコンタクトの検出を行う研究を示し
ている.
・子供と大人の間で行われるインタラクションのデータセ
ットを提示している.また,提案手法であるPEECとCRF
に基づいた手法は最新手法と比べ,高い精度でのアイコン
タクト木演出を行うことが可能となっている.
Links
論文 :
http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=7163095
Krishna Kumar Singh, Kayvon Fatahalian,Alexei A. Efros, “KrishnaCam: Using a Longitudinal, Single-
Person, Egocentric Dataset for Scene Understanding Tasks ”, in IEEE2016
【205】
Keywords: Cameras, Visualization, Streaming media, Urban areas, Computer vision, Legged locomotion, Global Positioning System
概要
・FPV研究に用いることのできる大規模データセットを提
供している.本データセットの特徴としては,コンピュー
タビジョン大学院生の9か月間の生活をGPS位置,加速度
および身体の向きデータとともに記録し,分析が施されて
いる.データは70時間(7600万フレーム)ほど記録されてい
るこのデータでは,記録者のより自然な生活の動きをとっ
ているので,意図していたことを途中でやめたり,動きの
ない食事をとるなどのデータも記録されている.シーン映
像を与えたときの記録者の自然な動きからの行動予測など
に活用することができる。
Links
論文 :
http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumb
er=7477717
プロジェクト
Yipin Zhou, Tamara L. Berg, “Temporal Perception and Prediction in Ego-Centric Video”, in ICCV2016
【206】
Keywords: Prediction,Egocentric,FPV
新規性・差分
概要
・一人称視点動画を用いて行動予測に関する研究を行った.
本論文では2つの実験を行った.1つは時系列順に短いスニ
ペットを並びかえる,2つ目は対象のビデオに対し,その
前後のスニペットのどちらが対象とするビデオに近い行動
かを識別した.
・RGB特徴,シーン認識,行動認識の3要素を用いること
を提案している.提案手法と従来手法の比較を行うと,提
案手法の方が認識精度が高いという結果を得た.
Links
論文 :
https://www.computer.org/csdl/proceedings/iccv/2015/8391/00/
8391e498.pdf
Zdenek Kalal, Krystian Mikolajczyk, and Jiri Matas, “Tracking-Learning-Detection”, in IEEE2012.【207】
Keywords:Tracking-by-detection,
新規性・差分
概要
・リアルタイム追跡手法を提案した研究である.オンライ
ン追跡の代表的な手法としても有名.追跡,学習,検出を
行うフレームワークを構成することで長期的な追跡を行う
ことを可能とした.
・TLDは見え方の変化や大きさの変化に強いトラッカーで
ある.この中核をなすアルゴリズムはP-NLearningと呼ば
れる学習手法である.追跡対象の軌道に近い窓をpositive
とし,遠い窓をnegativeとして半教師学習を行っている.
これにより追跡対象の更新が可能となる.
Links
論文 :
http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=6104061
&tag=1
Lin Wu,Chunhua Shen,Anton van den Hengel , “Deep Recurrent Convolutional Networks for Video-
based Person Re-identification: An End-to-End Approach ”, in arXiv2016
【208】
Keywords: Video-based person re-identification,Gated recurrent unit,Recurrent convolutional networks
概要
・ビデオベースの人物再同定で新たなリカレントネットワ
ークを提案している.ビデオを入力すると全フレームから
CNNの全結合層を盛り込んだ特徴が抽出される.全時系列
のステップからの特徴は完全な配列のための外観情報を与
えるため,PoTで時系列情報を統合する.際同定には[色情
報とフロー情報を用いる.データセットにはILIDSと
PID2011を用いている.
Links
論文 :
https://pdfs.semanticscholar.org/2d61/30f043e69849fc0443bb
489c5d21f933eddd.pdf
Deciphering DNA replication dynamics in eukaryotic cell populations in relation with their averaged
chromatin conformations in Nature 2016
概要
DNA複製の非局所モデルを提案する.このモデルは,出芽酵
母およびヒト細胞の両方の実験データと一致し,複製開始速度や
複製フォーク密度および複製DNAの割合の時間的な経過をいかな
るパラメータに依存しないで予測できる.
この結果は,真核生物のDNA複製のダイナミクスを制御するプ
ログラムが,複製の開始に起因して確率論的に発生する現象であ
ることを示唆している.
新規性
複製開始の位置や時間に関して不確実性を考慮に入
れて, DNA複製の非局所モデルを提案した.
LINK
http://www.nature.com/articles/srep22469
発火起点と未発火起点のみを区別した
DNAの発火プロセスのモデル化
A. Goldar, A. Arneodo, B. Audit, F. Argoul, A. Rappailles, G. Guilbaud, N. Petryk, M. Kahli and O. Hyrien
【209】
Dynamic Texture Recognition via Orthogonal Tensor Dictionary Learning in ICCV2015
Yuhui Quan, Yan Huang and Hui Ji
概要
Dynamic Texture(DT)のパターンを認識する
ために,スパースなコード化を基にした認識手
法を提案する.DT認識のために,構造テンソ
ル辞書を利用する.提案した辞書は,既存の辞書
よりも高次元ノンデータに対して高速かつスケ
ーラブルである.
さらに,提案した辞書学習法に基づいて,
DT記述子を開発した.その記述子は,既存のア
プローチよりも優れた適応性,識別性,スケー
ラビリティを備えている.
複数のデータセットの実験によって,これら
の利点を証明した.
新規性
DTパターン識別のための構造テンソル辞書の提案
LINK
http://www.cv-
foundation.org/openaccess/content_iccv_2015/papers/Quan_Dynami
時間コストと減衰挙動
(左)辞書の時間コスト
(中)特徴抽出の時間コスト
(右) 目的関数値の減衰挙動
提案手法を様々なデータセットに適用した結果
【210】
【211】
新規性・差分
概要
・本論文では, ブースティングされたHOG(Histogram of
Oriented Gradients)特徴を用いて, 静的画像における歩行者検
出と車両検出を組み合わせた手法を提案する.
・HOGを用いた手法では, 特徴ベクトルのサイズが大きいため、
トレーニングサンプルの数が制限され、分類の計算コストが増加
する.
・提案手法では, 車両の影の下にある影の特徴は道路画像におけ
る車両検出の重要な特徴であり,建物、雲、花、フェンスなどの非
車両領域を効果的に推定する.
論文
http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=7139161
Links
Keywords: AdaBoost HOG, SVM, vehicle detection
Diqing Sun, Junzo Watada, “Detecting Pedestrians and Vehicles in Traffic Scene Based on Boosted HOG
Features and SVM ”, IEEE, 2015.
Meirav Galun, Tal Amir, Tal Hassner, Ronen Basri, Yaron Lipman, “Wide baseline stereo matching with
convex bounded distortion constraints”, in ICCV2015, 2015.
【212】
Keywords: epipolar consistent bounded distortion(EBD), Bounded distortion (BD)
新規性・差分
概要
・広いベースライン設定で対応を見つけることは困難であ
る.既存の手法は対応させるためのより優れた特徴記述子
の開発,エピポーラ線制約の正確な修復に焦点を当ててき
た.そこで我々は近似エピポーラ拘束が与えられた際の対
応関係を見つけるという困難な問題に焦点を当て,変形モ
デルを統合する新しい方法を提案する.
・対の静的シーンの広いベースライン画像における対応関
係を発見するための新規な方法を紹介する.エピポーラ制
約を考慮してもマッチングがあいまいであることに留意し,
エピポーラ線に沿った幾何学的変化をモデル化するために
変形マップを使用する.具体的には2つの画像と推定され
た基本行列を与えられた際に画像を関連づけ,2つの要件
を満たす幾何学的マップを計算する.
Links
論文
http://www.cv-
foundation.org/openaccess/content_iccv_2015/papers/Galun_
Wide_Baseline_Stereo_ICCV_2015_paper.pdf
提案手法で計算された深度マッ
プ
HerzjesuとFountainデータセットのすべて
のイメージペアについて計算された中央値
Herzjesu(左)およびFountain
(右)
データセットのF measure
【213】
Keywords: depth, albedo, shading, optical flow, surface contours
新規性・差分
概要
・我々は本質的な画像推定の問題として,ビデオシーケン
スからの高密度深度マップの推定を定式化する.また,
我々のアプローチは複数のイントリンシック画像の推定を
相乗的に統合する.提案手法は複数の固有画像の推定を組
み合わせているため,ベースライン法と比較して深度推定
が改善される.
・ビデオから一貫したアルベドとシェーディングを抽出す
る方法と組み合わせ,RGBと深度のペアのデータベースか
らのラベル転送を使用する奥行き推定のためにサンプルベ
ースのフレームワークを構築する.その際,アルベド,シ
ェーディング,およびピクセル値からサーフェス境界を予
測する輪郭検出器を作成し,これを使用して深度境界の推
定を改善する.また,推定された深さマップのメトリック
精度を改善するために、モーションからの疎構造を提案手
法と統合する.
Links
論文
http://www.cv-
foundation.org/openaccess/content_iccv_2015/papers/Kong_Intri
nsic_Depth_Improving_ICCV_2015_paper.pdf
Naejin Kong, Michael J. Black, “Intrinsic Depth:Improving Depth Transfer with Intrinsic Images”, in
ICCV2015, 2015.
人の歩行およびカメラの動きのあるリビングルームのシ
ーン
(c)は提案手法の結果であり,SfMキューの欠落にかかわ
らず,全体的に深さを十分に推定している.
【214】
Keywords: detects repeated 3D structures, 3D MRF
新規性・差分
概要
・我々は与えられた奥行き画像からカメラの視点で見るこ
とができない3Dの領域に拡張する手法を提案する.提案
手法が実世界のデータを用いて単一の深度画像から完全な
3Dシーンを完成させ,シーンの新規な視点から完全な深
度マップを合成することができることを実証する.さらに,
定量的かつ定量的に方法を評価することを可能にする広範
な合成三次元形状に関する結果を示す.
・経路計画,音声波進行分析,新しい視点生成などの多く
のアプリケーションにおいてカメラでは見られないジオメ
トリの欠落部分を使用する必要がある. そこで,現在の
奥行きマップを拡張するために複数の容積測定推定を生成
し,これらすべて併合する.
Links
論文
http://www.cv-
foundation.org/openaccess/content_iccv_2015/papers/Korman_Pee
king_Template_Matching_ICCV_2015_paper.pdf
新しい視点の深度合成
(a)は照用に示されたRGB画像,(b)は入力 - 単一視点の奥行きマッ
プ,(c)はinputdepth-map(b)から計算された新しい視点デプスマ
ップ,(d)は完成した奥行きマップである.
Simon Korman, Eyal Ofek, Shai Avidan, “Peeking Template Matching for Depth Extension”, in
ICCV2015, 2015.
Zhuoyuan Chen, Xun Sun, Liang Wang, “A Deep Visual Correspondence Embedding Model for Stereo
Matching Costs”, in ICCV2015, 2015.
【215】
Keywords: , semi-global method (SGM), Markov Random Field(MRF)
新規性・差分
概要
・本稿ではステレオマッチングのためのデータ駆動マッチ
ングコストについて述べ,畳み込みニューラルネットワー
クを介した新規な深い視覚に対応した埋め込みモデルを提
案する.KITTIとMiddleburyのデータセットを用いた実験
より,モデルの有効性実証された.
・本稿ではマッチングコスト計算ステップに焦点を当て,
あいまいさに対処するためのデータ駆動型アプローチを提
案する.畳み込みニューラルネットワークを介した新規な
深い視覚に対応した埋め込みモデルは明度を豊かな埋め込
み空間に明示的にマッピングする.これにより外観データ
を活用して画像パッチ間の視覚的相違を学習する.さらに,
我々の学習ベースのマッチングコストをSGMに組み込む.
Links
論文
http://www.cv-
foundation.org/openaccess/content_iccv_2015/papers/Chen_A
_Deep_Visual_ICCV_2015_paper.pdf
エラーしきい値を3ピクセルに設定し,KITTIベンチマー
クに
おけるパイプラインの定性的評価の結果
ミドルベリのデータに深い埋め込みコス
トを
使用した勝者の結果の例
Behjat Siddiquie, Rogerio S. Feris, Larry S.Davis, “Image ranking and retrieval based on multi-attribute
queries”, in CVPR, 2011.
【216】
Keywords: Multi-Attribute, BMRM
新規性・差分
概要
マルチアトリビュートを用いた画像の画像の順位付けと検
索を行う新たな手法を提案.Wild(LFW)、FaceTracerお
よびPASCAL VOCデータセットのLabeled Facesに対し、
提案手法が有効であることがわかった.
複数属性の正解が与えられた場合、正解に存在しない他の
属性も用いることで、多属性検索を可能にしている。
Links
論文:
http://rogerioferis.com/publications/marr
_cvpr2011_camReady.pdf
Keywords: human action, computer vision, Hough, tracking
行動認識のための新しいframe workの提
案.
Hough変換とRandom forestsを組み合わせた
新しいframe workの提案.
classification
A Yao, J Gall, L Van Gool, “A Hough transform-based voting framework for action recognition”, Computer
Vision and Pattern Recognition (CVPR), 2010.
【217】
Links
論文:
http://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=553988
3
概要
新規性・差分
手法
結果
localization
Weizmann, KTH, UCF Sports, UCR
datasetに対して評価.
Katsunori Ohnishi, Atsushi Kanehira, Asako Kanezaki, Tatsuya Harada, “Recognizing Activities of Daily
Living with a Wrist-mounted Camera”, in arXiv2016
【218】
Keywords:FPV , Action Recognition
新規性・差分
概要
・FPV研究での自己行動推定を行っている.行動と手にも
つ物体には相関があるという仮定の元,物体を大きく撮影
することができれば,より行動分類が詳細に可能と考えて
いる.そこで手首にウェアラブルカメラを装着し,行動識
別を行った.
・ウェアラブルカメラを手首につけ日常行動のデータを作
成した.また,行動分類のための新しいアルゴリズムを作
成している.結果にはヘッドマウントカメラとリストマウ
ントカメラを比較した際の精度を出力しており,全体的に
リストマウントカメラの精度が高いことを示した.
Links
論文 :
https://arxiv.org/pdf/1511.06783.pdf
【219】 Karol Gregor, Ivo Danihelka, “DRAW: A Recurrent Neural Network For Image Generation”, 2015.
Keywords: Deep Recurrent Attentive Writer,Image generation
概要
・画像生成のためのDeep Recurrent Attentive
Writer (DRAW) neural network architecture を
紹介する.DRAW networksは複雑な画像の反復
的な構築を可能にする連続的な可変自己符号化
フレームワークを用いている.
結論
・DRAW neural network architecture を紹介し,
ハウスナンバーの写真などの現実的な自然画像
を生成する能力と,二値化されたMNIS生成に
関する結果を改善することを実証した.また,
画像生成だけでなく画像分類にも有益であるこ
とを立証した.
Links
論文 https://arxiv.org/pdf/1502.04623v2.pdf
【220】
Oriol Vinyals, Alexander Toshev, “Show and Tell: A Neural Image Caption
Generator”, in CVPR, 2015.
Keywords: A Neural Image Caption Generator
概要
・コンピュータビジョンと機械翻訳の進歩を組み合
わせた,画像について自然な文章を生成するために使
用できるモデルを提示する.このモデルは訓練画像が
与えられた場合,ターゲット記述文の尤度を最大にす
るように訓練される.
結論
・画像を自動的に閲覧してWord Neighbors を生成
するneural network systemであるNICを提示した.
NICは画像をコンパクトな表現にエンコードし,続
いて対応する文を生成するa convolution neural
network に基づいている.実験で定性的結果と定量
評価の点でNICの堅牢性が示された. Links
論文 http://www.cv-
foundation.org/openaccess/content_cvpr_2015/papers/Vin
yals_Show_and_Tell_2015_CVPR_paper.pdf
【221】Licheng Yu, Eunbyung Park, “Visual Madlibs: Fill in the blank Image
Generation and Question Answering ”, 2015.
Keywords: Image Generation
概要
・10,738個の画像を対象とした360,001個の自然言語
記述からなる新しいデータセットを紹介する. Visual
Madlibsデータセットは、自動的に作成された空白を
埋めるテンプレートを使用して収集される.Visual
Madlibsデータセットのいくつかの分析を提供し,焦
点を絞った記述生成,および画像の複数選択の質問応
答に適用可能であることを示す.
結論
・ターゲットとする自然言語記述のための新しい空
白埋め込み戦略を導入し,Visual Madlibsデータセ
ットを収集した.分析は, 文章の記述が一般的な全
体画像の記述よりも詳細であることを示した.
Links
論文 https://arxiv.org/pdf/1506.00278v1.pdf
【222】Hao Fang, Saurabh Gupta, “From Captions to Visual Concepts and Back”, in
CVPR, 2015.
Keywords: automatically generating image descriptions
概要
・画像キャプチャのデータセットから直接学
習したvisual detectors,,language models,
multimodal similarity modelsの画像記述を自
動的に生成するための新しい手法を提案する.
結論
・提案システムは画像および対応するキャプション
を訓練し、画像中の領域から名詞、動詞および形容
詞を抽出することを学習する.次に、これらの検出
された単語を含むテキストを生成するために言語モ
デルを導く.システムを評価した結果,人間のパフ
ォーマンス以上のパフォーマンスを達成した.
Links
論文 http://www.cv-
foundation.org/openaccess/content_cvpr_2015/papers/Fang_From_Captions_to_2015_CVPR_paper.pdf
【223】Andrej Karpathy, Li Fei-Fei, “Deep Visual-Semantic Alignments for Generating Image Descriptions”, in
CVPR, 2015.
Keywords: generates natural language descriptions
概要
・画像とその領域の自然言語記述を生成するモデルを
提案する.画像と文章の記述を利用して言語と視覚デ
ータの間の相互対応について学習する.alignment
modelは,画像領域に対するConvolutional Neural
Networks,文に対するbidirectional Recurrent Neural
Networksおよびmultimodal embeddingを通して2つの
様式を構造化した新しい組み合わせに基づいている.
結論
・Flickr8K、Flickr30K、およびMSCOCOデータセ
ットの検索実験では、 alignment modelが最先端の
結果をもたらすことを示した.
Links
論文 http://cs.stanford.edu/people/karpathy/cvpr2015.pdf
プロジェクト http://cs.stanford.edu/people/karpathy/deepimagesent/
【224】 Scott Reed, Zeynep Akata, Xinchen Yan“Generative Adversarial Text to Image Synthesis ”, arXiv, 2016.
Keywords: generative adversarial networks
概要
・本論文では,文字とピクセルの視覚的な概念を翻訳し,
テキストと画像モデリングのこれらの進歩を効果的に橋渡
しするために,新しいdeep architectureとgenerative
adversarial networks(GANs)を開発する.
Links 論文
https://arxiv.org/pdf/1605.05396v2.pdf
【225】
Emily Denton, Soumith Chintala, “Deep Generative Image Models using a Laplacian Pyramid of
Adversarial Networks”, in NIPS, 2015.
Keywords: generates natural language descriptions
概要
・自然画像のサンプルを生成できるgenerative parametric
modelを紹介する. 提案手法としてはLaplacian pyramid
framework内のconvolutional networksのカスケードを使用
して粗いものから細かいもので画像を生成する.ピラミッ
ドの各レベルでは, Generative Adversarial Netsを使用し
てseparate generative convnet modelが訓練される.
Links
論文 http://papers.nips.cc/paper/5773-deep-generative-image-models-using-a-laplacian-pyramid-of-adversarial-networks.pdf
プロジェクト http://papers.nips.cc/paper/5773-deep-generative-image-models-using-a-laplacian-pyramid-of-adversarial-networks
【226】Alec Radford, Luke Metz, Soumith Chintala, “UNSUPERVISED REPRESENTATION LEARNING WITH
DEEP CONVOLUTIONAL GENERATIVE ADVERSARIAL NETWORKS ”, in ICLR, 2016.
Keywords: generates natural language descriptions
概要
・教師なし学習の強力な候補者であるdeep convolutional
generative adversarial networks (DCGANs)と呼ばれるCNN
クラスを紹介する.様々な画像データセットを訓練すること
によって,deep convolutional adversarial pairがgenerator と
discriminatorの両方でオブジェクトパーツからシーンへの表
現の階層を学習するという証拠が示される.
Links
論文 https://arxiv.org/pdf/1511.06434v2.pdf
【227】 Ming-Yu Liu, Oncel Tuzel, “Coupled Generative Adversarial Networks ”, in NIPS, 2016.
Keywords: generates natural language descriptions
概要
・マルチドメイン画像の共同分布を学習するためのcoupled
generative adversarial network (CoGAN)を提案する.トレー
ニングセット内の異なる領域に対応する画像のタプルを必要
とする既存のアプローチとは対照的に,CoGANは対応する
画像のタプルなしで共同分布を学習することができる.
Links
論文 http://papers.nips.cc/paper/6544-coupled-generative-adversarial-networks.pdf
Anelia Angelova, Alex Krizhevsky, Vincent Vanhoucke, Abhijit Ogale and Dave Ferguson, “Real-
Time Pedestrian Detection with Deep Network Cascades”, in BMVC, 2015.
【228】
Keywords:
新規性・差分
概要
・Caltech pedestrian detection benchmark に対して,
average miss rate が26.2%を達した.
・15 fpsで実行可能のアルゴリズムを提案
Links
論文
http://www.bmva.org/bmvc/2015/papers/paper032/paper032.p
df
・高速かつ高精度の歩行者検出を行うDNNの提案
・中間層3つのDeep networkをカスケード接続すること
により,高速なアルゴリズムを実現
James Steven Supanci, Gregory Rogez, Yi Yang , Jamie Shotton , Deva Ramanan, “Depth-based hand
pose estimation: data, methods, and challenges”, in ICCV2015, 2015.
【229】
Keywords: Pose estimation, nearest-neighbor (NN)
新規性・差分
概要
・近年,手の姿勢の推定は急速に成熟している.商品深度
センサの導入と多数の実用化により,進歩が加速している.
1つのフレームの深さから手の姿勢を推定することに焦点
を当て,最先端な分析を提案する.
・我々は均一な採点基準の下で4つのテストセットにわた
る13の最先端の手の姿勢推定システムを評価する.さらに,
現代的なアプローチを幅広く調査し以前の制限に対処する
新しいテストセットを導入する.そしてNNのサンプルボ
リュームに基づくポーズ推定の新しいベースラインを提案
する.
Links
論文
http://www.cv-
foundation.org/openaccess/content_iccv_2015/papers/Supan
cic_Depth-Based_Hand_Pose_ICCV_2015_paper.pdf
クロスデータセットの一般化
比較
データセットの設計比
較
提案手法の失敗例
Zifeng Wu, Yongzhen Huang, Liang Wang, Xiaogang Wang, and Tieniu Tan, “A Comprehensive Study
on Cross-View Gait Based Human Identification with Deep CNNs”, in IEEE2016
【230】
Keywords:cross-view, Deep learning, CNN, human identification, gait
新規性・差分
概要
・本論文では外観ベースでCNNを用いた歩行特徴での人物
再同定手法を提案している.クロスビュー歩行認識の観点
により,CASIA-Bデータセットを用いて実験を行った.
・CNNを用いた歩行特徴での人物再同定手法はこの論文が
初となる.実験結果より,視野角36°以上で従来手法と比
べ,提案手法は利点を示している.平均認識率は94.1%に
達し、以前の最良の結果(65%未満)よりもはるかに優れ
ている.
Links
論文 :
http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=7439821
Joe Yue-Hei Ng, Jonghyun Choi, Jan Neumann, Larry S. Davis, “ActionFlowNet: Learning Motion
Representation for Action Recognition”, in arXiv pre-print 1612.03052, 2016.
【231】
Keywords: Joint Estimating Optical Flow and Action
新規性・差分
概要
オプティカルフローと行動を同時に推定するフローである.推定し
たフローも行動認識のための手がかりとする.学習はマルチタスク
によるものであり,フローとアピアランスを同時に用いて行動認識
をすることができる.なお,畳み込みのアーキテクチャはDeep
Residual Networks (ResNetを参考にしている.
・オプティカルフローを推定し,アピアランスやフロー画像を用いて行動
認識を行うネットワークを構築した.本提案はひとつのアーキテクチャに
てこれら全てのタスクをこなす
・ネットワークはマルチタスク学習により最適化される
Links
論文
https://arxiv.org/pdf/1612.0305
2v1.pdf
プロジェクト
Yifan Wang, Jie Song, Limin Wang, Luc Van Gool, “Two-Stream SR-CNNs for Action Recognition in
Videos”, in BMVC, 2016.
【232】
Keywords: two stream CNN, Action recognition,
新規性・差分
概要
・行動はキューと呼ばれる複数の要素によって定義され,
右図(a)~(d)に示すように4つのタイプに分けることが可能
・様々なキューの位置情報を意味的に認識したCNNベース
の行動認識フレームワークの提案
・物体検出器の出力から動画内の関係のある人物および物
体を抽出する,R-CNNのように高速で効率的な方法を提
案
・得られた出力は,RoiPooling層を介して,従来の2
stream CNN に組み込まれる.
・各セマンティックキューによって最終的な予測を行うた
めのチャネルを構成
Links
論文
http://www.bmva.org/bmvc/2016/papers/paper108/paper108.p
df
プロジェクト
Umer Raf, Ilya Kostrikov, Juergen Gall, Bastian Leibe, “An Efficient Convolutional Network for Human
Pose Estimation”, in BMVC, 2016.
【233】
Keywords: Human Pose Estimation, CNN, Convolutional Pose Machine
新規性・差分
概要
・pre-training を必要とせず,ミッドレンジのGPUで稼働
し,複雑なモデルを使用したベンチマークと同等に効率的
なCNNアーキテクチャを使用した骨格推定手法の提案.
Convolutional Pose Machineと比較し,優れた性能を発揮
していることを確認.
・Fully Convolutional GoogLeNet (FCGN) networkの提案
・最初の17層を取り出し,deconvolution層を加えて全結
合
・スキップ層を導入し,2つのGCGNを共有の重みと結合
したマルチネットワーク
・従来の複雑なモデルを使用した手法に対して優れたパフ
ォーマンスを発揮し,省メモリ,短時間で学習が可能
Links
論文
http://www.bmva.org/bmvc/2016/papers/paper109/paper109.p
df
プロジェクト
Sergey Zagoruyko, Adam Lerer, Tsung-Yi Lin, Pedro O. Pinheiro, Sam Gross, Soumith Chintala, Piotr
Dollár, “A MultiPath Network for Object Detection”, in BMVC, 2016.
【234】
Keywords: Object Recognition, MultiPath Network, COCO dataset
新規性・差分
概要
・COCO datasetには,複数のスケール,コンテキスト,
乱雑さ,多くのオクルージョンを含む画像が含まれる.そ
のデータセットを用いて,より正確な物体位置の特定を行
う.
標準のFast RCNNの物体検出器に以下3つの変更を加える
(1)複数のネットワーク層の特徴へアクセスする接続をスキ
ップ
(2)複数の物体解析で物体のコンテクストを利用する共起的
構造
(3)局在化を改善する積分損失関数およびネットワークの調
整
Links
論文
http://www.bmva.org/bmvc/2016/papers/paper015/paper015.p
df
Holger Caesar, Jasper Uijlings, Vittorio Ferrari, “Region-based semantic segmentation with end-to-end
training”, in ECCV, 2016.
【235】
Keywords: Semantic segmentation, end-to-end training, region-based
新規性・差分
概要
セマンティックセグメンテーションを行う際には
以下の問題がある.
・Fully Convolutional approachesでは,受容野が
正方形,マルチスケール非対応,低解像度
・Region-based approachesでは,end to end で学
習不可,殆どの領域は無関係,Lossが領域サイズ
を無視,非差別的なクラスはSoftmaxおよびMax
over regionsの順にラベルを決定
以上の問題に対応したアプローチの提案
・微分可能な領域からピクセルへの層
・微分可能な自由なROI Pooling
・Softmaxおよびmax over regionsを正しい順に処理
→複数の重複領域に対してもend to end で学習可能
→Fully Convolutional approachesとRegion-based
approachesの問題点を解決
Links
論文 https://arxiv.org/pdf/1607.07671v1
プロジェクト
↑ 2つのデータセットに対してState-of-the-art,合理的な精度と平均IOU
↓ 粗い入力の境界
Peng Wang, Alan Yuille, “DOC: Deep OCclusion Estimation From a Single Image”, in ECCV, 2016.
【236】
Keywords: oclusion estimation,
新規性・差分
概要
・意味的なエッジとエッジに沿ったオクルージョンの関係
の推定.画像内の境界(エッジ)が属するものの推定
・
・PASCAL Instance Occlusion Dataset (PIOD)に基づき,
大規模なオクルージョンデータセットを構築
・新規画素ベースのオクルージョン表現と密な予測のため
のlossの設計
・単一の画像からのオクルージョン推定に向けたdeep
convolutional networkを使用
Links
論文
http://www.eccv2016.org/files/poste
rs/P-1A-33.pdf
プロジェクト
Stephan Richter, Vibhav Vineet, Stefan Roth, Vladlen Koltun, “Playing for Data: Ground Truth from
Computer Games”, in ECCV, 2016.
【237】
Keywords: Semantic segmentation, computer games, dataset
新規性・差分
概要
・商用のオープンワールドゲームからプレイ画面をキャプ
チャし,セマンティックセグメンテーション向けのデータ
セットを構築
・セマンティックセグメンテーションの精度が向上したこ
とからゲームを用いた大規模なデータセットの有用性を提
示.
・ゲームを用いたデータセットの構築
・プライバシーを気にする必要がないため,無限にデータ
セットを作成可能
・アノテーションに要する時間の短縮
Links
論文 goo.gl/Pe9dCE
プロジェクト
http://download.visinf.t
u-
darmstadt.de/data/fro
m_games/
code
https://bitbucket.org/vis
inf/projects-2016-
Guilhem Cheron, Ivan Laptev, Cordelia Schmid, “P-CNN: Pose-based CNN Features for Action
Recognition”, in ICCV, 2015.
【238】
Keywords: Human Action Recognition, Pose-based CNN, improved dense trajectories,
新規性・差分
概要
・外観情報を用いた人物行動認識の研究が多くなされてい
る中,人物の姿勢情報を利用した行動認識の重要性につい
て書かれた論文
・人物の外観情報と姿勢情報を統合した行動認識に特化し
たネットワークであるPose-based Convolutional Neural
Network descriptor (P-CNN)を提案.
・手作業で姿勢アノテーションし行動認識を行う実験(GT)
と,姿勢を推定し行動認識を行う実験(Pose)を行い,その
重要性を評価.
・行動認識においては外観情報(iDT)が効果的であるという
結果を覆し,姿勢の重要性を提示
・外観情報と姿勢情報を組み合わせることでState-of-the-
artな結果が得られた.
Links
論文 http://www.di.ens.fr/willow/research/p-cnn/P-
CNN_cheronICCV15.pdf
プロジェクト
Rui-Wei Zhao, Jianguo Li, Yurong Chen, Jia-Ming Liu, Yu-Gang Jiang, Xiangyang Xue, “Regional Gating
Neural Networks for Multi-label Image Classification”, in BMVC, 2016.
【239】
Keywords: Multi-label image classification, RGNN
新規性・差分
概要
・マルチラベルの画像分類に向けたDeep learning
frameworkであるregional gating neural networks (RGNN)
の提案.
・RGNNは,コンテキスト領域の特徴を自動で選択し,特
別なgate unitsによってより良い分類に向け結合するend-
to-end なフレームワークである.
RGNNは以下の5つのステップで構成される.
(1)物体の検出を行い複数の物体領域を生成
(2)Shared Conv + ROI pool + FC layersによって領域内の
特徴を取得する.
(3)Region/feature level gateによって効果的なコンテキス
トを取得する.
(4)Multi-scale cross region poolingによってコンテキストイ
メージレベルの特徴を取得する.
(5)結合したコンテキストの特徴をFC層に送り,画像ラベ
ルの予測を行う.
Links
論文
http://www.bmva.org/bmvc/2016/papers/paper072/abstract072.
pdf
プロジェクト
PASCAL VOC 2007と2012, MS-COCO benchmarksで評価した結果RGNN
がState-of-the-artな識別率を出した.
Jingjing Liu, Shaoting Zhang, Shu Wang, Dimitris N. Metaxas, “Multispectral Deep Neural Networks for
Pedestrian Detection”, in BMVC, 2016.
【240】
Keywords: Pedestrian Detection, Multispectral Deep Neural Networks,
新規性・差分
概要
・歩行者検出に向けたマルチスペクトル(色と熱)画像を利
用したFaster RCNNの提案.
・低(早期結合),中(途中結合),高(後期結合),信頼(スコ
ア結合)レベルという情報結合に対して,畳み込み層,全
結合層,決定層をうまく設計し,ネットワークを構成する.
・KAIST multispectral pedestrian dataset (KAIST)で通常の
Faster RCNNよりも優れた性能を発揮.
Links
論文
http://www.bmva.org/bmvc/2016/papers/paper073/paper073.p
df
プロジェクト
Figure 2は本稿で提案されたFaster RCNNのモデルである.
左からそれぞれ,低レベル,中レベル,高レベル,信頼レベルのモデルとな
っている.
Dan Liu, Mao Ye, “Memory-based Gait Recognition”, in BMVC, 2016.
【241】
Keywords: gait recognition, Memory-based Gait Recognition, MGR, Memory neuron network
新規性・差分
概要
・人間の脳の記憶と予測のメカニズムに着想を得た,歩行
シーケンスと認識プロセスを実現するための単純で効果的
な記憶ベース歩行認識手法Memory-based Gait
Recognition(MGR)を提案
・姿勢抽出モデルを利用して,頑健な2Dの関節位置情報
を歩行特徴として抽出する.
・大規模な並列計算により,メモリニューロンネットワー
ク(MNN)は歩行特徴の不完全な部分の修復を行う.
・
Links
論文
http://www.bmva.org/bmvc/2016/papers/paper082/pa
per082.pdf
プロジェクト
こちら側に図や実験結果を挿入し,キャプションを付けて
ください.
Michael Edwards, Xianghua Xie, “Graph Based Convolutional Neural Network”, in BMVC, 2016.
【242】
Keywords: Graph Based Convolutional Neural Network,
新規性・差分
概要
・ラプラシアングラフのスペクトル領域を用いて,不規則
な空間幾何を示す領域にCNN演算子を適用する方法の提案.
・グラフGの頂点間のエッジ重みとして近傍関係を定義す
ることで,不規則な領域内の局所化された特徴を学習する
・領域を固定グラフ表現として定式化し,(1)によって特徴
マップを学習する.
・信号fs,iに関する勾配計算は(2)によって計算される
・またスペクトルフィルタは(3)によって求められる.
・従来のCNNのプーリングに類似したグラフの粗密化の方
法として代数Multigridを使用し,前の層のノードを次の層
の特異ノードに集約する.
・(2),(3)を使用することで,規則的・不規則的な空間領
域に対して高い精度を得られた.
Links
論文 http://www.bmva.org/bmvc/2016/papers/paper114/paper114.pdf
Yi Zhou, Li Liu, Ling Shao, Matt Mellor, “DAVE: A Unified Framework for Fast Vehicle Detection and
Annotation”, in ECCV, 2016.
【243】
Keywords: DAVE, Fast Vehicle Proposal Network, FVPN, Attributes Learning Network, ALN, Detection and Annotation
新規性・差分
概要
・動画中から,車両の検出,視点,車両の色認識,車種の
判定を同時に行うDAVEというフレームワークの提案.
・DAVEはFVPNとALNという2つのCNNで構成される.
・FVPN(Fast Vehicle Proposal Network ):高速車両提案
ネットワーク(浅い完全畳み込み)は車両を検出する
・ALN(Attributes Learning Network):属性学習ネットワー
ク(マルチタスクGoogLeNet)は車両検証,姿勢推定,色認
識,車種分類を同時に行う.
Links
論文 https://arxiv.org/pdf/1607.04564v3
プロジェクト
左図は,検出実験時のUTS, Pascal VOC 2007 Car, LISA 2010 Car dataset
におけるPrecision-Recall曲線.
右図は,アトリビュート推定の結果を示す.
結果
Liliang Zhang, Liang Lin, Xiaodan Liang, Kaiming He, “Is Faster R-CNN Doing Well for Pedestrian
Detection”, in ECCV, 2016.
【244】
Keywords: Pedestrian Detection, Faster R-CNN, Region Proposal Network, Boosted Forests
新規性・差分
概要
・Fast / Faster R-CNNの歩行者検出タスクにおいて,低解
像度中の検出やハードネガティブの除去はチャレンジング
な課題である.その課題に対応する.
・Region Proposal Network(RPN)を用いて,候補バウンデ
ィングボックス,スコア,畳込み特徴を計算する.
・候補ボックスは,RPNによって計算された畳み込み特徴
マップからプーリングされた特徴を,Boosted Forests
(BF)に入力し,分類される.
Links
論文 https://arxiv.org/pdf/1607.07032v2
プロジェクト
RPNが高い精度で歩行者を検出していることが確認できる
特徴の解像度の重要性
Bootstrapping/Hard negativeのマイニングによる変化
【2016.12】cvpaper.challenge2016
ご質問・コメント等ありましたら,cvpaper.challenge@gmail.com / Twitter@CVPaperChallengまでお願いします.

More Related Content

PDF
【2015.08】(3/5)cvpaper.challenge@CVPR2015
PDF
【2015.08】(2/5)cvpaper.challenge@CVPR2015
PDF
【2015.08】(5/5)cvpaper.challenge@CVPR2015
PDF
【2016.01】(2/3)cvpaper.challenge2016
PDF
cvpaper.challenge@CVPR2015(Re-ID)
PDF
【2016.02】cvpaper.challenge2016
PDF
【2016.07】cvpaper.challenge2016
PDF
【2015.05】cvpaper.challenge@CVPR2015
【2015.08】(3/5)cvpaper.challenge@CVPR2015
【2015.08】(2/5)cvpaper.challenge@CVPR2015
【2015.08】(5/5)cvpaper.challenge@CVPR2015
【2016.01】(2/3)cvpaper.challenge2016
cvpaper.challenge@CVPR2015(Re-ID)
【2016.02】cvpaper.challenge2016
【2016.07】cvpaper.challenge2016
【2015.05】cvpaper.challenge@CVPR2015

What's hot (20)

PDF
【2015.08】(4/5)cvpaper.challenge@CVPR2015
PDF
【2015.07】(1/2)cvpaper.challenge@CVPR2015
PDF
【2016.06】cvpaper.challenge2016
PDF
【2016.01】(1/3)cvpaper.challenge2016
PDF
ECCV 2016 まとめ
PDF
【2016.08】cvpaper.challenge2016
PDF
【2015.07】(2/2)cvpaper.challenge@CVPR2015
PDF
cvpaper.challenge@CVPR2015(Attribute)
PDF
【2017.06】 cvpaper.challenge 2017
PDF
【2016.03】cvpaper.challenge2016
PDF
【2017.05】 cvpaper.challenge 2017
PDF
CVPR 2016 まとめ v1
PDF
【2016.01】(3/3)cvpaper.challenge2016
PDF
【2016.09】cvpaper.challenge2016
PDF
cvpaper.challenge in CVPR2015 (PRMU2015年12月)
PDF
cvpaper.challenge@CVPR2015(Dataset)
PDF
【2016.04】cvpaper.challenge2016
PDF
コンピュータビジョンの今を映す-CVPR 2017 速報より- (夏のトップカンファレンス論文読み会)
PDF
【2016.05】cvpaper.challenge2016
PDF
【2017.03】cvpaper.challenge2017
【2015.08】(4/5)cvpaper.challenge@CVPR2015
【2015.07】(1/2)cvpaper.challenge@CVPR2015
【2016.06】cvpaper.challenge2016
【2016.01】(1/3)cvpaper.challenge2016
ECCV 2016 まとめ
【2016.08】cvpaper.challenge2016
【2015.07】(2/2)cvpaper.challenge@CVPR2015
cvpaper.challenge@CVPR2015(Attribute)
【2017.06】 cvpaper.challenge 2017
【2016.03】cvpaper.challenge2016
【2017.05】 cvpaper.challenge 2017
CVPR 2016 まとめ v1
【2016.01】(3/3)cvpaper.challenge2016
【2016.09】cvpaper.challenge2016
cvpaper.challenge in CVPR2015 (PRMU2015年12月)
cvpaper.challenge@CVPR2015(Dataset)
【2016.04】cvpaper.challenge2016
コンピュータビジョンの今を映す-CVPR 2017 速報より- (夏のトップカンファレンス論文読み会)
【2016.05】cvpaper.challenge2016
【2017.03】cvpaper.challenge2017

Similar to 【2016.12】cvpaper.challenge2016 (20)

PDF
関西CVPRML勉強会 2012.2.18 (一般物体認識 - データセット)
PDF
自己教師学習(Self-Supervised Learning)
PPTX
2012 kanemotolablecture1
PDF
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
PDF
Transformer 動向調査 in 画像認識(修正版)
PDF
Opencv object detection_takmin
PDF
論文紹介: Exploiting semantic segmentation to boost reinforcement learning in vid...
PPTX
[CVPR2020読み会@CV勉強会] 3D Packing for Self-Supervised Monocular Depth Estimation
PPTX
MS COCO Dataset Introduction
PDF
20120623 cv勉強会 shirasy
PDF
大規模画像認識とその周辺
PPTX
Androidアプリケーション応用 WebAPI開発
PDF
文献紹介:Elaborative Rehearsal for Zero-Shot Action Recognition
PDF
【CVPR 2019】Defense Against Adversarial Images using Web-Scale Nearest-Neighbo...
PDF
データからインサイト そして、アイデアの発想へ(KJ法)
PDF
コンピュータビジョン7章資料_20140830読書会
PPTX
2012 kanemotolablecture2
DOCX
march report in japanese
PDF
A Study on the Generation of Clothing Captions Highlighting the Differences b...
PPTX
事例からわかる!テスト自動化導入パターン
関西CVPRML勉強会 2012.2.18 (一般物体認識 - データセット)
自己教師学習(Self-Supervised Learning)
2012 kanemotolablecture1
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
Transformer 動向調査 in 画像認識(修正版)
Opencv object detection_takmin
論文紹介: Exploiting semantic segmentation to boost reinforcement learning in vid...
[CVPR2020読み会@CV勉強会] 3D Packing for Self-Supervised Monocular Depth Estimation
MS COCO Dataset Introduction
20120623 cv勉強会 shirasy
大規模画像認識とその周辺
Androidアプリケーション応用 WebAPI開発
文献紹介:Elaborative Rehearsal for Zero-Shot Action Recognition
【CVPR 2019】Defense Against Adversarial Images using Web-Scale Nearest-Neighbo...
データからインサイト そして、アイデアの発想へ(KJ法)
コンピュータビジョン7章資料_20140830読書会
2012 kanemotolablecture2
march report in japanese
A Study on the Generation of Clothing Captions Highlighting the Differences b...
事例からわかる!テスト自動化導入パターン

【2016.12】cvpaper.challenge2016

  • 2. Chuang Gan, Chen Sun, Lixin Duan, Boqing Gong, “Webly-supervised Video Recognition by Mutually Voting for Relevant Web Images and Web Video Frames”, in ECCV, 2016. 【1】 Keywords: Weakly Supervised Learning, Video Recognition 新規性・差分 概要 Web検索結果の上位サンプルにより学習したデータで動画 に対する認識を行う.サンプルや労力などよりコストの低 い学習フレームワークを提案.検索により抽出した動画像 から関連するフレームのみを抽出する(右図や式より). ・簡易的な学習や関連するフレームのみ抽出するフレーム ワークにより,UCF101やTRECVID MEDなどのデータで 良好な精度を実現した.教師ありの学習にいかに近づける かが今後の課題である. Links 論文 http://crcv.ucf.edu/people/faculty/Gong/P aper/webly-supervised.pdf プロジェクト http://research.google.com/pubs/pub454 93.html ポスター http://www.eccv2016.org/files/posters/P- 2B-15.pdf
  • 3. Endri Dibra, Cengiz Oztireli, Remo Ziegler, Markus Gross, “Shape from Selfies: Human Body Shape Estimation using CCA Regression Forests”, in ECCV, 2016. 【5】 Keywords: Shape from Selfies, Silhouette 新規性・差分 概要 自撮り画像から3次元人体モデルを復元する研究.シルエ ットの抽出とView推定,CCAによる投影,Random Forestsにより3次元のメッシュを再構成する. ・Selfieからのシルエットや3次元メッシュ復元を実行. ・Random Forestsによるビュー推定やCCAによるビュー ごとの相関を求める Links 論文 https://graphics.ethz.ch/~edibra/Publications/Shape%20from% 20Selfies%20- %20Human%20Body%20Shape%20Estimation%20using%20 CCA%20Regression%20Forests.pdf プロジェクト
  • 4. Lisa Anne Hendricks, Zeynep Akata, Marcus Rohrbach, Jeff Donahue, Bernt Schiele, Trevor Darrell, “Generating Visual Explanations”, in ECCV, 2016. 【2】 Keywords: Image Captioning, Explanation 新規性・差分 概要 画像説明文と関連して,画像のより詳細なラベル (Explanation)を付与する研究.具体的には画像により詳細 な形容詞や詳細ラベルを割振る.右図はExplanationsの詳 細や認識のための画像や言語のフレームワークである. ・画像により詳細な説明を与えるExplanationを提案した. 形容する言葉や詳細ラベルなどを混合したようなモデルで ある. Links 論文 https://arxiv.org/pdf/1603.08507v1.pdf ポスター http://www.eccv2016.org/files/posters/P-2B-17.pdf
  • 5. Yu Du, Yongkang Wong, Yonghao Liu, Feilin Han, Yilin Gui, Zhen Wang, Mohan Kankanhalli, Weidong Geng, “Marker-Less 3D Human Motion Capture with Monocular Image Sequence and Height-Maps”, in ECCV, 2016. 【3】 Keywords: 3D Pose Estimation, Markerless MoCap 新規性・差分 概要 マーカレスモーキャプの問題に対して,可視画像や身長マ ップにより3次元姿勢推定を実行する(右図).目的関数 の定義により,画像から抽象化,さらに2Dから3D姿勢へ の投影を行う. ・RGB画像や画像から計算された身長マップを入力として, Dual-StreamのCNNにより3次元姿勢推定を行い,マーカ レスモーキャプを実現. ・2D-3Dに変換する目的関数を新規に提案. Links 論文 https://www.google.co.jp/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&ved=0ahUKEwi7l drO6dHQAhWHTbwKHc- PA2cQFggdMAA&url=http%3A%2F%2Fwww.springer.com%2Fcda%2Fcontent%2Fdocu ment%2Fcda_downloaddocument%2F9783319464923-c2.pdf%3FSGWID%3D0-0-45- 1588730-p180264620&usg=AFQjCNGP7ce8- COneTrsvajAeOtQ3BHpyA&sig2=V4P1Dl77_nfptTIE8RBWUw&cad=rja YouTube https://www.youtube.com/watch?v=BJ8e2EMfaQM
  • 6. Anil Usumezbas, Ricardo Fabbri, Benjamin Kimia, “From Multiview Image Curves to 3D Drawings”, in ECCV, 2016. 【4】 Keywords: 3D Drawing 新規性・差分 概要 2次元の写真や絵画を入力すると3次元のモデルとして出力 される研究.2次元の複数の写真や,線画の情報を用いて3 次元を復元する. ・右図のモデルにより,2Dから3Dのモデル(主に3次元の 線画)を復元.右下図にその一例を示す. Links 論文 https://arxiv.org/abs/1609.05561 Supplementary http://multiview-3d- drawing.sourceforge.net/papers/usumezbas-fabbri-kimia- ECCV2016-supplementary.pdf プロジェクト https://vision.lems.brown.edu/3d-drawing ポスター http://www.eccv2016.org/files/posters/P-2B-21.pdf
  • 7. Anirban Roy, Sinisa Todorovic, “A Multi-Scale CNN for Affordance Segmentation in RGB Images”, in ECCV, 2016. 【6】 Keywords: Affordance, Segmentation 新規性・差分 概要 アフォーダンスセグメンテーションを提案.ピクセルレベ ルでアフォーダンスのラベル付けが可能.距離画像や平面 検出を用いた半自動ラベル付け処理も実装.Multi-scale CNNによりアフォーダンスを推定する. ・ピクセルレベルでのアフォーダン ス(機能に関する)セグメンテーシ ョンを実現した ・Multi-scale CNNによりスケールの 変動に対応したラベル付け ・Affordance Datasetを提案 Links 論文 http://web.engr.oregonstate.edu/~sinisa/res earch/publications/eccv16_affordance.pdf ポスター http://www.eccv2016.org/files/posters/P- 2B-28.pdf
  • 8. Cheng-Sheng Chan, Shou-Zhong Chen, Pei-Xuan Xie, Chiung-Chih Chang, Min Sun, “Recognition from Hand Cameras: A Revisit with Deep Learning”, in ECCV, 2016. 【7】 Keywords: First Person View 新規性・差分 概要 ウェアラブルカメラにおいて,頭部に装着するだけでなく, 左右両手に取り付けることで,物体認識や対象行動を認識 しやすくする.これにより,全てのシーンが見やすい位置 で撮影可能,ハンドジェスチャーがエゴモーションとして 取得可能というメリットを取ることができる.また,頭部 カメラの特徴もそのまま統合可能である. ・頭部と両手から3視点のウェアラブルカメラにより一人 称ビジョンを撮影可能である. ・Daily Life Datasetの提案により,効果を実証した. ・さらに,屋内環境の3次元再構成を行った. Links 論文 https://arxiv.org/abs/1512.01881 ポスター http://www.eccv2016.org/files/posters/P-2B-47.pdf
  • 9. Georgia Gkioxari, Alexander Toshev, Navdeep Jaitly, “Chained Predictions Using Convolutional Neural Networks”, in ECCV, 2016. 【8】 Keywords: CNN, Structured Problem, Chain Model 新規性・差分 概要 NLPであるようなChain Modelを導入して,構造的な問題 (e.g. 人物の姿勢,シーンと物体)を解決する.右図がコン ピュータビジョンにおけるChain Modelの提案である. Single Image/Videoであっても汎用的に用いることができ るモデルである. ・Chain Modelをコンピュータビジョンに拡張して構造化 された問題に対して適用した ・MPII Human Pose DatasetやPenn Action Datasetに対し て用いて,姿勢推定やそれを用いた行動認識の問題に適用 し,良好な性能を実現した. Links 論文 https://arxiv.org/abs/1605.02346 プロジェクト http://people.eecs.berkeley.edu/~gkioxari/ChainMode ls/index.html ポスター http://www.eccv2016.org/files/posters/P-3A- 13.pdf
  • 10. Xinchen Yan, Jimei Yang, Kihyuk Sohn, Honglak Lee, “Attribute2Image: Conditional Image Generation from Visual Attributes”, in ECCV, 2016. 【9】 Keywords: Image Generation, Attribute 新規性・差分 概要 画像生成のための事前情報として属性(アトリビュート) を用いることを考える.画像生成はVAE(特に,Attribute- conditional VAEとよぶ)を用い,顔を対象として生成する. ・表に比較結果を示す ・右下図に顔画像の生成結果を示す Links 論文 https://arxiv.org/pdf/1512.0057 0v2.pdf プロジェクト https://sites.google.com/site/at tribute2image/ ポスター http://www.eccv2016.org/files/ posters/P-3A-16.pdf コード https://github.com/xcyan/eccv1 6_attr2img
  • 11. Yu Xiang, Wonhui Kim, Wei Chen, Jingwei Ji, Christopher Choy, Hao Su, Roozbeh Mottaghi, Leonidas Guibas, Silvio Savarese, “ObjectNet3D: A Large Scale Database for 3D Object Recognition”, in ECCV, 2016. 【10】 Keywords: 3D Shape Database 新規性・差分 概要 3次元物体認識のためのデータセットであるObjectNet3D を提案する.データベースは従来の3D Warehouseや ShapeNetから抽出したCADデータを参考にして,2次元画 像に対応付けを行う.RGBDデータセットは従来と比較し て(中央表),カテゴリ数100, インスタンス数200K,3D Shape 44Kと膨大に増加している. ・RGBと従来の3DデータからCADデータを対応付けて 100クラス分類の問題を設定した ・右下表は物体検出や回転姿勢推定の結果である. Links 論文 https://yuxng.github.io/xiang_eccv16.pdf プロジェクト http://cvgl.stanford.edu/projects/objectnet3d/ ポスター http://www.eccv2016.org/files/posters/S-3C-08.pdf
  • 12. Maxim Tatarchenko, Alexey Dosoivitskiy, Thomas Brox, “Multi-View 3D Models from Single Images with a Convolutional Network”, in ECCV, 2016. 【11】 Keywords: 3D Models, 2D-3D 新規性・差分 概要 単眼画像を入力として,3次元モデルを復元する研究.2D画像-- ConvNet--Synthetic data--3D--Interpolationという流れである (右上図).畳み込みネットは右図に示すモデルで,2D画像や ビューポイントのConvolutionやDeConvolutionを含む. ・従来の手法と比較して3次元モデルの生成を高精細にし た ・シンプルなアーキテクチャで3次元モデルの復元を行っ た Links 論文 http://lmb.informatik.uni- freiburg.de/Publications/2016/TDB16a/tdb16.pdf プロジェクト http://lmb.informatik.uni- freiburg.de/Publications/2016/TDB16a/ YouTube https://www.youtube.com/watch?v=uf4-l6h7iGM ポスター http://www.eccv2016.org/files/posters/S-3B-09.pdf
  • 13. Yuta Itoh, Jason Orlosky, Kiyoshi Kiyokawa, Gudrun Klinker, “Laplacian Vision: Augmenting Motion Prediction via Optical See-Through Head-Mounted Displays”, in SIGGRAPH E-Tech, 2016. 【12】 Keywords: Head-Mounted Display 新規性・差分 概要 HMDによる視覚のアシストを行う研究である.ここでは, 運動を推定することにより物体の挙動を予測してARによ り動線を描画する.取り扱う範囲としては単純な物理学で 説明される運動である. ・単純な物理学を題材としてHMDによる視覚のアシスト を行った ・3次元の運動予測を行うことで,HMDにおいても自然な 可視化を実現した Links 論文 http://campar.in.tum.de/pub/itoh2016ah/itoh2016ah.pdf プロジェクト YouTube https://www.youtube.com/watch?v=2GD7KQOHiMs
  • 14. Takashi Miyaki, Jun Rekimoto, “LiDARMAN: Reprogramming Reality with Egocentric Laser Depth Scanning”, in SIGGRAPH E-Tech, 2016. 【13】 Keywords: LiDARMAN, First Person Vision 新規性・差分 概要 LiDARMAN (LiDARを用いて3次元空間を再構成して Oculusにより人間に見せる)により,現実世界を再認識す るという研究である.LiDARは人間の3次元知覚能力より も優れている(という話である)ため,その空間を見せる ことで新たな教示があるかもしれない. ・知覚世界を3次元で置き換えることで新たな認識を想起 させる取り組み ・Reprogramming Realityという概念である Links 論文 http://delivery.acm.org/10.1145/2930000/2929481/a15- miyaki.pdf?ip=150.29.147.196&id=2929481&acc=OPENTOC&key=27692522F5DD 4C64%2E27692522F5DD4C64%2E4D4702B0C3E38B35%2E383ADA7593775D6 F&CFID=699409355&CFTOKEN=29514591&__acm__=1480673225_a917e2a18d 205f3ce37a899874b361ac プロジェクト https://lab.rekimoto.org/projects/lidarman/ YouTube https://www.youtube.com/watch?v=CCmWGYIMleU
  • 15. Mikhail Matrosov, Olga Volkova, Dzmitry Tsetserukou, “LightAir: a Novel System for Tangible Communication with Quadcopters using Foot Gestures and Projected Image”, in SIGGRAPH E-Tech, 2016. 【14】 Keywords: Human-Drone Interaction 新規性・差分 概要 クアッドコプターを題材として,Human-Drone Interaction を提唱した.FootGestureやDronePiano, 3Dポイントクラ ウドを活用したDroneBallなどがアプリケーションとして 構成されている. ・著者らは特に,世界初の”Human-Drone Bilateral Tangible Interaction”であると主張 Links 論文 http://delivery.acm.org/10.1145/2940000/2932429/a16- matrosov.pdf?ip=150.29.147.196&id=2932429&acc=OPENTO C&key=27692522F5DD4C64%2E27692522F5DD4C64%2E4 D4702B0C3E38B35%2E383ADA7593775D6F&CFID=699409 355&CFTOKEN=29514591&__acm__=1480674841_b75eddb 18c8f66b721daf56173bc055a プロジェクト YouTube https://www.youtube.com/watch?v=D9UcGUnWTSg
  • 16. 【15】Takashi Miyazaki, Nobuyuki Shimizu, “Cross-Lingual Image Caption Generation”, in ACL, 2016. Keywords: 自然言語処理, Image caption generation 概要 ・人工知能問題としてimage caption generationの自動化が挙 げられる.image caption generationに関する研究は一般的に 英語が言語として用いられるため他の言語では乏しい.そこ で,日本語のデータセットを用いて日本語でキャプチャ生成 しキャプションデータセットおよび生成モデルを開発する. 結論 ・Yahoo!クラウドソーシングサービスを利用して26,500枚の 画像に対して131,740字のキャプションを収集し、日本語の 画像キャプションデータセットを作成した.Monolingual learning ,Alternate learning ,Transfer learning の3つの学習 方法で比較されTransfer learning の精度が高かった. Links 論文 https://www.aclweb.org/anthology/P/P16/P16-1168.pdf プロジェクト http://research-lab.yahoo.co.jp/ml/20160807_takmiyaz.html
  • 17. Theodoros Tsiligkaridis, Keith W. Forsythe, “Adaptive Low-Complexity Sequential Inference for Dirichlet Process Mixture Models”, in NIPS2015, 2015. 【16】 Keywords: Adaptive SUGS(ASUGS), DPMMDirichlet process mixture models (DPMM) 新規性・差分 概要 ・クラスタの数が先験的に未知数である場合において,オ ンラインクラスタリングとパラメータ推定のためのガウス 分布のDirichlet process mixturesを行うための逐次性低複 雑推論手法を開発する. 本論文で濃度パラメータのための新規な低複雑度のデータ 駆動適応設計を提案し,それがクラスの数に対する対数増 殖率を導くことを示した.合成データセットと実データセ ットの実験を通じて,私たちの方法がより良い性能を達成 し、他の最先端のオンライン学習DPMMメソッドと同じく らい速いことを示した. ・大規模サンプル漸近論によって動機付けられたαを 適応させるための適応非ベイズ法を提案し,そのアル ゴリズムをASUGS(Adaptive SUGS)と呼ぶ. ASUGSの基本的な考え方はSUGSの貪欲なアプロー チに直接関係してるが,新しいデータが到着したとき に集中的に濃度パラメータを選択するための低複雑で 安定した方法であり、クラスタリングのパフォーマン スが大幅に向上する. Links 論文 http://papers.nips.cc/paper/6035-adaptive-low-complexity-sequential-inference-for- dirichlet-process-mixture-models.pdf 著者 https://scholar.google.com/citations?user=hVUVOTIAAAAJ&hl=en (a)合成データセットに対するSVA、SVA- PM、ASUGS、およびASUGS-PMのクラスタ リングパフォーマンス ASUGS-PMは16個のクラスタを正しく識別す る。 (b)合成データに対する合同対数尤度、反復の 関数 としてのクラス数の平均および分散 ASUGS-PMは最も高い対数尤度を達成し,クラ ス数に最も近い漸近的分散を有する. ASUGSPMとSVA-PMを用いて得られたクラス タの平均画像とテストセットに対する予測対数 尤度
  • 18. Huitong Qiu, Fang Han, Han Liu, Brian Caffo, “Robust Portfolio Optimization”, in NIPS2015, 2015. 【17】 Keywords: portfolio optimization, Orthogonalized Gnanadesikan-Kettenring (OGK), Tyler's M-estimator 新規性・差分 概要 ・分位統計に基づく堅牢なポートフォリオ最適化手法を提案する.提案 手法は資産収益の極端な事象に対して堅牢であり,限られた履歴データ 下で大きなポートフォリオに対応する.高次元での堅牢性を達成し,シリ アル依存を可能にすることによって既存のものを拡張できた. ・Gnanadesikan-Kettenring(OGK)は高次元で計算上扱いやすいもので あるが,固定次元が固定されている場合のみ一貫性が保証される.縮小 されたTylorのM-推定量は、大きな行列を反復的に反転することを含む. また,その整合性は次元がサンプルサイズと同じオーダーにある場合に のみ保証される.ロバスト推定器は独立したデータ点の下で分析される. そのため時系列データの下でのそれらの性能は疑わしい本稿では分位値 ベースの散布行列推定器を構築し,堅牢なポートフォリオ最適化手法を 提案する. Links 論文 http://papers.nips.cc/paper/5714-robust-portfolio- optimization.pdf 著者 https://www.linkedin.com/in/huitong-qiu-89843440 S&P 500インデックスデータを使用した4つの競合するアプローチの下で 年率換算されたシャープレシオ,リターン,およびリスク ポートフォリオリスク,選択された株式数, オラクル最適ポートフォリオに対する合致 率
  • 19. Qinqing Zheng, John Lafferty, “A Convergent Gradient Descent Algorithm for Rank Minimization and Semidefinite Programming from Random Linear Measurements”, in NIPS2015, 2015. 【18】 Keywords: gradient descent algorithm, singular value projection(SVP), nuclear norm relaxation 新規性・差分 概要 ・本論文では単純で拡張性があり,かつ高速な勾配降下アル ゴリズムを提案し,ランクの不一致問題と密接に関連する準 正則プログラムに対して最適化する.ランクrと条件数ρの正 の半正定値のn>n行列のランダム測定において,本手法は大 域的最適値に線形収束することが保証される. ・慎重に構成された初期化とステップサイズを使用してワ イヤーフローによる位相検索とf(Z)を最適化するための勾 配降下アルゴリズムを開発する.提案手法ではO制約を用 いて勾配降下スキームが制約を満たす最小ランクを高い確 率で正確に回復できる.また,線形に収束し,計算コスト が低く抑えられる. Links 論文 http://papers.nips.cc/paper/5830-a-convergent-gradient- descent-algorithm-for-rank-minimization-and-semidefinite- programming-from-random-linear-measurements.pdf 著者 https://www.cs.uchicago.edu/directory/qinqing-zheng (a)より密集したケースにおいて,我々の手法は核ノルムアプローチよりも 速く,SVPよりもわずかに優れている. (b)よりまばらなケースでは、他のアプローチよりもはるかに高速である. (c)より提案手法のサンプル複雑さもSVPと核ノルムアプローチと同じよ うにスケーリングすべきであることを示唆している.
  • 20. Modeling of lung morphogenesis using fractal geometriesin ECS 1988 T.R. NELSON and D.K. MANCHESTER 概要 フラクタル次元を用いた肺と気管支画像の構築手法の提案.肺の 複雑さをフラクタル次元で表現し,気管支の長さの合計と平均が 相似図形を構成するために必要な部分集合の数と縮尺率に依存し ていることが示されている.式に条件を与えることで,胎児横隔 膜ヘルニアの肺も表現することができた. 新規性 肺のような複雑な画像も単純な数式のみで表現でき る. さらに,左右対称でない肺であっても,式の与え方 次第で表現できる. LINK http://ieeexplore.ieee.org/document/14515/?arnumb er=14515 【19】
  • 21. Fractal Brownian Motions, Fractional Noises and Applicationsin SIAM 1968 Benoit B. Mandelbrot and Joohn W. Van Ness 新規性 複雑なブラウン運動の定式化 非整数次元ブラウン運動は自然界の時 系列データのモデリングに役立つ LINK http://epubs.siam.org/doi/abs/10.1137/101009 3 【20】
  • 22. A Learning Approach with Under- and Over-sampling for Imbalanced Data Sets in IIAI 2016 Chun-Wu Yeh, Der-Chiang Li, Liang-Sian Lin and Joohn Tung-I Tsai 概要 高精度に物体を識別するために,不均等なデータセットを是 正する. 大量に用意できているクラスのデータを減少させ, 少量しか用意できなかったクラスのデータを増加することで, 偏りを是正する.データの減少は,box-and-whisker plot法で 行われ,データの増加は,合成したサンプルを加えることで 行われる. 新規性 偏りのあるデータセットを物体認識に適したデー タセットへ修正することが可能 LINK http://ieeexplore.ieee.org/abstract/document/7557706/ 実験とその結果 少数クラスの割合:r トレーニングデータの数:N PM:proposed method NDO:normal distribution-based over-sampling ACC(Accuracy) G-MEAN(Geometric mean) Fl(F-measure) Result Test dataset 【21】
  • 23. RIDE: Reversal Invariant Descriptor Enhancementin ICCV2015 Xie, L., Wang, J., Lin, W., Zhang, B. and Tian, Q 概要 SIFTに代表されるハンドクラフト記述子は,画像が左右反転して いる場合,別の画像と判断してしまうことがある. そこで,RIDE(Reversal Invariant De-scriptor Enhancement)と名付 けた画像の反転に影響されにくい特徴記述子を提案する. 新規性 反転の影響を受けない特徴記述子 LINK http://research.microsoft.com/en- us/um/people/jingdw/pubs%5CICCV15- 手法 SIFTと反転させたSIFTを組み合わせた特 徴記述子を提案した. P-37:Oxford Pet-37 dataset (37 cat/dog breeds, 7349 images) A-100:Aircraft-100 dataset (100 aircraft models, 100 images for each model) F-102: Oxford Flower-102 dataset (8189 flower images from 102 categories) B-200: Caltech-UCSD Bird-200-2011 dataset (11788 bird images over 200 different species) [1]:A. Angelova and S. Zhu. Efficient Object Detection and Segmentation for Fine-Grained Recognition. CVPR, 2013. [15]:X. Guo and X. Cao. FIND: A Neat Flip Invariant Descriptor. ICPR, 2010 [22]:R. Ma, J. Chen, and Z. Su. MI-SIFT: Mirror and Inversion Invariant Generalization for SIFT Descriptor. CIVR, 2010. [23]:S. Maji, E. Rahtu, J. Kannala, M. Blaschko, and A. Vedaldi. Fine-Grained Visual Classification of Aircraft. Technical Report, 2013. [25]:N. Murray and F. Perronnin. Generalized Max Pooling. CVPR, 2014. [28]:M. Paulin, J. Revaud, Z. Harchaoui, F. Perronnin, and C. Schmid. Transformation Pursuit for Image Classification. CVPR, 2014. [30]:J. Pu, Y. Jiang, J. Wang, and X. Xue. Which Looks Like Which: Exploring Inter-class Relationships in Fine-Grained Visual Categorization. ECCV, 2014. [41]:Z. Wang, J. Feng, and S. Yan. Collaborative Linear Coding for Robust Image Classification. IJCV, 2014. [46]:L. Xie, Q. Tian, and B. Zhang. Max-SIFT: Flipping Invariant Descriptors for Web Logo Search. ICIP, 2014. [55]:W. Zhao and C. Ngo. Flip-Invariant SIFT for Copy and Object Detection. IEEE TIP, 2013. 結果 【22】
  • 24. Daisuke Ochi, Akio Kameda, Kosuke Takahashi, Motohiro Makiguchi, Kouta Takeuchi, “VR Technologies for Rich Sports Experience”, in SIGGRAPH E-Tech, 2016. 【23】 Keywords: VR, Sports 新規性・差分 概要 VRを用いた,より実際のスポーツ体験に近づけようとす る試みである.右図のようにHMDやスマートフォン,鏡 を用いて構成されている.全方向カメラ (omnidirectional camera)を用いて撮影された映像をVR空間に投影する. ・スポーツ空間をよりリアルに見せるべく,VRによるス ポーツ表現方法を構成した ・スマートフォンにて3次元空間をより現実的に見せる Kirari! for Mobile! (KfM)のシステムを提案した. Links 論文 http://delivery.acm.org/10.1145/2950000/2949030/a21- ochi.pdf?ip=218.41.245.155&id=2949030&acc=OPENTOC&key=4D4702B0C3E38B35%2E4D4702 B0C3E38B35%2E4D4702B0C3E38B35%2E383ADA7593775D6F&CFID=871467668&CFTOKEN= 81958465&__acm__=1480768293_f65e846e49d013fb0f2c4133e98f4ebb YouTube https://www.youtube.com/watch?v=6DioO_NAMAc
  • 25. Mose Sakashita, Keisuke Kawahara, Amy Koike, Kenta Suzuki, Ippei Suzuki, Yoichi Ochiai, “Yadori: Mask-Type User Interface for Manipulation of Puppets”, in SIGGRAPH E-Tech, 2016. 【24】 Keywords: Mask-type Interface, Kinect 新規性・差分 概要 「能」の人形劇を題材として,マスク装着型でパペットを 遠隔操作できるようなインターフェイスを開発した. KinectやHMDを統合したセンシングシステムをパペットに 同期することで自然な一体感を実現する. ・従来は人が直接操っていた能の人形も,デジタルな世界 では遠隔で操作できる.さらに,自分の表情や動作を伝達 することが可能になることが期待される. Links 論文 http://delivery.acm.org/10.1145/2930000/2929478/a23- sakashita.pdf?ip=218.41.245.155&id=2929478&acc=OPENTOC&key=4D4702B0C3E38B35%2 E4D4702B0C3E38B35%2E4D4702B0C3E38B35%2E383ADA7593775D6F&CFID=871467668& CFTOKEN=81958465&__acm__=1480768243_d92c6cf3ade75e4d0f91b395d34fb786 プロジェクト
  • 26. Shenlong Wang, Min Bai, Gellert Mattyus, Hang Chu, Wenjie Luo, Bin Yang, Juntin Liang, Joel Cheverie, Sanja Fidler, Raquel Urtasun, “TorontoCity: Seeing the World with a Million Eyes”, in arXiv pre-print 1612.00423, 2016. 【25】 Keywords: 3D Database, TorontoCity Benchmark 新規性・差分 概要 広範に渡るトロント市を3次元で復元したというベンチマークの提案. 712.5km^2,8439kmの道路,400,000の建物を復元した.航空機,ドロー ン,自動車という異なる視点から撮影されたデータにより再構成を行った (右図).3次元の地図を生成することが最終目標ではあるが,ベンチマー ク中には複数のタスク --Building Footprint and Road Segmentation, Building Hight Estimation, Instance Segmentation, Building Structured Contours, Road Centerline, Curb Extraction, Semantic Segmentationなど-- を提供する. 2009~2011は10cm/pixel,2012~2013は5~8cm/pixelにてデータをサンプリ ングした. ・従来のデータセットは少量のセンサーにより撮影(カメラ,LiDAR等)さ れているが,本論文のデータは多量のセンサにより撮影された.また,広 範に渡る3Dデータを含んでいるとは言えない. ・OpenStreetMapやGoogle Mapと比較するとさらに高精度かつよりリッチ な3次元データを含んでいると言える. ・セマンティックセグメンテーションの手法において,FCNやResNet-56を 用いて各種タスクの評価を行った.詳細な結果は次ページの表に示すとお りである. ・今後もさらに,Tree Detection, Road Sign Detection, Building Reconstructionなどタスクをさらに追加する予定である. Links 論文 https://arxiv.org/pdf/1612.00423.pdf 著者 http://www.cs.toronto.edu/~slwang/
  • 28. Debidatta Dwibedi, Tomasz Malisiewicz, Vijay Badrinarayanan, Andrew Rabinovich, “Deep Cuboid Detection: Beyond 2D Bounding Boxes”, in arXiv pre-print 1611.10010, 2016. 【26】 Keywords: 3D Cuboid Detection 新規性・差分 概要 平面的な検出ではなく,2次元画像から3次元的に立方体を 検出 (3D Cuboid Detection)する研究を行う.右図のように 詳細な立方体の角を検出する.右下図にはVGGNet- Faster-R-CNNをベースにしたモデルを示す.RPNで通常 通り2Dの候補領域を抽出するが,後段のネットワークで は3Dのボックスを返却する. ・2Dではなく,3Dで立方体を検出するアルゴリズムを提 案した. ・VGG Faster R-CNNモデルをベースにして,2次元の候 補領域,3次元の立方体検出器を生成した. Links 論文 https://arxiv.org/pdf/1611.10010.pdf プロジェクト
  • 29. Yao Li, Guosheng Lin, Bohan Zhuang, Lingqiao Liu, Chunhua Shen, Anton van den Hengel, “Sequential Person Recognition in Photo Albums with a Recurrent Network”, in arXiv pre-print 1611.09967, 2016. 【27】 Keywords: Photo Album, Person Recognition 新規性・差分 概要 長期に渡る写真アルバムを入力することで人物間のつなが りを推定してくれる推定器を構築してくれる.ひとつの写 真に写っているような空間方向や,写真間に現れる時間軸 方向の解析もLSTMの中で推定を行ってくれる.フォトア ルバムにおける人物認識を行うPeople In Photo Albums (PIPA) datasetにてstate-of-the-artな性能. ・CNN-LSTMを用いたフォトアルバムにおける人物認識に おいて最高精度を達成した ・右下表がPIPA datasetにおける性能.オリジナル, Album, Time, Dayにおいて精度評価. Links 論文 https://arxiv.org/pdf/1611.09967.pdf プロジェクト
  • 30. Carlos Arteta, Victor Lempitsky, Andrew Zisserman, “Counting in the Wild”, in ECCV, 2016.【28】 Keywords: Counting, Crowd Analysis 新規性・差分 概要 クラウドソーシングにより位置づけされたペンギンのカウントを行う. 40箇所,1時間に一回記録,数年にわたりペンギンの数の変動を記録す る大規模プロジェクトの一環で行われた.マルチタスクのVGGNetの学 習により,弱教師付き学習でもペンギンのカウンティングができるよ うになった.マルチタスクではセグメンテーションs(p),密度マップ λ(p),不確実性マップ u(p)と3つの関数を同時に最適化することから VGGNetを学習する(右図). ・評価はMean Counting Error (MCE)を用いた.正解値と コンピュータによる推定値の誤差により評価された. ・密度マップのみでなく,セグメンテーションがあった方 が推定地の精度がよくなることがわかった. Links 論文 https://www.robots.ox.ac.uk/~vgg/publications/2016/Arteta16/arteta16.pdf プロジェクト http://www.robots.ox.ac.uk/~vgg/publications/2016/Arteta16/ データセット http://www.robots.ox.ac.uk/~vgg/research/penguins/ ポスター http://www.eccv2016.org/files/posters/P-3B-19.pdf
  • 31. Ziming Zhang, Venkatesh Saligrama, “Zero-Shot Recognition via Structured Prediction”, in ECCV, 2016.【29】 Keywords: Zero-Shot Learning, Zero-Shot Recognition 新規性・差分 概要 従来のZero-Short Learning & Recognitionでは学習したsourceやtarget ドメインを元に,unseenな潜在空間を推定することであるが, Projection Domain Shiftという,推定対象クラスのマッピングが中央で はない問題が生じ,誤認識を引き起こしていた.これを,(1) ラベルな しのデータに対してクラスタの中心を推定,(2) 推定したクラスタ中心 にてtargetドメインの割り当てを更新,(1)(2)をくりかえすことでクラ スタとそのインスタンスの割り当てをよくする. ・従来のTargetドメインやインスタンスの割り当てを改善 し,Zero-Shot Learningにおける精度を改善した ・右下の表では各データセットのAveraveがもっとも高い 性能を達成した Links 論文 https://www.researchgate.net/profile/Venkatesh_Saligrama/publication/308189175_Z ero- Shot_Recognition_via_Structured_Prediction/links/580794ee08ae63c48fec6df3.pdf? origin=publication_list ポスター http://www.eccv2016.org/files/posters/P-3B-22.pdf
  • 32. Mohammad Moghimi, Mohammad Saberian, Jian Yang, Li-Jia Li, Nuno Vasconcelos, Serge Belongie, “Boosted Convolutional Neural Networks”, in BMVC, 2016. 【30】 Keywords: BoosteCNN, Convulutional Neural Networks 新規性・差分 概要 ・今までのBoostCNNのメリットとNetworkを組み合わせ た新規のBoostingアルゴリズムの提案 ・深層学習のアーキテクチャにBoostingを行うための重み を追加するためのアルゴリズムを提案 ・具体的に,Boostingのiterate時に,Boostingの重みを近 似するようなネットワークを組む ・また様々なネットワークに対応可 ・さらに追加したネットワークを最適化し,手間を省くこ とが可能 Links 論文 http://www.bmva.org/bmvc/2016/papers/paper024/paper024.p df プロジェクト 上式は,提案したアルゴリズムである. g(x)はネットワーク,w(x)はBoosting重み、Mはクラス数, Dはトレーニングセットを示す.
  • 33. Yancheng Bai, Wenjing Ma, Yucheng Li, Liangliang Cao, Wen Guo, Luwei Yang, “Multi-Scale Fully Convolutional Network for Fast Face Detection”, in BMVC, 2016. 【31】 Keywords: Fully Convolutional Network, FCN, 新規性・差分 概要 ・高速顔検出に向けたfully convolutional networkの新規ア ーキテクチャの提案 ・異なるスケールの顔モデルをend to endで同時に学習可 能 ・様々なスケールのモデルが同じ畳込み特徴マップを共有 可能 ・VGAの画像に対し,GPA上で約100[fps]で処理が可能 ・FDDB,AFW,Pascal faces datasetでState of the art な 識別率 Links 論文 http://www.bmva.org/bmvc/2016/papers/paper051/paper051.p df プロジェクト
  • 34. Suman Saha, Gurkirt Singh, Michael Sapienza, Philip H. S. Torr, Fabio Cuzzolin, “Deep Learning for Detecting Multiple Space-Time Action Tubes in Videos”, in BMVC, 2016. 【32】 Keywords: Detecting Action, Multiple space-time action, action localization 新規性・差分 概要 ・時間的にトリミングされていない動画内の人物の時間 的・空間的な位置の特定と複数の同時行動の分類を行うア プローチの提案 ・UCF101, J-HMDB- 21, LIRIS-HARL datasetsで精度の向 上と検出速度の向上を確認 本フレームワーク3つの段階で構成される. ・外観および動作検出ネットワークにより,カラー画像と オプティカルフローから行動をローカライズする. ・外観ネットワーク検出はカラー画像とオプティカルフロ ーを動作検出スコアと組み合わせることでBoostingする ・単体の行動例に近いシーケンスであるアクションチュー ブは,動的プログラミングによって2つのエネルギーを最 大化することで構築される. Links 論文 http://www.bmva.org/bmvc/2016/papers/paper058/paper058.p df プロジェクト
  • 35. Won-Dong Jang, Chang-Su Kim, “Semi-Supervised Video Object Segmentation Using Multiple Random Walkers”, in BMVC, 2016. 【33】 Keywords: Video Object Segmentation, semi-supervised, Multiple Random Walkers 新規性・差分 概要 ・半教師あり学習による動画中の物体セグメンテーション アルゴリズムの提案. ・第1フレームでセグメンテーションしたい物体を指定す ることで,その後の動画内の物体をセグメーテーションす る. ・前フレームのセグメンテーションに基づいて前景と背景 の初期分布を推定する. ・その2つの初期分布に基づいてmultiple random walkers(MRW)をシミュレートする(右式). ・SegTrack v2 datasetでパフォーマンスの向上を確認. Links 論文 プロジェクト pfは前景,pbは背景エージェントの動きを示す. rfとrbは再起分布,Acは繊維行列を示す.
  • 36. Pierre Rolin, Marie-Odile Berger, Frédéric Sur, “Enhancing pose estimation through efficient patch synthesis”, in BMVC, 2016. 【34】 Keywords: pose estimation, patch, RANSAC, 新規性・差分 概要 ・平面部分のシーン画像から仮想視点を配置するアプロー チの提案. ・実験では,より正確に推定を行い,処理時間の短縮が確 認された. ・シーンの半局所的な平面のパッチを合成,可視性制約を 使用し,この合成パッチからシーンモデルを充実させる中 間的アプローチを導入 ・. Links 論文 http://www.bmva.org/bmvc/2016/papers/paper105/paper105.p df プロジェクト Fig.1はセグメントパッチに対する仮想視点の位置決めの方法を示 す. Fig.2はパッチ合成による姿勢推定結果の改善例を示す.
  • 37. Peng Wang, Lingqiao Liu, Chunhua Shen, Zi Huang, Anton van den Hengel, Heng Tao Shen, “What’s Wrong with that Object? Identifying Images of Unusual Objects by Modelling the Detection Score Distribution”, CVPR, 2016. 【35】 Keywords: Gaussian Processes (GP), Global SVM, Multi-Instance Learning(MIL) 新規性・差分 概要 ・本論文では, 画像から物体を識別するとき, 画像内の物体 が不規則になることに余ってご認識しがちである.この問 題に対処するために通常の物体と不規則な状態の物体を学 習した検出器を用いて, 複数の画像領域での検出スコアの 分布を調べる.私たちが提案したアプローチは大きなデー タセットに匹敵する方法よりも性能が優れているこ都を示 す. ・ Links 論文 http://www.cv- foundation.org/openaccess/content_cvpr_2016/papers/Wan g_Whats_Wrong_With_CVPR_2016_paper.pdf ・従来のアプローチは「通常のオブジェクトの画像, 異例 のオブジェクトの画像」と「他のオブジェクトの画像」の スコア値の両方の観点および空間分布に異なるレベルのス コアを示すことある.その為, 同時に単一の場所での検出 スコアと複数の領域間のスコアの依存関係をモデル化する ために新たな共分散関数を作成する.
  • 38. Hyun-Koo Kim, Young-Nam Shin, Sa-gong Kuk, Ju H. Park, and Ho-Youl Jung, “Night-Time Traffic Light Detection Based On SVM with Geometric Moment Features”, WASET, 2011. 【36】 Keywords: Night-time traffic light detection, multi-class classification, driving assistance system. 新規性・差分 概要 ・本論文では, 本稿では、夜間における交通信号の検出方 法について述べる.RGBカラー画像から信号光の候補領域 を抽出し, Rutaによって提案された色変換を使用して色領 域で表現し、次に赤と緑の色の優勢領域を候補として選択 し, SVMに 基づくマルチクラス分類器が候補に適用する. 本論文では, BF, BMF, GMFを用いた.提案手法を行った 結果, 平均15ms /フレームの演算時間で検出率の93%に達 した. ・ Links 論文 http://waset.org/publications/8944/night-time-traffic-light- detection-based-on-svm-with-geometric-moment-features ・昼間に信号の暗い領域や照明ランプの領域などの色や特 徴に基づいて, 信号を検出する.昼間の交通光の検出と認 識に焦点を当てた研究が殆どである. .しかし, 夜間での信号認識はあまり行われていない.カ メラでデータセットを取り, RGB画像から, 信号校の情報 を抽出し, ノイズを削除し, SVMで多クラス分類を行い, 信 号機の発行を識別する.本論文では, BF, BMF, GMFを用 いる.
  • 39. Xianbin Cao, Changxia Wu, Pingkun Yan, Xuelong Li, “DAVE: A Unified Framework for Fast Vehicle Detection and Annotation”, arXiv:1607.04564v3, 2016. 【37 】 Keywords: Vehicle Detection, Attributes Annotation, Latent Knowledge Guidance, Joint Learning, Deep Networks 新規性・差分 概要 ・複雑な背景, 物体などがあるビデオデータから車両認識を行うのは困 難である.本論文では, 車検出と属性注釈を効果的に組み合わせた DAVE(Detection and Annotation for Vehicles)の高速フレームワーク を紹介する.従来研究より, 提案手法の方が識別制度, 識別速度が高かっ た. ・ Links 論文 https://arxiv.org/pdf/1607.04564v3.pdf ・モーションベースのアプローチではフレーム減算, 適応的バックグラウ ンドモデリング, オプティカルフローを使用する.しかし, 視覚情報が利 用されにくいため車両以外の移動物体が誤って検出される.提案手法で は, 車両検出と、姿勢、色、種類の注釈を1つのフレームワークに統一す るDAVEを用いる.DAVEは, 車のような物体抽出のための高速車両提案 ネットワーク(FVPN)と, 各提案を検証し, 各車両の姿勢, 色およびタイ プを同時に推定することを目的とする属性学習ネットワーク(ALN)の2 つの畳み込みニューラルネットワークからなる..
  • 40. Xianbin Cao, Changxia Wu, Pingkun Yan, Xuelong Li, “LINEAR SVM CLASSIFICATION USING BOOSTING HOG FEATURES FOR VEHICLEDETECTION IN LOW-ALTITUDE AIRBORNE VIDEOS”, IEEE, 2011. 【38】 Keywords: Vehicle detection, boosting HOG feature, linear SVM, urban environment 新規性・差分 概要 ・移動車両の検出は照度のばらつきおよびシーンの複雑さのために非常 に困難な作業である.照度の変化に敏感ではなく, オブジェクトの形状 と外観を特徴付ける上で優れた性能を示すHOG特徴を用いて, また, 教 師あり学習を実行するための機械学習メタアルゴリズムの一種であるブ ースティングを用いて移動車両を識別する.従来手法と比較して, 提案 手法はより高い検出率、より低い誤検出率およびより速い検出速度にお いてより良い性能を達成した。 ・ Links 論文 http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=6116132 ・従来では, 移動車や静的車を検出するための車の影を含むいくつかの外 観特徴を組み合わせて, 車を識別する.また, 基準フレームで予測された 車両の位置、向き、スケール情報を使用して車両認識を行ったが, 照度の ばらつきおよびシーンの複雑さのために非常に困難である.そのため, オ ブジェクトの形状と外観を特徴付ける上で優れた性能を示すHOG特徴を 用いる. 教師あり学習を実行するための機械学習メタアルゴリズムの一 種であるブースティングを用いる.これらを用いて, 車両分類のための 線形SVM分類器を訓練するために最終的な特徴ベクトルを確立するため に組み合わされる.
  • 41. Liliang Zhang, Liang Lin, Xiaodan Liang, Kaiming He “Is Faster R-CNN Doing Well for PedestrianDetection”,ECCV, 2016. 【39】 Keywords: Faster R-CNN, Pedestrian detection 新規性・差分 手法 結果 概要 ・Faster R-CNNを歩行者検出用にチューニング ・歩行者検出用のベンチマーク(caltech, inria, eth, kitti)で State-of-the-artを達成 ・ Links 論文 https://arxiv.org/abs/1607.07032 ・Faster R-CNNのRPNを用いて歩行者検出(anchorは単一 のアスペクト比で9種のスケール) ・Boosted Forestをカスケードすることでhard negativeに も強い識別器 ・解像度の低い人物を検出できるようhole algorithmを適 用
  • 42. Rupesh Kumar Srivastava, et al. "Higway Networks”, in arxiv:1505.00387, 2015. 【40】 Keywords:Highway Networks 新規性・差分 手法 結果 概要 ・CNNにtransform gateとcarry gateを持たせることで100 層を超えるモデルの学習に成功 ・100層のネットワークでもロスが減少し精度を出すこと ができた ・tansform gateとcarry gateの二つのゲートをCNNに持たせることで伝播の 度合いを調整する Links 論文 https://arxiv.org/abs/1505.00387 ・入力に対し2分岐構造をもち、一方は畳み込みH(x,W)、一方は恒等写像xで 各出力に対しTransform gate T(x,W)とCarry gate C(x, W)で出力の値を調整
  • 43. Francois Chollet, “Deep Learning with Separable Convolutions”, in arxiv:1610.02357, 2016. 【41】 Keywords:Inception, Xception 新規性・差分 手法 結果 概要 ・Inceptionの改良としてXceptionの提案 ・Inception v3を上回る精度を達成 ・通常のCNNでは入力チャネル数×出力チャネル数のフィルタが必要となる が、Xceptionでは入力のチャネルを分割して各チャネルに対し畳み込み最終 的な出力をConcatする Links 論文 https://arxiv.org/abs/1610.02357v1
  • 44. Alex Graves et al., “Hybrid computing using a neural network with dynamic external memory”, in nature, 2016. 【42】 Keywords:google, DNC, LSTM 新規性・差分 手法 結果 概要 ・Differential Neural Computers(DNC)の提案 ・bAbIや経路探索問題などにおいてLSTMを大幅に上回る 精度を達成 ・LSTMでは細かなメモリのやり取りが不可能だったが、メモリ行列とwrite headとread headと呼ばれる書き込みと読み込みを制御する構造を導入する ことで、必要なメモリの書き込みと読み取りを可能にした。 (数式等はスペースの都合上割愛) Links 論文 http://www.nature.com/nature/journal/v538/n7626/pdf/nature20101.pdf ・bAbIにおいて、Mean Error Rate 3.8%、2 typeの質問に 答えられなかった(LSTMはMean Error Rate 7.5%、6type に答えられなかった) ・経路探索においてLSTMでは平均達成率37%に対しDNC では平均達成率98.8%を達成。さらに学習回数はLSTMの 半分(100万回)
  • 45. Yoshua Bengio et al., “Curriculum Learning”, in ICML, 2009. 【43】 Keywords:machin learning, curriculum learning 新規性・差分 手法 結果 概要 ・Curriculum Leaningの提案 ・一般的な学習方法よりも高精度な結果を得た ・モデルの学習を行う際、データの難しさを定義して学習初期段階では簡単 なデータで学習をし、徐々に難しいデータを与えて学習する。 Links 論文 http://ronan.collobert.com/pub/matos/2009_curriculum_icml.pdf
  • 46. Florian Schroff, “FaceNet: A Unified Embedding for Face Recognition and Clustering”, in arxiv:1503.03832, 015. 【44】 Keywords:face net, face recognition 新規性・差分 手法 結果 概要 ・Triplet Lossを用いたEmbeddingの最適化により顔認識 に適した表現の学習 ・顔認識においてState-of-the-artの達成 ・対象となる人をanchorとし、それに対しpositiveとnegativeを定義す る.anchorを基準としたpositiveとnegativeとの距離を学習することでpositive がanchorの近くに、neativeがanchorの遠くになるようなEmbeddingの学習 Links 論文 https://arxiv.org/abs/1503.03832
  • 47. Shuochen Su, et al., “Deep Video Deblurring”, in arxiv:1611.08387, 2016. 【45】 Keywords:Deblurring 新規性・差分 手法 結果 概要 ・up-convolutionを用いたアーキテクチャでVideoベースの ボケ除去を行う ・従来手法と比較してPSNR/MSSIMの指標で最も良い結果 ・segmentationで用いられるup-convolutionを用いたDeBlurNet(DBN)でボケ 除去を実現 ・入力に通常のRGBのみを用いたDBN+singleやOptical Flow画像を追加で入 力するDBN+FLOW、SURFとRANSACを用いたDBN+HOMOGなどの複数の モデルで精度検証 Links 論文 https://arxiv.org/pdf/1611.08387.pdf
  • 48. Alexander Kirillov, et al., “InstanceCut: from Edges to Instances with MultiCut”, in arxiv:1611.0272, 2016. 【46】 Keywords:sgmentation, instance 新規性・差分 手法 結果 概要 ・semantic segmentationとedge detectionを組み合わせる ことでinstanceレベルのsemantic segmentationを実現 ・CityScapesにおいて従来手法の中で最も高精度 ・Fully Convolutional Networksの複数の中間層からfeature mapを取り出して それらを用いてedge検出を行い、superpixelにより情報の補間をすることで edge検出を行う ・semantic segmentationは既存のモデルを用いた Links 論文 https://128.84.21.199/abs/1611.08272
  • 49. Li Wan, David Eigen, Rob Fergus “End-to-End Integration of a Convolutional Network, Deformable Parts Model and Non-Maximum Suppression”, CVPR, 2015. 【47】 Keywords: Deformable Parts Model(DPM), CNN, NMS 新規性・差分 概要 ・全体とパーツの形状およびパーツの位置ずれ・変形に対するコストで 評価するDeformable Parts Model(DPM)とCNNを用いた物体検出を 行う. ・ Links 論文 http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Wan_End-to- End_Integration_of_2015_CVPR_paper.pdf ・従来研究では, 画像サイズを変更し, 著しい歪みを与え,全体を各領域ご とに再計算する必要がある.そのために計算量が多い. ・本手法では, CNNで画像ピラミッドからHOG特長を抽出し, 特長マップ に変形可能な部品モデルに適用し, NMS制御から得られた応答マップに 適用し, 物体を検出する.トレーニングには, 全ての段階で損失関数を使 用する.
  • 50. Jonathan Huang, Vivek Rathod, Chen Sun, Menglong Zhu, Anoop Korattikara, Alireza Fathi, Ian Fischer, Zbigniew Wojna, Yang Song, Sergio Guadarrama, Kevin Murphy, “Speed/accuracy trade-offs for modern convolutional object detectors”, in arXiv, 2016. 【48】 Keywords: Object Detection, Faster R-CNN, R-FCN, SSD 概要 ・CNNによる物体検出の精度・速度のトレードオフを調査. ・メタアーキテクチャ(Faster R-CNN, R-FCN, SSD),特徴抽 出器(VGG, Inception, ResNet等),解像度,bounding box候補 数を変更し比較実験. Links 論文 https://arxiv.org/pdf/1611.10012v1.pdf 新規性・差分 ・Tensorflowでの統一された実装で,三種のメタアーキテク チャの広範な比較実験を実施. ・Faster R-CNNで候補数を減らすと,大きな精度低下無し に高速化が可能であることを示した(候補数50個で,候補数 300個の場合の96%の精度が得られる). ・SSDは特徴抽出器のclassification精度に影響を受けにくい を示した.
  • 51. Zhe Cao, Tomas Simon, Shih-En Wei, Yaser Sheikh, “Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields”, in CVPR submission, 2017. 【49】 Keywords: 2D Pose Estimation, Part Affinity Fields 新規性・差分 概要 2次元姿勢推定の問題に対して,高精度かつリアルタイム(10fps前後)にて 処理可能なフレームワークであるPart Affinity Fields (PAFs)を提案する.2 次元の人物領域をベクトル場(vector fields)として扱い,各部位やその位置 関係に関して最適化する.時系列方向への拡張により,部位推定の信頼度 向上や複数人物などが居た際に全体の整合性を向上する. ・MSCOCO 2016 keypoints challengeにてstate-of-the-art な精度を実現した.また,MPII Multi-Person benchmarkに おいてもトップの精度や処理時間を実現した. Links 論文 https://arxiv.org/pdf/1611.08050.pdf スライド http://posefs1.perception.cs.cmu.edu/Users/ZheCao/Multi- person%20pose%20estimation-CMU.pdf 動画 http://posefs1.perception.cs.cmu.edu/Users/ZheCao/humanpose.mp4
  • 52. Sanghoon Hong, Byungseok Roh, Kye-Hyeon Kim, Yeongjae Cheon, Minje Park, “PVANet: Lightweight Deep Neural Networks for Real-time Object Detection”, in NIPS Workshop Efficient Methods for Deep Neural Networks (EMDNN), 2016. 【50】 Keywords: Object Detection, Faster R-CNN 概要 ・CReLU, Inception, HyperNet 等を組み合わせた,軽量・ 高速な物体検出用CNNを提案. ・ResNet-101の10%以下の計算で,PASCAL VOC2007, VOC2012 で順に84.9%, 84.2% mAPを達成. Links 論文 https://arxiv.org/pdf/1611.08588v1.pdf コード https://github.com/sanghoon/pva-faster-rcnn 新規性・差分 ・現在使用されているネットワークは冗長性が高く,精度を 維持したまま軽量化が可能であることを示した.
  • 53. Min Bai, Raquel Urtasun, “Deep Watershed Transform for Instance Segmentation”, in arXiv, 2016. 【51】 Keywords: Semantic Segmentation, Instance Level Semantic Segmentation 概要 ・watershedアルゴリズムの考えをCNNと組み合わせた Deep Watershed Tranformを提案し,Cityscapesの Instance Level Segmentationでstate-of-the-artを75%向上. Links 論文 https://arxiv.org/pdf/1611.08303v1.pdf 新規性・差分 ・watershed transformのエネルギーをCNNで学習すること で,Instance Segmentationを行った. ・シンプル,高速,高精度,end-to-endでの学習が容易, RNNや反復的な方法を使用しないため任意の数のインスタ ンスを扱いやすい,という利点がある.
  • 54. Jingwei Huang, Huarong Chen, Bin Wang, Stephen Lin, “Automatic Thumbnail Generation Based on Visual Representativeness and Foreground Recognizability”, in ICCV2015, 2015. 【52】 Keywords: various appearance features, content-based image retrieval (CBIR), object recognition 新規性・差分 概要 ・本論文ではどの程度元写真を視覚的に表しているか,サ ムネイル作成のトリミングと縮小を行った後に前景をどの 程度認識できるかの2つを考慮した自動サムネイル生成手 法を提案する.実験より,提案手法が画像に及ぼす効果と 関連する手法と比べて優れていることを示している. ・本手法では2つの考慮すべき要因をモデル化し,従来手 法よりも優れたサムネイルを生成する.1つ目の要因であ るサムネイルの視覚的表現をモデル化する.外観フィーチ ャで画像に対するサムネイルの視覚的表現をモデル化する ことにより,効率的に画像検索が行える.2つ目の要因で あるサムネイルにおける前景認識可能性をモデル化する. トリミングやリスケーリング後は前景の被写体を認識が困 難となるため,サムネイルの有用性が失われる.そこで content-based image retrieval (CBIR) と物体認識から得ら れる共通の画像特徴を適応させる.これにより効果的 に 前景認識可能性をモデル化できる. Links 論文 http://www.cv- foundation.org/openaccess/content_iccv_2015/papers/Huang_ Automatic_Thumbnail_Generation_ICCV_2015_paper.pdf 著者 http://hjwdzh.github.io/peter/ 提案手法による 画像サムネイ例 User studyの結果 提案手法において,サムネイルが元 の写真をどの程度視覚的に表してい るか,どの程度簡単に前景を認識で きるかのバランスを取ることを目指 している. 相互検証比較 提案手法は,オフセットとリスケーリング係 数の観点より,真理値に最も近い一致度とな った. 4つの手法の中で投票を行った結果, 我々の手法が最も多くの票を集めた.
  • 55. Lap-Fai Yu, Noah Duncan, Sai-Kit Yeung, “Fill and Transfer: A Simple Physics-based Approach for Containability Reasoning”, in ICCV2015, 2015. 【53】 Keywords: Voxel Representation, Boltzmann Method (LBM) 新規性・差分 概要 ・オブジェクトアフォーダンスの視覚的認識は強力なコン ピュータビジョンとロボットアプリケーションを構築する ために有効な材料として登場した.本論文では,液体を含 むアフォーダンスである液体収容性の推定について新しい 手法を提案する.我々のアプローチは,液体を注ぐ,移動 させるという2つの単純な物理的プロセスに基づいてコン テナオブジェクトを分析する. ・コンテナの操作に関して,Brandlらはゆがめさせたパラメ ータを使用して源物体から目標物体までの移送注ぎ動作を行 った.Kunzeらは物理的なシミュレーションを用いてオブジ ェクトの操作を推論することを提案した.提案手法ではこれ らの作業と比較し,アノテーションを必要とせず,一般的な 容器に対する注ぎ方向と移動方向の両方を自動的に推論する ことに重点を置く. Links 論文 http://www.cv- foundation.org/openaccess/content_iccv_2015/papers/Yu_Fill_and_Tran sfer_ICCV_2015_paper.pdf 著者 http://www.cs.umb.edu/~craigyu/ 流体シミュレーション(LBM)との比 較 コンテナの識別精度 転送方向および優先順位について ユーザーの選択と自動出力の比較 左:傾き軸推定における精度とリコール対角誤差許容値 右:ガウスノイズSDに対するコンテナの識別精度
  • 56. Ching-Hui Chen, Hui Zhou, and Timo Ahonen, “Blur-aware Disparity Estimation from Defocus Stereo Images”, in ICCV2015, 2015. 【54】 Keywords: relative blur versus disparity(RBD), stereo matching 新規性・差分 概要 ・通常,デフォーカスぼかしはステレオ画像間の視覚的対 応を確立する際に性能低下を引き起こす.そこでステレオ 画像における焦点のミスマッチに対して頑強なぼけ認識視 差推定するためrelative blur versus disparity(RBD)モデルを 提案する.RBDモデルは焦点の不一致を補償するためにマ ッチングコストと集計ウェイトを更新することにより,視 差推定を改善する.合成データセットと実データセットの 両方を使用した実験より,提案アルゴリズムの有効性が実 証された. ・パラメータまたは各方向から画像より形成した焦点スタッ クを用いて較正している従来の手法とは対照的に,提案手法 では一対の焦点外れステレオ画像から視差を推定する一般的 な手段を扱う.フォーカス設定,アパーチャの直径を含むデ フォーカスボケに影響 を与えるカメラパラメータは相対的 なボケを視差の関数として特徴付けるためにRBDモデルの係 数によって簡潔に表される.RBDモデ ルと統合させるため にステレオマッチングを採用する. Links 論文 http://www.cv- foundation.org/openaccess/content_iccv_2015/papers/Chen_Blur- Aware_Disparity_Estimation_ICCV_2015_paper.pdf 合成データで評価された左側 の画像の不良ピクセルの割合 アパーチャの非対称な直径を持つ 実世界での反復テクスチャの実験 反復時のRBDモデルの加重最小二乗フィッティン グ
  • 57. Dongqing Zou, Xiaowu Chen, Guangying Cao, Xiaogang Wang, “Video Matting via Sparse and Low- Rank Representation”, in ICCV2015, 2015. 【55】 Keywords: Video Matting, Discriminative Dictionary Learning, Temporally matting 新規性・差分 概要 ・以前のビデオマッティング手法では,アルファマットを推定 する前に局所的ではないものが導入され,一部のデータで印象 的な結果が得られた.しかし,一方で不十分なサンプルまたは 過剰なサンプルを探すことは良好なサンプルを欠く,ノイズが 出現する可能性がある.他方では,類似の特徴を有するピクセ ルに対して一貫した非局所構造を構築することは困難であり, 空間的および時間的に不一致のビデオマットを生じる.そこで 本論文では空間的,時間的に一貫性のあるマッティング結果を 得るための新しいビデオマッティング方法を提案する. ・本論文では疎と低位の表現を用いた新しいビデオマッティン グ手法を提案する.いくつかのキーフレームにいくつかの疎な 入力がある場合,最初に2つのサブディクショナリからなる辞 書を学習する.これらの2つのサブ辞書はそれぞれ既知の前景 領域および背景領域の内容をキーフレームに記述する.学習さ れた辞書を用いて係数行列を得るために低ランクおよび疎の表 現を追求し,入力ビデオ内のすべてのピクセルを表現する.最 後にアルファ値の局所的な滑らかさを高めるために使用される マルチフレームラプラシアンと組み合わせて各フレームのアル ファマットを解決する. Links 論文 http://www.cv- foundation.org/openaccess/content_iccv_2015/papers/Zou_Video_Matting_v 5つのビデオに対する異なる方法のエラー率の比 較 我々の方法とKNNマッティングの定量的評価、クローズドフ ォームマッティングと非ローカルスムース事前ガイド画像マ ティング
  • 58. Learning Query and Image Similarities with Ranking Canonical Correlation Analysis in ICCV2015 Ting Yao, Tao Mei and Chong-Wah Ngo 概要 画像検索の際に問題となることは,クエリ(言 葉)と画像のランキング関数についてである. 様々なランキング関数が提案されているが,ほ とんどの関数には制限がある. そこで,それらの制限を低減する,クエリと画 像の類似性を学習する新しいランキング標準相 関関数(RCCA)を提案する. 新規性 クエリデータと画像データの共通部分空間を見 つけて,類似度を学習する. また,クエリデータと画像データをクリック回 数によって結び付け,嗜好関係を学習する. LINK http://www.cv-foundation.org/openaccess/content_iccv_2015/papers/Yao_Learning_Query_and_ICCV_2015_paper.pdf 画像ベースの検索結果キーワードベースの検索結 果 【56】
  • 59. The analysis of the influence of fractal structure of stimuli on fractal dynamics in fixational eye movements and EEG signal in Nature 2016 概要 複雑な視覚刺激がもたらす眼球固定運動の可 塑性を調査する. その結果,視覚ダイナミクスのフラクタル時 間構造が視覚刺激のフラクタルダイナミクスに 移動することが分かった. 画像のフラクタル性と脳派信号,眼球固定運 動の間に関係があることを示した. 新規性 画像のフラクタル性(複雑さ)が視覚にもたらす 影響を調査した. LINK http://www.nature.com/articles/srep26639 Hamidreza Namazi, Vladimir V. Kulish and Amin Akrami 実験に用いたフラクタル画像 Dはフラクタル次元 視覚刺激の違いによる,眼球固定運動,脳波信号のフラクタル解析結果 【57】
  • 60. Multifractal analysis of weighted networks by a modified sandbox algorithm in Nature 2015 概要 複雑な加重ネットワークの解析手法として, マルチフラクタル解析に対して,改良サンドボ ックスアルゴリズムを提案する. 加重フラクタルネットワーク(WFN)の仲間で ある,Sierpinski WFNおよび,Cantor dust WFNのマルチフラクタル特性を調査した. また,フラクタル次元と一般化フラクタル次 元がWFNのエッジの重みによって,どのように 変化するかを調査した. 新規性 加重ネットワークには,マルチフラクタル性 が含まれていることを解明し,エッジの重み にも影響を受けていることを解明した. LINK http://www.nature.com/articles/srep17628#conclusions Yu-Qin Song, Jin-Long Liu, Zu-Guo Yu and Bao-Gen Li 【58】
  • 61. The suppression of scale-free fMRI brain dynamics across three different sources of effort: aging, task novelty and task difficulty in Nature 2016 概要 BOLD fMRI信号のフラクタルスケーリングが,様々 な認知的努力のために,抑制されることを示した.ス ケールフリー信号を定量化するハースト信号の減少は, タスクの困難さ,新しさ,そして,老化の影響による. これらの結果より,フラクタルスケーリングが様々 な認知的努力およびタスク関係の指標となることを示 した. ※認知的努力:思考のリソースを消費して,意識して認識すること 新規性 認知的努力およびタスク関係を表す新しい指標の提案 LINK http://www.nature.com/articles/srep30895 Nathan W. Churchill, Robyn Spring, Cheryl Grady, Bernadine Cimprich, Mary K. Askren, Patricia A. Reuter-Lorenz, Mi Sook Jung, Scott Peltier, Stephen C. Strother and Marc G. Berman 上段の3つの図は,ハースト信号,SDBOLDおよびGconnの被験者間 で計算された平均脳地図. 中段の2つの散発図は,run1(不慣れなタスク)とrun2(慣れたタスク), 若年者と高齢者のハースト信号とSDBOLDの関係を表す. 下段の2つの散発図は,run1とrun2,若年者と高齢者のハースト信号 とGconnの関係を表す. 【59】
  • 62. Ippei Suzuki, Shuntarou Yoshimitsu, Keisuke Kawahara, Nobutaka Ito, Atsushi Shinoda, Akira Ishii, Takatoshi Yoshida, Yoichi Ochiai, “Gushed Light Field: Design Method for Aerosol-based Fog Display”, in SIGGRAPH Asia E-Tech, 2016. 【60】 Keywords: Display, Light Field 新規性・差分 概要 ガスの噴出とプロジェクタの放射により空中にディスプレ イを生成する技術.ディスプレイのサイズや描画速度や重 量のトレードオフを解決した.冷却用のエアロゾルスプレ ーを用いて,噴出時のノズルについても形状を変えて施行 を行った.実装としては宙にスプレーを噴出,ウェアラブ ル,ドローンなどにて行った. ・スプレーの噴出とプロジェクタにより,宙に3次元のデ ィスプレイを生成することに成功した. ・ウェアラブルやドローンに実装してディスプレイを構築 した. Links 論文 http://delivery.acm.org/10.1145/2990000/2988244/a9- suzuki.pdf?ip=150.29.147.176&id=2988244&acc=OPEN&key=27692522F5 DD4C64%2E27692522F5DD4C64%2E4D4702B0C3E38B35%2E6D218144 511F3437&CFID=701046516&CFTOKEN=31117022&__acm__=14810731 65_d59eef7080a0f3103b6589586ef86a03 プロジェクト http://digitalnature.slis.tsukuba.ac.jp/2016/08/glf/
  • 63. Samy Bengio, et al., “Scheduled Sampling for Sequene Prediction with Recurrent Neural Networks”, in NIPS, 2015. 【61】 Keywords: 新規性・差分 手法 結果 概要 ・Scheduled Samplingによる系列データの予測 ・RNNによる系列データの予測のための新たな学習方法の 提案 ・系列データ予測では学習の際前段のRNNの出力の真の値を次の入力にする が、その入力を確率的に予測値にして学習する Links 論文 https://arxiv.org/abs/1506.03099
  • 64. R. F. Mansour, “A Robust Approach to Multiple Views Gait Recognition Based on Motion Contours Analysisn ”, WIAR, 2012. 【62】 Keywords: Biometric, silhouette, Motion analysis Introduction 新規性・差分 概要 ・監視カメラの角度によって, 人物認識が困難になることがある.本論 文では,コンピュータビジョン技術によって人間の歩行を分析, 分類する ための自動歩行認識のアプローチを提案する. ・ Links 論文 http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=6210572 ・現在の歩行認識は, 視野角が変更されているために認識するのに困難と なる.これは、歩容特徴データベースが生成された視野角でのプローブ データが取得されたときの視野角と同じでない可能性がある. ・本手法では, 視差, 既知の較正パラメータと3次元シルエットをもたらす 輪郭の2次元座標を用いて輪郭の座標。抽出された人間の輪郭のインスタ ンスに示し, 移動シルエットの変化の法則を分析し、アルゴリズムの複雑 さを低減するために, ステレオシルエットベクター(SSV)を用いて, 人 の方向の変化,腕の振りや足の歩行, 3つの水平セグメントにバイナリシル エットを細分化する.
  • 65. Roland Kwitt, Sebastian Hegenbart, Roland Kwitt, Sebastian Hegenbart, “One-Shot Learning of Scene Locations via Feature Trajectory Transfer”, CVPR, 2016. 【63】 Keywords: appearance of scenes changes, Places-CNN, feature trajectory transfer 新規性・差分 概要 ・屋外のシーン外観において, 雨, 晴れなどによって 一時的な属性の強 さによって変化する.本稿では, 属性の変動性を属性の強さの関数とし てどのように画像表現が変化するかを研究する.本手法では, 表現に基 づいてシーン画像の過渡状態を予測することができる。 第2に、そのよ うな過渡状態と特徴表現の要素との間の関数依存性を、特徴空間におけ る軌道としてモデル化することができる。 ・従来研究では, 屋外のシーン外観において, 雨, 晴れなどによって 一時 的な属性の強さによって変化する. ・提案手法では, シーンの位置の外観が一時的なシーン属性の状態に応 じてどのように変化するかを教師あり画像から得た情報を取り入れて, 一時的な属性の強さを弱める. Links 論文 http://wwwx.cs.unc.edu/~mn/sites/default/files/kwitt_cvpr_2016.pdf
  • 66. Fengfu Li, Bo Zhang, Bin Liu, “Ternary Weight Networks”, in NIPS Workshop Efficient Methods for Deep Neural Networks (EMDNN), 2016. 【64】 Keywords: Low Precision Network, Ternary Weight Network 概要 ・三値(-1, 0, 1)の重みを使用するTernary Weight Network (TWN)の最適化方法を提案. ・TWNは,binary precision (BinaryNet, XNOR-Net等)の約 38倍の表現力(3×3フィルタの場合。33×3 / 23×3 ≒ 38)が あり,full precisionよりわずかに低い精度を,高速・省メ モリで実現可能. Links 論文 https://arxiv.org/pdf/1605.04711v2.pdf コード https://github.com/fengfu-chris/caffe-twns 新規性・差分 ・full precisionネットワークをTernary Weightで近似するため の,シンプルで高精度な閾値ベースの近似解法を提案.
  • 67. Ganesh Venkatesh, Eriko Nurvitadhi, Debbie Marr, “Accelerating Deep Convolutional Networks using low-precision and sparsity”, in arXiv, 2016. 【65】 Keywords: Low Precision Network, Ternary Weight Network 概要 ・2-bit precisionのResnet-152で,ImageNet Top-5 accuracy 93.2%を達成. ・専用のアクセラレータである,Deep Learning Accelerator Core (DLAC)を開発. ・重みは三値(-1, 0, 1)のいずれかを取り,またReLUを使用す るため,演算の半数以上がゼロ掛けの演算となる.このような演 算を省略することで,1 TFLOPS/mm2 相当の演算性能を実現. Links 論文 https://arxiv.org/pdf/1610.00324v1.pdf 新規性・差分 ・従来手法では精度を妥協していたのに対し,提案手法では 32-bit precisionの場合とほぼ同等の精度を実現. ・従来のアクセラレータの約4倍の演算性能を実現.
  • 68. Mitsuru Ambai, Takuya Matsumoto, Takayoshi Yamashita, Hironobu Fujiyoshi, “Ternary Weight Decomposition and Binary Activation Encoding for Fast and Compact Neural Network”, in ICLR submission, 2017. 【66】 Keywords: Low Precision Network, Ternary Weight, Integer Decomposition 概要 ・整数基底分解を用い,以下の(1),(2)により学習済みネットワー クの計算量を低減. (1)重み行列を三値の基底行列と実数値の係数行列の積で近似 (2)activation vectorをbinary vectorの重み付き和で近似 Links 論文 https://openreview.net/pdf?id=ByOK0rwlx 新規性・差分 ・XNOR-Net等と異なり学習アルゴリズムの変更が不要. ・Deep CompressionやDistillationのような再学習が不要.
  • 69. Shunsuke Saito, Lingyu Wei, Jens Fursund, Liwen Hu, Chao Yang, Ronald Yu, Kyle Olszewski, Stephen Chen, Isabella Benavente, Yen-Chun Chen, Hao Li, “Pinscreen: 3D Avatar from a Single Image”, in SIGGRAPH Asia E-Tech, 2016. 【67】 Keywords: Avartar, Face 新規性・差分 概要 単眼画像から3次元の顔を捉えてアバターを投影する. 異なる人物間においても顔や顔パーツ認識を行い,ア バターを設定可能.CVPR2016にて行われていた企業 デモをSIGGRAPH Asiaにおいても発表した. ・単眼カメラからの3Dアバターシステムを提案した. ・単眼画像から人物の顔を認識してアバターを設定する Links 論文 http://delivery.acm.org/10.1145/3020000/3014572/a15- li.pdf?ip=150.29.147.176&id=3014572&acc=OPEN&key=27692522F5DD4C64%2 E27692522F5DD4C64%2E4D4702B0C3E38B35%2E6D218144511F3437&CFID =701046516&CFTOKEN=31117022&__acm__=1481072698_e0fde8d3c2025936 f83c10b13af93ab5 動画 https://www.youtube.com/watch?v=oHEW4WjmI5o
  • 70. Daniel Onoro-Rubio, Roberto J. Lopez-Sastre, “Towards perspective-free object counting with deep learning”, in ECCV, 2016. 【68】 Keywords: Counting, 新規性・差分 概要 混雑状況において人物や自動車などをカウントする問題 を取り扱う.提案のモデルはCounting CNN (右図左), Hydra CNN (右図右)である.Counting CNNは全て畳み込 み層により構成,Hydra CNNはマルチスケールから畳み 込みを行い,全結合層にて全てのマップを統合する. ・混雑状況のカウンティング問題に対してふたつのアーキ テクチャを構築した. ・結果はデータにより良し悪しがあるが,概ねHydra CNN の方が良好な精度を出した. Links 論文 http://agamenon.tsc.uah.es/Personales/rlopez/docs/eccv2016- onoro.pdf コード https://github.com/gramuah/ccnn YouTube https://www.youtube.com/watch?v=juXI2WpS4K0 ポスター http://www.eccv2016.org/files/posters/P-3B-26.pdf
  • 71. Noah Siegel, Zachary Horvitz, Roie Levin, Santosh Divvala, Ali Farhadi, “FigureSeer: Parsing Result- Figures in Research Papers”, in ECCV, 2016. 【69】 Keywords: Research Paper Analysis 新規性・差分 概要 CNNを用いた,研究論文の解析.論文から図を切り取り図 を解析する.グラフやOCRにより文字を読み取り,グラフ 中からベストな手法や数値を出力する.また,類似してい る論文をレコメンドすることも可能である.Paper Corpus をsemanticscholar.orgから,Figureをpdffigures.allenai.org から取り出した.60Kの論文画像をCNNにより学習して各 種要素を取り出した. ・論文の画像を解析してグラフの結果や各種情報を取り出 すための手法を提案した ・定量的な評価で各種タスクの精度(上表),AlexNet, ResNetなどによる評価(下表)が記載されている. Links 論文 http://ai2-website.s3.amazonaws.com/publications/Siegel16eccv.pdf プロジェクト http://allenai.org/plato/figureseer/ デモ https://docs.google.com/forms/d/e/1FAIpQLSfsqXAyWEogohaexOUzz- 8GfnymdYUnuTvMrAqfrqwbbtWWmg/viewform コード https://github.com/allenai/figureseer データセット ai2-website.s3.amazonaws.com/data/FigureSeerDataset.zip ポスター http://www.eccv2016.org/files/posters/P-3B-29.pdf
  • 72. Jacob Walker, Carl Doersch, Abhinav Gupta, Martial Hebert, “An Uncetain Future: Forecasting from Variational Autoencoders”, in ECCV, 2016. 【70】 Keywords: Forecasting Flow, Variational Autoencoders (VAE) 新規性・差分 概要 生成的にフローを予測する研究.VAEを用いてトラジェク トリの分布や予測を行う.画像における将来のモーション を推定する. ・右図のように動画の入力からモーションを予測した.オ プティカルフローとして予測を実行している. ・表にRepresentation learningの評価について記述されて いる. Links 論文 http://www.cs.cmu.edu/~jcwalker/DTP/eccv2016.pdf プロジェクト http://www.cs.cmu.edu/~jcwalker/DTP/DTP.html ポスター http://www.eccv2016.org/files/posters/P-3B-39.pdf
  • 73. Satoshi Iizuka, Edgar Simo-Serra and Hiroshi Ishikawa,“Let there be Color!: Joint End-to-end Learning of Global and Local Image Priors for Automatic Image Colorization with Simultaneous Classification ”, in SIGGRAPH, 2016. 【71】 Keywords: CNN, Colorization 新規性・差分 概要 白黒画像からカラー画像への自動変換手法である. 4種類のネットワークを用いる.異なるスケールから大域 的特徴と局所的特徴を抽出し,Fusion layerにて領域とそ のラベルが結合し,de concolutionより色画像を生成する. この彩度画像と輝度画像をアップサンプリングし復元画像 を生成する. Links Project:http://hi.cs.waseda.ac.jp/~iizuka/projects/colorization/ja/ Paper :http://www.bmva.org/bmvc/2015/papers/paper119/paper119.pdf 入力画像のサイズに制限がない.またモデルの学習に大規模デ ータセットを用いたことから,色とラベルをともに学習してい ることにより自然な色付けを可能にした.
  • 74. Edgar Simo-Serra, Sanja Fidler, Francesc Moreno-Noguera and Raquel Urtasun,“Neuroaesthetics in Fashion: Modeling the Perception of Fashionability”, in CVPR, 2015. 【72】 Keywords: Fashionability,conditional random field, Linear regression 新規性・差分 概要 ファッション推奨システムの提案.SNSにアップロードされる 画像より抽出ッする特徴と,画像のタグといったメタデータを 条件付き確率場(下)によりFashionabilityを学習し,線形回帰よ り評価している.また,SNS上にアップロードされた大規模・ 長期間Fashionabilityを学習することにより背景および,アイテ ムの推奨が可能である. Links Project:http://hi.cs.waseda.ac.jp/~esimo/ja/research/fashio nability/ Paper: http://hi.cs.waseda.ac.jp/~esimo/publications/SimoSerraCV PR2015.pdf Fashionabilityという,いわゆる「お洒落度」のような感 性を数値化し,14万枚からなるFashion 144k データセッ トを公開した.さらにファション性とGDPの関連性解析 といった社会学的側面からの考察も行っている. (上) ファ ッション 推奨シス テムの概 要 (左)Fashi onability の採点要 素
  • 75. Yedid Hoshen, Shmuel Peleg, “An Egocentric Look at Video Photographer Identity”, CVPR, 2016.【73】 Keywords: Egocentric cameras, CNN, LPC, Optical Flow 新規性・差分 概要 ・一人称視点のカメラから撮影した風景を認識し, 撮影している人を特定 する.これにより, その人のアイデンティティを特定することができる. 手法として, 物理的に動機付けされた手書きの記述子と畳み込みニューラ ルネットワークで認識する.認識制度は約90%である. ・従来研究では, 写真のスタイルと写真の場所は写真家の認 識の手がかりとして使用しているが, どちらの方法もデフォ ルト設定と同じ場所でカメラを使用する写真家を区別して いない. 提案手法では, 一人称視点のカメラ映像の撮影者を認識する 手法を用いる. Links 論文 http://www.cs.huji.ac.il/~peleg/papers/cvpr16-biometric.pdf
  • 76. Jan Schluter, “Learning to Pinpoint Singing Voice From Weakly Labeled Examples”, in ISMIR, 2016.【74】 Keywords: Singing Voice Detector 新規性・差分 概要 楽器に関する音楽の検出は容易にできるようになってきた が,一方で歌声の検出はばらつきが大きいため困難な問題 として扱われてきた.本論文では歌声の検索を題材として その学習方法を提案する.Convolutional Neural Networks (CNN)を用いるだけでなく,Multiple Instance Learning (MIL)や顕著性マップを用いている.30秒単位のアノテー ションされた音楽のシーケンスを10,000サンプル用意し, CNNにより学習する. ・MILや顕著性マップによる精度向上がメインの貢 献である ・ピンポイントで楽曲から歌声位置を特定するこ とに成功した Links 論文 https://18798-presscdn-pagely.netdna- ssl.com/ismir2016/wp- content/uploads/sites/2294/2016/07/315_Paper.pdf 関連研究 http://www.ofai.at/~jan.schlueter/pubs/2015_ismir.pdf
  • 77. H. Chen, A. Gallagher, and B. Girod,“Describing Clothing by Semantic Attributes”, in ECCV, 2012. 【75】 Keywords: Attributes,conditional random field 新規性・差分 概要 イベントに合わせたファッション解析,性別分類をといった アプリケーション開発を念頭に置いた,姿勢に基づいた複数の 属性およびファッション推定手法の提案である. Links Paper: http://chenlab.ece.cornell.edu/people/Andy/publications/ECCV2012_ ClothingAttributes.pdf 特徴抽出段階の間に人間の姿勢モデルを組み込み,条件付き確 率場の最適化によって属性間の共起性を評価することで制約のな い画像中においても精度の良いファッション推定を可能にした. (上)提案アプリケーション (Dressing Style Analysis)の出 力例 (左)属性の分類手法の比較結果. 赤色が提案手法(姿勢推定+特 徴連結)を用いた手法で,推定 精度が最も高かった属性の個 数が多い. 姿勢推定より推定した胴体より40種類の特徴を抽出する.属性ご とにSVMより所属確率を算出し,条件付き確率モデルの最適化に より属性間の依存性を評価し,画像中に含まれる属性のリストを
  • 78. Eddy Ilg, Nikolaus Mayer, Tonmoy Saikia, Margret Keuper, Alexey Dosovitskiy, Thomas Brox, “FlowNet 2.0: Evolution of Optical Flow Estimation with Deep Networks”, in arXiv, 2016. 【76】 Keywords: Optical Flow, FlowNet 概要 ・オプティカルフローを推定するCNNであるFlowNetを改良し精 度・速度を向上.Sintel, KITTIでstate-of-the-artと同程度の精度を 高速(8fps)に得られる. ・元のFlowNetと同等の精度は140fpsで得られる. ・motion segmentation, action recognitionでの有効性を示す. Links 論文 https://arxiv.org/pdf/1612.01925v1.pdf プロジェクト・動画 http://lmb.informatik.uni- freiburg.de/Publications/2016/IMKDB16/ FlowNet関連まとめ資料 http://www.slideshare.net/cvpaperchallenge/20 1607cvpaperchallenge2016/51 http://www.slideshare.net/cvpaperchallenge/20 1607cvpaperchallenge2016/52 新規性・差分 ・学習データの与え方が重要であることを示した(Chairsデータセ ットで学習後,Things3Dでファインチューニングすると良い). ・中間層のオプティカルフローでwarpingを行うスタック型アーキ テクチャを開発. ・小さな変位に特化したサブネットワークを導入し,小さな変位 に対応.小さな変位用にデータセット(ChairsSDHom)も作成.
  • 79. Random Features for Sparse Signal Classification,Jen-Hao Rick Chang, Aswin C. Sankaranarayanan, B. V. K. Vijaya Kumar; The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016, pp. 5404-5412 【77】 Keywords: Ramdon Feature 新規性・差分 概要 本稿では、画像のように、疎な表現を楽しむ信号のランダムな特徴に対 する性能保証を導出し、カーネル類似度行列の所望の近似を達成するた めに必要とされるランダムな特徴の数が疎信号に対して著しく小さくな ることを示す。これに基づいて、データセットの低次元投影を最初に取 得し、続いて低次元投影上のランダム特徴を導出する圧縮ランダム特徴 と呼ばれる方式を提案している。 推論性能を達成するための同様の理論的保証を享受しながら, 従来のランダムな特徴よりも信号次元,計算時間,およびス トレージコストの大幅な改善があった. Links 論文 : http://www.cv- foundation.org/openaccess/content_cvpr_2016/papers/C hang_Random_Features_for_CVPR_2016_paper.pdf
  • 80. ”Discriminative Invariant Kernel Features: A Bells-and-Whistles-Free Approach to Unsupervised Face Recognition and Pose Estimation”,Dipan K. Pal, Felix Juefei-Xu, Marios Savvides; The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016, pp. 5590-5599 【78】 Keywords: 新規性・差分 概要 単一性としてモデル化されたnuisance transformationsへの不変性を生 成するために,明示的に区別して「単純な」アプローチを提案する.実 際には、このアプローチでは,非ユニタリ変換も同様に処理できます. 理論的結果は,不変の最近の理論が単一カーネルに基づいた差別的およ び核化された特徴にまで及ぶ範囲を拡大できる.特殊なケースとして、 単一の共通フレームワークを使用して、顔認識のための対象固有の姿勢 不変特徴を生成することができ,その逆もまた同様である 提案手法(DIKF)は,非常に難しい大規模な半合成フェースマッチン グや,ランドマークを使用しないアライメントされていない顔を用い た姿勢推定プロトコルの下でうまく機能することを示した,CMU MPIEでベンチマークを行い、オフアングル・フェース・マッチングの ほとんどすべてのケースで前の作業よりも優れています. Links 論文 : http://www.cv- foundation.org/openaccess/content_cvpr_2016/paper s/Pal_Discriminative_Invariant_Kernel_CVPR_2016_ paper.pdf
  • 81. “Deep Saliency with Encoded Low level Distance Map and High Level Features”,Gayoung Lee, Yu-Wing Tai, Junmo Kim, The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016 【79】 Keywords: low level feature,high level feature 新規性・差分 概要 顕著性検出の最近の進歩はシーン内の顕著な領域を検出するための高 レベルの特徴を得るために深い学習を利用してきた.これらの進歩は, 顕著性検出のために手作りの低レベルの特徴を利用する以前の研究よ り優れた結果を示している.ハンドクラフト特徴が高度な特徴のみを 使用する顕著性検出のパフォーマンスを向上させる補完的な情報を提 供できることを示します. エンコードされた低レベルの距離マップと高レベルのフィー チャを連結し、それらを完全に接続されたニューラルネット ワーク分類器に接続して、クエリ領域の顕著性を評価する。 実験より、深層学習に基づく顕著性検出方法の性能をさらに 改善できることを示した。 Links 論文 : https://arxiv.org/pdf/1604.05495v1.pdf
  • 82. “VLAD3: Encoding Dynamics of Deep Features for Action Recognition”,Yingwei Li, Weixin Li, Vijay Mahadevan, Nuno Vasconcelos; The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016, pp. 1951-1960 【80】 Keywords: action recognition,VLAD for Deep Dynamics 新規性・差分 概要 Deep Featureを用いた動作認識への以前のアプローチは、小さな時間 領域内でのみビデオフレームを処理する傾向があり、遠距離の動的な 情報を明示的にモデル化しない。しかし、そのような情報は、特にサ ブアクションを共有する複雑な活動の区別や、トリミングされていな いビデオを扱う場合に、アクションの正確な認識に重要です。ここで は、さまざまなレベルのビデオでの動作を考慮した、Deep Dynamics (VLAD^3)の表現を提案します。 Deep Featureとハンドクラフト特徴を組み合わせることで,従来手 法よりも高い精度で,動作認識ができている. Links 論文 : http://www.cv- foundation.org/openaccess/content_cvpr_2016/paper s/Li_VLAD3_Encoding_Dynamics_CVPR_2016_pap er.pdf
  • 83. “Action Recognition in Video Using Sparse Coding and Relative Features”,Anali Alfaro, Domingo Mery, Alvaro Soto The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016 【81】 Keywords: action recognition,Sparse Coding 新規性・差分 概要 この研究は、スパースコーディングを用いたビデオにおけるカテゴリ ベースの動作認識へのアプローチを提示している。提案されたアプロ ーチは主に2つの貢献がある.1つ目は代表的なアトミックアクション アクションまたはキーシーケンスを縮小されたセットに分解すること によって、クラス内変動を処理すること,2つ目は新しいビデオ記述 子(ITRA:時系列関係法記述子)を提案している. 提案手法は,いくつかの一般的なベンチマークデータセット で顕著なアクション認識性能に達し,代替技術を大幅に上回 る性能を発揮している. Links 論文 : https://arxiv.org/pdf/1605.03222v1.pdf
  • 84. Fabrication of Multscale Fractal-Like Structures by Controlling Fluid Interface Instability in Nature 2016 概要 細胞プレート上の流体界面の不安定性を制御する ことによって,拡張性のある規則的なフラクタル構 造を製作する. 流体は物質ごとに効率的に流れる.その流れを制 御することで,様々な規則的なフラクタル構造が製 作できる. その一例として,Caylry treeのフラクタルパター ンを製作した. こうして作成したフラクタル構造は,動物の肺内 部の血管の構造や植物の葉脈に類似する特徴がみら れる. 新規性 ・拡張性のある規則的なフラクタル構造の作成方法 ・ガス交換や血流などの用途としての 生物の構造を直接的に評価することができる. LINK http://www.nature.com/articles/srep37187 Tanveer ul Islam and Prasanna S. Gandhi Caylry treeの表現 【82】
  • 85. Aqueous synthesis of LiFePO4 with Fractal Granularity in Nature 2016 概要 リチウムイオンバッテリーに使用されるLiFePO4の電極 はフラクタル構造を有することができる.フラクタル構造 を持つことにより,水熱法によって,有機溶剤を使わない にもかかわらず,低コストで環境に優しく不純物を持たな いように,作成することができる. 一見複雑な構造を持つが,より単純な微細構造を繰り返 すことによって,成っている. 本手法によって,生成されたLiFePO4を用いたリチウム イオンバッテリーは,従来の高性能バッテリーに匹敵する. 新規性 フラクタル構造を有するLiFePO4の開発手法を提案し た. LINK http://www.nature.com/articles/srep27024 Zahilia Cabán-Huertas, Omar Ayyad, Deepak P. Dubal and Pedro Gómez-Romero Fractal LiFePO4 【83】
  • 86. Unique fractal evaluation and therapeutic implications of mitochondrial morphology in malignant mesothelioma in Nature2016 概要 悪性中皮腫の持つミトコンドリアが動的ネットワークを持ち, 細胞分裂に影響を与える.フラクタルの次元数や空隙性を計測 することによって,ミトコンドリアの動的ネットワークを解 析・評価する手法を提案する. これによって,見分けがつけづらい悪性中皮腫の種類を識別 することができる. *空隙性:フラクタルがどの程度,空間を満たしているかを表す 指標 新規性 悪性中皮腫の持つミトコンドリアの構造をフラクタル次元や空隙 性によって解析することで,見分けがつけにくい悪性中皮腫の変 化を迅速かつ強固で客観的に識別することができる. LINK http://www.nature.com/articles/srep24578 Frances E. Lennon, Gianguido C. Cianci, Rajani Kanteti, Jacob J. Riehm, Qudsia Arif, Valeriy A. Poroyko, Eitan Lupovitch, Wickii Vigneswaran, Aliya Husain, Phetcharat Chen, James K. Liao, Martin Sattler, Hedy L. Kindler and Ravi Salgia 【84】
  • 87. Black carbon radiative forcing at TOA decreased during aging in Nature 2016 概要 大気エアロゾルの一種である炭素粒子の成長過程を,炭素 粒子を小さな球状の単量体からなるフラクタル凝集体として シミュレートした. 炭素粒子の放射強制力が,成長過程において,BOA(大気の 底部)で増加し,TOA(大気の上部)で低下することを示した. また,炭素粒子の放射強制の成長過程は,表面アルベド, エアロゾル光学深度,太陽天頂角にも影響されることが分か った. これらの知見が気候変動の評価に役立つと期待される. 新規性 様々な条件下の出の炭素粒子の成長過程のシミュレ ート LINK http://www.nature.com/articles/srep38592 Yu Wu, Tianhai Cheng, Lijuan Zheng and Hao Chen 【85】
  • 88. Box-covering algorithm for fractal dimension of weighted networks in Nature 2016 概要 重み付けのない複雑なネットワークのフラクタル 次元を測定する古典的手法であるボックスカバーア ルゴリズムを,重み付けされたネットワークのフラ クタル次元を測定するために改良した. 提案手法では,重み付きネットワークのフラクタ ル特性は,ネットワークのトポロジーとエッジ重み によって決定される.また,エッジ重みに基づいて, フラクタル次元を変えることができる. 新規性 ボックスカバーアルゴリズムを重み付けされたネッ トワークに対応させた. LINK http://www.nature.com/articles/srep03049 Dai-Jun Wei, Qi Liu, Hai-Xin Zhang, Yong Hu, Yong Deng and Sankaran Mahadevan 【86】
  • 89. Jakub Sochor, Adam Herout, Jiˇr´ı Havel, “BoxCars: 3D Boxes as CNN Input for Improved Fine-Grained Vehicle Recognition ”, CVPR, 2016. 【87】 Keywords: CNN, vehicle recognition, unpacking 新規性・差分 概要 ・車両認識において, ビデオストリームから車の画像自体を深い畳み込 みニューラルネットワークを用いて, 認識性能を大幅に向上する手法を 述べる. ・ Links 論文 http://www.cv- foundation.org/openaccess/content_cvpr_2016/papers/Sochor_BoxCars_3D_Boxes_CVPR_2 016_paper.pdf ・従来研究では, 2Dの正面から撮影した画像から3Dモデルの車両を使用 して, 検出する.提案手法では監視カメラの映像データに基づく, 3D 情報 の抽出, 利用し, 車両認識する.
  • 90. Xuezhi Wen, Ling Shao, Wei Fang, Yu Xue “Efficient Feature Selection and Classification for Vehicle Detection”, IEEE, 2015. 【88】 新規性・差分 概要 ・Haar-like特徴での車選択, 車両検出の分類を行う.本論文でのアプロー チは理論的に効率の分析を行う.実験結果は, 提案されたアプローチが AdaBoostによる特徴選択プロセスをスピードアップするだけでなく、最 先端の方法よりも優れた検出性能を出力した. ・従来研究では, 形状の特徴を取得できるHOG, CNNより深い層 で行われているDNN, AdaBoostとコンパクトな表現を形成し, 構 造情報を符号化し、複数のスケールから情報を取り込み, 特に効 率的に計算するHaarlike特徴を用いる. 提案手法では, Haar-like特徴のプール層が大規模なため, AdaBoostを使用してサンプルの特徴値をクラスラベルと組み合 わせることで迅速かつ効果的なフィーチャ選択手法を用いる. Links 論文 http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=6898836 Keywords: — AdaBoost, Haar-like features,SVM, vehicle detection, weak classifier
  • 91. Michael B. Chang, Tomer Ullman, Antonio Torralba, Joshua B. Tenenbaum, “A Compositional Object- based Approach to Learning Physical Dynamics”, in ICLR submission, 2017. 【89】 Keywords: Physical Dynamics, Neural Physics Engine (NPE) 新規性・差分 概要 物体の運動を予測するニューラルネット,Neural Physics Engine (NPE)を提案する.単一の物理モデルを計算するの みならず,運動モデルと跳ね返りなどを導入することに成 功した.NPE内で物理計算を行い,2次元のアニメーショ ンの生成を行った. ・簡易的な物理モデルの組み合わせを計算・表現できるニ ューラルネットNPEを提案した ・可視化例は右下に示す通りである. Links 論文 https://arxiv.org/pdf/1612.00341v1.pdf プロジェクト 可視化 https://drive.google.com/drive/folders/0B xCJLi4FnT_6QW4tcF94d1doLWs
  • 92. Yusuf Aytar, Lluis Castrejon, Carl Vondrick, Hamed Pirsiavash, Antonio Torralba, “Cross-Modal Scene Networks”, in arXiv pre-print 1610.09003, 2016. 【90】 Keywords: Cross-Modal Scene Networks 新規性・差分 概要 クリップアートやアート,絵画などあらゆるテクスチャ表現を結びつけ る枠組みを提案した.Places Databaseに含まれるような自然画像やあ らゆるテクスチャ表現を結びつけることを本論文ではCross-Modelとよ び,この対応付けをおこなう手法をCross-Modal Scene Networksとよぶ. 自然画像とあるモダリティの共通の要素を学習して認識ができるように していると考えられる.右図はそのイメージである.分布には共通特徴 が含まれている. ・クロスモーダル学習をシーン認識の場面に適用した ・Natural Image, Sketches, Clip Art, Spatial Text, Descriptions と5つの畳み込みマップを学習により生成し,Pool5にて統合, 共有マップを経て認識を行う ・5種類のクロスモーダルを表現した,Cross-Modal Olaces Datasetを提案した.このデータはPlaces205 datasetをベース にした Links 論文 https://arxiv.org/pdf/1610.09003.pdf プロジェクト http://cmplaces.csail.mit.edu/
  • 93. E. Simo-Serra, S. Fidler, F. Moreno-Noguer, and R. Urtasun,“A High Performance CRF Model for Clothes Parsing”, in ACCV, 2014. 【91】 Keywords: Attributes,conditional random field 新規性・差分 概要 意味的な服装の領域分割手法の提案.提案手法では,CPMCアルゴリズ ムにより領域分割を行い,著者らが提案するパラメータ(下表)を用いた条件 付き確率問題としてラベルを推定している. Links Paper: https://pdfs.semanticscholar.org/a361/d7073638d8c4b7b33acde65e a47c5e5e2a73.pdf 従来手法よりもセグメンテーションの精度および,属性間の共 起性の再現率が向上した. (上)提案手法と従来手法によるセマンティックなセグメンテーショ ン結果(中央)セグメンテーションの精度 (下)属性間のJaccard係数(依存関係のある属性X,Yに対する X∩Y/X∪Y)
  • 94. Zezhi Chen, Tim Ellis, “Vehicle Detection, Tracking and Classification in Urban Traffic”, IEEE, 2012.【92】 Keywords: — Gaussian Mixture Model (GMM), HOG, background subtraction 新規性・差分 概要 ・監視カメラによる道路の車両の検出, 追跡, 分類のためのシステムを提案する.本 システムでは, システムは車両を数え、車、バン、バス、バイク(自転車を含む)の 4つのカテゴリを分類する.ビデオの評価結果は96.39%の検出率で, 厳しい気象条件 を含む場合でも、分類精度は94.69%である. ・従来手法では, 急激な照明変化, カメラの振動, 車の種類などに対応しなかった. 本手法では, 急激な照明変化やカメラの振動に対処するために、混合ガウスモデ ル(GMM)と影の除去法を使用する.また, 本手法では背景差分法とHOG特徴を 用いる. Links 論文 http://www.cs.huji.ac.il/~peleg/papers/cvpr16-biometric.pdf
  • 95. Zoya Bylinskii, Adria Recasens, Ali, Borji, Aude Oliva, Antonio Torralba, Fredo Durand, “Where should saliency models look next”, in ECCV, 2016. 【93】 Keywords: Saliency 新規性・差分 概要 顕著性は次にどうなっていなくてはいけないかを問うた論文.顕著性マップ の再実験を行う.現在のstate-of-the-artなモデルを画像タイプ認識,画像認 識,画像領域推定などのタスクで再検証する.今後も人間レベルのパフォー マンスに向けて向上し続けるためにはよりハイレベルコンセプトを学習する 必要があることを突き止めた.より詳細なデータベースを作成した.Action, Face, Important Objectなどタスクや注視領域を対応付けた.また,関連する 姿勢や周囲の物体などより高次なモデルを組み合わせる必要が あるとした. ・Finer-grained なデータセットを生成し,DeepFix, SALICON, Gaze MapなどState-of-the-artなモデルを比較 した ・今後の顕著性マップはより高次なモデルを統合する必要 があると位置付けた Links 論文 https://pdfs.semanticscholar.org/379a/26a63dd0d94bec0d8b7 7328f028cfd0e9f2a.pdf コード http://www.vision.caltech.edu/~harel/share/gbvs.php ポスター http://www.eccv2016.org/files/posters/P-4B-23.pdf
  • 96. K. Yamaguchi, T. Okatani, K. Sudo, K. Murasaki, and Y. Taniguchi,“Mix and Match: Joint Model for Clothing and Attribute Recognition”, in BMVC, 2015. 【94】 Keywords: Attributes, CNN, conditional random field 新規性・差分 概要 CNNの中間層より抽出した特徴と,条件付き確率を用いて属 性間の共起性の強弱も表現するような属性推定手法の提案.属性 推定では,属性と位置をともに学習することで推定精度を向上さ せている. Links Paper: http://vision.is.tohoku.ac.jp/~kyamagu/papers/yamaguchi2015mixma tch.pdf (1) 条件付き確率に基づくラベル間相関の検出 (2) boundary boxと平均画像を用いた属性推定 (3) CNNの中間層とCRFによる属性間の共起性によって属性認識にすること により汎用性が向上した (上左)属性ごとの平均画像 (上右)提案手法と従来手法による画像中に含まれているであろ う属性のリスト(赤は間違い) (下)手法ごとの属性の推定精度
  • 97. JiaJun Wu, Tianfan Xue, Joseph J. Lim, Yuandong Tian, Joshua B. Tenenbaum, Antonio Torralba, William T. Freeman, “Single Image 3D Interpreter Network”, in ECCV, 2016. 【95】 Keywords: 3D from 2D, CNN 新規性・差分 概要 2次元画像から3次元の構造を復元する問題において,2D-3Dを行 うネットワークを構築した.3D Interpreter Network (3D-INN)と 呼ばれるモデルは,キーポイントを検出し3次元に投影して最終 的には3次元構造を復元する(右図).3次元のアノテーションは 手に入れるのが困難であるが,3DCADから取り入れることでコ ントロール可能である.3Dのレンダリングが難しいが,キーポ イントベースで描画する.さらに,2D-3Dの誤差伝播が難しいが, 3D-to-2D Projection Layerを導入してFine-tuningを行った. ・各コンポーネント(Keypoint Estimation, 3D Interpreter)について評価を行った.キーポイン ト検出においてはMdshift (PCP: 69.1, AE: 1.39),提案手法(PCP: 66.7, AE: 1.35)@CUB-200- 2011であった.下のグラフは3D Interpreterに関する検討であり,横軸がRMSE,縦軸が Recallであり,従来手法と比較すると格段に向上が見られ,Fine-tuningを行ったほうが若干 良いことがわかった. ・研究の成果として,画像検索や物体グラフ(t-SNE)を作成するに至った. Links 論文 https://jiajunwu.com/papers/3dinn_eccv.pdf プロジェクト http://3dinterpreter.csail.mit.edu/ 著者 https://jiajunwu.com/ ポスター http://www.eccv2016.org/files/posters/O-4A-02.pdf
  • 98. Lichtsteiner, Posch, Delbruck, “A 128x128 120 dB 15μs Latency Asynchronous Temporal Contrast Vision Sensor”, in IEEE Journal of Solid-State Circuits(JSSC), 2008. 【96】 Keywords: Event Camera 新規性・差分 概要 ETH/UZHのグループがイベントカメラを開発した.時間 解像度は1μs,ダイナミックレンジは120dB, Transmission bandwidthは~200Kb/s,電力は20mWである. 現在,コンピュータビジョンにおいてもイベントカメラが 用いられるようになってきた. ・イベントカメラを開発した ・通常のカメラが固定長の記録なのに対して,イベントカ メラでは非同期なイベントに対応してミリ秒オーダの時間 解像度で撮像する.ピクセル単位の変化で画像を生成する ことができる. Links 論文 https://www.google.co.jp/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&ved=0ahUKEwjI0ZjHiOvQAhUIhbwKHV7 kB6wQFggcMAA&url=http%3A%2F%2Fwww.ini.uzh.ch%2Fadmin%2Fextras%2Fdoc_get.php%3Fid%3D42506&u sg=AFQjCNGdg5jzo1j_pdFOKFO34iHXnNDwYw&sig2=N1-vaKqEYmpQWHV7YETcWQ スライド http://www.rit.edu/kgcoe/iros15workshop/papers/IROS2015-WASRoP-Invited-04-slides.pdf
  • 99. Hanme Kim, Stefan Leutenegger, Andrew Davison, “Real-Time 3D Reconstruction and 6-DoF Tracking with an Event Camera”, in ECCV, 2016. 【97】 Keywords: Event Camera, 6DoF, Visual SLAM 新規性・差分 概要 イベントカメラを用いたVisual SLAMのための6-DoFのカメラトラッ キングを行う.通常のカメラが固定長の記録なのに対して,イベント カメラでは非同期なイベントに対応してミリ秒オーダの時間解像度で 撮像する.イベントカメラはリアルタイムかつ高ダイナミックレンジ であるという特徴も保有するため,SLAM問題に有利であるとして適 用した.右図が提案の枠組みであり,勾配計算・再構成・距離計算の 結果を用いてEKFにより6DoFのカメラ追跡を行う. ・イベントカメラの特性を用いてSLAMを行った ・ミリ秒オーダで撮像できるという点,変化位置のみを記 録するという特性がSLAMにマッチし,リアルタイムでの Visual SLAMを実現した Links 論文 https://www.doc.ic.ac.uk/~ajd/Publications/kim_etal_eccv2016.pdf ポスター http://www.eccv2016.org/files/posters/O-4A-01.pdf YouTube https://www.youtube.com/watch?v=yHLyhdMSw7w 著者 http://www.hanmekim.com/
  • 100. Jian Wang, Aswin C. Sankaranarayanan, Mohit Gupta, Srinivasa G. Narasimhan, “Dual Structured Light 3D using a 1D Sensor”, in ECCV, 2016. 【98】 Keywords: 3D reconstruction, Line Sensor 新規性・差分 概要 2Dから1Dののラインセンサーに置き換えることでローコ ストなシステムになると主張.また,非同期のDynamic Vision Sensor (DVS)になるとも主張した.ここから, Projectorや1D Line-sensorを用いた3次元再構成を行う (右図).ハードウェアの構成も右下図に示す. ・ラインセンサを用いてコストを抑えた撮像系を 構成するとともに,非同期のDVSを作成するこ とに成功した ・同センサを用いて3次元再構成を行った(結果 は図示されているとおり) Links 論文 http://imagesci.ece.cmu.edu/files/paper/2016/DualSL_ECCV16 .pdf プロジェクト ポスター http://www.eccv2016.org/files/posters/O-4A-03.pdf YouTube https://www.youtube.com/watch?v=QayhDr66lAs
  • 101. Rohit Girdhar, David Fouhey, Mikel Rodriguez, Abhinav Gupta, “Learning a Predictable and Generative Representation for Objects”, in ECCV, 2016. 【99】 Keywords: Generative Vector Representation, Object Generation 新規性・差分 概要 物体生成に関するベクトル表現の検討.3次元空間の生成・表現方 法の検討のみならず,そのフレキシブルな変換に対しても行った. 下に示す図は生成のアーキテクチャである.VoxelのAutoEncoder と画像の識別モデルを組み合わせたようなモデルである.3D-2Dの 64 Fully Connected Layerはユークリッド誤差,3DのAutoEncoder はシグモイドのクロスエントロピー誤差.学習はまずAutoEncoder 単体,次に画像ネットワーク,最後に統合モデルを最適化. ・オートエンコーダや画像識別モデルを統合したモデルに より3次元の物体生成を行った.ベクトル表現についても 検討. ・右下図のように,物体の足し算引き算のようなベクトル 表現も行えるようになった Links 論文 https://arxiv.org/pdf/1603.08637v2.pdf プロジェクト https://rohitgirdhar.github.io/GenerativePredictableVoxels/ ポスター http://www.eccv2016.org/files/posters/S-4A-09.pdf コード https://github.com/rohitgirdhar/GenerativePredictableVoxels
  • 102. Hang Chu, Shenlong Wang, Raquel Urtasun, Sanja Fidler, “HouseCraft: Building Houses from Rental Ads and Stree Views”, in ECCV, 2016. 【100】 Keywords: 3D Reconstruction, Building Houses 新規性・差分 概要 広告とGoogle Street Viewから3次元の家を再構成するという 研究.ストリートビューは動かした複数の視点から同じ建物 が移るという特性から3次元再構成を行う.二つの表は物体 検出精度や誤差に関する検討,最後の図は定性的な評価であ り,入力や2次元画像上での検出結果,3次元再構成の結果で ある. ・広告やストリートビューの複数視点から3次元構成を行 い,家を再構成するという研究である ・既存のデータやアイディアで2次元マップを3次元に復元 するという研究 Links 論文 http://chuhang.github.io/files/publications/ECCV_16.pdf プロジェクト http://www.cs.toronto.edu/housecraft/ ポスター http://www.eccv2016.org/files/posters/P-4A-10.pdf コード https://github.com/tfwu/HouseCraft/blob/master/readme.md ビデオ https://vimeo.com/174261051
  • 103. Li Niu, Jianfei Cai, Dong Xu, “Domain Adaptive Fisher Vector for Visual Recognition”, in ECCV, 2016. 【101】 Keywords: Fisher Vector, Domain Adaptation 新規性・差分 概要 ドメイン変換が行えるようなFisher Vectorを提案する. ドメインに依存しないコンポーネントを選択するように 学習する.ここではMaximum Mean Discrepancy (MMD)の最小化による.回帰行列や重みを同時に学習す る. ・画像認識や行動認識に適用した結果,有意な差が見られ た ・右表参照 Links 論文 http://link.springer.com/chapter/10.1007/978-3-319-46466-4_33 ポスター http://www.eccv2016.org/files/posters/P-4A-13.pdf 著者 http://www.ntu.edu.sg/home/asjfcai/
  • 104. Yuqiu Kong, Lijun Wang, Xiuping Liu, Huchuan Lu, Xiang Ruan, “Pattern Mining Saliency”, in ECCV, 2016. 【102】 Keywords: Pattern Mining, Saliency 新規性・差分 概要 顕著性マップを生成するためのシードを探索する問題である. パターンマイニングを最初に行い顕著性マップを行ったほうが ハイレベルな推定になるとした.提案のExternal Random Walk (ERW)は最初のシードの散布を行うためのランダムウォークを ベースとした手法である. ・顕著性を行う前にパターンマイニングを行ったほうがよ いと位置付けた ・右図は顕著性マップのためのMSRA,SODデータセット に対して顕著性を推定した結果である Links 論文 http://202.118.75.4/lu/Paper/ECCV2016/1231.pdf ポスター http://www.eccv2016.org/files/posters/P-4A-15.pdf
  • 105. Mohammadreza Mostajabi, Nicholas Kolkin, Gregory Shakhnarovich, “Diverse Sampling for Self- Supervised Learning of Semantic Segmentation”, in arXiv pre-print 1612.01991, 2016. 【103】 Keywords: Self-supervision, Semantic Segmentation 新規性・差分 概要 カテゴリーベースのセマンティックセグメンテーションにおいて,パラメ ータを特に設定することなく学習を行う”Self-Supervision”を実現するフ レームワークを提案する.この枠組みを実行するためにModular,とても 高速で3分以内で学習を終了する.このフレームワークは[Hariharan+, CVPR15]のHypercolumnsや[Mostajabi+, CVPR15]のzoomout表現をベー スにした自己学習手法である.右図に示すように,画像の入力からマルチ スケールに特徴を抽出して,スコア値から物体ごとや背景にシードを20点 散布して,この位置がセマンティックセグメンテーションのための学習入 力となる. ・物体認識のスコア値を元にしてセマンティックセグ メンテーションを実行するためのシードを抽出,学習 のための入力とした ・Supervisedなモデルには及ばなかったが,一部の手 法よりも精度が高く,今後も向上が期待される Links 論文 https://arxiv.org/pdf/1612.01991v1.pdf プロジェクト
  • 106. Hyun Oh Song, Stefanie Jegelka, Vivek Rathod, Kevin Murphy, “Learnable Structured Clustering Framework for Deep Metric Learning”, in arXiv pre-print 1612.01213, 2016. 【104】 Keywords: Metric Learning, Deep Learning 新規性・差分 概要 画像の距離計算において類似する特徴を空間的に近くに配置するMetric Learningがあるが,それをDeep Learningの枠組みで,さらに構造化学 習にて解くアルゴリズムを考案する.右は本論文におけるフレームワ ークである.CNNの学習(ランキングロス)により近い画像はよりラ ンクが高くなるようにする.結果的に近い画像は出力値が類似するよ うになる.FaceNetのようなTriplet学習に対してはsemi-hard negative mining,lifted structured embedding, n-pairs embeddingを追加した. ・CUB200-2011, Cars196, Stanford online productsのデー タにおいてstate-of-the-artな精度を実現.指標にはNMIや R@Kを用いた(右表) ・t-SNEにてDeep Metric Learningによる画像プロットの空 間を可視化した(右下図) Links 論文 https://arxiv.org/pdf/1612.01213v1.pdf 著者 https://www.cs.ubc.ca/~murphyk/mypapers.html
  • 107. Hengshuang Zhao, Jianping Shi, Xiaojuan Qi, Xiaogang Wang, Jiaya Jia, “Pyramid Scene Parsing Network”, in arXiv pre-print 1612.01105, 2016. 【105】 Keywords: Scene Parsing 新規性・差分 概要 ADE20K datasetを対象としたシーン解析(@ILSVRC2016)に対 してトップの成績を収めた.モデルにResNet-101, -269やピラ ミッド構造を適用して特徴マップの統合を行いセグメンテーシ ョン結果を復元している.その他にはデータ拡張,最終層にて ドロップアウト,Dilated Conv,繰り返し回数の増加,バッチ 正規化などのチューニングを行った. ・結果的に綺麗なセグメンテーションを実現し, ILSVRC2016のScene Parsingタスクにて優勝した ・ベースライン(FCN ADE20K pre-trained model)がが44% に対して,提案の手法は57%を記録した Links 論文 https://arxiv.org/pdf/1612.01105v1.pdf プロジェクト http://appsrv.cse.cuhk.edu.hk/~hszhao/projects/pspnet/index. html コード https://github.com/hszhao/PSPNet スライド http://image- net.org/challenges/talks/2016/SenseCUSceneParsing.pdf
  • 108. Xiaofang Wang, Kris M. Kitani and Martial Hebert ,“Contextual Visual Similarity”, in arXiv:1612.02534, 2016. 【106】 Keywords: Attributes, CNN, Image Retrival, Triplet Loss 新規性・差分 概要 色や行動といった視覚的類似性を考慮できる属性ベースの 画像検索手法の提案.(例:「黒い犬」は,犬という点では「白 い犬」に近いが,色の点では「黒い馬」との類似性の方が高 い)文脈上の視覚的類似性を符号化するために,3枚の画像を 入力し(クエリ画像,正例画像,負例画像)を入力し,VGGNet の重みを学習している. Links Paper: https://arxiv.org/pdf/1612.02534v1.pdf Tripletを用いた属性ベースの画像検索手法である.検索精度がベ ースラインより向上している.また,ラベル付されていない属 性のTripletを出力
  • 109. Wei Yang, Ping Luo and Liang Lin,“Clothing Co-Parsing by Joint Image Segmentation and Labeling”, in CVPR, 2014. 【107】 Keywords: Attributes, Semantic Segmentation, 新規性・差分 概要 衣服の共同解析システムを開発を念頭に置いた,タグ付けのみがされて いる衣服画像を意味的領域分割する手法の提案.Step 1.では画像上の前景 領域を抽出する.分割した領域をexemplar-SVMより統合する.Step 2.で は分割された領域を頂点とした服装構成にコンテキスト情報(例:アイテム の位置および相互関係)を組み込んだグラフィカルモデルを構築し,グラ フカットによりラベルの共同割り当てを行う. Links Paper: http://ss.sysu.edu.cn/~ll/files/clothingparsing_cvpr2014.pdf 2098枚のストリートファッション写真からなるCCPデータセットの提案. 従来手法(Fashionista)と比較し,セグメンテーション・ラベルの認識率が向上
  • 110. Satoshi Iizuka, Yuki Endo, Yoshihiro Kanamori and Jun Mitani,“Single Image Weathering via Exemplar Propagation”, in Eurographics, 2016. 【108】 Keywords: Weathering 新規性・差分 概要 複雑な特徴変動を伴う風化効果の生成手法を提案した.提 案手法では,材質ごとの放射既定関数より生成される風化 度マップによって導かれるパッチを合成し,画像全体で最 適化する.視覚的に自然な風化効果を生成するために、グ ラフカットを使用して顕著な風化特徴を含む”“weathering exemplar”を作成し,それからサンプリングされたパッチを 合成し一貫性を維持する. Links Paper: http://hi.cs.waseda.ac.jp/~iizuka/projects/weathering/data/weathering.pdf Project: http://hi.cs.waseda.ac.jp/~iizuka/projects/weathering/weathering_eng.html 従来手法とは異なり,風化度分布によって導出されるシームレ スなパッチベースの合成によって材質ごとの自然な風化を表現さ せている.これにより,従来手法と比較して自然な風化表現が可 能になった.
  • 111. Lukas Bossard, Matthias Dantone and Christian Leistner,“Apparel Classification with Style ”, in ACCV, 2012. 【109】 Keywords: Attribute, Random foreset, SVM 新規性・差分 概要 画像中の自動属性推定手法の提案.まず上半身を検出する. 次に複数の特徴を密に抽出する.抽出された特徴に対するヒス トグラムはランダムフォレストよってタイプ分類,SVMによっ て属性分類に使用する. Links Paper:http://people.ee.ethz.ch/~lbossard/projects/accv12/accv12_apparel- classification-with-style.pdf Project: http://people.ee.ethz.ch/~lbossard/projects/accv12/index.html ベンチマークデータセットの提案.さらに属性の分類性能につ いて,従来手法が35.07%であるのに対し,提案手法では41.38% であり精度向上を確認した.
  • 112. Peng Wang et al., “What’s Wrong with that Object? Identifying Images of Unusual Objects by Modelling the Detection Score Distribution∗ ”, in CVPR, 2016. 【110】 Keywords: Identification 新規性・差分 概要 シーン内の既知のオブジェクトに含まれる,そのオブジェクト以外の 箇所を特定する.そのクラスに属しはするがそのクラスに特有でない ものを特定することで,検出をより良いものにする.複数の画像領域 におけるスコアの分布を計算して異常な物体を識別する.独自のデー タセットも提案. ・通常の物体画像と異常物体の画像が、スコア値および空 間分布の両方で異なる領域レベルのスコアを示すことに着 目している。これらの分布をモデル化するためにGPを使 用して、それぞれについて2つの生成モデルを作成する。 具体的には、単一の場所における検出スコアと複数の領域 間のスコア依存性を同時にモデル化するため共分散関数を 計算している。 Links 論文 http://www.cv- foundation.org/openaccess/content_cvpr _2016/papers/Wang_Whats_Wrong_Wit h_CVPR_2016_paper.pdf
  • 113. Zhe Zhu et al., “Traffic-Sign Detection and Classification in the Wild∗ ”, in CVPR, 2016. 【111】 Keywords: Traffic-Sign Detection, Dataset 新規性・差分 概要 交通標識の検出と分類をより現実世界に近い画像で,高精度に行う. 照度や気象条件のバリエーションを考慮した,10万枚規模の新しい データセットを公開.GrundTruthとして,bounding boxと標識のマ スクを提供.また,End-to-EndのCNNを認識手法として提案. ・従来の交通標識ベンチマークの111倍の枚数,32倍の解 像度. Links 論文 http://www.cv- foundation.org/openaccess/content_cvpr _2016/papers/Zhu_Traffic- Sign_Detection_and_CVPR_2016_pape r.pdf
  • 114. Yuxing Tang et al., “Large Scale Semi-supervised Object Detection using Visual and Semantic Knowledge Transfer ∗ ”, in CVPR, 2016. 【112】 Keywords: Object Detection 新規性・差分 概要 視覚と意味の両方から,物体の類似性に関する知識を利用.視覚的に も意味的にも類似したカテゴリーは、異なるカテゴリーに比べてより 一般的な伝達可能な特性を示すはずであるという直感に基づく.2つ の画像について,カテゴリ違いとbounding boxの違いをモデル化し この情報を転送して分類器を検出器に変換する. ・ILSVRC2013の100クラス分類で,これまでよりmAPが 3.88向上.類似度の計算はAlexNetの全結合層から. Links 論文 http://www.cv- foundation.org/openaccess/content_cvpr _2016/papers/Tang_Large_Scale_Semi- Supervised_CVPR_2016_paper.pdf
  • 115. Radu Tudor Ionescu et al., “How hard can it be? Estimating the difficulty of visual search in an image∗ ”, in CVPR, 2016. 【113】 Keywords: Obeject Detection 新規性・差分 概要 人間が思う画像の難しさが機械による認識の難しさにどのような影響 を及ぼすか,そしてそれらの特性がどれほど正確であるかを分析する. CNNの回帰モデルにより計算したこの難易度のスコアは,物体の検 出や認識の精度の向上に役立つことを示した. ・難易度スコアは,含まれるアノテーションされた物体の数や, 遮蔽具合など,10ほどの項目から計算している.VGGNetをベー スにした実験では,検出と分類でそれぞれ8%,1%と,計算した" 難しさ"は少なからず精度を向上させることを示した. Links 論文 http://www.cv- foundation.org/openaccess/content_cvpr _2016/papers/Ionescu_How_Hard_Can _CVPR_2016_paper.pdf
  • 116. Nitipat Sirikuntamat , Shin'ichi Satoh, Thanarat H. Chalidabhongse“Vehicle Tracking in Low Hue Contrast Based on CAMShift and Background Subtraction”, JCCSSE, 2012. 【114】 Keywords: — vehicle tracking, CAMShift, vehicle detection, 新規性・差分 概要 ・本論文では, CAMShiftに基づく方法を用いて高速道路で車両を追跡する方法を提案 する. Continuously Adaptive Mean Shift(CAMShift)は, 物体追跡でよく知られているアル ゴリズムである.しかし, CAMShiftには計算量, 識別精度に問題がある.そのため, CAMShiftに基づく新しい手法を用いて, これらの問題を解決する. ・従来研究では, Continuously Adaptive Mean Shift (CAMShift)を用いて, 車両を追 跡する方法があるが, 車の色, 背景の差が大きい為, 車両追跡がしにくい.また, 追 跡する際に見失うと, 大量の計算が必要である. ・提案手法では, 移動する前景オブジェクトと陰影背景を区別できる計算モデル を用いて, 背景の差におけるデメリット, 計算量を改善する. Links 論文:http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=7219770
  • 117. Yang Ji, Ming Yang, Zhengchen Lu, Chunxiang Wang, “Pedestrian Detection aided by Deep Learning Semantic Tasks”, IEEE, 2015. 【115】 Keywords: — traffic light, VSA, spectral residual, HOG, SVM 新規性・差分 概要 ・本論文では, 信号機の検出と認識を行う論文である. 複雑な都市環境での交通信号 の検出と認識の問題を解決するためにVisual Selective Attention(VSA)モデルと HOG機能を統合する方法を提案する.実験結果より, 従来手法より, 提案手法のほう が識別精度, 処理時間は高い. ・従来研究では, 多くの事前作業が行う必要がある.そのため, 地図情報が正確で 最新野茂を使わないといけないので, 計算量のコストが高くなる. ・提案手法では, VSAモデルを使用して、信号機の候補領域を取得し, これらの候 補領域にHOG特徴とSVM分類器を使用して、信号機の正確な領域を取得する. これらの領域内では, グレースケール画像の情報に基づいて信号光の色が認識さ れる Links 論文:http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=7225699
  • 118. Michael Weber, Peter Wolf and J. Marius Zollner, “DeepTLR: A single Deep Convolutional Network for Detection and Classification of Traffic Lights”, IEEE, 2016. 【116】 Keywords: — traffic light, DeepTLR, Bounding Box, DeepTLR 新規性・差分 概要 ・本論文では,リアルタイムで交通信号の検出に関する手法を 述べる.リアルタイムでの信号検出と分類のためのカメラベ ースのシステムであるDeepTLRを提案します.また, 時間的 情報を用いるため, フレーム検出を行い, 信号の検出を行う. リアルタイムアプリケーションに必要なフレームレートで動 作し, 信号機を検出する. ・従来研究では, 信号機認識に用いる地域提案の数に大きく依存 する.そのため, 提案の数が増えるつれて, 信号を検出するのが 困難になる. ・提案手法では, フレーム単位で信号機を検出する.検出および 状態分類には, 各細かいピクセル領域の分類し, バウンディング ボックスによって, 信号機があるところに候補領域を抽出し, 単 一のディープニューラルネットワークを用いて, 信号機を検出す る. Links http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=7535408
  • 119. K.V. Arya, Shailendra Tiwari, Saurabh Behwal, “Real-time Vehicle Detection and Tracking”, IEEE, 2016.【117】 Keywords: Vehicle detection and tracking, Foreground mask 新規性・差分 概要 ・本論文では, 物体の動きの軌跡に焦点を当てた車両の検出お よび追跡のための効率的な方法を述べる.本論文の手法は車 両候補ではないオブジェクトを選択的に削除し, 同時に候補車 両を統合する. ・従来研究では, 車両監視は, 複雑な環境でオブジェクトのを移 動させているため, 車両検出が困難になる.そのため, 車両検出 には生成された前景マスクの品質に依存する. ・提案手法では, 入力動画として低解像度ビデオと高解像度ビデ オの両方を使用する.最後のフレームに達するまで, すべてのフ レームで繰り返し検出と追跡のタスクを実行する. Links http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=7561327
  • 120. Basin entropy: a new tool to analyze uncertainty in dynamical systems in Nature2016 概要 流域エントロピーによって,引力流域の最終状態を判別可能か判断す る手法を提案する. 非線形動力学において引力流域の初期状態が, どのように最終状態につながるかを解析することは重要な問題である. しかし,引力流域の性質によっては,推定が難しい場合もあるため, 予測可能か否かを判別する必要がある. また,フラクタル流域境界が存在するか否かを判断することができる. 境界の流域エントロピーがlog2よりも大きい場合,その流域はフラクタ ル性を持つ.これによって,境界のフラクタル性の判別にも使用できる. 新規性 非線形ダイナミクスの不確定性の探索のための手法として,流域 エントロピーを提案した. LINK http://www.nature.com/articles/srep31416 Alvar Daza, Alexandre Wagemakers, Bertrand Georgeot, David Guéry-Odelin and Miguel A. F. Sanjuán 予測が困難な引力流域(a)と 予測できる引力流域(b) 【118】
  • 121. Strongly enhanced light trapping in a two-dimensional silicon nanowire random fractal array in Nature 2016 概要 Siナノワイヤ(SiNW)の光学特性について報告. 提案したナノワイヤアレイのランダムフラクタル構造が, 材料の屈折率によって,ラマン錯乱と光ルミネセンスを大きく 向上させるので,内面に強力な多重散乱が発生することを示した. 新規性 • 光学特性とフラクタル性の間に強い相関があることを解明 • ランダムフラクタル構造を持ったSiNWの工業的に互換性のある安 価な製造手法の提案 LINK http://www.nature.com/lsa/journal/v5/n4/full/lsa201662a.html Barbara Fazio, Pietro Artoni, Maria Antonia Iatì, Cristiano D'Andrea, Maria Josè Lo Faro, Salvatore Del Sorbo, Stefano Pirotta, Pietro Giuseppe Gucciardi, Paolo Musumeci, Cirino Salvatore Vasi1, Rosalba Saija, Matteo Galli, Francesco Priolo and Alessia Irrera SiNWのSEM像の断面図(a,b) フラクタル次元を示すグラフ(c) フラクタルの空隙性を示すグラフ(d) 【119】
  • 122. Temporal fractals in seabird foraging behaviour: diving through the scales of time in Nature 2013 概要 動物の行動と環境との関係が持つフラクタル性を コガタペンギンの飼育と観察を通して分析した. 4つのフラクタルの解析法で分析を行った結果, そのフラクタル構造はペンギンの潜水距離と餌接種行動時間との間に相 関を示した.また,個体差の影響がほとんどないことを 示した. ペンギンの潜水行動は餌接種行動の中の1行動であるが, フラクタル時間がその基本的な特徴を示すことが分かった. 新規性 動物と環境間の相互作用を分析する手法の提案 LINK http://www.nature.com/articles/srep01884 Andrew J. J. MacIntosh, Laure Pelletier, Andre Chiaradia, Akiko Kato and Yan Ropert- Coudert Frequencyベースでの解析結果(a)と Fractalベースでの解析結果(b) DFA: Detrended Fluctuation Analysis DFAb: Bridge-detrended Fluctuation Analysis HAV: Hurst absolute value method 【120】
  • 123. Fractal Based Analysis of the Influence of Odorants on Heart Activity in Nature 2016 概要 心拍数と嗅覚刺激の関係を調査した.心臓の研究において,外部刺激が心臓へ与える影響を調査することは重要である.外 部刺激の中でも,嗅覚刺激は心電図信号にマッピングされた心臓活動に影響を及ぼすことが分かっているが,その間の関係 性の調査はいまだなされていなかった. 調査の結果,構造的で複雑な付臭剤がフラクタル心拍数の減少を起こしたことから,心拍数の複雑さが付臭剤の分子構造 の複雑さに影響されていることが示された.また,より高いエントロピーを有する付臭剤はより低い近似エントロピーを有 する心拍数を引き起こすことも示された. 新規性 心拍数と臭覚刺激の関係性の解明 LINK http://www.nature.com/articles/srep3855 5 Hamidreza Namazi and Vladimir V. Kulish 付臭剤の臭いの違い(左)と分子構造の複雑さ(右)による時系列のフラクタル次元 【121】
  • 124. Fractal features of soil particle size distribution in newly formed wetlands in the Yellow River Delta in Nature 2015 概要 海岸の新たに形成された湿地における土壌粒怪分布特性をフラクタルスケーリング理論を適用して,解析した. その結果,フラクタル次元とエントロピー寸法は126um未満の微粒子に敏感に反応し,容量次元は126-2000umの粒子に敏感に反応した. 乾季と雨季を比べたとき,土壌のフラクタル次元は雨季で増加した.また,植物の根が張っているときも植物の種類によって影響は異 なるがフラクタル次元は増加した. これらの結果から,植生管理は土壌の品質を 向上するための最も有効な方法であることが判明した. 新規性 土壌粒径分布特性のフラクタルスケーリング理論を用いた解析 LINK http://www.nature.com/articles/srep10540 Junbao Yu, Xiaofei Lv, Ma Bin, Huifeng Wu, Siyao Du, Mo Zhou, Yanming Yang and Guangxuan Han 黄河三角州における新たに形成された湿地の土壌粒径分布のフラクタル特 性 【122】
  • 125. Noninvasive, label-free, three-dimensional imaging of melanoma with confocal photothermal microscopy: Differentiate malignant melanoma from benign tumor tissue in Nature 2016 概要 皮膚癌における悪性黒色腫は皮膚癌患者の2%未満に過ぎないが,死亡者の大多数を占 める.悪性黒色腫の発見のため,患部の3D画像に対して,古典的形態計測法(メラニン密度 及びサイズ分布)とフラクタル解析を用いて解析した.フラクタル解析により,悪性黒色腫 の成長中にメラニン分布がよりカオスとなり,組織化が不十分になることが分かった. その結果,3Dフラクタル解析は悪性黒色腫診断において,従来手法や2Dフラクタル解 析よりも有効であることが分かった. 新規性 従来方法では見分けづらい悪性黒色腫のフラクタル解析を用いた識別 LINK http://www.nature.com/articles/srep30209 Jinping He, Nan Wang, Hiromichi Tsurui, Masashi Kato, Machiko Iida and Takayoshi Kobayashi 悪性黒色腫 良性黒色腫 【123】
  • 126. Optimization of hierarchical structure and nanoscale-enabled plasmonic refraction for window electrodes in photovoltaics in Nature2016 概要 準フラクタル構造を持った金属ネットワークによって,理想的な電極をほぼ完璧 に実現できる. リーフ・ベネレーション・ネットワークは最適構造の重要な特徴を有しており, 他のネットワークよりも優れている. 階層トポロジの要素がネットワークを最適化 しており,5つの階層ネットワークに対して,実証した. また,この構造だけでなく,ナノワイヤを含むネットワークがプラズモン屈折に よって,幾何学的な制約を抑えて透明性を獲得できることを示した. 新規性 ・電極に最適な金属ネットワークの構造の提案 ・幾何学的な制約を抑えた透明性の獲得手法の提案 LINK http://www.nature.com/articles/ncomms12825 Bing Han, Qiang Peng, Ruopeng Li, Qikun Rong, Yang Ding, Eser Metin Akinoglu, Xueyuan Wu, Xin Wang, Xubing Lu, Qianming Wang, Guofu Zhou, Jun-Ming Liu, Zhifeng Ren, Michael Giersig, Andrzej Herczynski, Krzysztof Kempa and Jinwei Gao 電極のネットワーク 【124】
  • 127. The size-distribution of Earth’s lakes in Nature 2016 概要 パーコレーション理論に基づいて,地球上の湖の面積分布を予測し,この 期待値を実際の湖沼センサスデータから評価する. 主要な生態系パターンと過程は湖の大きさに比例しており,湖の面積と個 数の非対称性(大きな湖は少ないが,小さな湖は多い)は,湖の生態系の制約 になっている.しかし,湖の面積分布の記述や評価は不十分である. ここでは,湖の面積をテール指数およびフラクタル次元の累乗積によって, 評価した.それぞれの期待値は,テール指数:2.05,フラクタル次元:4/3と なり,湖沼センサスデータでは,テール指数:1.97,フラクタル次元:1.38と なり,類似したことが確認できた.しかし,8.5㎢未満の呼称は類似しなかっ た.原因として,小さい湖は力学的な影響を受けやすく,地形の挙動がフラ クタル性を持たないためである. 新規性 地球上の湖の面積分布の記述手法の提案 LINK http://www.nature.com/articles/srep29633 少数の大きな湖と多数の小さな湖(NASA) B. B. Cael and D. A. Seekell 【125】
  • 128. Universality in boundary domain growth by sudden bridging in Nature 2016 概要 クラスタ集中における境界領域の変化の際の普遍性について,最大集中 時の限界について報告する. 広範囲のパーコレーションモデルにおいて,幅広く観察可能な普遍的な スケーリング挙動について,初めて報告する. 最大集中時,境界領域が突発的に変化する.モデルとは無関係に,線形次 元Lの2次元正方格子について,境界の界面幅の最大磁化率xは,万能指数 y=1のとき,スケーリングx~Lyを示すとことが分かった. パーコレーション閾値による臨界境界の急速な変化は,普遍的なスケー リングxを強調することが分かった. 新規性 臨界境界の急速な変化における普遍性について調査・報告した. LINK http://www.nature.com/articles/srep21110 臨界未満の境界領域 A. A. Saberi, S. H. Ebrahimnazhad Rahbari, H. Dashti-Naserabadi, A. Abbasi, Y. S. Cho and J. Nagler 【126】
  • 129. Fractality à la carte: a general particle aggregation model in Nature 2016 概要 フラクタル性は,物理的,科学的,生物学的な特徴を決定づけている.そ のため,フラクタル性を引き起こすメカニズムの理解は重要な問題である. メカニズムの解明のために,凝集現象によって成長するクラスタに対し て,いくつかの単純なモデルはフラクタル性をもたらす基本要素の解明に 貢献した.しかし,実際にこれらの要素がどのようにフラクタル性につなが っているかは具体的に解明されていない. ここでは,単純かつ多目的な粒子凝集モデルを提案し,任意のフラクタ ル次元を有する粒子凝集モデルによって,クラスタのフラクタル性と形態 学へのエントロピー的,エネルギー的な寄与を明らかにした. 新規性 フラクタル性をもたらす要素の解明 LINK http://www.nature.com/articles/srep19505 フラクタル・ダイアグラム J. R. Nicolás-Carlock, J. L. Carrillo-Estrada and V. Dossetti 【127】
  • 130. Scaling in topological properties of brain networks in Nature 2016 概要 脳内ネットワークは,相互間のつながりは弱いが全体として高度にモジ ュール化されている. 脳の基本的な動作原理はシステムレベルでの位相自己組織化であること を示唆している.この脳内ネットワークのフラクタル性やスケーリング特性 は,機能的な脳組織に関連するあらゆるレベルの地形学的モジュールやサ ブモジュールの類似した自己組織を示し,レベル内およびレベル間の情報 伝達におけるエネルギーコストが最小限に抑えられることを示した. また,まばらに存在するいくつかのハブは,それぞれのモジュールの機 能に干渉するが,脳内ネットワークの様々なレベルで残りのモジュールに 干渉することはできないことを示した. 新規性 脳内ネットワークの解析 LINK http://www.nature.com/articles/srep24926 線虫,猫,猿の脳内ネットワーク Soibam Shyamchand Singh, Budhachandra Khundrakpam, Andrew T. Reid, John D. Lewis, Alan C. Evans, Romana Ishrat, B. Indrajit Sharma and R. K. Brojen Singh 【128】
  • 131. Heterogeneous Structure of Stem Cells Dynamics: Statistical Models and Quantitative Predictions in Nature 2014 概要 幹細胞集団動態を理解することは,細胞の振る舞いの予測に役立つ. ここでは,3種類の幹細胞中の高速もしくは低速分裂亜集団及び休止細胞 の共存を,非ガウス統計学的アプローチを用いて同定する. 数学的に分析した結果,幹細胞が分子及び触覚シグナルによって,相互 作用するとき,時間依存のフラクタル挙動を示す. これらの結果より,幹細胞ダイナミクスの洗練されたモデルは,2つ以上 の分割サブ母集団の存在と,それらのマルチフラクタル特性を考慮に入れ て,堂宇質性過程を単純化しないことを示唆した. 新規性 幹細胞集団動態の理解 LINK http://www.nature.com/articles/srep04826 幹細胞集団の異種性 Paul Bogdan, Bridget M. Deasy, Burhan Gharaibeh, Timo Roehrs and Radu Marculescu 【129】
  • 132. The role of fivefold symmetry in suppressing crystallization in Nature 2016 概要 結晶化の抑制が動態的または熱力学的性質を持つかを検討する.五角形の 双峰型粒子の配列を優先することで,5重対称性の程度を詳説できるモデル を用いて,5重対称性が面心立法晶への結晶化に動態的,熱力学的影響を持 つことを示した. 5重対称性の度合いは,結晶成長速度にほとんど影響を与えず,ハード球 体システムにおける流体構造によって,結晶の成長が弱く依存するのみで あることを示した.また,5重対称性を増加させると,一次秩序が二十面体 の豊富な二次相に転移することが分かった. 新規性 ガラス結晶の結晶抑制における5重対称性の影響の調査 LINK http://www.nature.com/articles/ncomms13225 二十面体の豊富な位相の核形成 Jade Taffs and C. Patrick Royall 【130】
  • 133. Resolving Fine-Scale Heterogeneity of Co-seismic Slip and the Relation to Fault Structure in Nature 2016 概要 地震による断層の滑り分布は地震の過程の分析のためには重要である.ここでは, 1992年のLanders地震と1999年のHector Mine地震の断層の滑り分布を解析し,そ の変動と幾何学的断層構造の間の空間的相関を発見した. スペクトル解析によって観測された共地震滑りの変動は自己アフィンフラクタル に従う.Landersのフラクタル次元はHector Mineのフラクタル次元よりも高いこと が分かった. 断層の複雑さが不均質な応力状態を引き起こし,それが共地震滑りを制御する物 理的原因として説明できることを提案した. この知見は,断面の構造と地震の破壊動作の間の基本的な関係を示している. 新規性 地震による滑り分布を解析することにより,断面の構造と地震の破壊動作の 間の関係の解明 LINK http://www.nature.com/articles/srep27201 1992年のLanders地震と1999年のHoector Mine地震の相関図 C. W. D. Milliner, C. Sammis, A. A. Allam, J. F. Dolan, J. Hollingsworth, S. Leprince and F. Ayoub 【131】
  • 134. Mathematical Modelling and Prediction of the Effect of Chemotherapy on Cancer Cells in Nature 2015 概要 癌細胞への薬物の拡散とDNA歩行のフラクタル性を考慮して,分裂拡散 方程式を用いて化学療法の効果のモデル化と予測を行った. ここでは,腫瘍内の薬物の拡散とDNA歩行の関係をフラクタル系列とし て作成するFractal Diffusion Equation(FDE)に基づくモデルを構築した. また,癌の効果の分析に有用な薬物を提案するだけでなく,異なる薬物, 癌に対する効果も分析することが可能であることを示した. 新規性 抗がん剤の投与時の薬物の伝達,拡散,消費の様子を予測するために,FDE に基づくモデルを構築した. LINK http://www.nature.com/articles/srep13583 腫瘍への薬物の伝達,拡散および消費の様子 Hamidreza Namazi, Vladimir V. Kulish and Albert Wong 【132】
  • 135. Aerosol influence on energy balance of the middle atmosphere of Jupiter in Nature 2015 概要 NASAの宇宙船VoyagerとCassiniの観測に基づき,太陽熱やガス成分の 赤外冷却だけでは木星の大気中のエネルギーバランスが維持できないこと を示した.エネルギーバランスを維持するために,光とオーロラの化学反応 によって生成されたフラクタル骨材粒子からなる厚いエアロゾル層が中高 経度での成層圏の輻射加熱を促し,局所的にガス加熱の速度を5-10倍に引 き上げていることを示した. 本論文では,このフラクタル骨材粒子が木星以外の惑星でもエネルギー バランスを維持する上で重要である可能性を示した. 新規性 木星のエネルギーバランスの解明 LINK http://www.nature.com/articles/srep13583 木星の加熱と冷却の流れ Xi Zhang, Robert A. West, Patrick G. J. Irwin, Conor A. Nixon and Yuk L. Yung 【133】
  • 136. Neurons in the primate dorsal striatum signal the uncertainty of object–reward associations in Nature 2016 概要 人間や動物は生き延びるために,可変な報酬や未知の報酬を観察し,行 動する必要がある.そこで,不確実な対象に関する行動を媒介するニューロ ン機構を解明する. 霊長類の背側線条体の領域を囲むカプセル内のニューロンが報酬の不確 実性を示していることが判明した. これらの不確実性の応答は,報酬の不確実性に関連するオブジェクトの 存在に依存しており,霊長類の場合,新規のオブジェクト報酬を学習する につれて,急速に進化することが判明した. 新規性 不確実な報酬に関するニューロン機構の解明 LINK http://www.nature.com/articles/ncomms12735 背側線条における選択的報酬と不確実な応答 Xi Zhang, Robert A. West, Patrick G. J. Irwin, Conor A. Nixon and Yuk L. Yung 【134】
  • 137. Fractal cartography of urban areas in Nature 2012 概要 都市部の関連情報への迅速なアクセスは土地利用の理解と規制,その進化に 不可欠である.しかし,都市部の特徴付けと規制は複雑なプロセスが必要であり, 専門家による介入が必要である. そこで,大都市圏の時空間フラクタル解析を行い,地図作製表現とビルドア ップ領域の分類を生成するモデルを開発し,最も近似した計画と規制を必要と する領域を特定する. また,提案したモデルによって特定された都市部の対応によって,政策規制 が柔軟かつ適応性があり,時間通りに行動する必要があるかを示す. 新規性 世界中の都市部の自動分類のため,首都圏のフラクタル解析を行っ た. LINK http://www.nature.com/articles/srep00527 リスボンの首都圏のフラクタル解析 Sara Encarnação, Marcos Gaudiano, Francisco C. Santos, José A. Tenedório and Jorge M. Pacheco 【135】
  • 138. Yuanqi Su, Yuehu Liu, Bonan Cuan, Nanning Zheng, “Contour Guided Hierarchical Model for Shape Matching”, in ICCV2015, 2015. 【136】 Keywords: Match based on TwoStage Deformation, Shape Match with Part Variation 新規性・差分 概要 ・星型モデルはシンプルさと有効性により形状マッチングで一般的である. しかしながら部品間の緩やかな幾何学的接続が欠点である.そこで,本論文 ではこれらの接続を再考し相互に関連するローカルマッチングのセットに対 するグローバルマッチングを減少させる新しいアルゴリズムを提案する. ETHZ形状およびInria Horse データセットの結果より提案手法の有用性が示され た. ・本論文において,与えられた形状テンプレートに類似した物体境界を探索しようとする 画像側か らのマッチング問題を考慮する.この方法では,形状マッチングは与えられたテンプレートを説明 するのに最適な輪郭断片のサブセットを選択する方法である.通常,輪郭断片の選択はNP困難な組 合せ最適化プロセスが含まれる.そこで,我々はオ ブジェクト境界の複数の部分を見つけ出し,それらを閉じた境界に組み立てる手法を 提案する.オブジェクト境界が通常壊れているため,ローカル部分をローカライズする ことはグローバル部分を検出することより簡単である.したがって我々は形状テンプ レートを部分に分割し,部分テンプレートはオブジェクトの関与する輪郭断片の選択を 補助できる.選択された輪郭フラグメントがオブジェクト境界であることを保証できない 場合は隣接する部分テンプレートにある領域を共有させる.共有領域は選択されたフ ラグメント間のギャップを埋めるのに効果的であり最終的に境界にリンクされる. Links 論文 http://www.cv- foundation.org/openaccess/content_iccv_2015/papers/Su_ Contour_Guided_Hierarchical_ICCV_2015_paper.pdf 著者 http://dblp.uni-trier.de/pers/hd/s/Su:Yuanqi ETHZデータセットのFPPI対DR曲 線 比較のための全ての方法として0.2の重複率を使用した. 64はパ ーツを生成するための正方形のサイズである. wは部品バリエー ションとの一致,woは部品バリエーションなしのマッチを表す.
  • 140. Xiang Fu, Chien-Yi Wang, Chen Chen, Changhu Wang, C.-C. Jay Kuo, “Robust Image Segmentation Using Contour-guided Color Palettes”, in ICCV2015, 2015. 【137】 Keywords: contour-guided color palette (CCP), mean-shift (MS), bandwidth (BW) parameters 新規性・差分 概要 ・堅牢な画像セグメンテーションのためにcontour-guided color palette(CCP)が提案されている.それは画像の輪 郭と色の手がかりを効率的に統合する.画像に依存するカ ラーパレットを達成するためにサンプリングされた色空間 内において画像の代表色を見つけるには, mean-shift (MS)アルゴリズムが存在する.このカラーパレットは漏れ 回避,偽の境界線除去,小領域合併などの後処理技術によ ってさらに細かく調整された空間領域における予備のセグ メンテーションを提供する.そこで我々はCCPとMSのセ グメンテーション性能を比較し分析する. ・本研究ではCCPと呼ばれる新しい方法が輪郭と色の手が かりを効果的に統合することを示す.他の方法とは異なり, イメージ依存のカラーパレットを形成するためのガイダン スとして輪郭キの手がかりを取る.これは元の画像の色の 複雑さを低減し,特有の領域を分離するのに十分な数の代 表的な色を保持する. Links 論文 http://www.cv- foundation.org/openaccess/content_iccv_2015/papers/Fu_ Robust_Image_Segmentation_ICCV_2015_paper.pdf 3つの典型的な画像におけるBWパラメータの下 でのMSおよびCCPによる代表色(上)および 境界F-測定(下)の数の比較 3つの典型的な画像におけるMSおよびCCPの代表 的 な色指数に対する累積ヒストグラムのプロット BSDS300データセット上のいくつか の セグメンテーション方法の性能比較 最良の2つの結果が赤色(最良)と青色 (2番目に良い)で強調表示される. 青色,緑色および赤色の曲線は大,中および 小スペクトルBWパラメータを用いて得られる.
  • 141. Ran Ju, Tongwei Ren, Gangshan Wu, “StereoSnakes: Contour Based Consistent Object Extraction For Stereo Images”, in ICCV2015, 2015. 【138】 Keywords: StereoSnakes, Stereo correspondence cost 新規性・差分 概要 ・従来手法では,計算が非常に冗長である.また,ステレ オマッチングアルゴリズムの不完全性のために整合性が損 なわれる可能性がある.そこで本論文では領域の代わりに 一貫性のあるオブジェクト輪郭を探索する輪郭に基づく手 法を提案する.また,いくつかのアプリケーションで、私た ちの方法をステレオ画像編集の基本ツールとしてどのように 使用できるかを示す. ・ステレオマッチングの従来手法では計算コスト非常に高 い,またはアルゴリズムの不正確さにより一貫性のない抽 出につながる可能性がある.そこで1つのビューから別の ビューに輪郭を一致させることにより画像全体をマッチン グさせる.輪郭の探索空間は画像全体の画素よりもはるか に小さいため抽出コストが大幅に削減される. Links 論文 http://www.cv- foundation.org/openaccess/content_iccv_2015/papers/Ju_StereoSnak es_Contour_Based_ICCV_2015_paper.pdf Adobeオープンデータセットの評価結 果 Adobeオープンデータセットのステレオ画 像 ”Lamppost1”の比較結果 上2行は異なる方法の誤ってラベル付けされたピク セルの数と割合を示す.最後の行は異なるメソッ ドの平均処理速度を示す.
  • 142. Federico Camposeco, Torsten Sattler, Marc Pollefeys, “Non-Parametric Structure-Based Calibration of Radially Symmetric Cameras”, in ICCV2015, 2015. 【139】 Keywords: Structure from Motion (SfM) model, Wide Field of View (WFOV) 新規性・差分 概要 ・我々は非中央システムを含む任意の放射対称カメラの内 因性および外因性較正を推定するための新規な2ステップ 法を提案する.最初のSfMモデルから光軸に沿った平行移 動までの構造を仮定してカメラの姿勢を推定する.第2の ステップとして発注制約を使用してカメラ中心の平行移動 を求めることにより較正する. ・写真においてシーンの異なる部分を強くつなぎ合わせる ためにWFOVをSfMモデルに挿入することにより,再構成の 品質を向上させることができる. Links 論文 http://www.cv- foundation.org/openaccess/content_iccv_2015/paper s/Camposeco_Non-Parametric_Structure- Based_Calibration_ICCV_2015_paper.pdf 中央(aおよびb)および非中央カメラcの合成較正 θ(rd) 中枢および非中枢症例の実際の較正
  • 143. Runze Zhang, Shiwei Li, Tian Fang, Siyu Zhu, “Joint Camera Clustering and Surface Segmentation for Large-scale Multi-view Stereo”, in ICCV2015, 2015. 【140】 Keywords: multi-view stereo (MVS), structure from motion (SFM) 新規性・差分 概要 ・スパースポイントベースのカメラクラスタリングは不均 一な再構成被覆率と高い冗長性の問題を抱えている.そこ で最初のまばらな復元から大規模マルチビューステレオに 分解するための手法を提案する. ・従来の手法では再構成領域は3D空間内で均一にサンプ リングされない,再構成シーンのオクルージョンやイメー ジフィーチャの不一致のためSFMポイントが疎であるとい った問題がある.そこで我々は制約付きエネルギー最小化 問題として定式化されるジョイントカメラクラスタリング および表面セグメンテーションにおいての3つの基準を提 案する.また,カメラのクラスタリング問題を確率モデル のパラメータ推定問題として定式化することにより General Expectation-Maximizationアルゴリズムによって解 けるようにする. Links 論文 http://www.cv- foundation.org/openaccess/content_iccv_2015/papers/Zhang_ Joint_Camera_Clustering_ICCV_2015_paper.pdf Ncは使用されているカメラの数,Ucはカメラごとの使用時間, SDdは点とそれに最 も近い10点の平均距離の標準偏差である.Pはすべてのクラスタにおける各ピクセル の平均再構築時間,CRはカバレッジレシオ,tclusterはクラスタリングアルゴリズム の時間である.tpmvsはすべてのクラスタのpmvsの合計実行時間, ttotalは合計時間 である. 実験時の統計 (a)はクラスタの密集点(b)は別のクラスタの密集点 (c)は(a),(b)の合成であ る. クラスタによる密集 点
  • 144. 【141】 Keywords: 3D reconstruction, backscatter, photometric stereo 新規性・差分 概要 ・測光ステレオは3D再構成に広く使用されている.しかし, 散乱媒体において光源および物体の両方からの前方散乱光 と媒体から散乱された後方散乱のために現在まで制限され ている.そこで希薄媒質の一般的な単一散乱仮定の下で光 の伝播の主要なモードに対処する手法を提案する. ・さまざまな照明下での輝度変化から表面法線を推定する 測光ステレオにおいて散乱媒体では光の伝播は散乱によっ て影響されるため,測光アルゴリズムの性能が低下する. そこで我々は単一散乱モデルに基づいて後方散乱である3 つの散乱効果を処理するために物体の距離変化に対して表 面変化が小さいと仮定し,物体の小さな表面変動近似を導 入する. Links 論文 http://www.cv- foundation.org/openaccess/content_iccv_2015/papers/Murez_P hotometric_Stereo_in_ICCV_2015_paper.pdf 玩具のロブスターとマスクの表面再構 成 Zak Murez, Tali Treibitz, Ravi Ramamoorthi, David Kriegman, “Photometric Stereo in a Scattering Medium”, in ICCV2015, 2015.
  • 145. 【142】 Keywords: local color prior (LC), reverse intensity distribution (RID), stereo matching 新規性・差分 概要 ・従来のステレオマッチングアルゴリズムはアナグリフ画 像に対処するときに失敗する.この問題を解決し正確な深 度マップを得るために我々は前の局所的な色および逆強度 分布係数を使用する2つの新規データコストを提案する. ・本論文では視差マップを計算するだけでなくアナグリフ 画像の欠落した色情報を同時に色付けするための反復的な 結合方法を提案する.正確な視差マップはLCおよびRIDに 基づく2つの新規アナグリフデータコストを使用すること によって推定される.欠落した色を復元するために得られ た視差を用いて既知の色情報をある画像から別の画像に転 送する.次に拡散ベースのカラー化を使用して、遮蔽され た領域の残りのピクセルを色付けする.正確なカラー化を 達成するために色の類似性に基づく新規のカーネル関数を 導入する. Links 論文 http://www.cv- foundation.org/openaccess/content_iccv_2015/papers/Williem_De pth_Map_Estimation_ICCV_2015_paper.pdf Williem, Ramesh Raskar, In Kyu Park, “Depth Map Estimation and Colorization of Anaglyph Images Using Local Color Prior and Reverse Intensity Distribution”, in ICCV2015, 2015. 彩色結果のPSNR比較 実データセットの視差とカラー化の比較 結果 (a)は左画像,(b)は右画像,(c)は提案された方法の視差マップである.(d)はMIの視差マップ, (e)はセンサス+ GCの視差マップ,(f)はASIFTフローの視差マップである.(g)提案された方法の 着色結果,(h)提案された方法の差分マップ,(i)はP-Joulinの視差マップ,(j)はASIFT-Joulinの差 分マップ,(k)はLinの差分マップである.
  • 146. Learning mid-level features for recognition,Y-Lan Boureau, Francis Bach, Yann LeCun, Jean Ponce; The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2010 【143】 Keywords: mid-level features 新規性・差分 概要 シーンやオブジェクトの認識に成功した多くのモデルは,低レ ベルの記述子(GaborフィルタやSIFT記述子など)を中間の複 雑さのより豊かな表現に変換される.この論文では目標は3つ あります.いくつかの種類のコーディングモジュール(ハード およびソフトなベクトル量子化,スパースコーディング)とプ ーリングスキーム(平均または最大を取ること)の包括的な交 差検証を通じて,中間レベルの特徴抽出の各ステップの相対的 重要性を確立することを目指しています. 複数の認識ベンチマークで高い性能を示している. Links 論文 : http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=55 39963
  • 147. Slow and steady feature analysis: higher order temporal coherence in video, Dinesh Jayaraman, Kristen Grauman, The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016【144】 Keywords: 新規性・差分 概要 ・遅い特徴分析を「安定した」特徴分析に一般化することを提 案している。 ・重要な考え方は,学習された特徴空間内の高次導関数が小さ くなければならないという前提を課していることである. ・目的のために,未ラベルビデオから連続的なフレームのタプ ル上に正則化器を備えた畳み込みニューラルネットワークを訓 練している. ラベルのないYouTubeやKITTIのビデオを含む5つのさまざま なデータセットを使用して,提案手法が物体,シーン,およ びアクションの認識タスクに及ぼす影響を実証した. Links 論文 : https://arxiv.org/pdf/1506.04714v2.pdf
  • 148. Cross-stitch Networks for Multi-task Learning, Ishan Misra, Abhinav Shrivastava, Abhinav Gupta, Martial Hebert, The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016【145】 Keywords: multi-task 新規性・差分 概要 ・マルチタスク学習を用いたConvNetsの共有表現を学習する ための原則的なアプローチを提案する. ・新しい共有単位「クロスステッチ」を提案している.クロス ステッチユニットを有するネットワークは,共有およびタスク 特有の表現の最適な組み合わせを学習することができる. 複数のタスクにまたがって一般化することで,トレーニング例の 少ないカテゴリが,ベースライン方法よりも大幅にパフォーマン スが改善されている. Links 論文 : https://arxiv.org/pdf/1604.03539v1.pdf
  • 149. Deep Metric Learning via Lifted Structured Feature Embedding, Hyun Oh Song, Yu Xiang, Stefanie Jegelka, Silvio Savarese; The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016 【146】 Keywords: mid-level features 新規性・差分 概要 ・挙げられた問題に新しく構造化された予測目的を最適化する ことによって,アルゴリズムが人工的な特徴の埋め込まれた状 態を知ることが可能となった. ・CUB-200-2011 [37],CARS196 [19],およびOnline Productsデータセットの実験では,GoogLeNet[33]を使用し て実験されたすべての埋め込みサイズについて,既存のDeep featureの埋め込み方法よりも大幅に改善されている. ・Online Product dataset(メトリック学習のためのオンライ ン製品の23,000クラスの120,000画像)を収集しました. Links 論文 : https://arxiv.org/pdf/1511.06452v1.pdf
  • 150. TI-POOLING: transformation-invariant pooling for feature learning in Convolutional Neural Networks, Dmitry Laptev, Nikolay Savinov, Joachim M. Buhmann, Marc Pollefeys; The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016 【147】 Keywords: transformation-invariant 新規性・差分 概要 ・回転や位取りの変更など,データの不規則な変化に関す る事前知識を効率的に処理できるTI-POOLINGを提案して いる. ・変形したデータセットを考慮したparallel siamese architecturesに対して全結合層前に出力にTI-POOLING演 算子を適用することで変形不変を実現している. ・既存のデータセットや,変形を加えたデータセットで高い 性能を示している. Links 論文 : https://arxiv.org/pdf/1604.06318v2.pdf
  • 151. CoMIC: Good features for detection and matching at object boundaries, Swarna Kamlam Ravindran, Anurag Mittal; The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016 【148】 Keywords: CoMIC 新規性・差分 概要 ・等長曲線上の安定部分を特定し,その上の角を検出する. さらに,コーナーに関連する等光度曲線は,背景から部分 を破棄し,マッチングを改善するために使用する. ・CoMIC(最大の安定した等強度曲線のコーナー)ポイ ントは,最先端の検出器と比較して物体境界領域で優れた 結果をもたらし,同時に内部領域でも同等に機能する. ・既存の検出器よりも高い性能を示している. Links 論文 : https://arxiv.org/pdf/1604.06318v2.pdf
  • 152. Progressive Feature Matching With Alternate Descriptor Selection and Correspondence Enrichment, Yuan- Ting Hu, Yen-Yu Lin; The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016, pp. 346-354 【149】 Keywords: feature matching 新規性・差分 概要 ・画像マッチングのための正確なシステムを確立する上で の2つの困難に取り組んでいる.第1に,画像マッチング は特徴抽出のための記述子に依存するが,最適な記述子は しばしば画像から画像,またはパッチからパッチで変化す る.第2に,従来のマッチング手法は効率の懸念から対応 候補の小さなセットに対して幾何学的検査を実行する.そ のため,リコールではパフォーマンスが制限されることが ある.よって,適応記述子選択と漸進的候補濃縮を画像マ ッチングに統合することにより,2つの問題に取り組むこ とを目指す. ・提案手法が既存手法よりも高い性能を示している. Links 論文 : http://www.cv- foundation.org/openaccess/content_cvpr_2016/papers/H u_Progressive_Feature_Matching_CVPR_2016_paper.p df
  • 153. Structured Feature Similarity With Explicit Feature Map, Takumi Kobayashi; The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016, pp. 1211-1219 【150】 Keywords:SSIM 新規性・差分 概要 ・画質評価の分野では,SSIM [27]は,L2メトリックの代 わりに,画像間の有効な類似性を生成している.本稿では, SSIMに基づく特徴類似度測定法を提案する. ・従来の手法とは異なり,特徴マッチングの重要な要件で ある高堅牢性のSSIMベースの類似度測定法を構築するた めに,ヒストグラム形式ではなく,空間グリッド上などで 抽出された特徴配列のテンソル構造上に構築した. ・様々なタスクの実験において,提案手法は特徴マッチング と分類の両方において良好な性能を示している. Links 論文 : http://www.cv- foundation.org/openaccess/content_cvpr_2016/papers/K obayashi_Structured_Feature_Similarity_CVPR_2016_p aper.pdf
  • 154. A Deeper Look at Saliency: Feature Contrast, Semantics, and Beyond, Neil D. B. Bruce, Christopher Catton, Sasa Janjic; The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016, pp. 516-524 【151】 Keywords: FCN 新規性・差分 概要 ・人間の注視予測と顕著なオブジェクトセグメンテーショ ンの両方を含む視覚的顕著性モデリングの問題を考察して いる. ・この論文の目標は,より洗練された視覚的顕著性モデル を導出することに関連する高水準の考慮事項を特定するこ とである. ・人間の視線と顕著な物体との関係を探求しており,FCNの 文脈においてこの点についてさらに検討している. Links 論文 : http://www.cv- foundation.org/openaccess/content_cvpr_2016/papers/B ruce_A_Deeper_Look_CVPR_2016_paper.pdf
  • 155. ReD-SFA: Relation Discovery Based Slow Feature Analysis for Trajectory Clustering, Zhang Zhang, Kaiqi Huang, Tieniu Tan, Peipei Yang, Jun Li; The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016, pp. 752-760 【152】 Keywords: ReD-SFA 新規性・差分 概要 ・スペクトル埋め込み/クラスタリングについては,デ ータ内の固有構造を反映する関係グラフをどのように構 築するかという問題に対して,特徴学習とグラフ構築の ためにRelation Discoveryに基づくReD-SFA手法を提 案している. ・更新された距離と既存の関係グラフによってそれぞれ パラメータ化された2つのベルヌーイ分布間の不一致を 減らすために,この問題をクロスエントロピー(CE) 最小化問題として定式化している. ・モーションセグメンテーション,時系列クラスタ リング,群集検出などの様々な軌道クラスタリング タスクを用いて広範な実験を行った. ・ReDSFAは信頼性の高いクラスタ内関係を高精度 に発見することができ,従来手法と比較して競争力 のあるクラスタリング性能を達成することができた. Links 論文 : http://www.cv-foundation.org/openaccess/content_cvpr_2016/papers/Zhang_ReD- SFA_Relation_Discovery_CVPR_2016_paper.pdf
  • 156. Tomislav Pejsa, Daniel Rakita, Bilge Mutlu, Michael Gleicher, “Authoring Directed Gaze for Full-Body Motion Capture”, in SIGGRAPH Asia, 2016. 【153】 Keywords: Full Body MoCap, Directed Gaze 新規性・差分 概要 身体のモーションキャプチャのみならず,視線についても キャプチャしてアニメーションに反映させる.目の領域は 非常に小さいが,動きがあると人物の意図が(アニメーシ ョンにおいても)わかるようになる.視線に合わせてアニ メーションを微調整することもできるようになった. ・モーションキャプチャによる身体の動作や視線による意 図の把握ができるようになり,グラフィックスのアニメー ションを生成する際もよりリアルなものができる Links 論文 http://delivery.acm.org/10.1145/2990000/2982444/a161- pejsa.pdf?ip=218.41.245.155&id=2982444&acc=OPENTOC&key=4D4702B0C3E38B35%2E4D4702B0C3E38B35%2E4D4702B0C3E38B35%2E383ADA7593775D6F&CFID=7 03437228&CFTOKEN=56619126&__acm__=1481581883_8c9c1b5abff36972b22742eab195fe49 プロジェクト ビデオ https://vimeo.com/191892437
  • 157. Helge Rhodin, Christian Richardt, Dan Casas, Eldar Insafutdinov, Mohammad Shafiei, Hans-Peter Seidel, Bernt Schiele, Christian Theobalt, “EgoCap: Egocentric Marker-less Motion Capture with Two Fisheye Cameras”, in SIGGRAPH Asia, 2016. 【154】 Keywords: Ecocentric View, Motion Capture 新規性・差分 概要 2台の魚眼カメラから,カメラ装着者のマーカレスモーシ ョンキャプチャを行う(右図).屋外環境においてもモー キャプができたり,屋内のデスク周りなど狭い環境でのモ ーキャプ,VRにリアルなモーションを反映させることが 可能.姿勢推定はResNet-101を使用,MPIIやLeeds Sports dataにて初期値を学習し,魚眼カメラによる姿勢推 定にファインチューニング. ・魚眼による一人称カメラより,装着者の姿勢を推定しモ ーキャプやVRへの投影を行うことに成功した Links 論文 https://gvv.mpi-inf.mpg.de/projects/EgoCap/content/rhodin2016egocap.pdf プロジェクト https://gvv.mpi-inf.mpg.de/projects/EgoCap/ 動画 https://www.youtube.com/watch?v=v-4E-jtOet0
  • 158. Shu Liu, Xiaojuan Qi, Jianping Shi, Hong Zhang, Jiaya Jia, “Multi-scale Patch Aggregation (MPA) for Simultaneous Detection and Segmentation”, in CVPR, 2016. 【155】 Keywords segmentation: 新規性・差分 概要 オブジェクトの同時検出,セグメンテーションを行うため のフレームワークを提案している.mid-levelのパッチを介 することでオブジェクトインスタンスを検出し,セグメン トする.各パッチ上でネットワークを設計し,オブジェク トインスタンスを推論するための迅速かつ効果的なpatch aggregation algorithmを行う.VOC2012 segmentation val and VOC2012 SDS valのデータセットで62.1% と 61.8% の結果が得られている. 我々は統一されたエンドツーエンドの訓練可能なネットワ ークに基づいて新しいSDSシステムを達成しました.生の 画像を入力として取り,パッチを分類して分割します.次に, ネットワークのパッチ出力からオブジェクトを推測するた めに,単純な集約プロセスが採用されます.我々は,SDSのた めのいくつかのデータセットについて我々の方法を評価し た. Links 論 文:http://www.cse.cuhk.edu.hk/leojia/pap ers/mpa_cvpr16.pdf
  • 159. Sayanan Sivaraman, Mohan Manubhai Trivedi, “Vehicle Detection by Independent Parts for Urban Driver Assistance”, IEEE, 2013. 【156】 Keywords: detection by parts, machine learning, occlusions, vehicle detection 新規性・差分 概要 ・本論文では, 市街地運転者支援のためのVDIP (Vehicle Detection by Independent Parts)を提案す る.VDIPとは, 都市部での走行において、対向車、先 行車、側方車、および部分的に遮蔽された車両を検出 するための軽量で堅牢なフレームワークを用いる.シ ステムは軽量で、リアルタイムで実行されます。現実 世界のオンロードデータセットに関する広範な定量分 析が可能である. ・従来研究では, 車両の視界に問題があり、相対的な位置によっ て, 車両の外観にばらつきが生じるため, カメラを車両に搭載す ると, 死角が生じる. ・提案手法では, 部分一致分類を訓練するために使用し, 検出さ れた部分からサイドビュー車両を形成する.階層的学習プロセ スにより, 効率的な評価を得られるVDIPを取得する.部品と車 両の追跡にはカルマンフィルタを使用する. 論文:http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=6532394 Links
  • 160. Bin Tian, Ye Li, Bo Li, Ding Wen, “Rear-View Vehicle Detection and Tracking by Combining Multiple Parts for Complex Urban Surveillance”, IEEE, 2014. 【157】 Keywords: Kalman filter (KF), Markov random field (MRF), part-based object detection, tracking, vehicle detection. 新規性・差分 概要 ・本論文では, 固定カメラを用いた複数の車両用突状 部に基づく後方視界検出と追尾法を述べる.本手法で は, リアルタイム性能で車両追跡を実装することがで きる. ・従来研究では, 複雑な都市環境, 悪天候, 照明の変化, 照 明条件, 車の姿勢, 外観情報によって車両検出するのに困 難となる. ・提案手法では, 車両は、ナンバープレートやリアランプ など複数の凸部からなる物体として扱い, 位置決めし, マ ルコフランダムフィールドモデルを用いて確率グラフが 構築する.カルマンフィルタを用いて車両の軌道を推定 し、追跡に基づく検出手法を提案する. 論 文:http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=6 627986 Links
  • 161. Sayanan Sivaraman, Mohan M. Trivedi, “Real-Time Vehicle Detection Using Parts at Intersections”, IEEE, 2012. 【158】 Keywords: Driver Assistance, Real-time Vision, Machine Learning. 新規性・差分 概要 ・本論文では, 車両のパーツを用いて車両のリアルタ イム検出を行うかつ軽量なアプローチを提案する.部 品による完全な車両検出は、現実世界のデータで評価 され、リアルタイムで実行できる. ・従来研究では,車両がカメラの視界に出入りするときに 発生し, オクルージョンが生じ, 車両検出を複雑にしてし まう. ・提案手法では, 学習で訓練された分類器を使用して, 自 動車部品を個別に検出する.学習された一致分類を使用 して部分応答に一致する.パーツ構成は、サポートベク ターマシン分類を使用して評価する. 論 文:http://ieeexplore.ieee.org/stamp/stamp.jsp?arnum ber=6627986 Links
  • 162. Zahid Mahmood, Tauseef Ali, Shahid Khattak, Samee U. Khan, Laurence T. Yang, “Automatic Vehicle Detection and Driver Identification Framework for Secure Vehicle Parking”, IEEE, 2015. 【159】 Keywords: Eigenface, Euclidian distance, Face Recognition, Haar-like, Adaboost. 新規性・差分 概要 ・本論文では, 車両の駐車スペースの安全性を高めるた めに誰が乗っているかを識別する.実験結果より, リ アルタイムで公共の車両駐車場に使用できる. ・従来手法では, 車両認識を行っているが, セキュリティ 目的のための手法が行われていない. ・提案手法では, 3つのステップに分かれる.1つ目に Haar-like特徴とAdaBoostを用いて, 車両を矩形領域に抽 出する. 2つ目にEigenfacesベースの顔を抽出する.3つ 目に、顔画像をデータベース内の顔画像と比較すること によってドライバを識別する. 論文: http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=742096 7 Links
  • 163. Huieun Kim, Youngwan Lee, Taekang Woo, and Hakil Kim, ”Integration of Vehicle and Lane detection for Forward Collision Warning System”, IEEE, 2016. 【160】 Keywords: Eigenface, Euclidian distance, Face Recognition, Haar-like, Adaboost. 新規性・差分 概要 ・本論文では, リアルタイムで前方衝突警告システムの ための車線と車両の検出を提案する.実際の道路を用 いた結果, リアルタイムでも使用できる. ・従来手法では, スマートフォンをベースとした運転手支援 システムは、外的条件および介在接触するためには困難で ある.また, ステレオカメラの設置などでコストがかかる. ・提案手法では, 車線と車両の検出を統合することにより, 道路の情報を使用して, 運転環境の正確な情報を提供し 誤 報を防ぐことができる. 論文: http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=768470 3 Links
  • 164. Maroš Bláha, Christoph Vogel, Audrey Richard, Jan D. Wegner, Thomas Pock, Konrad Schindler, “Large-Scale Semantic 3D Reconstruction: an Adaptive Multi-Resolution Model for Multi-Class Volumetric Labeling”, in CVPR, 2016. 【161】 Keywords : 新規性・差分 概要 セマンティック3D再構成のmulti-resolution formulationを 提案している.これまでの方法では計算コストが高く,メ モリの消費量が多いいため,限られたシーン(small scenes)small scenesと低解像度に限られている.そこで マルチ解像度に適応した処理スキームを提案している. 結果の品質を損なうことなく,マルチ解像度に適応した処 理スキームでこれまで手法よりもはるかに大きなシーンを 処理することが可能となっている. Links 論文:https://www.ethz.ch/content/dam/ethz/special- interest/baug/igp/photogrammetry-remote-sensing- dam/documents/pdf/cvpr2016_blaha_vogel_etal.pdf youtube:https://www.youtube.com/watch?v=Hlbcv0nU-N4
  • 165. Ravi Kumar Satzoda, Mohan M. Trived, ”IEfficient Lane and Vehicle detection with Integrated Synergies (ELVIS)”, CVPR, 2014. 【162】 Keywords: vehicle detection, lane detection, integrated system 新規性・差分 概要 ・本論文では, 車載情報を組み込んだELVIS(Efficient Lane and Vehicle detection with Integrated Synergies) を用いた効率的な車線と車両の検出を行う.実験結果 より, 既存の技術より35%少ない平均計算コストでよ り信頼性の高い識別をした. ・従来手法では, 車両・車線検出の両方を行った研究はされ ていない.理由としては, 両方を行うと, 識別率・処理時間 が従来研究より劣るからである. ・提案手法では, 車載情報を組み込んだELVIS(Efficient Lane and Vehicle detection with Integrated Synergies)を用 いる.本稿では, 特徴量にはHOG特徴, 識別機にはSVMを用 いる. 論文:http://www.cv- foundation.org//openaccess/content_cvpr_workshops_2014/W 17/papers/Satzoda_Efficient_Lane_and_2014_CVPR_paper.p df Links
  • 166. Vincent Dumoulin, Jonathon Shlens, Manjunath Kudlur, “A Learned Representation for Artistic Style”, in ICLR submission, 2017. 【163】 Keywords: Style Transfer, Scalable Deep Network 新規性・差分 概要 ・絵画のスタイルトランスファーにおいて,混合度を表現 できるネットワークを表現. Links 論文 https://arxiv.org/pdf/1610.07629v3.pdf プロジェクト https://research.googleblog.com/2016/10/supercharging- style-transfer.html ビデオ https://www.youtube.com/watch?v=6ZHiARZmiUI スタイルトランスファーの表現方法の改善を行い、複数のスタイルの 絵画を混ぜ合わせることに成功.DNNによる表現方法をスケーラブ ルにすることによりスタイルの度合いを調整でき,その混合にも成功 した.右下図にはDNNによるアーキテクチャが示されている. Content Loss L_cやStyle Loss L_sを最適化.L_cは各層のアクティベ ーションにより,L_sは各層のアクティベーションから計算されるグ ラム行列を最適化.
  • 167. Jonathan Shen, Noranart Vesdapunt, Vishnu N. Boddeti, Kris M. Kitani, “In Teacher We Trust: Learning Compressed Models for Pedestrian Detection”, in arXiv pre-print 1612.00478, 2016. 【164】 Keywords: Pedestrian Detection, Knowledge Distillation 新規性・差分 概要 歩行者検出において,ResNetやACFをベースにして Knowledge Distillation (知識の蒸留)を行う.右図のように, TeacherやStudentにあたる識別器を準備して,Ground Truthによる誤差関数だけでなく,TeacherとStudentの誤 差も最適化する.正解値との比較がHard Lossなのに対し てTeacher-Studentの比較をSoft Lossと呼称. ・教師と生徒によるSoft Lossを用いて歩行者検出の識別器 を最適化した. ・State-of-the-artには及ばなかったが,一定の成果を得た Links 論文 https://arxiv.org/pdf/1612.00478v1.pdf プロジェクト
  • 168. C N Dickson, A M Wallace, M Kitchin, B Connor, ”Improving infrared vehicle detection with polarisation”, IEEE, 2013. 【165】 Keywords: vehicle detection, polarimetric histogram, 新規性・差分 概要 ・本論文では, 赤外線偏光画像に基づく記述子によって, 赤外線強度のみに基づくものよりも優れた車両検出性 能を提示する. ・従来手法では, 赤外線画像における車両の検出を行うが, 車両と似たような物体が存在すると識別が困難となる. ・提案手法では, 車両の偏光度および角度から構築された新 しい偏光ヒストグラム記述子を示す.車両用ヒストグラム は車両の上部と側面に関連する特定の角度での偏光値を用 いる. 論文: http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=6740492 Links
  • 169. Chun-Ming Tsai, Jun-Wei Hsieh, Frank Y. Shih, B Connor, ”Motion-Based Vehicle Detection in Hsuehshan Tunnel”, IEEE, 2016. 【166】 新規性・差分 概要 ・本論文では, 雪山トンネルで車両を検出するための動 きに基づく車両検出を提案する.提案された方法が雪 山トンネル内の車両を検出するのに有効であることを 示した。 ・従来手法では, 長いトンネルでのカメラビジョンベースの 車両検出, カメラから現れるビデオ品質は, 動的な照明環境, カメラ解像度, カメラエージング, カメラ位置, カメラ視野 角, 異質および車速によって車両検出が困難となる. さら に, 車両の色, 形, 大きさ, 外観のため検出しにくい. ・提案手法では, 照明補償、移動に基づく検出、および車両 識別アルゴリズムを使用することによって時間の複雑さを 低減する. 論文: http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=7449856Links Keywords: vehicle detection, Hsuehshan tunnel, vehicle identification
  • 170. Fractal dendrite-based electrically conductive composites for laser-scribed flexible circuits in Nature 20 概要 3DフラクタルAgマイクロデンドライトの制御可能な合成を実証する. 提案する3Dフラクタルデンドライト(FDs)をエンジニアリングポリマ樹脂に 注入した.そのFDsを銀の体積の0.97%(重量の8%)注入したとき,極めて低いパ ーコレーション閾値を達成した. これはFDsのナノサイズの突起に起因することが判明した.低温状態で単純 な焼結過程によって,お互いに融着し,導電ネットワークを形成する. モンテカルロ法を用いてシミュレートされたパーコレーション閾値は,空間 的広がりと接触確率の両方の観点から実験結果と一致する. 新規性 3Dフラクタルデンドライトを用いた導電性複合材 料の開発 LINK http://www.nature.com/articles/ncomms9150 複雑な差の異なる銀ベースの3Dフラクタルデンドライトと それをエンジニアリングポリマ樹脂に導入した結果 Cheng Yang, Xiaoya Cui, Zhexu Zhang, Sum Wai Chiang, Wei Lin, Huan Duan, Jia Li, Feiyu Kang and Ching-Ping Wong 【167】
  • 171. Observational evidence confirms modelling of the long-term integrity of CO2-reservoir caprocks in Nature 2016 概要 大気中のCO2を地底に貯蔵することが考えられているが,貯蔵したCO2 の漏出を防 ぐ第一の封印はキャップロックに依存する.キャップロックとは,天然ガスや石油を含 有する層の上を覆う不透過性の地層のことである.天然のCO2貯蔵層は何百年もCO2を 安全に貯蔵しているが,仮に貯蔵しているものがCO2を含んだ海水の場合,キャップ ロックが想定外の反応を示す可能性がある. そこで,地質学的にCO2貯蔵に必要な時間スケールを満足する程度, CO2に曝され たCO2貯蔵層とキャップロックの鉱物反応を調査した. 鉱物反応の伝播はレドックス感受性の鉱物溶解反応および炭酸塩の沈殿によって遅 延されることが分かった.これは,105年当たり約7cmキャップロックへの浸透を減少 させる. この距離は予測よりも1桁小さいことが分かった. この結果より, 長期間CO2に 曝されたキャップロックの輸送制限反応を考慮に入れる意味を証明している. 新規性 長期間CO2を含んだ海水に曝されたキャップロックの状態の調査 LINK http://www.nature.com/articles/ncomms12268 ユタ州グリーン川南部のリトルグランドウォッシュフ ォールトの北90mを掘削した地層の持つCO2の様子 N. Kampman, A. Busch, P. Bertier, J. Snippe, S. Hangx, V. Pipich, Z. Di, G. Rother, J. F. Harrington, J. P. Evans, A. Maskell, H. J. Chapman and M. J. Bickle 【168】
  • 172. Fractal Nature of Metallic and Insulating Domain Configurations in a VO2 Thin Film Revealed by Kelvin Probe Force Microscopy in Nature 2015 概要 Kelvinプローブ力顕微鏡法を用いて,エピタキシャルによって 成長したVO2 / TiO2薄膜の表面仕事関数および空間分布を調査し た. 粒界をほとんど含んでいない試料では,金属から絶縁体への転 移を通して,金属と絶縁体の持つ表面仕事関数値の観察が可能で あった.表面仕事関数マップから推定される金属断片は2次元パー コレーションモデルに基づいて抵抗の変化を示す. また, Kelvinプローブ力顕微鏡法の推定値は,ドメイン構成の フラクタル性を明らかにした. 新規性 ・表面仕事関数とVO2 / TiO2薄膜の抵抗値を測定し, 温度依存性ドメイン構成とその金属から絶縁体への転移への 影響を調査 ・ドメイン構成がパーコレーションモデルの特徴であるフラク タル構造を形成することを示唆 LINK http://www.nature.com/articles/srep10417 TiO2基板上に成長させた厚さ15nmの VO2薄膜のX線回折パターン Ahrum Sohn, Teruo Kanki, Kotaro Sakai, Hidekazu Tanaka and Dong-Wook Kim 【169】
  • 173. 【170】 Keywords: light field (LF), depth from light field (DfLF) 新規性・差分 概要 ・LF焦点スタックの2つの提案特徴を使用してLFから深さ を回復させる手法について説明する.1つ目の特徴は非遮 蔽である画素が合焦スライスを中心とする焦点深度寸法に 沿って対称性を示すことである.2つ目は仮定された奥行 きマップとLFからの合成焦点スタックとの間の差異に基づ くデータ一貫性測定である.この2つの特徴はシーンの深 さを抽出するための反復最適化フレームワークで使用でき る. ・本手法では焦点スタックの対称解析と分析-合成に基づ いた新しいデータ一貫性測定の2つの焦点スタックの特徴 を求めてDfLF技術を使用新たな深さを提案する. Links 論文 http://www.cv- foundation.org/openaccess/content_iccv_20 15/papers/Lin_Depth_Recovery_From_ICC V_2015_paper.pdf Haiting Lin, Can Chen, Sing Bing Kang, Jingyi Yu, “Depth Recovery from Light Field Using Focal Stack Symmetry”, in ICCV2015, 2015. ビュー数分 析 ガウス雑音によるデータセットの誤差比 較 屋内と屋外のデータセットにお ける 視差再構成結果
  • 174. Using Spatial Order to Boost the Elimination of Incorrect Feature Matches, Lior Talker, Yael Moses, Ilan Shimshoni; The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016, pp. 1809- 1817 【171】 Keywords: 新規性・差分 概要 ・明示的に計算することなく正しい一致の数を推定する効 率的な方法を提案する.また,画像間の重なり領域を推定 している. ・順列と自然な仮定との間のケンドール距離メトリックを 用いて、正しい一致と不正確な一致の分布を推定する方法 を示している. ・Structure from Motionパイプラインの画像マッチングス テージの実行時間をを正確にマッチングされた特徴点の約 80%を維持しながら,約99%減少させることができる. ・各画像の特徴の空間的順序のみを使用して特徴マッチン グの分析のための実データセットに対するこの推定の有効 性を実証した. Links 論文 : http://www.cv- foundation.org/openaccess/content_cvpr_2016/papers/Talker_Using
  • 175. Discriminative Multi-Modal Feature Fusion for RGBD Indoor Scene Recognition, Hongyuan Zhu, Jean- Baptiste Weibel, Shijian Lu; The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016, pp. 2969-2976 【172】 Keywords:Multi-Modal 新規性・差分 概要 ・rgbdシーン認識のための新規な識別的マルチモーダル融合フレ ームワークを導入し、同時にすべてのサンプルについてモダリテ ィ間およびモダリティ間の相関を考慮する学習された特徴を弁別 的かつコンパクトに規則化する. ・マルチモーダル層からの結果は、より低いCNN層に逆伝播する ことができ,したがってCNN層およびマルチモーダル層のパラメ ータは、収束するまで反復的に更新される. ・大規模なSUN RGB-Dデータセットの実験は,我々の 方法が画像セグメンテーションなしで最先端を達成した ことを示している. ・SUN-RGBDデータセットにおける精度,長さ,学習の オーバーヘッドの点で,従来手法を上回った. Links 論文 : http://www.cv- foundation.org/openaccess/content_cvpr_2016/papers/Z hu_Discriminative_Multi-
  • 176. Temporal Action Localization With Pyramid of Score Distribution Features, Jun Yuan, Bingbing Ni, Xiaokang Yang, Ashraf A. Kassim; The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016, pp. 3093-3102 【173】 Keywords: Action Localization 新規性・差分 概要 ・各検出ウィンドウを中心とした複数の解像度で動き 情報を取得するために,PSDF(Pyramid of Score Distribution Feature)を提案する.この特徴は未知の作 用位置および持続時間の影響を緩和しかつ従来の検出 アプローチよりも有意な性能向上を示す. ・THUMOS'15とMPII Cooking Activities Datasetで アクションローカリゼーションフレームワークをテ ストした.両方のデータセットにおいて以前の試み よりも大幅なパフォーマンス改善を示した. Links 論文 : http://www.cv- foundation.org/openaccess/content_cvpr_2016/pap ers/Yuan_Temporal_Action_Localization_CVPR_2
  • 177. Kernel Approximation via Empirical Orthogonal Decomposition for Unsupervised Feature Learning, Yusuke Mukuta, Tatsuya Harada; The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016, pp. 5222-5230 【174】 Keywords: Kernel Approximation 新規性・差分 概要 ・カーネル近似法について,訓練データから推定された確率分布 を用いて経験的直交分解を用いて、複雑な後処理を行わずに良好 な汎化性能を有する手法を提案している. ・カーネル近似を用いた階層的特徴抽出は,既存の方法よりも優 れた性能を示すことを示している. ・合成されたデータと実際のデータを用いた実験は,本提案 手法がNystrom法に匹敵する.また,ランダム特徴法より優 れた性能をもたらしたことを示した. Links 論文 : http://www.cv- foundation.org/openaccess/content_cvpr_2016/papers/Mukuta_Kernel_Approx imation_via_CVPR_2016_paper.pdf
  • 178. Modality and Component Aware Feature Fusion for RGB-D Scene Classification Anran Wang, Jianfei Cai, Jiwen Lu and Tat-Jen Cham; The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016 【175】 Keywords: 新規性・差分 概要 ・畳み込みニューラルネットワーク(CNN)は物体認識には優 れているが,シーン画像の空間的変動が大きいことは,通常, 標準のfull-image CNN特徴がシーン分類に最適でないことを意 味する.よって,広い空間的な柔軟性を可能にするフレームワ ークを検討し、代わりに、画像ごとに多数の領域提案から得ら れたローカルCNN特徴のFisherベクトル(FV)符号化分布を考 慮する. ・プロポーザルベースのFV機能とグローバルなCNN機能の両 方について回帰分析を組み合わせて組み合わせることで, SUNRGBDデータセットとNYU depthデータセットV2におい て,シーン分類で高いパフォーマンスを達成した. Links 論文 : https://www.researchgate.net/profile/Anran_Wang2/publ ication/299852654_Modality_and_Component_Aware_F eature_Fusion_for_RGB- D_Scene_Classification/links/5706490708aecbf68ba9a 提案フレームワーク
  • 179. Constrained Deep Transfer Feature Learning and its Applications, Yue Wu, Qiang Ji; The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016 【176】 Keywords: 新規性・差分 概要 ・データ不足の対象領域で特徴学習を行うための制約付きの深い伝 達特徴学習フレームワークを提案している. ・固定された特徴空間において転送学習を実行する代わりに,ソー スドメインとターゲットドメインとの間の意味的ギャップを最小に するために,より高いレベルの特徴空間において転送と特徴学習を 反復的に同時に実行することを提案している. ・可視領域からの知識を転送することによってサーモアイの検出の ための熱的特徴学習のための提案された.また,クロスビューの表 情認識に適用した枠組みを適用した. Links 論文 : http://homepages.rpi.edu/~wuy9/CVPR16/Constr ained%20Deep%20Transfer%20Feature%20Lear ning%20and%20its%20Applications.pdf
  • 180. Object Tracking via Dual Linear Structured SVM and Explicit Feature Map,Jifeng Ning, Jimei Yang, Shaojie Jiang, Lei Zhang, Ming-Hsuan Yang; The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016, pp. 4266-4274 【177】 Keywords: 新規性・差分 概要 ・シンプルで効率的なデュアル線形SSVM(DLSSVM)ア ルゴリズムを導入し,トラッキング中の学習と実行を高速 化している. ・明示的な特徴マップを使用して特徴表現の交差カーネル を近似し,追跡性能を向上させている. ・提案されたDLSSVMトラッカーが, ベンチマークデータセットにおいて, 従来手法に対して有利に機能すること を示した. Links 論文 : http://www.cv- foundation.org/openaccess/content_cvpr_2016/papers/Ning _Object_Tracking_via_CVPR_2016_paper.pdf Comparing optimization processes for the Struck [8] and DLSSVM methods.
  • 181. Xinchao Wang , Vitaly Ablavsky, Horesh Ben Shitrit, Pascal Fua, ”Take your eyes off the ball: Improving ball- tracking by focusing on team play”, Computer Vision and Image Understanding, 2014. 【178】 Keywords: Tracking, Video analysis and event recognition, Occlusion , reasoning,Behavior , Sports video, Tracking the invisible 新規性・差分 概要 ・本論文では,チームスポーツでの正確なビデオベース のボールトラッキングには, オクルージョンが生じ, ボ ールを追跡するのが困難となる.そのため, どのプレー ヤーがボールを所持しているかを決定するという観点 から追跡を定式化する手法を示す.実験結果より, ロン グバスケットボールとサッカーの試合に適用した場合 の追跡率が向上した. ・従来手法では, 必要に応じて頻繁にオブジェクトを再検出 し, いくつかのフレームにわたって結果を集約する最新のト ラッキングは堅牢性を高めますが、オブジェクトが個々の フレームで検出するのが難しい場合でも失敗する可能性が ある. ・提案手法では, 最初に選手を追跡し, 誰がボールを持って いるかを決定し, 次に選手の軌跡を利用して信頼できるボー ル追跡を達成する.球の占有を明示的に説明する状態空間 を導入することによって, 我々は、CRFとして損失関数を 定義する. 論文: http://ac.els-cdn.com/S1077314213002300/1-s2.0-S1077314213002300- main.pdf?_tid=09278e22-c1c5-11e6-94c2- 00000aacb35e&acdnat=1481696448_ee5ddf7d1925c015e47508ca913657e1 Links
  • 182. Xinchao Wang , Vitaly Ablavsky, Horesh Ben Shitrit, Pascal Fua, ”Take your eyes off the ball: Improving ball- tracking by focusing on team play”, Computer Vision and Image Understanding, 2014. 【179】 Keywords: vehicle detection, Hsuehshan tunnel, vehicle identification 新規性・差分 概要 ・本論文では,移動, 追跡などが可能な車両検出手法を提案する. シミュレーション結果は, 提案されたシステムが単純で堅牢であ り, 高速道路監視システムにリアルタイムで使用可能である. ・従来手法では, 必要に応じて頻繁にオブジェクトを再検出し, オ ブジェクトが個々のフレームで検出するのが難しい場合でも失敗 する可能性がある. ・提案手法では, 車両検出は状態遷移、すなわち「車両到着」, 「車両移動」, および「車両出発」という逐次プロセスとして考 え, 選択されたAOI内の前景マスクの比率または照明ピクセルの比 率は、提案された状態機械の特徴として使用する.計算上簡単で あり, 車両の存在を検出するのに有効である. 論文 http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=6485465: Links
  • 183. Xinchao Wang , Vitaly Ablavsky, Horesh Ben Shitrit, Pascal Fua, ”Take your eyes off the ball: Improving ball- tracking by focusing on team play”, Computer Vision and Image Understanding, 2014. 【180】 Keywords: vehicle detection, Hsuehshan tunnel, vehicle identification 新規性・差分 概要 ・本論文では, 形態と色の違いを利用した新しい多地点背景モデ ルに基づく統合車両検出とカウントアルゴリズムを使用する. 実験結果より, 照明および背景の変化に対してロバストである. ・従来手法では, 昼夜の照明条件が異なるため, 車両を捕捉し昼夜 に統一された方法はない. ・提案手法では, 特徴背景モデルに基づく統合された車両の検 出・カウントを行い, 昼と夜の両方で車両を強調して表示するた めに形態フィルタの使用し, 捕捉のための色差特徴を用いて, 車両 を検出する. 論文 http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=6727057 Links
  • 184. Feng Zhou, Yuanqing Lin, “Fine-grained Image Classification by Exploring Bipartite-Graph Labels”, in CVPR, 2016. 【181】 Keywords : 新規性・差分 概要 食べ物の画像が与えられたとき,fine-grained object recognition engineはど の料理に属しているか判断できるか? ultra-fine grained画像認識は,画像検索の際のより多くのアプリケーション に応用するためのカギとなる.しかし,画像データが少ないと,クラス間の かすかな違いを識別することが困難となる.ultra-fineは超微細なオブジェク トクラス間の関係をもたらす.BGL(bipartite-graph labels)による超微細な オブジェクトクラス間の関係を活用するための新しい手法を提案している. 6つのレストランから収集された37,885の食品画像と合計 975のメニューからなる新しい食品ベンチマークデータセ ットを作成している.この新しい食品と他の3つのデータ セットに関する実験結果は,BGLがfine-grainedオブジェ クト認識での前進を示している. Links 論文:http://www.cv- foundation.org/openaccess/content_cvpr _2016/papers/Zhou_Fine- Grained_Image_Classification_CVPR_2 016_paper.pdf
  • 185. Z.Q. Xiang, X.L. Huang and Y.X. Zou, ”An Effective and Robust Multi-view Vehicle Classification Method Based on Local and Structural Features”,IEEE , 2016. 【182】 Keywords: SIFT, SVM, vehicle classification 新規性・差分 概要 ・本論文では, 車両を2つまたは3つのタイプに分類する従来の方 法とは異なり, リアルタイムで交通システムにおける車両分類の 手法を示す.実験結果は, 提案手法が95.95%の平均精度をリア ルタイムに車両を分類し, 本手法の有効性を示した. ・従来手法では, 固定カメラから1つの視点から撮影した画像のみ を考慮しており, 視点の変化は考慮していない. ・提案手法では, SIFTを用いて局所特徴を取得し, L2ノルムスパー ス符号化技術を用いて計算コストを削減し, 車両の建物構造を構 造的特徴として抽出し, SVMを用いて分類する. 論文 http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=7544999 Links
  • 186. Lukas Bossard, Matthias Dantone and Christian Leistner,“Apparel Classification with Style ”, in ACCV, 2012. 【183】 Keywords: label, Expectation-Maximization algorithm, CNN 新規性・差分 概要 ノイズラベルを含むデータと含まないデータを共に学習することで, ノイズを多く含むような画像におけるCNNの頑健性を向上させてい る.ノイズラベルとGTラベルとの差分をEMアルゴリズムより推論 し,ネットワーク全体の重みを最適化する Links Paper:http://www.ee.cuhk.edu.hk/~xgwang/papers/xiaoXYHWcvpr15.pdf ノイズラベルと,ラベルの両方を含む大規模な衣類分類データセ ットを提案している.また提案手法によりノイズラベルを修正で き,分類性能が向上している.(右表) (上) 提案手法概要 (左) ノイズラベルのグラフィカルモデル.2種類の潜在変 数により,入力画像とノイズの多いラベルとの間のギャッ プを埋める.
  • 187. Bolei Zhou, Yuandong Tian, Sainbayar Sukhbaatar, Arthur Szlam, and Rob Fergus,“Simple Baseline for Visual Question Answering”, in arXiv:1512.02167, 2015. 【184】 Keywords: label, Expectation-Maximization algorithm, CNN 新規性・差分 概要 シーン認識に単純な語彙情報を組み合わせた手法をベースラインと して提案する.問題文からの単語が示すクラスの特徴と画像からの 特徴を連結して予測する. Links Paper:https://arxiv.org/pdf/1512.02167v2.pdf 評価実験では,RNNを使用する一般的な従来手法と比較し,同等 の性能を示している.
  • 188. Christopher Thomas, Adriana Kovashka, “Seeing Behind the Camera: Identifying the Authorship of a Photograph”, in CVPR, 2016. 【185】 Keywords: Photographers, CNN, PhotographerNet 新規性・差分 概要 ・画像から撮影した写真家を推定 ・Low-level特徴,High-level特徴を用いてSVMでF値を評 価 ・Hybrid-CNNのpool5層が最高の結果を残した ・カメラマンを推定するという新規の問題設定を提案 ・41人の有名な写真家によって撮られた180,000枚以上の データセットを作成した. Links 論文 http://www.cv- foundation.org/openaccess/content_cvpr_2016/papers/Thoma s_Seeing_Behind_the_CVPR_2016_paper.pdf ポスター http://people.cs.pitt.edu/~chris/files/2016/cvpr2016_photograph er_poster.pdf ・Low-level特徴 Color:L*a*b*のヒストグラムでビン数が30 GIST:256×256ピクセルにリサイズしてGIST特徴抽出 SURF:SURF特徴をk-means(k=500)でクラスタリング, bag-of-wordsでベクトル量子化 ・High-level特徴を用いてSVMでF値を評価 Obhect Bank:物体識別の結果を特徴としたもの CaffeNet:ILSVRC2012 challengeのpre-train Hybrid-CNN:物体認識とシーン認識の1183分類3.6M枚 の 画像で学習されたネットワーク PhotographerNET:Hybrid-CNNのアーキテクチャに ・データセットをtest set(10%)とtraining set(90%)で分割 ・training setの中でCNN用のtest(10%)とtrain(90%)に分割 ・SVMは線形カーネルを使用 ・他クラス分類にはone-vs-all法を用いる
  • 189. Kota Yamaguchi, Takayuki Okatani, Kyoko Sudo, Kazuhiko Murasaki and Yukinobu Taniguchi, “Mix and Match: Joint Model for Clothing and Attribute Recognition”, in BMVC, 2015. 【186】 Keywords: clothing recognition,attribute recognition 新規性・差分 概要 ・衣服にはスカートとドレスを同時に着用しないことやジャケ ットとシャツが好ましい組み合わせであることなどがあり,そ の共起性を用いてConditional Random Field(CRF)により衣服属 性推定を行っている. ・Chictopia datasetとDress dataseに対して属性推定 ・姿勢推定を行ってから局所特徴を用いて属性推定を行う という従来の手法に対し,CRFを用いることにより精度向 上 Links 論文 http://www.bmva.org/bmvc/2015/papers/paper051/paper051.p df 著者 http://vision.is.tohoku.ac.jp/~kyamagu/ja/
  • 190. Michael Edwards and Xianghua Xie, “Graph Convolutional Neural Network”, in BMVC, 2016. 【187】 Keywords:Graph CNN,MNIST 新規性・差分 概要 ・グラフを用いたCNNによる文字認識 ・MNISTの識別問題に対して規則的なグリッド をした場合と不規則なグリッドをした場合対し てそれぞれ94.23%と94.96%の精度で識別可能 ・グラフベースの認識にCNNを適用 ・プーリング演算の代わりにAlgebraic Multigridを使用 Links 論文 http://www.bmva.org/bmvc/2016/papers/paper114/paper114.p df
  • 191. Qiang Zhang and Abhir Bhalerao, “Loglet SIFT for Part Description in Deformable Part Models: Application to Face Alignment”, in BMVC, 2016. 【188】 Keywords: 新規性・差分 概要 ・Deformable Part Models (DPM)のパーツ表現のための SIFTアルゴリズムを提案 ・提案手法であるloglet gradientフィルタを用いることに より精度向上 ・DPMのためのSIFTアルゴリズム提案 ・Loglet SIFTによりDPMベースの識別において精度を大 幅向上 Links 論文 http://www.bmva.org/bmvc/2016/papers/paper031/paper031.p df Appendix http://www.bmva.org/bmvc/2016/papers/paper031/sup031.pdf
  • 192. Wei Liu, Chaofeng Chen, Kwan-Yee K. Wong, Zhizhong Su and Junyu Han, “STAR-Net: A SpaTial Attention Residue Network for Scene Text Recognition”, in BMVC, 2016. 【189】 Keywords: STAR-Net, CNN, scene recognition 新規性・差分 概要 ・シーンテキストを認識するためのCNNの提 案 ・Spatial Attention Mechanismにより,テキス トの 歪みを除去することにより,歪みのない画像に 対して特徴抽出を行える. ・spatial attention mechanismとresidue convolutional blocksを用いて特徴を抽出 ・シーンテキスト認識のためのCNNであるSpaTial Attention Residue Network (STAR-Net)を提案 ・歪みの少ない場面テキストの最先端の方法に匹敵するパ フォーマンスを達成し,大きい歪みを伴うシーンテキスト については,提案手法の方法より優れている. Links 論文 http://www.bmva.org/bmvc /2016/papers/paper043/paper043.pdf
  • 193. Yancheng Bai, Wenjing Ma, Yucheng Li, Liangliang Cao, Wen Guo and Luwei Yang, “Multi-Scale Fully Convolutional Network for Fast Face Detection”, in BMVC, 2016. 【190】 Keywords: Fully Convolutional Network, Face Detection 新規性・差分 概要 ・Fully Convolutional Networknによる高速顔 検出のためのフレームワークの提案 ・異なるスケールモデルが同じ畳み込み特徴 マップを共有することにより高速な顔検出を 行う. ・VGA画像用のGPUで約100FPSを実行可能 ・FDDB,AFW,Pascal faces datasetで最新の 手法を上回る精度を実現 Links 論文 http://www.bmva.org/bmvc/2016/ papers/paper051/paper051.pdf
  • 194. Yanan Miao, Xiaoming Tao and Jianhua Lu, “Robust 3D Car Shape Estimation from Landmarks in Monocular Image”, in BMVC, 2016. 【191】 Keywords: Monocular image, 3D shape 新規性・差分 概要 ・単眼画像から3Dオブジェクト形状を再構成. ・3次元形状とカメラ姿勢の両方を推定するロバストなモ デルを提案 ・単眼画像の2次元ランドマークから3次元の車の形状を推 定する際に,観測値の異常値を処理するための堅牢なモデ ルを提案 ・State-of-the-artの手法と比較し,優れた性能を記録 Links 論文 http://www.bmva.org/bmvc/2016/papers/paper099/ paper099.pdf
  • 195. Suraj Srinivas and Venkatesh Babu, “Learning Neural Network Architectures using Backpropagation”, in BMVC, 2016. 【192】 Keywords: CNN 新規性・差分 概要 ・CNNにおけるニューロンの総数を制限するために使用さ れる新しい訓練可能なパラメータTri-State ReLUの提案 ・小規模ネットワークと大規模ネットワークの両方でこの 手法を実験的に検証し,予測精度に影響を与えることなく, 少ないパラメータでモデルを学習できるに成功 ・アーキテクチャ選択を行い,かなり少数のパラメータを 持つモデルを学習 ・Tri-State ReLUによるニューロンの総数を少なくするた めの正則化項の提案 Links 論文 http://www.bmva.org/bmvc/2016/ papers/paper104/paper104.pdf
  • 196. Tomoki Watanabe, Satoshi Ito and Kentaro Yokoi, “Co-occurrence Histograms of Oriented Gradients for Pedestrian Detection”, in PSIVT, 2009. 【193】 Keywords: human detect ,pedestrian detect co-occurrence, local feature 新規性・差分 概要 ・輝度勾配の共起性を用いた特徴の提案 ・人物検出のデータセットであるDaimlerChrysler , INRIA datasetによる実験でstate-of-the-artを 上回る精度 ・輝度勾配の共起性を用いた特徴であるCo-occurrence Histograms of Oriented Gradients(CoHOG)の提案 ・CoHOGのmiss rateはHOGの半分未満であった. Links 論文 http://link.springer.com/chapter/10.1007 /978-3-540-92957-4_4
  • 197. Xiaopeng Zhang, Hongkai Xiong, Wengang Zhou, Weiyao Lin, Qi Tian, “Picking Deep Filter Responses for Fine-grained Image Recognition”, in CVPR, 2016. 【194】 Keywords : 新規性・差分 概要 鳥や犬などのサブカテゴリまで認識することは,微小な違 いな為に,非常に困難な問題である.学習段階とテスト段 階の両方で,オブジェクト/part level annotationsを使用し ない自動細分化認識手法を提案する. 特定のパターンに対応する特有のフィルタを見つけ,新し いpositive sample miningとpart model retrainingを繰り返 し交互に行うことで一連のパーツ検出器を学習する.フィ ッシャーベクトルの空間的に重み付けされた組み合わせを 介してdeep filter responsesをpoolする.これらの技術をす べて統合することで,はるかに強力なframe workが生成さ れ,CUB-200-2011とStanford Dogsで行われた実験では, 提案されたアルゴリズムが既存の方法より優れていること が示されている. Links 論文:http://www.cv- foundation.org/openaccess/content_cvpr _2016/papers/Zhang_Picking_Deep_Filt er_CVPR_2016_paper.pdf
  • 198. Sam Hare, Amir Saffari, Philip H.S.Torr, “Struck:Structured Output Tracking with Kernels”, in ICCV2011.【195】 Keywords:GPU-based tracking, Tracking-by-detection, structured output SVMs, budget maintenance 新規性・差分 手法 結果 概要 ・物体追跡手法の提案.主流となっている適応型追跡法の 一つであり,トラッカーの設計時に追跡対象の事前情報を 組み込めないような場合でも高い追跡性能を誇る.オクル ―ジョンや輝度変化に対しても頑健な現在主流な追跡手法 の一つである. ・従来の適応型追跡手法では,追跡問題を分類タスクとし て扱い,追跡対象のオンライン学習を行う.しかし,更新 にはラベル付されたデータとの対応付けが必要であり,こ この対応付けが重要となる.本稿では構造化された出力予 測に基づいて追跡対象のラベル付を必要としないフレーム ワークを設計. ・右側が従来の追跡手法.左が今回提案する手法. ・従来手法と比べて高い追跡性能を誇ることが実証された. Links 論文:http://www.robots.ox.ac.uk/~tvg/publications/2015/struck- author.pdf コード: http://www.samhare.net/research/struck/code 著者: http://www.samhare.net/research/struck
  • 199. Yi Wu, Jongwoo Lim, Ming-Hsuan Yang, “Online Object Tracking: A Benchmark”, in CVPR2013.【196】 Keywords: performance evaluation, Object tracking, benchmark dataset 新規性・差分 手法 結果 概要 ・現在の物体追跡手法はオンライン追跡が主流となってお り,様々な追跡手法が発表されている.ここで本論文は, 同じデータセットに対して代表的なオンライン追跡の手法 を用いてどのアルゴリズムがどのように有効なのかを検証 している.今後の追跡手法の方向性についても提案した論 文である. ・大規模な性能評価のため,29の公式で入手可能な追跡ア ルゴリズムを統一されたコードライブラリに統合した.こ ちらはプロジェクトページにて公開されている. ・データセットには,追跡に悪影響を与える隠れや輝度変 化のどの11の要因のアノテーション付けを行った50個のデ ータを用意している.こちらも公開されている. ・3つの評価方法(OPE,TRE,SREと呼んでいる.詳細は論文を参照)を使 い,29の追跡アルゴリズムを評価した.また,それぞれの評価方法で追跡精 度と成功率の側面を評価している. ・結果は表のようになっており, それぞれの評価方法では変わるが, SCM,Struck,ASLAのアルゴリズ ムが主に優秀な成績をマークした. Links 論文 :http://www.cv- foundation.org/openaccess/content_cvpr_2013/papers/Wu_On line_Object_Tracking_2013_CVPR_paper.pdf プロジェクト: https://sites.google.com/site/trackerbenchmark/benchmarks/v1 0
  • 200. 【197】 新規性・差分 結果 概要 ・他のスパースモデリングでの手法は追跡対象と背景の区 分が不十分であり,オクル―ジョンに弱くなってしまうと いう欠点があった.提案手法ではスパース係数を利用して, オクル―ジョンに強い,より堅牢な追跡方法を提案してい る.また,適応的なテンプレート更新手法で追跡エラーを 少なくしている. ・MILやVTDなどの代表的な追跡手法と 比べ,エラー率の少なさや追跡精度に提 案手法が優れていることを示している. Links 論文 : http://ieeexplore.ieee.org/document/6247880/?arnumber=6247 880 プロジェクト: http://faculty.ucmerced.edu/mhyang/pubs.html Xu Jia, Huchuan Lu, Ming-Hsuan Yang, “Visual Tracking via Adaptive Structural Local Sparse Appearance Model ”, in IEEE2012. Keywords: performance evaluation, Object tracking, benchmark dataset ・スパースモデリングを用いた追跡手法.オクル―ジョン や輝度変化に対して頑健な追跡アルゴリズムであり,2016 年現在も主力となる手法である.
  • 201. 【198】 Keywords: Commonality discovery,First-person video 新規性・差分 結果 概要 ・FPVでの視点情報解析の研究の一つである.多人数間で 共有される視覚モチーフの発見を目的とする.複数人物に ウェアラブルカメラを装着し,ビデオ間の類似性,ビデオ 間の視点分散,注意を向ける方向の3つの側面からクラス タリング問題で視点解析手法の提案を行う. ・教師なし共通性クラスタリングのフレームワークを軸と して手法を提案した.データの作成には,ある場所に3,4 人を割り当て,それぞれ指定した物体を見るということの みを指示したデータを取得した.この指示物体がグラウン ドトゥルースとなる.また全部で44人のデータを取得して いる.特徴抽出にはSIFT特徴とフィッシャーベクターを用 いたものと,PlaceNetの6層から抽出した特徴を用いた. ・他の注意視点解析手法に比べ早く,そして正確な視覚モチーフの発見を行 うことができることが分かった. Links 論文 :http://link.springer.com/chapter/10.1007/978-3-319- 46475-6_12 Ryo Yonetani, Kris M. Kitani,Yoichi Sato, “Visual Motif Discovery via First-Person Vision”, in ECCV2016.
  • 202. Jia Xu, Lopamudra Mukherjee, Yin Li, Jamieson Warner, James M. Rehg, Vikas Singh, “Gaze-Enabled Egocentric Video Summarization via Constrained Submodular Maximization”,in CVPR2015. 【199】 Keywords:FPV,Video Summarization 新規性・差分 概要 ・FPVでの視点情報解析の研究の一つである.この論文で は,視点解析による結果から映像の要約を行う.視点追跡 を使用することで,動画の要約タスクが大幅に向上するこ とを示した. ・提案手法では,視線情報を入力し,時系列ウィンドウに 要約する.データには15時間以上の動画を用いて要約を行 っている.結果として,視点追跡を用いることで注視情報 が要約の関連性が普遍的に改善することを示している. Links 論文 : http://www.cv- foundation.org/openaccess/content_cvpr_2015/papers/Xu_Ga ze-Enabled_Egocentric_Video_2015_CVPR_paper.pdf プロジェクト: http://pages.cs.wisc.edu/~jiaxu/projects/ego-video-sum/
  • 203. Cheng Li, Kris M. Kitani, “Model Recommendation with Virtual Probes for Egocentric Hand Detection”, in ICCV2013 【200】 Keywords:Object Detection , Egocentric , FPV 新規性・差分 概要 ・FPVの利点の一つである手の詳細な映像の取得を生かし た研究である.本論文では,ピクセルレベルで手の検出を 行っており,手と指の形状から,精巧な運動や作業技能の 分析やジェスチャーの認識に繋げることが可能である. ・外観特徴と相互相関特徴を用いてピクセル単位の手検出 器を構築している.また,ピクセル単位の手検出を行った 結果から,セグメンテーションを行い,手領域の区分に成 功している. Links 論文 : http://www.cv- foundation.org/openaccess/content_iccv_2013/papers/Li_Mod el_Recommendation_with_2013_ICCV_paper.pdf
  • 204. David Liu, Tsuhan Chen, “Unsupervised Image Categorization and Object Localization using Topic Models and Correspondences between Images”, in ICCV2007 【201】 Keywords: 新規性・差分 結果 概要 ・教師なしでの物体のローカリゼーション,画像のカ テゴリー付けをトピックモデルの応用と画像間対応を 改良することで行う論文. ・トピックモデルの応用としてはトピックをカテゴリ ーとして捉え,VWsを単語として扱う.トピックモ デルにはPLSAのモデルを用いている.この時rは文章 の多義性を扱えることが可能になっている. 画像間の対応付けとしては[A spectral technique for correspondence problems using pairwise constraints] を参考に行っている.従来の類似性に報酬マップをあ たえる手法ではオブジェクトの変形が大きい場合に誤 った報酬マップになってしまうが本手法では報酬マッ プではなく外観情報に依存した学習を行うことで解決 を行っている. ・Caltech-4 とCaltech-backgroundを用いて教師なし物体認識及び物 体ローカリゼーション実験を行った. Links 論文 :
  • 205. Gregory Rogez, James S. Supancic III, Deva Ramanan, “First-Person Pose Recognition Using Egocentric Workspaces”, in CVPR2015 【202】 Keywords:Pose Recognition ,FPV 新規性・差分 結果 概要 ・FPVの利点の一つである手の詳細な映像の取得を生かし た研究である.胸部に取り付けたカメラで腕及び手の姿勢 推定を行う.. ・手の外観とワークスペースの位置が相関することを利用 して,胸部のカメラでの作業空間座標から深度特徴を用い てSVMで手の姿勢認識を行うトレインデータで3D空間座 標を生成する ・手,腕,物体,背景からなる作業空間上においてリアルタイムでの姿勢推 定を行うことが実現できた.Links 論文 :http://www.cv- foundation.org/openaccess/content_cvpr_2015/papers/Rogez_ First-Person_Pose_Recognition_2015_CVPR_paper.pdf
  • 206. Ryo Yonetani, Kris M. Kitani, Yoichi Sato, “Recognizing Micro-Actions and Reactions From Paired Egocentric Videos”, in CVPR2016 【203】 Keywords: FPV,Action Recognition 新規性・差分 結果 概要 ・FPVでのインタラクション解析の研究である.本論文で は,会話をする2人の頭部にカメラを装着し,動作の解析 と反応の解析を行うことで相互の人物のインタラクション を2人の映像を用いて解析する. ・話し手と聞き手の動作と反応を確認するために一対のデ ータを使って解析することを提案している.データは全部 で1226組のビデオを取得している. ・FisherVectorを用いた手法や,累積変位を用いた手法,TCNN,IDTなどの 手法で実験を行い,一対のデータを使って解析することで認識精度が向上す ることを確認した. Links 論文 : http://www.cv- foundation.org/openaccess/content_cvpr_2016/papers/Yoneta ni_Recognizing_Micro-Actions_and_CVPR_2016_paper.pdf
  • 207. Zhefan Ye, Yin Li, Yun Liu, Chanel Bridges, Agata Rozga, James M. Rehg, “Detecting bids for eye contact using a wearable camera”, in IEEE2015 【204】 Keywords:Cameras, Face, Feature extraction, Estimation, Autism, Glass 新規性・差分 概要 ・FPV研究の利点である,インタラクション解析の研究を 行っている.本論文では,視点カメラを用いて子供から大 人の目へと向かうアイコンタクトの検出を行う研究を示し ている. ・子供と大人の間で行われるインタラクションのデータセ ットを提示している.また,提案手法であるPEECとCRF に基づいた手法は最新手法と比べ,高い精度でのアイコン タクト木演出を行うことが可能となっている. Links 論文 : http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=7163095
  • 208. Krishna Kumar Singh, Kayvon Fatahalian,Alexei A. Efros, “KrishnaCam: Using a Longitudinal, Single- Person, Egocentric Dataset for Scene Understanding Tasks ”, in IEEE2016 【205】 Keywords: Cameras, Visualization, Streaming media, Urban areas, Computer vision, Legged locomotion, Global Positioning System 概要 ・FPV研究に用いることのできる大規模データセットを提 供している.本データセットの特徴としては,コンピュー タビジョン大学院生の9か月間の生活をGPS位置,加速度 および身体の向きデータとともに記録し,分析が施されて いる.データは70時間(7600万フレーム)ほど記録されてい るこのデータでは,記録者のより自然な生活の動きをとっ ているので,意図していたことを途中でやめたり,動きの ない食事をとるなどのデータも記録されている.シーン映 像を与えたときの記録者の自然な動きからの行動予測など に活用することができる。 Links 論文 : http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumb er=7477717 プロジェクト
  • 209. Yipin Zhou, Tamara L. Berg, “Temporal Perception and Prediction in Ego-Centric Video”, in ICCV2016 【206】 Keywords: Prediction,Egocentric,FPV 新規性・差分 概要 ・一人称視点動画を用いて行動予測に関する研究を行った. 本論文では2つの実験を行った.1つは時系列順に短いスニ ペットを並びかえる,2つ目は対象のビデオに対し,その 前後のスニペットのどちらが対象とするビデオに近い行動 かを識別した. ・RGB特徴,シーン認識,行動認識の3要素を用いること を提案している.提案手法と従来手法の比較を行うと,提 案手法の方が認識精度が高いという結果を得た. Links 論文 : https://www.computer.org/csdl/proceedings/iccv/2015/8391/00/ 8391e498.pdf
  • 210. Zdenek Kalal, Krystian Mikolajczyk, and Jiri Matas, “Tracking-Learning-Detection”, in IEEE2012.【207】 Keywords:Tracking-by-detection, 新規性・差分 概要 ・リアルタイム追跡手法を提案した研究である.オンライ ン追跡の代表的な手法としても有名.追跡,学習,検出を 行うフレームワークを構成することで長期的な追跡を行う ことを可能とした. ・TLDは見え方の変化や大きさの変化に強いトラッカーで ある.この中核をなすアルゴリズムはP-NLearningと呼ば れる学習手法である.追跡対象の軌道に近い窓をpositive とし,遠い窓をnegativeとして半教師学習を行っている. これにより追跡対象の更新が可能となる. Links 論文 : http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=6104061 &tag=1
  • 211. Lin Wu,Chunhua Shen,Anton van den Hengel , “Deep Recurrent Convolutional Networks for Video- based Person Re-identification: An End-to-End Approach ”, in arXiv2016 【208】 Keywords: Video-based person re-identification,Gated recurrent unit,Recurrent convolutional networks 概要 ・ビデオベースの人物再同定で新たなリカレントネットワ ークを提案している.ビデオを入力すると全フレームから CNNの全結合層を盛り込んだ特徴が抽出される.全時系列 のステップからの特徴は完全な配列のための外観情報を与 えるため,PoTで時系列情報を統合する.際同定には[色情 報とフロー情報を用いる.データセットにはILIDSと PID2011を用いている. Links 論文 : https://pdfs.semanticscholar.org/2d61/30f043e69849fc0443bb 489c5d21f933eddd.pdf
  • 212. Deciphering DNA replication dynamics in eukaryotic cell populations in relation with their averaged chromatin conformations in Nature 2016 概要 DNA複製の非局所モデルを提案する.このモデルは,出芽酵 母およびヒト細胞の両方の実験データと一致し,複製開始速度や 複製フォーク密度および複製DNAの割合の時間的な経過をいかな るパラメータに依存しないで予測できる. この結果は,真核生物のDNA複製のダイナミクスを制御するプ ログラムが,複製の開始に起因して確率論的に発生する現象であ ることを示唆している. 新規性 複製開始の位置や時間に関して不確実性を考慮に入 れて, DNA複製の非局所モデルを提案した. LINK http://www.nature.com/articles/srep22469 発火起点と未発火起点のみを区別した DNAの発火プロセスのモデル化 A. Goldar, A. Arneodo, B. Audit, F. Argoul, A. Rappailles, G. Guilbaud, N. Petryk, M. Kahli and O. Hyrien 【209】
  • 213. Dynamic Texture Recognition via Orthogonal Tensor Dictionary Learning in ICCV2015 Yuhui Quan, Yan Huang and Hui Ji 概要 Dynamic Texture(DT)のパターンを認識する ために,スパースなコード化を基にした認識手 法を提案する.DT認識のために,構造テンソ ル辞書を利用する.提案した辞書は,既存の辞書 よりも高次元ノンデータに対して高速かつスケ ーラブルである. さらに,提案した辞書学習法に基づいて, DT記述子を開発した.その記述子は,既存のア プローチよりも優れた適応性,識別性,スケー ラビリティを備えている. 複数のデータセットの実験によって,これら の利点を証明した. 新規性 DTパターン識別のための構造テンソル辞書の提案 LINK http://www.cv- foundation.org/openaccess/content_iccv_2015/papers/Quan_Dynami 時間コストと減衰挙動 (左)辞書の時間コスト (中)特徴抽出の時間コスト (右) 目的関数値の減衰挙動 提案手法を様々なデータセットに適用した結果 【210】
  • 214. 【211】 新規性・差分 概要 ・本論文では, ブースティングされたHOG(Histogram of Oriented Gradients)特徴を用いて, 静的画像における歩行者検 出と車両検出を組み合わせた手法を提案する. ・HOGを用いた手法では, 特徴ベクトルのサイズが大きいため、 トレーニングサンプルの数が制限され、分類の計算コストが増加 する. ・提案手法では, 車両の影の下にある影の特徴は道路画像におけ る車両検出の重要な特徴であり,建物、雲、花、フェンスなどの非 車両領域を効果的に推定する. 論文 http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=7139161 Links Keywords: AdaBoost HOG, SVM, vehicle detection Diqing Sun, Junzo Watada, “Detecting Pedestrians and Vehicles in Traffic Scene Based on Boosted HOG Features and SVM ”, IEEE, 2015.
  • 215. Meirav Galun, Tal Amir, Tal Hassner, Ronen Basri, Yaron Lipman, “Wide baseline stereo matching with convex bounded distortion constraints”, in ICCV2015, 2015. 【212】 Keywords: epipolar consistent bounded distortion(EBD), Bounded distortion (BD) 新規性・差分 概要 ・広いベースライン設定で対応を見つけることは困難であ る.既存の手法は対応させるためのより優れた特徴記述子 の開発,エピポーラ線制約の正確な修復に焦点を当ててき た.そこで我々は近似エピポーラ拘束が与えられた際の対 応関係を見つけるという困難な問題に焦点を当て,変形モ デルを統合する新しい方法を提案する. ・対の静的シーンの広いベースライン画像における対応関 係を発見するための新規な方法を紹介する.エピポーラ制 約を考慮してもマッチングがあいまいであることに留意し, エピポーラ線に沿った幾何学的変化をモデル化するために 変形マップを使用する.具体的には2つの画像と推定され た基本行列を与えられた際に画像を関連づけ,2つの要件 を満たす幾何学的マップを計算する. Links 論文 http://www.cv- foundation.org/openaccess/content_iccv_2015/papers/Galun_ Wide_Baseline_Stereo_ICCV_2015_paper.pdf 提案手法で計算された深度マッ プ HerzjesuとFountainデータセットのすべて のイメージペアについて計算された中央値 Herzjesu(左)およびFountain (右) データセットのF measure
  • 216. 【213】 Keywords: depth, albedo, shading, optical flow, surface contours 新規性・差分 概要 ・我々は本質的な画像推定の問題として,ビデオシーケン スからの高密度深度マップの推定を定式化する.また, 我々のアプローチは複数のイントリンシック画像の推定を 相乗的に統合する.提案手法は複数の固有画像の推定を組 み合わせているため,ベースライン法と比較して深度推定 が改善される. ・ビデオから一貫したアルベドとシェーディングを抽出す る方法と組み合わせ,RGBと深度のペアのデータベースか らのラベル転送を使用する奥行き推定のためにサンプルベ ースのフレームワークを構築する.その際,アルベド,シ ェーディング,およびピクセル値からサーフェス境界を予 測する輪郭検出器を作成し,これを使用して深度境界の推 定を改善する.また,推定された深さマップのメトリック 精度を改善するために、モーションからの疎構造を提案手 法と統合する. Links 論文 http://www.cv- foundation.org/openaccess/content_iccv_2015/papers/Kong_Intri nsic_Depth_Improving_ICCV_2015_paper.pdf Naejin Kong, Michael J. Black, “Intrinsic Depth:Improving Depth Transfer with Intrinsic Images”, in ICCV2015, 2015. 人の歩行およびカメラの動きのあるリビングルームのシ ーン (c)は提案手法の結果であり,SfMキューの欠落にかかわ らず,全体的に深さを十分に推定している.
  • 217. 【214】 Keywords: detects repeated 3D structures, 3D MRF 新規性・差分 概要 ・我々は与えられた奥行き画像からカメラの視点で見るこ とができない3Dの領域に拡張する手法を提案する.提案 手法が実世界のデータを用いて単一の深度画像から完全な 3Dシーンを完成させ,シーンの新規な視点から完全な深 度マップを合成することができることを実証する.さらに, 定量的かつ定量的に方法を評価することを可能にする広範 な合成三次元形状に関する結果を示す. ・経路計画,音声波進行分析,新しい視点生成などの多く のアプリケーションにおいてカメラでは見られないジオメ トリの欠落部分を使用する必要がある. そこで,現在の 奥行きマップを拡張するために複数の容積測定推定を生成 し,これらすべて併合する. Links 論文 http://www.cv- foundation.org/openaccess/content_iccv_2015/papers/Korman_Pee king_Template_Matching_ICCV_2015_paper.pdf 新しい視点の深度合成 (a)は照用に示されたRGB画像,(b)は入力 - 単一視点の奥行きマッ プ,(c)はinputdepth-map(b)から計算された新しい視点デプスマ ップ,(d)は完成した奥行きマップである. Simon Korman, Eyal Ofek, Shai Avidan, “Peeking Template Matching for Depth Extension”, in ICCV2015, 2015.
  • 218. Zhuoyuan Chen, Xun Sun, Liang Wang, “A Deep Visual Correspondence Embedding Model for Stereo Matching Costs”, in ICCV2015, 2015. 【215】 Keywords: , semi-global method (SGM), Markov Random Field(MRF) 新規性・差分 概要 ・本稿ではステレオマッチングのためのデータ駆動マッチ ングコストについて述べ,畳み込みニューラルネットワー クを介した新規な深い視覚に対応した埋め込みモデルを提 案する.KITTIとMiddleburyのデータセットを用いた実験 より,モデルの有効性実証された. ・本稿ではマッチングコスト計算ステップに焦点を当て, あいまいさに対処するためのデータ駆動型アプローチを提 案する.畳み込みニューラルネットワークを介した新規な 深い視覚に対応した埋め込みモデルは明度を豊かな埋め込 み空間に明示的にマッピングする.これにより外観データ を活用して画像パッチ間の視覚的相違を学習する.さらに, 我々の学習ベースのマッチングコストをSGMに組み込む. Links 論文 http://www.cv- foundation.org/openaccess/content_iccv_2015/papers/Chen_A _Deep_Visual_ICCV_2015_paper.pdf エラーしきい値を3ピクセルに設定し,KITTIベンチマー クに おけるパイプラインの定性的評価の結果 ミドルベリのデータに深い埋め込みコス トを 使用した勝者の結果の例
  • 219. Behjat Siddiquie, Rogerio S. Feris, Larry S.Davis, “Image ranking and retrieval based on multi-attribute queries”, in CVPR, 2011. 【216】 Keywords: Multi-Attribute, BMRM 新規性・差分 概要 マルチアトリビュートを用いた画像の画像の順位付けと検 索を行う新たな手法を提案.Wild(LFW)、FaceTracerお よびPASCAL VOCデータセットのLabeled Facesに対し、 提案手法が有効であることがわかった. 複数属性の正解が与えられた場合、正解に存在しない他の 属性も用いることで、多属性検索を可能にしている。 Links 論文: http://rogerioferis.com/publications/marr _cvpr2011_camReady.pdf
  • 220. Keywords: human action, computer vision, Hough, tracking 行動認識のための新しいframe workの提 案. Hough変換とRandom forestsを組み合わせた 新しいframe workの提案. classification A Yao, J Gall, L Van Gool, “A Hough transform-based voting framework for action recognition”, Computer Vision and Pattern Recognition (CVPR), 2010. 【217】 Links 論文: http://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=553988 3 概要 新規性・差分 手法 結果 localization Weizmann, KTH, UCF Sports, UCR datasetに対して評価.
  • 221. Katsunori Ohnishi, Atsushi Kanehira, Asako Kanezaki, Tatsuya Harada, “Recognizing Activities of Daily Living with a Wrist-mounted Camera”, in arXiv2016 【218】 Keywords:FPV , Action Recognition 新規性・差分 概要 ・FPV研究での自己行動推定を行っている.行動と手にも つ物体には相関があるという仮定の元,物体を大きく撮影 することができれば,より行動分類が詳細に可能と考えて いる.そこで手首にウェアラブルカメラを装着し,行動識 別を行った. ・ウェアラブルカメラを手首につけ日常行動のデータを作 成した.また,行動分類のための新しいアルゴリズムを作 成している.結果にはヘッドマウントカメラとリストマウ ントカメラを比較した際の精度を出力しており,全体的に リストマウントカメラの精度が高いことを示した. Links 論文 : https://arxiv.org/pdf/1511.06783.pdf
  • 222. 【219】 Karol Gregor, Ivo Danihelka, “DRAW: A Recurrent Neural Network For Image Generation”, 2015. Keywords: Deep Recurrent Attentive Writer,Image generation 概要 ・画像生成のためのDeep Recurrent Attentive Writer (DRAW) neural network architecture を 紹介する.DRAW networksは複雑な画像の反復 的な構築を可能にする連続的な可変自己符号化 フレームワークを用いている. 結論 ・DRAW neural network architecture を紹介し, ハウスナンバーの写真などの現実的な自然画像 を生成する能力と,二値化されたMNIS生成に 関する結果を改善することを実証した.また, 画像生成だけでなく画像分類にも有益であるこ とを立証した. Links 論文 https://arxiv.org/pdf/1502.04623v2.pdf
  • 223. 【220】 Oriol Vinyals, Alexander Toshev, “Show and Tell: A Neural Image Caption Generator”, in CVPR, 2015. Keywords: A Neural Image Caption Generator 概要 ・コンピュータビジョンと機械翻訳の進歩を組み合 わせた,画像について自然な文章を生成するために使 用できるモデルを提示する.このモデルは訓練画像が 与えられた場合,ターゲット記述文の尤度を最大にす るように訓練される. 結論 ・画像を自動的に閲覧してWord Neighbors を生成 するneural network systemであるNICを提示した. NICは画像をコンパクトな表現にエンコードし,続 いて対応する文を生成するa convolution neural network に基づいている.実験で定性的結果と定量 評価の点でNICの堅牢性が示された. Links 論文 http://www.cv- foundation.org/openaccess/content_cvpr_2015/papers/Vin yals_Show_and_Tell_2015_CVPR_paper.pdf
  • 224. 【221】Licheng Yu, Eunbyung Park, “Visual Madlibs: Fill in the blank Image Generation and Question Answering ”, 2015. Keywords: Image Generation 概要 ・10,738個の画像を対象とした360,001個の自然言語 記述からなる新しいデータセットを紹介する. Visual Madlibsデータセットは、自動的に作成された空白を 埋めるテンプレートを使用して収集される.Visual Madlibsデータセットのいくつかの分析を提供し,焦 点を絞った記述生成,および画像の複数選択の質問応 答に適用可能であることを示す. 結論 ・ターゲットとする自然言語記述のための新しい空 白埋め込み戦略を導入し,Visual Madlibsデータセ ットを収集した.分析は, 文章の記述が一般的な全 体画像の記述よりも詳細であることを示した. Links 論文 https://arxiv.org/pdf/1506.00278v1.pdf
  • 225. 【222】Hao Fang, Saurabh Gupta, “From Captions to Visual Concepts and Back”, in CVPR, 2015. Keywords: automatically generating image descriptions 概要 ・画像キャプチャのデータセットから直接学 習したvisual detectors,,language models, multimodal similarity modelsの画像記述を自 動的に生成するための新しい手法を提案する. 結論 ・提案システムは画像および対応するキャプション を訓練し、画像中の領域から名詞、動詞および形容 詞を抽出することを学習する.次に、これらの検出 された単語を含むテキストを生成するために言語モ デルを導く.システムを評価した結果,人間のパフ ォーマンス以上のパフォーマンスを達成した. Links 論文 http://www.cv- foundation.org/openaccess/content_cvpr_2015/papers/Fang_From_Captions_to_2015_CVPR_paper.pdf
  • 226. 【223】Andrej Karpathy, Li Fei-Fei, “Deep Visual-Semantic Alignments for Generating Image Descriptions”, in CVPR, 2015. Keywords: generates natural language descriptions 概要 ・画像とその領域の自然言語記述を生成するモデルを 提案する.画像と文章の記述を利用して言語と視覚デ ータの間の相互対応について学習する.alignment modelは,画像領域に対するConvolutional Neural Networks,文に対するbidirectional Recurrent Neural Networksおよびmultimodal embeddingを通して2つの 様式を構造化した新しい組み合わせに基づいている. 結論 ・Flickr8K、Flickr30K、およびMSCOCOデータセ ットの検索実験では、 alignment modelが最先端の 結果をもたらすことを示した. Links 論文 http://cs.stanford.edu/people/karpathy/cvpr2015.pdf プロジェクト http://cs.stanford.edu/people/karpathy/deepimagesent/
  • 227. 【224】 Scott Reed, Zeynep Akata, Xinchen Yan“Generative Adversarial Text to Image Synthesis ”, arXiv, 2016. Keywords: generative adversarial networks 概要 ・本論文では,文字とピクセルの視覚的な概念を翻訳し, テキストと画像モデリングのこれらの進歩を効果的に橋渡 しするために,新しいdeep architectureとgenerative adversarial networks(GANs)を開発する. Links 論文 https://arxiv.org/pdf/1605.05396v2.pdf
  • 228. 【225】 Emily Denton, Soumith Chintala, “Deep Generative Image Models using a Laplacian Pyramid of Adversarial Networks”, in NIPS, 2015. Keywords: generates natural language descriptions 概要 ・自然画像のサンプルを生成できるgenerative parametric modelを紹介する. 提案手法としてはLaplacian pyramid framework内のconvolutional networksのカスケードを使用 して粗いものから細かいもので画像を生成する.ピラミッ ドの各レベルでは, Generative Adversarial Netsを使用し てseparate generative convnet modelが訓練される. Links 論文 http://papers.nips.cc/paper/5773-deep-generative-image-models-using-a-laplacian-pyramid-of-adversarial-networks.pdf プロジェクト http://papers.nips.cc/paper/5773-deep-generative-image-models-using-a-laplacian-pyramid-of-adversarial-networks
  • 229. 【226】Alec Radford, Luke Metz, Soumith Chintala, “UNSUPERVISED REPRESENTATION LEARNING WITH DEEP CONVOLUTIONAL GENERATIVE ADVERSARIAL NETWORKS ”, in ICLR, 2016. Keywords: generates natural language descriptions 概要 ・教師なし学習の強力な候補者であるdeep convolutional generative adversarial networks (DCGANs)と呼ばれるCNN クラスを紹介する.様々な画像データセットを訓練すること によって,deep convolutional adversarial pairがgenerator と discriminatorの両方でオブジェクトパーツからシーンへの表 現の階層を学習するという証拠が示される. Links 論文 https://arxiv.org/pdf/1511.06434v2.pdf
  • 230. 【227】 Ming-Yu Liu, Oncel Tuzel, “Coupled Generative Adversarial Networks ”, in NIPS, 2016. Keywords: generates natural language descriptions 概要 ・マルチドメイン画像の共同分布を学習するためのcoupled generative adversarial network (CoGAN)を提案する.トレー ニングセット内の異なる領域に対応する画像のタプルを必要 とする既存のアプローチとは対照的に,CoGANは対応する 画像のタプルなしで共同分布を学習することができる. Links 論文 http://papers.nips.cc/paper/6544-coupled-generative-adversarial-networks.pdf
  • 231. Anelia Angelova, Alex Krizhevsky, Vincent Vanhoucke, Abhijit Ogale and Dave Ferguson, “Real- Time Pedestrian Detection with Deep Network Cascades”, in BMVC, 2015. 【228】 Keywords: 新規性・差分 概要 ・Caltech pedestrian detection benchmark に対して, average miss rate が26.2%を達した. ・15 fpsで実行可能のアルゴリズムを提案 Links 論文 http://www.bmva.org/bmvc/2015/papers/paper032/paper032.p df ・高速かつ高精度の歩行者検出を行うDNNの提案 ・中間層3つのDeep networkをカスケード接続すること により,高速なアルゴリズムを実現
  • 232. James Steven Supanci, Gregory Rogez, Yi Yang , Jamie Shotton , Deva Ramanan, “Depth-based hand pose estimation: data, methods, and challenges”, in ICCV2015, 2015. 【229】 Keywords: Pose estimation, nearest-neighbor (NN) 新規性・差分 概要 ・近年,手の姿勢の推定は急速に成熟している.商品深度 センサの導入と多数の実用化により,進歩が加速している. 1つのフレームの深さから手の姿勢を推定することに焦点 を当て,最先端な分析を提案する. ・我々は均一な採点基準の下で4つのテストセットにわた る13の最先端の手の姿勢推定システムを評価する.さらに, 現代的なアプローチを幅広く調査し以前の制限に対処する 新しいテストセットを導入する.そしてNNのサンプルボ リュームに基づくポーズ推定の新しいベースラインを提案 する. Links 論文 http://www.cv- foundation.org/openaccess/content_iccv_2015/papers/Supan cic_Depth-Based_Hand_Pose_ICCV_2015_paper.pdf クロスデータセットの一般化 比較 データセットの設計比 較 提案手法の失敗例
  • 233. Zifeng Wu, Yongzhen Huang, Liang Wang, Xiaogang Wang, and Tieniu Tan, “A Comprehensive Study on Cross-View Gait Based Human Identification with Deep CNNs”, in IEEE2016 【230】 Keywords:cross-view, Deep learning, CNN, human identification, gait 新規性・差分 概要 ・本論文では外観ベースでCNNを用いた歩行特徴での人物 再同定手法を提案している.クロスビュー歩行認識の観点 により,CASIA-Bデータセットを用いて実験を行った. ・CNNを用いた歩行特徴での人物再同定手法はこの論文が 初となる.実験結果より,視野角36°以上で従来手法と比 べ,提案手法は利点を示している.平均認識率は94.1%に 達し、以前の最良の結果(65%未満)よりもはるかに優れ ている. Links 論文 : http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=7439821
  • 234. Joe Yue-Hei Ng, Jonghyun Choi, Jan Neumann, Larry S. Davis, “ActionFlowNet: Learning Motion Representation for Action Recognition”, in arXiv pre-print 1612.03052, 2016. 【231】 Keywords: Joint Estimating Optical Flow and Action 新規性・差分 概要 オプティカルフローと行動を同時に推定するフローである.推定し たフローも行動認識のための手がかりとする.学習はマルチタスク によるものであり,フローとアピアランスを同時に用いて行動認識 をすることができる.なお,畳み込みのアーキテクチャはDeep Residual Networks (ResNetを参考にしている. ・オプティカルフローを推定し,アピアランスやフロー画像を用いて行動 認識を行うネットワークを構築した.本提案はひとつのアーキテクチャに てこれら全てのタスクをこなす ・ネットワークはマルチタスク学習により最適化される Links 論文 https://arxiv.org/pdf/1612.0305 2v1.pdf プロジェクト
  • 235. Yifan Wang, Jie Song, Limin Wang, Luc Van Gool, “Two-Stream SR-CNNs for Action Recognition in Videos”, in BMVC, 2016. 【232】 Keywords: two stream CNN, Action recognition, 新規性・差分 概要 ・行動はキューと呼ばれる複数の要素によって定義され, 右図(a)~(d)に示すように4つのタイプに分けることが可能 ・様々なキューの位置情報を意味的に認識したCNNベース の行動認識フレームワークの提案 ・物体検出器の出力から動画内の関係のある人物および物 体を抽出する,R-CNNのように高速で効率的な方法を提 案 ・得られた出力は,RoiPooling層を介して,従来の2 stream CNN に組み込まれる. ・各セマンティックキューによって最終的な予測を行うた めのチャネルを構成 Links 論文 http://www.bmva.org/bmvc/2016/papers/paper108/paper108.p df プロジェクト
  • 236. Umer Raf, Ilya Kostrikov, Juergen Gall, Bastian Leibe, “An Efficient Convolutional Network for Human Pose Estimation”, in BMVC, 2016. 【233】 Keywords: Human Pose Estimation, CNN, Convolutional Pose Machine 新規性・差分 概要 ・pre-training を必要とせず,ミッドレンジのGPUで稼働 し,複雑なモデルを使用したベンチマークと同等に効率的 なCNNアーキテクチャを使用した骨格推定手法の提案. Convolutional Pose Machineと比較し,優れた性能を発揮 していることを確認. ・Fully Convolutional GoogLeNet (FCGN) networkの提案 ・最初の17層を取り出し,deconvolution層を加えて全結 合 ・スキップ層を導入し,2つのGCGNを共有の重みと結合 したマルチネットワーク ・従来の複雑なモデルを使用した手法に対して優れたパフ ォーマンスを発揮し,省メモリ,短時間で学習が可能 Links 論文 http://www.bmva.org/bmvc/2016/papers/paper109/paper109.p df プロジェクト
  • 237. Sergey Zagoruyko, Adam Lerer, Tsung-Yi Lin, Pedro O. Pinheiro, Sam Gross, Soumith Chintala, Piotr Dollár, “A MultiPath Network for Object Detection”, in BMVC, 2016. 【234】 Keywords: Object Recognition, MultiPath Network, COCO dataset 新規性・差分 概要 ・COCO datasetには,複数のスケール,コンテキスト, 乱雑さ,多くのオクルージョンを含む画像が含まれる.そ のデータセットを用いて,より正確な物体位置の特定を行 う. 標準のFast RCNNの物体検出器に以下3つの変更を加える (1)複数のネットワーク層の特徴へアクセスする接続をスキ ップ (2)複数の物体解析で物体のコンテクストを利用する共起的 構造 (3)局在化を改善する積分損失関数およびネットワークの調 整 Links 論文 http://www.bmva.org/bmvc/2016/papers/paper015/paper015.p df
  • 238. Holger Caesar, Jasper Uijlings, Vittorio Ferrari, “Region-based semantic segmentation with end-to-end training”, in ECCV, 2016. 【235】 Keywords: Semantic segmentation, end-to-end training, region-based 新規性・差分 概要 セマンティックセグメンテーションを行う際には 以下の問題がある. ・Fully Convolutional approachesでは,受容野が 正方形,マルチスケール非対応,低解像度 ・Region-based approachesでは,end to end で学 習不可,殆どの領域は無関係,Lossが領域サイズ を無視,非差別的なクラスはSoftmaxおよびMax over regionsの順にラベルを決定 以上の問題に対応したアプローチの提案 ・微分可能な領域からピクセルへの層 ・微分可能な自由なROI Pooling ・Softmaxおよびmax over regionsを正しい順に処理 →複数の重複領域に対してもend to end で学習可能 →Fully Convolutional approachesとRegion-based approachesの問題点を解決 Links 論文 https://arxiv.org/pdf/1607.07671v1 プロジェクト ↑ 2つのデータセットに対してState-of-the-art,合理的な精度と平均IOU ↓ 粗い入力の境界
  • 239. Peng Wang, Alan Yuille, “DOC: Deep OCclusion Estimation From a Single Image”, in ECCV, 2016. 【236】 Keywords: oclusion estimation, 新規性・差分 概要 ・意味的なエッジとエッジに沿ったオクルージョンの関係 の推定.画像内の境界(エッジ)が属するものの推定 ・ ・PASCAL Instance Occlusion Dataset (PIOD)に基づき, 大規模なオクルージョンデータセットを構築 ・新規画素ベースのオクルージョン表現と密な予測のため のlossの設計 ・単一の画像からのオクルージョン推定に向けたdeep convolutional networkを使用 Links 論文 http://www.eccv2016.org/files/poste rs/P-1A-33.pdf プロジェクト
  • 240. Stephan Richter, Vibhav Vineet, Stefan Roth, Vladlen Koltun, “Playing for Data: Ground Truth from Computer Games”, in ECCV, 2016. 【237】 Keywords: Semantic segmentation, computer games, dataset 新規性・差分 概要 ・商用のオープンワールドゲームからプレイ画面をキャプ チャし,セマンティックセグメンテーション向けのデータ セットを構築 ・セマンティックセグメンテーションの精度が向上したこ とからゲームを用いた大規模なデータセットの有用性を提 示. ・ゲームを用いたデータセットの構築 ・プライバシーを気にする必要がないため,無限にデータ セットを作成可能 ・アノテーションに要する時間の短縮 Links 論文 goo.gl/Pe9dCE プロジェクト http://download.visinf.t u- darmstadt.de/data/fro m_games/ code https://bitbucket.org/vis inf/projects-2016-
  • 241. Guilhem Cheron, Ivan Laptev, Cordelia Schmid, “P-CNN: Pose-based CNN Features for Action Recognition”, in ICCV, 2015. 【238】 Keywords: Human Action Recognition, Pose-based CNN, improved dense trajectories, 新規性・差分 概要 ・外観情報を用いた人物行動認識の研究が多くなされてい る中,人物の姿勢情報を利用した行動認識の重要性につい て書かれた論文 ・人物の外観情報と姿勢情報を統合した行動認識に特化し たネットワークであるPose-based Convolutional Neural Network descriptor (P-CNN)を提案. ・手作業で姿勢アノテーションし行動認識を行う実験(GT) と,姿勢を推定し行動認識を行う実験(Pose)を行い,その 重要性を評価. ・行動認識においては外観情報(iDT)が効果的であるという 結果を覆し,姿勢の重要性を提示 ・外観情報と姿勢情報を組み合わせることでState-of-the- artな結果が得られた. Links 論文 http://www.di.ens.fr/willow/research/p-cnn/P- CNN_cheronICCV15.pdf プロジェクト
  • 242. Rui-Wei Zhao, Jianguo Li, Yurong Chen, Jia-Ming Liu, Yu-Gang Jiang, Xiangyang Xue, “Regional Gating Neural Networks for Multi-label Image Classification”, in BMVC, 2016. 【239】 Keywords: Multi-label image classification, RGNN 新規性・差分 概要 ・マルチラベルの画像分類に向けたDeep learning frameworkであるregional gating neural networks (RGNN) の提案. ・RGNNは,コンテキスト領域の特徴を自動で選択し,特 別なgate unitsによってより良い分類に向け結合するend- to-end なフレームワークである. RGNNは以下の5つのステップで構成される. (1)物体の検出を行い複数の物体領域を生成 (2)Shared Conv + ROI pool + FC layersによって領域内の 特徴を取得する. (3)Region/feature level gateによって効果的なコンテキス トを取得する. (4)Multi-scale cross region poolingによってコンテキストイ メージレベルの特徴を取得する. (5)結合したコンテキストの特徴をFC層に送り,画像ラベ ルの予測を行う. Links 論文 http://www.bmva.org/bmvc/2016/papers/paper072/abstract072. pdf プロジェクト PASCAL VOC 2007と2012, MS-COCO benchmarksで評価した結果RGNN がState-of-the-artな識別率を出した.
  • 243. Jingjing Liu, Shaoting Zhang, Shu Wang, Dimitris N. Metaxas, “Multispectral Deep Neural Networks for Pedestrian Detection”, in BMVC, 2016. 【240】 Keywords: Pedestrian Detection, Multispectral Deep Neural Networks, 新規性・差分 概要 ・歩行者検出に向けたマルチスペクトル(色と熱)画像を利 用したFaster RCNNの提案. ・低(早期結合),中(途中結合),高(後期結合),信頼(スコ ア結合)レベルという情報結合に対して,畳み込み層,全 結合層,決定層をうまく設計し,ネットワークを構成する. ・KAIST multispectral pedestrian dataset (KAIST)で通常の Faster RCNNよりも優れた性能を発揮. Links 論文 http://www.bmva.org/bmvc/2016/papers/paper073/paper073.p df プロジェクト Figure 2は本稿で提案されたFaster RCNNのモデルである. 左からそれぞれ,低レベル,中レベル,高レベル,信頼レベルのモデルとな っている.
  • 244. Dan Liu, Mao Ye, “Memory-based Gait Recognition”, in BMVC, 2016. 【241】 Keywords: gait recognition, Memory-based Gait Recognition, MGR, Memory neuron network 新規性・差分 概要 ・人間の脳の記憶と予測のメカニズムに着想を得た,歩行 シーケンスと認識プロセスを実現するための単純で効果的 な記憶ベース歩行認識手法Memory-based Gait Recognition(MGR)を提案 ・姿勢抽出モデルを利用して,頑健な2Dの関節位置情報 を歩行特徴として抽出する. ・大規模な並列計算により,メモリニューロンネットワー ク(MNN)は歩行特徴の不完全な部分の修復を行う. ・ Links 論文 http://www.bmva.org/bmvc/2016/papers/paper082/pa per082.pdf プロジェクト こちら側に図や実験結果を挿入し,キャプションを付けて ください.
  • 245. Michael Edwards, Xianghua Xie, “Graph Based Convolutional Neural Network”, in BMVC, 2016. 【242】 Keywords: Graph Based Convolutional Neural Network, 新規性・差分 概要 ・ラプラシアングラフのスペクトル領域を用いて,不規則 な空間幾何を示す領域にCNN演算子を適用する方法の提案. ・グラフGの頂点間のエッジ重みとして近傍関係を定義す ることで,不規則な領域内の局所化された特徴を学習する ・領域を固定グラフ表現として定式化し,(1)によって特徴 マップを学習する. ・信号fs,iに関する勾配計算は(2)によって計算される ・またスペクトルフィルタは(3)によって求められる. ・従来のCNNのプーリングに類似したグラフの粗密化の方 法として代数Multigridを使用し,前の層のノードを次の層 の特異ノードに集約する. ・(2),(3)を使用することで,規則的・不規則的な空間領 域に対して高い精度を得られた. Links 論文 http://www.bmva.org/bmvc/2016/papers/paper114/paper114.pdf
  • 246. Yi Zhou, Li Liu, Ling Shao, Matt Mellor, “DAVE: A Unified Framework for Fast Vehicle Detection and Annotation”, in ECCV, 2016. 【243】 Keywords: DAVE, Fast Vehicle Proposal Network, FVPN, Attributes Learning Network, ALN, Detection and Annotation 新規性・差分 概要 ・動画中から,車両の検出,視点,車両の色認識,車種の 判定を同時に行うDAVEというフレームワークの提案. ・DAVEはFVPNとALNという2つのCNNで構成される. ・FVPN(Fast Vehicle Proposal Network ):高速車両提案 ネットワーク(浅い完全畳み込み)は車両を検出する ・ALN(Attributes Learning Network):属性学習ネットワー ク(マルチタスクGoogLeNet)は車両検証,姿勢推定,色認 識,車種分類を同時に行う.
  • 247. Links 論文 https://arxiv.org/pdf/1607.04564v3 プロジェクト 左図は,検出実験時のUTS, Pascal VOC 2007 Car, LISA 2010 Car dataset におけるPrecision-Recall曲線. 右図は,アトリビュート推定の結果を示す. 結果
  • 248. Liliang Zhang, Liang Lin, Xiaodan Liang, Kaiming He, “Is Faster R-CNN Doing Well for Pedestrian Detection”, in ECCV, 2016. 【244】 Keywords: Pedestrian Detection, Faster R-CNN, Region Proposal Network, Boosted Forests 新規性・差分 概要 ・Fast / Faster R-CNNの歩行者検出タスクにおいて,低解 像度中の検出やハードネガティブの除去はチャレンジング な課題である.その課題に対応する. ・Region Proposal Network(RPN)を用いて,候補バウンデ ィングボックス,スコア,畳込み特徴を計算する. ・候補ボックスは,RPNによって計算された畳み込み特徴 マップからプーリングされた特徴を,Boosted Forests (BF)に入力し,分類される. Links 論文 https://arxiv.org/pdf/1607.07032v2 プロジェクト RPNが高い精度で歩行者を検出していることが確認できる 特徴の解像度の重要性 Bootstrapping/Hard negativeのマイニングによる変化