Submit Search
Webカメラ画像のリアルタイム識別 / Web Cam Image Recognition with Inception V3
1 like
195 views
M
moto2g
Inception V3を使ってWebカメラ画像をリアルタイムに識別してみる。 Web Cam Image Recognition with Inception V3
Technology
Read more
1 of 19
Download now
Download to read offline
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
More Related Content
PDF
Chainer でのプロファイリングをちょっと楽にする話
NVIDIA Japan
PDF
2015年度GPGPU実践基礎工学 第8回 並列計算の概念(プロセスとスレッド)
智啓 出川
PDF
2015年度GPGPU実践基礎工学 第3回 GPUクラスタ上でのプログラミング(CUDA)
智啓 出川
PDF
1076: CUDAデバッグ・プロファイリング入門
NVIDIA Japan
PDF
ChainerRL の学習済みモデルを gRPC 経由で使ってみる試み (+アルファ)
NVIDIA Japan
PDF
2015年度GPGPU実践プログラミング 第5回 GPUのメモリ階層
智啓 出川
PDF
2015年度GPGPU実践基礎工学 第1回 学際的分野における先端シミュレーション技術の歴史
智啓 出川
PDF
2015年度GPGPU実践基礎工学 第6回 ソフトウェアによるCPUの高速化技術
智啓 出川
Chainer でのプロファイリングをちょっと楽にする話
NVIDIA Japan
2015年度GPGPU実践基礎工学 第8回 並列計算の概念(プロセスとスレッド)
智啓 出川
2015年度GPGPU実践基礎工学 第3回 GPUクラスタ上でのプログラミング(CUDA)
智啓 出川
1076: CUDAデバッグ・プロファイリング入門
NVIDIA Japan
ChainerRL の学習済みモデルを gRPC 経由で使ってみる試み (+アルファ)
NVIDIA Japan
2015年度GPGPU実践プログラミング 第5回 GPUのメモリ階層
智啓 出川
2015年度GPGPU実践基礎工学 第1回 学際的分野における先端シミュレーション技術の歴史
智啓 出川
2015年度GPGPU実践基礎工学 第6回 ソフトウェアによるCPUの高速化技術
智啓 出川
What's hot
(20)
PDF
2015年度GPGPU実践基礎工学 第2回 GPGPUの歴史と応用例
智啓 出川
PDF
2015年度GPGPU実践基礎工学 第4回 CPUのアーキテクチャ
智啓 出川
PDF
Jjug ccc 2016 spring i 5 javaデスクトッププログラムを云々
torutk
PDF
2015年度GPGPU実践プログラミング 第15回 GPU最適化ライブラリ
智啓 出川
PDF
EnrootとPyxisで快適コンテナ生活
Kuninobu SaSaki
PDF
2015年度GPGPU実践基礎工学 第10回 GPUのプログラム構造
智啓 出川
PDF
2015年度GPGPU実践基礎工学 第11回 GPUでの並列プログラミング(ベクトル和)
智啓 出川
PPTX
組込みAndroid入門実習
ksk sue
PDF
2015年度GPGPU実践基礎工学 第9回 GPUのアーキテクチャ
智啓 出川
PDF
2015年度GPGPU実践プログラミング 第1回 GPGPUの歴史と応用例
智啓 出川
PDF
Blueqat SDKハンズオン
Yuichiro MInato
PDF
【Unite Tokyo 2019】運用中超大規模タイトルにおけるUnityアップデート課題の解決手法と事例
UnityTechnologiesJapan002
PDF
2015年度GPGPU実践基礎工学 第13回 GPUのメモリ階層
智啓 出川
PDF
2015年度GPGPU実践基礎工学 第15回 GPGPU開発環境(OpenCL)
智啓 出川
PDF
ディープラーニングによるラーメン二郎全店舗識別と生成
knjcode
PDF
2015年度GPGPU実践基礎工学 第7回 シングルコアとマルチコア
智啓 出川
PDF
Jubatus 新機能ハイライト
JubatusOfficial
PDF
GPGPU Seminar (GPGPU and CUDA Fortran)
智啓 出川
PDF
2015年度GPGPU実践プログラミング 第2回 GPUのアーキテクチャとプログラム構造
智啓 出川
PDF
【Unite Tokyo 2019】Unityだったら簡単!マルチプレイ用ゲームサーバ開発 ~実践編~
UnityTechnologiesJapan002
2015年度GPGPU実践基礎工学 第2回 GPGPUの歴史と応用例
智啓 出川
2015年度GPGPU実践基礎工学 第4回 CPUのアーキテクチャ
智啓 出川
Jjug ccc 2016 spring i 5 javaデスクトッププログラムを云々
torutk
2015年度GPGPU実践プログラミング 第15回 GPU最適化ライブラリ
智啓 出川
EnrootとPyxisで快適コンテナ生活
Kuninobu SaSaki
2015年度GPGPU実践基礎工学 第10回 GPUのプログラム構造
智啓 出川
2015年度GPGPU実践基礎工学 第11回 GPUでの並列プログラミング(ベクトル和)
智啓 出川
組込みAndroid入門実習
ksk sue
2015年度GPGPU実践基礎工学 第9回 GPUのアーキテクチャ
智啓 出川
2015年度GPGPU実践プログラミング 第1回 GPGPUの歴史と応用例
智啓 出川
Blueqat SDKハンズオン
Yuichiro MInato
【Unite Tokyo 2019】運用中超大規模タイトルにおけるUnityアップデート課題の解決手法と事例
UnityTechnologiesJapan002
2015年度GPGPU実践基礎工学 第13回 GPUのメモリ階層
智啓 出川
2015年度GPGPU実践基礎工学 第15回 GPGPU開発環境(OpenCL)
智啓 出川
ディープラーニングによるラーメン二郎全店舗識別と生成
knjcode
2015年度GPGPU実践基礎工学 第7回 シングルコアとマルチコア
智啓 出川
Jubatus 新機能ハイライト
JubatusOfficial
GPGPU Seminar (GPGPU and CUDA Fortran)
智啓 出川
2015年度GPGPU実践プログラミング 第2回 GPUのアーキテクチャとプログラム構造
智啓 出川
【Unite Tokyo 2019】Unityだったら簡単!マルチプレイ用ゲームサーバ開発 ~実践編~
UnityTechnologiesJapan002
Ad
Similar to Webカメラ画像のリアルタイム識別 / Web Cam Image Recognition with Inception V3
(20)
PPTX
AWSとGPUインスタンスのご紹介
Yasuhiro Matsuo
PDF
Google Meet でもバーチャル背景を使いたい (WebRTC Meetup Online)
mganeko
PDF
1010: エヌビディア GPU が加速するディープラーニング
NVIDIA Japan
PDF
20161122 gpu deep_learningcommunity#02
ManaMurakami1
PDF
ICCV19読み会 "Learning Single Camera Depth Estimation using Dual-Pixels"
Hajime Mihara
PDF
Unreal Engine 4.27 ノンゲーム向け新機能まとめ
エピック・ゲームズ・ジャパン Epic Games Japan
PPTX
機械学習 / Deep Learning 大全 (5) Tool編
Daiyu Hatakeyama
PDF
JSAI 2020 1J5-GS-2-01 TensorShader 高次元ニューラルネットワーク深層学習フレームワーク
Takuma Yoshimura
PPTX
Gruntでjava script前作業の自動化!
Tanaka Yuichi
PDF
GPU と PYTHON と、それから最近の NVIDIA
NVIDIA Japan
PDF
深層学習の新しい応用と、 それを支える計算機の進化 - Preferred Networks CEO 西川徹 (SEMICON Japan 2022 Ke...
Preferred Networks
PDF
Neural Network Console delta_tokyo_#3
AkiraYasukawa1
PDF
機械学習プロジェクトにおける Cloud AI Platform の使い方 (2018-11-19)
Yaboo Oyabu
PDF
Singularity Containers for Enterprise Use
AtsutoHashimoto
PPTX
Azure Antenna AI 概要
Miho Yamamoto
PDF
Adobe Anywhere デモンストレーション
Dell TechCenter Japan
PDF
エヌビディアが加速するディープラーニング~進化するニューラルネットワークとその開発方法について~
NVIDIA Japan
PPTX
深層学習 環境構築 Azure
Yuki Hattori
PDF
研究を加速するChainerファミリー
Deep Learning Lab(ディープラーニング・ラボ)
PDF
ディープラーニングイメージで構築する快適・高速な機械学習環境
Yaboo Oyabu
AWSとGPUインスタンスのご紹介
Yasuhiro Matsuo
Google Meet でもバーチャル背景を使いたい (WebRTC Meetup Online)
mganeko
1010: エヌビディア GPU が加速するディープラーニング
NVIDIA Japan
20161122 gpu deep_learningcommunity#02
ManaMurakami1
ICCV19読み会 "Learning Single Camera Depth Estimation using Dual-Pixels"
Hajime Mihara
Unreal Engine 4.27 ノンゲーム向け新機能まとめ
エピック・ゲームズ・ジャパン Epic Games Japan
機械学習 / Deep Learning 大全 (5) Tool編
Daiyu Hatakeyama
JSAI 2020 1J5-GS-2-01 TensorShader 高次元ニューラルネットワーク深層学習フレームワーク
Takuma Yoshimura
Gruntでjava script前作業の自動化!
Tanaka Yuichi
GPU と PYTHON と、それから最近の NVIDIA
NVIDIA Japan
深層学習の新しい応用と、 それを支える計算機の進化 - Preferred Networks CEO 西川徹 (SEMICON Japan 2022 Ke...
Preferred Networks
Neural Network Console delta_tokyo_#3
AkiraYasukawa1
機械学習プロジェクトにおける Cloud AI Platform の使い方 (2018-11-19)
Yaboo Oyabu
Singularity Containers for Enterprise Use
AtsutoHashimoto
Azure Antenna AI 概要
Miho Yamamoto
Adobe Anywhere デモンストレーション
Dell TechCenter Japan
エヌビディアが加速するディープラーニング~進化するニューラルネットワークとその開発方法について~
NVIDIA Japan
深層学習 環境構築 Azure
Yuki Hattori
研究を加速するChainerファミリー
Deep Learning Lab(ディープラーニング・ラボ)
ディープラーニングイメージで構築する快適・高速な機械学習環境
Yaboo Oyabu
Ad
Webカメラ画像のリアルタイム識別 / Web Cam Image Recognition with Inception V3
1.
Webカメラ画像のリアルタイム識別 Inception v3を動かす 開発倶楽部 Hideki Tsujimoto
(moto2g)
2.
内容 Webカメラから取り込んだ画像をInception v3で識別する。
学習済みモデルを使うので、高性能GPUが無くても大丈夫。
3.
サンプル あるある Pythonやライブラリのバージョンアップにより、この内容のままでは動 かないかも…。今回も参考にしたサンプルを修正する必要があった。
4.
Inception v3とは Googleが開発した画像識別の学習済みモデル
ものすごい量の画像を学習しており、識別精度が非常に高い
5.
実行したときの環境 Windows 10
Home Webカメラ (Logicool C270m) NVIDIA GTX1080Ti Python 3.6.5 Tensorflow-GPU 1.11.0 Keras 2.2.4 Open CV 3.4.3.18 … Webカメラ画像の処理用
6.
環境構築 CUDA(GPUを使う場合だけ) GPUのドライバ、CUDA、cuDNNをインストールしておく。 ※
Tensorflowが対応しているCUDA、cuDNNのバージョンを調べて おくこと。 Software requirements https://www.tensorflow.org/install/gpu
7.
環境構築 Pythonライブラリ > pip
install tensorflow-gpu ※GPUを使う場合はこっち > pip install tensorflow ※GPUを使わない場合はこっち > pip install keras > pip install opencv-python > pip install pillow ※Python 3.x系ではPILの代わりにPillowを使う
8.
Inception v3のサンプルソース取得 以下をクローン https://github.com/fchollet/deep-learning-models ※"inception_v3.py"さえあればOK
9.
動作確認用に識別する画像を配置 識別したい画像を"inception_v3.py"と同じフォルダに “elephant.jpg”という名前で配置する。 象じゃなくても何の画像でも良い。 サンプルプログラムが“elephant.jpg”を読み込むようになっているの で、ひとまずそのままにしているだけ。
10.
サンプルプログラムの修正 下記の環境ではプログラム修正が必要だった。 Keras==2.2.4 Keras-Applications==1.0.6
11.
サンプルプログラムの修正 inception_v3.py 35行目あたり from keras_applications.imagenet_utils
import decode_predictions ※こっちは変えない from keras_applications.imagenet_utils import _obtain_input_shape
12.
サンプルプログラムの修正 inception_v3.py 157行目あたり # Determine
proper input shape input_shape = _obtain_input_shape( input_shape, default_size=299, min_size=139, data_format=K.image_data_format(), require_flatten=include_top)
13.
Webカメラ無しで動作確認 > python inception_v3.py 下記のように識別した結果が表示される。 Predicted:
[[('n02504458', 'African_elephant', 0.58458555), ('n01871265', 'tusker', 0.35385665), ('n02504013', 'Indian_elephant', 0.01978532), ('n02134084', 'ice_bear', 0.0005529468), ('n02437312', 'Arabian_camel', 0.0005336157)]]
14.
以降、"inception_v3.py"を"inception_v3_with_cam.py"とい う名前でコピーしてそちらを修正する。
15.
学習済みモデルをローカルに保存 元のサンプルプログラムはモデルを毎回ダウンロードしている。 予めダウンロードしたファイルを読み込むようにプログラムを修正する。 “inception_v3_with_cam.py”と同じ場所に”models”フォルダ を作成し、下記からダウンロードしたものをその中に配置する。 https://github.com/fchollet/deep-learning- models/releases/download/v0.5/inception_v3_weights_tf_dim_ordering_tf_kernels.h5 https://github.com/fchollet/deep-learning- models/releases/download/v0.5/inception_v3_weights_tf_dim_ordering_tf_kernels_notop.h5 https://s3.amazonaws.com/deep-learning-models/image-models/imagenet_class_index.json
16.
学習済みモデルをローカルに保存 kerasのget_fileにmd5_hashを渡すと、モデルがキャッシュされて いてもダウンロードしてチェックする。md5_hashを渡さなくする。 inception_v3_with_cam.py 378行目あたり、384行目あたり if
include_top: weights_path = get_file( 'inception_v3_weights_tf_dim_ordering_tf_kernels.h5', WEIGHTS_PATH, cache_subdir='models', md5_hash=None) else: weights_path = get_file( 'inception_v3_weights_tf_dim_ordering_tf_kernels_notop.h5', WEIGHTS_PATH_NO_TOP, cache_subdir='models', md5_hash=None)
17.
Webカメラの画像を読み込むように修正 import cv2
inception_v3.pyのmainをガッツリ変える。 スライドでは書ききれないので以下の内容を参照 https://github.com/moto2g/image_recognition
18.
Webカメラ対応版の動作確認 > python inception_v3_with_cam.py カメラ画像上に、最も可能性の高い識別結果とパーセンテージを表示する。 カメラ画像のウインドウをアクティブにして"q"キーで終了。
19.
おつかれさまでした
Download