Upload
Download free for 30 days
Login
Submit Search
JPEGのDCTブロックで コンテンツ指向のトリミング
92 likes
33,363 views
Yohsuke Furuta
JPEGのDCTブロックで コンテンツ指向のトリミング
Engineering
Read more
1 of 15
Download now
Downloaded 40 times
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
More Related Content
PDF
RICOH THETAの全天球画像でペーパークラフト
Takehiko YOSHIDA
PDF
2024 Trend Updates: What Really Works In SEO & Content Marketing
Search Engine Journal
PDF
Storytelling For The Web: Integrate Storytelling in your Design Process
Chiara Aliotta
PDF
Artificial Intelligence, Data and Competition – SCHREPEL – June 2024 OECD dis...
OECD Directorate for Financial and Enterprise Affairs
PDF
How to Leverage AI to Boost Employee Wellness - Lydia Di Francesco - SocialHR...
SocialHRCamp
PDF
2024 State of Marketing Report – by Hubspot
Marius Sescu
PDF
Everything You Need To Know About ChatGPT
Expeed Software
PDF
Product Design Trends in 2024 | Teenage Engineerings
Pixeldarts
RICOH THETAの全天球画像でペーパークラフト
Takehiko YOSHIDA
2024 Trend Updates: What Really Works In SEO & Content Marketing
Search Engine Journal
Storytelling For The Web: Integrate Storytelling in your Design Process
Chiara Aliotta
Artificial Intelligence, Data and Competition – SCHREPEL – June 2024 OECD dis...
OECD Directorate for Financial and Enterprise Affairs
How to Leverage AI to Boost Employee Wellness - Lydia Di Francesco - SocialHR...
SocialHRCamp
2024 State of Marketing Report – by Hubspot
Marius Sescu
Everything You Need To Know About ChatGPT
Expeed Software
Product Design Trends in 2024 | Teenage Engineerings
Pixeldarts
Featured
(20)
PDF
How Race, Age and Gender Shape Attitudes Towards Mental Health
ThinkNow
PDF
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
marketingartwork
PDF
Skeleton Culture Code
Skeleton Technologies
PDF
PEPSICO Presentation to CAGNY Conference Feb 2024
Neil Kimberley
PDF
Content Methodology: A Best Practices Report (Webinar)
contently
PPTX
How to Prepare For a Successful Job Search for 2024
Albert Qian
PDF
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
PDF
Trends In Paid Search: Navigating The Digital Landscape In 2024
Search Engine Journal
PDF
5 Public speaking tips from TED - Visualized summary
SpeakerHub
PDF
ChatGPT and the Future of Work - Clark Boyd
Clark Boyd
PDF
Getting into the tech field. what next
Tessa Mero
PDF
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Lily Ray
PDF
How to have difficult conversations
Rajiv Jayarajah, MAppComm, ACC
PDF
Introduction to Data Science
Christy Abraham Joy
PDF
Time Management & Productivity - Best Practices
Vit Horky
PDF
The six step guide to practical project management
MindGenius
PDF
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
RachelPearson36
PDF
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Applitools
PDF
12 Ways to Increase Your Influence at Work
GetSmarter
PDF
ChatGPT webinar slides
Alireza Esmikhani
How Race, Age and Gender Shape Attitudes Towards Mental Health
ThinkNow
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
marketingartwork
Skeleton Culture Code
Skeleton Technologies
PEPSICO Presentation to CAGNY Conference Feb 2024
Neil Kimberley
Content Methodology: A Best Practices Report (Webinar)
contently
How to Prepare For a Successful Job Search for 2024
Albert Qian
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
Trends In Paid Search: Navigating The Digital Landscape In 2024
Search Engine Journal
5 Public speaking tips from TED - Visualized summary
SpeakerHub
ChatGPT and the Future of Work - Clark Boyd
Clark Boyd
Getting into the tech field. what next
Tessa Mero
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Lily Ray
How to have difficult conversations
Rajiv Jayarajah, MAppComm, ACC
Introduction to Data Science
Christy Abraham Joy
Time Management & Productivity - Best Practices
Vit Horky
The six step guide to practical project management
MindGenius
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
RachelPearson36
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Applitools
12 Ways to Increase Your Influence at Work
GetSmarter
ChatGPT webinar slides
Alireza Esmikhani
Ad
JPEGのDCTブロックで コンテンツ指向のトリミング
1.
JPEGのDCTブロックで コンテンツ指向のトリミング 古田陽介(@4_suke)
2.
こんなことない? • 構図を工夫して撮影した写真 • Webサイトにアップロードしたら真ん中でトリ ミングされたサムネイル作られる •
切ない
3.
• コンテンツの場所を考慮して切り取ってくれれば いいのに!
4.
コンテンツ指向のトリミング? • トリミングする場所やサイズ を画像内容によって変化させ ることをここではそう呼ぶこ とにします http://www.imagemagick.org/discourse-server/viewtopic.php?t=18065
5.
顔認識は計算リソースがかなり必要 事前計算する場合、それを記録する ストレージが必要 顔以外は考慮してくれない 画像変換サービスにはかなり重い FacebookのOGP画像に顔が入っている場合のトリミング位置 ¦ Sunday
In The Park http://snowadays.jp/2014/03/2629 • 実例:Facebook • 顔認識の結果をベースとしている(らしい)
6.
• なんかもっと • ライトな方法ってないだろうか
7.
• そうだ! • JPEGエンコーダーの •
DCTブロックを直接参照すればいいじゃないか
8.
話すこと • JPEGデコーダに処理を追加して高周波成分の中 心位置を求め、 • その情報を使ってトリミングをしたら、 •
構図を工夫した画像でも良い感じに切り抜きで きた
9.
↑ 元画像 ←真ん中で切り取り 今回話す方法→
10.
原理 1. JPEGのデコードの過程で、元画像を8x8pixelごとに離散 コサイン変換(DCT)したデータを得られる 2. 画像をDCT変換すると高周波と低周波に分離できる 3.
経験則:コンテンツのある場所は周波数が高い • 写真:ピントが合ってエッジが立ってる • イラスト:書き込みが多く、輪郭線が多い • 顔:目や口、髪の毛の陰影
11.
アプローチ • ハフマン展開+逆量子化とDCT-I の間に処理を追加 • 各ブロック内の高周波成分を積分 してブロックの特徴量を算出 •
全ブロックの特徴量の重心を計算 • 重心が枠に入るように適当なサイ ズでcrop • ハフマン展開+逆量子化 • 高周波成分の算出
12.
DEMO
13.
JPEGの圧縮・展開工程内のDCTをそのまま使うので追加計算 が少ない 追加実装も少ない! パターンマッチングではないのでコンテンツの種類を問わない JPEGにしか適用できない 緻密なコンテンツ、複数の物体が同居しているコンテンツには メリット小さい 文字が入っているコンテンツは苦手
14.
• そのうちやりたいこと • libjpegに組み込む •
定量的評価 • jpgjs のバグ直す
15.
https://github.com/yohsuke/jpgjs/tree/ content-detected-crop
Download