SlideShare a Scribd company logo
Explaining and
Harnessing
Adversarial Examples
(2015)
Ian J. Goodfellow, Jonathon Shlens,
Christian Szegedy
@mikibear_ 논문 정리 170118
핵심,
ADVERSARIAL EXAMPLES
핵심,
ADVERSARIAL EXAMPLES
적대적 예제...?
거슬러 올라가봅시다
Intriguing properties of neural networks
(2013, Christian Szegedy at el.)
분류를 시행하는 뉴럴 네트워크 모델 아무거나 하나를 생각해봅시다
ex) Alexnet, VGG, ResNet, Inception...
이 논문에서는 다음과 같은 상황을 가능케 하는 예시
(Examples)를 제시합니다
분류 모델 : "이것은 '확실히' 개다"
(위와 같은)
분류 모델 : "이것은 '확실히' 개가 아니다"
?????????
Explaining and harnessing adversarial examples (2015)
더해지는
노이즈
제대로 분류되는
원본 사진
높은 confidence로
오분류되는 사진
네, 사실 두 사진은 다른 사진입니다.
'정상적으로 분류되는 사진'에
'적절한 작은 노이즈'를 더하면
'명백하게 오분류하는 사진'을 만들 수
있다…
는 것이 본 논문의 요지입니다.
근데 이 사진 두 개가 정말 달라보이나요?
“개” (99%)
"타조" (99%)
근데 이 사진 두 개가 정말 달라보이나요?
“개” (99%)
"타조" (99%)
아뇨
그럼 이런 노이즈를 어떻게
적절하게 찾을 수 있나요?
너무나 흔한 Optimization Problem...
너무나 흔한 Optimization Problem...
분류 모델의
Black-box 함수
원본 이미지
노이즈 라벨
1) 이미지에 노이즈를 더했더니
오분류를 일으키는 노이즈를 찾되,
2) Norm이 가장 작은 것을 찾아야 한다
정리하면...
그 다음엔 원하는 Optimization 기법을
걸면 됩니다. 논문에서는 L-BFGS를
걸고 있습니다.
근데 이 문제 Non-convex라네요
Explaining and Harnessing Adversarial Examples
(2015, Ian J. Goodfellow, Jonathon Shlens & Christian Szegedy)
다시 처음으로 돌아와서요...
‘좀 더 편하게
이런 Adversarial Example를
찾을 순 없을까?’
Linear Model에서...
얘를 가능한 작게 키워서
Decision Boundary를 크게
넘기는 term을 찾으면…
(따라서 모델의 입력이
high-dimension일수록
이러한 예제를 찾기
쉬워집니다.)
Non-linear model에 linear한 노이즈 때려박아
Adversarial Example 만들기
"The linear view of adversarial
examples suggests a fast way of
generating them. We hypothesize that
neural networks are too linear to resist
linear adversarial perturbation."
"neural networks
are too linear"
Explaining and harnessing adversarial examples (2015)
그러니까…
Non-linear하다고 받아들여지는 모델에
만약 linear perturbation을 넣어서 그 모델이
깨진다면, 그 모델은 충분히 linear하다고 볼
수 있다…
이런 말입니다.
Non-linear model에 linear한 노이즈 때려박아
Adversarial Example 만들기
Backpropagation으로 너무나 쉽게 구할 수
있는
Gradient
Google
LeNet
VS
Linear Perturbations
Explaining and harnessing adversarial examples (2015)
Explaining and harnessing adversarial examples (2015)
LeNet, 박살
첫번째 의문,
'이렇게 얻어진 Adversarial Example을
갖다가 다시 모델에 학습시키면 어떨까?'
Explaining and harnessing adversarial examples (2015)
결론,
'Adversarial Example 자체에
효과가 어느 정도 있을 뿐만 아니라,
Model Generalization에 효과도 있다.
심지어 그 성능이 Dropout보다도 낫다.'
(사견) 하지만,
몇몇 다른 논문들을 보면 효과가 없을 때도
있고, 심지어 또 다른 Adversarial
Example에 노출된다고 하니 좀 경계해야
하는 부분 같습니다.
두번째 의문,
'그러면 좀 더 Non-linear한 RBF
network는 어떤가?'
역시나,
좀 더 원본 데이터와 뚜렷하게 차이가 납니다.
즉, Adversarial Example에 좀 더 robust하죠.
세번째 의문,
'Ensembel 기법을 쓰면 좀 낫지 않을까?' -> 안 낫다네요.
네번째 의문,
'인풋에 일괄적으로 distortion을 걸면서 학습을 시키면 좀 낫지
않을까?' -> 안 낫다네요.
논문의 결론,
1) Universal approximation theorem이
적용되는 현존하는 모든 모델은
Adversarial Example을 막기엔 너무
Linear하다
2) 근데 Adversarial Example로 모델을
학습시키면 좀 낫다
References,
1) Intriguing properties of neural networks
https://arxiv.org/abs/1312.6199
2) Explaining and Harnessing Adversarial Examples
https://arxiv.org/abs/1412.6572
3) Adversarial Examples
http://www.iro.umontreal.ca/~memisevr/dlss2015/goo
dfellow_adv.pdf
틀린 내용이 있거나 중요한데 빠져있는 경우 알려주세요!
@mikibear

More Related Content

PDF
딥러닝 기본 원리의 이해
PDF
Understanding deep learning requires rethinking generalization (2017) 1/2
PDF
Understanding deep learning requires rethinking generalization (2017) 2 2(2)
PDF
Paper Reading : Learning from simulated and unsupervised images through adver...
PPTX
Chapter 7 Regularization for deep learning - 3
PDF
실패한 오픈소스 공헌으로 배워가기
PPTX
Chapter 7 Regularization for deep learning - 2
PDF
[Paper] EDA : easy data augmentation techniques for boosting performance on t...
딥러닝 기본 원리의 이해
Understanding deep learning requires rethinking generalization (2017) 1/2
Understanding deep learning requires rethinking generalization (2017) 2 2(2)
Paper Reading : Learning from simulated and unsupervised images through adver...
Chapter 7 Regularization for deep learning - 3
실패한 오픈소스 공헌으로 배워가기
Chapter 7 Regularization for deep learning - 2
[Paper] EDA : easy data augmentation techniques for boosting performance on t...

Viewers also liked (20)

PDF
Paper Reading : Enriching word vectors with subword information(2016)
PPTX
머신러닝의 자연어 처리기술(I)
PPTX
0415_seminar_DeepDPG
PDF
Phoenix with Elm
PPTX
1118_Seminar_Continuous_Deep Q-Learning with Model based acceleration
PPTX
Introduction For seq2seq(sequence to sequence) and RNN
KEY
6장 지능형 웹 크롤링
PPTX
Image segmentation hj_cho
PDF
한국어와 NLTK, Gensim의 만남
PPTX
141118 최창원 웹크롤러제작
PDF
자바, 미안하다! 파이썬 한국어 NLP
PDF
20141223 머하웃(mahout) 협업필터링_추천시스템구현
PDF
[F2]자연어처리를 위한 기계학습 소개
PDF
High level-api in tensorflow
PPTX
The beginner’s guide to 웹 크롤링 (스크래핑)
PDF
[4차]왓챠 알고리즘 분석(151106)
PDF
2017 tensor flow dev summit
PPTX
딥러닝을 이용한 자연어처리의 연구동향
PPTX
텐서플로우 기초 이해하기
PDF
2015 py con word2vec이 추천시스템을 만났을때
Paper Reading : Enriching word vectors with subword information(2016)
머신러닝의 자연어 처리기술(I)
0415_seminar_DeepDPG
Phoenix with Elm
1118_Seminar_Continuous_Deep Q-Learning with Model based acceleration
Introduction For seq2seq(sequence to sequence) and RNN
6장 지능형 웹 크롤링
Image segmentation hj_cho
한국어와 NLTK, Gensim의 만남
141118 최창원 웹크롤러제작
자바, 미안하다! 파이썬 한국어 NLP
20141223 머하웃(mahout) 협업필터링_추천시스템구현
[F2]자연어처리를 위한 기계학습 소개
High level-api in tensorflow
The beginner’s guide to 웹 크롤링 (스크래핑)
[4차]왓챠 알고리즘 분석(151106)
2017 tensor flow dev summit
딥러닝을 이용한 자연어처리의 연구동향
텐서플로우 기초 이해하기
2015 py con word2vec이 추천시스템을 만났을때
Ad

Similar to Explaining and harnessing adversarial examples (2015) (20)

PDF
19.05.07 explaining and harnessing adversarial examples
PDF
정말 딥러닝은 사람처럼 세상을 인식하고 있을까?
PDF
OCGAN:one class novelty detection using gans with constrained latent represen...
PDF
Learning how to explain neural networks: PatternNet and PatternAttribution
PPTX
Deep learning overview
PPTX
InfoGAN Paper Review
PDF
Neural network의 변천사 이태영
PPTX
Anomaly Detection with GANs
PPTX
Convolutional Neural Networks
PDF
지적 대화를 위한 깊고 넓은 딥러닝 PyCon APAC 2016
PDF
[컴퓨터비전과 인공지능] 10. 신경망 학습하기 파트 1 - 2. 데이터 전처리
PPTX
InfoGAN: Interpretable Representation Learning by Information Maximizing Gene...
PDF
AnoGAN을 이용한 철강 소재 결함 검출 AI
PPTX
Generative adversarial network
PDF
Neural Networks Basics with PyTorch
PPTX
딥러닝 - 역사와 이론적 기초
PPTX
Gan (generative adversarial network)
PDF
Coursera Machine Learning (by Andrew Ng)_강의정리
PPTX
Anomaly detection practive_using_deep_learning
19.05.07 explaining and harnessing adversarial examples
정말 딥러닝은 사람처럼 세상을 인식하고 있을까?
OCGAN:one class novelty detection using gans with constrained latent represen...
Learning how to explain neural networks: PatternNet and PatternAttribution
Deep learning overview
InfoGAN Paper Review
Neural network의 변천사 이태영
Anomaly Detection with GANs
Convolutional Neural Networks
지적 대화를 위한 깊고 넓은 딥러닝 PyCon APAC 2016
[컴퓨터비전과 인공지능] 10. 신경망 학습하기 파트 1 - 2. 데이터 전처리
InfoGAN: Interpretable Representation Learning by Information Maximizing Gene...
AnoGAN을 이용한 철강 소재 결함 검출 AI
Generative adversarial network
Neural Networks Basics with PyTorch
딥러닝 - 역사와 이론적 기초
Gan (generative adversarial network)
Coursera Machine Learning (by Andrew Ng)_강의정리
Anomaly detection practive_using_deep_learning
Ad

Explaining and harnessing adversarial examples (2015)