SlideShare a Scribd company logo
ConvolutionalNeural
NetworksforSentence
Classification
Yoon Kim
New York University
EMNLP 2014
발표: 곽근봉
Wordvector와CNN을활용한문장분류
Abstract
이미 트레이닝된 word vector를 활용
Word2vec를 활용하여 단어를 vector화 함
Simple한 CNN 구조 사용
3가지 filter를 가진 단순한 Convolutional Layer
높은 정확도
7개의 벤치마크 중 4곳에서 가장 높은 정확도
문장 분류(Sentence Classification)
감정 분류(Sentiment Analysis)
예시)
이번 아이폰의 카메라 성능은 정말 좋은 것 같아 – 긍정
이 레스토랑의 음식은 정말 실망스러웠어 – 부정
주제 분류
예시)
유승민의 자신감, 19대 대선 예비후보 등록 – 정치
손흥민 없는 슈틸리케호, 중국전 공격 조합은? – 스포츠
WordRepresentations(Embedding)
어떻게단어를계산할까?
사전을 만들어서 ID를 부여하자
간단하고 적용하기 쉬움
단어들과의 관계를 나타내지 못함 ( 예, 개=ID143, 고양이=ID537)
모든 단어가 다르기 때문에, 학습시키기 위해서는 굉장히 많은 데이터들이 필요
각 단어마다 Vector 값을 부여하자
단어들의 특징을 표현할 수 있도록 수치로 된 값 부여
(예, 개=[2,6,3,1,4])
Word2Vec
어떻게단어에Vector값을줄까?
문장에서 나오는 단어들의 위치로 학습시키자!
the quick brown fox jumped over the lazy dog
([the, brown], quick), ([quick, fox], brown), ([brown, jumped], fox)
Word2Vec
어떻게단어에Vector값을줄까?
그랬더니 특정 방향들이 의미를 담고 있었어!
https://tensorflowkorea.gitbooks.io/tensorflow-kr/content/g3doc/tutorials/word2vec/
CNN과WordVector를이용한문장분
류
k
n
h
n : 문장에 나오는 단어의 갯수 k : Word Vector의 차원 h : 필터 윈도우 사
이즈
ModelArchitecture
Page2 Figure1 (Yoon Kim, Convolutional Neural Networks for Sentence Classification, EMNLP 2014)
Static,Non-static,Multichannel
k
n
h
Back Propagation
static
non-static multichannel
Staticvs.Non-static
Page5 Table3 (Yoon Kim, Convolutional Neural Networks for Sentence Classification, EMNLP 2014)
Non-static으로 학습시키니 word vector가 의미를 더 잘 이해하게 되었
군!
CNN과WordVector를이용한문장분
류Results
Page4 Table2 (Yoon Kim, Convolutional Neural Networks for Sentence Classification, EMNLP 2014)
한국어문장분류에도
높은성능을보일까?
제28회한글및한국어정보처리학술대회논문집(2016년)
한국어에적합한단어임베딩모델
및파라미터튜닝에관한연구 최상혁, 설진석, 이상구
Word2Vec 를 사용하기 위해 전처리가 필요하다
영어와는 달리 한국어는 조사와 어미가 다양해서 어근을 추출할 필요가 있다
전처리를 위해 오픈 소스인 꼬꼬마 형태소 분석기, 트위터 형태소 분석기를 사용함
나무 위키, 위키피디아 등을 활용하자
기존의 말뭉치보다 크기가 크고 현대적인 단어 용법을 사용한다
최상혁, 설진석, 이상구, 한국어에 적합한 단어 임베딩 모델 및 파라미터 튜닝에 관한 연구, 제28회 한글 및 한국어 정보처리 학술대회 논문집(2016년)
2015년동계학술발표회논문집
컨볼루션신경망기반
대용량텍스트데이터분류기술
CNN은 훌륭한 정확도를 가지나 Word2Vec는 성능 향상에 도움을 주지
못함
조휘열, 김진화, 윤상웅, 김경민, 장병탁
조휘열, 김진화, 윤상웅, 김경민, 장병탁 , 컨볼루션 신경망 기반 대용량 텍스트 데이터 분류 기술, 2015년 동계학술발표회 논문집
Q&A
kkb2849@gmail.com
https://github.com/kkb2849

More Related Content

PDF
GloVe:Global vectors for word representation
PPTX
From A Neural Probalistic Language Model to Word2vec
PDF
메이크챗봇 자연어기초
PPTX
Word 2 Vec Algorithm
PPTX
(Kor ver.)NLP embedding(word2vec) tutorial & implementation(Tensorflow)
PPTX
Brief hystory of NLP and Word2Vec
PPTX
A joint many task model
PDF
연구실 세미나 Show and tell google image captioning
 
GloVe:Global vectors for word representation
From A Neural Probalistic Language Model to Word2vec
메이크챗봇 자연어기초
Word 2 Vec Algorithm
(Kor ver.)NLP embedding(word2vec) tutorial & implementation(Tensorflow)
Brief hystory of NLP and Word2Vec
A joint many task model
연구실 세미나 Show and tell google image captioning
 

What's hot (20)

PDF
20150331 msr outreach media_roundtable_deck_연세대강홍구교수_음성합성
PDF
Context2Vec 기반 단어 의미 중의성 해소, Word Sense Disambiguation
PPTX
LDA : latent Dirichlet Allocation (Fairies NLP Series) - Korean Ver.
PPTX
황승원 포항공대 교수
PPTX
딥러닝을 이용한 자연어처리의 연구동향
PDF
Lab Seminar - Reading Wikipedia to Answer Open-Domain Questions (DrQA)
 
PPTX
추천 시스템 개요 (1)-draft
PPTX
단어 의미 중의성 해소, Word Sense Disambiguation(WSD)
PPTX
임태현, Text-CNN을 이용한 Sentiment 분설모델 구현
PPTX
Word2Vec 개요 및 활용
PPTX
Nlp word2vec
PDF
파이썬과 자연어 4 | word/doc2vec
PDF
B6 문맥인식기술활용
PDF
자연어4 | 1차강의
PPTX
머신러닝의 자연어 처리기술(I)
PDF
딥러닝 기반의 자연어처리 최근 연구 동향
PDF
[214]베이지안토픽모형 강병엽
PDF
Spam text message filtering by using sen2 vec and feedforward neural network
PPTX
Bi directional attention flow for nlp
PDF
Neural Machine Translation 기반의 영어-일본어 자동번역
20150331 msr outreach media_roundtable_deck_연세대강홍구교수_음성합성
Context2Vec 기반 단어 의미 중의성 해소, Word Sense Disambiguation
LDA : latent Dirichlet Allocation (Fairies NLP Series) - Korean Ver.
황승원 포항공대 교수
딥러닝을 이용한 자연어처리의 연구동향
Lab Seminar - Reading Wikipedia to Answer Open-Domain Questions (DrQA)
 
추천 시스템 개요 (1)-draft
단어 의미 중의성 해소, Word Sense Disambiguation(WSD)
임태현, Text-CNN을 이용한 Sentiment 분설모델 구현
Word2Vec 개요 및 활용
Nlp word2vec
파이썬과 자연어 4 | word/doc2vec
B6 문맥인식기술활용
자연어4 | 1차강의
머신러닝의 자연어 처리기술(I)
딥러닝 기반의 자연어처리 최근 연구 동향
[214]베이지안토픽모형 강병엽
Spam text message filtering by using sen2 vec and feedforward neural network
Bi directional attention flow for nlp
Neural Machine Translation 기반의 영어-일본어 자동번역
Ad

Similar to Convolutional neural networks for sentence classification (20)

PDF
(Papers Review)CNN for sentence classification
PDF
CNN for sentence classification
PDF
Natural Language Processing(NLP) - Basic
PDF
Deep Learning for Chatbot (1/4)
PDF
[224] backend 개발자의 neural machine translation 개발기 김상경
PPTX
Papago/N2MT 개발이야기
PDF
Deep Learning for Chatbot (2/4)
PDF
[싸이그램즈 2018] 텍스트 데이터 전처리로 시작하는 NLP
PDF
파이썬을 활용한 챗봇 서비스 개발 3일차
PDF
문자 단위의 Neural Machine Translation
PDF
[222]neural machine translation (nmt) 동작의 시각화 및 분석 방법
PDF
딥러닝 기반 자연어 언어모델 BERT
PDF
[study] character aware neural language models
PDF
파이썬을 활용한 자연어 분석
PPTX
[Paper Review] Image captioning with semantic attention
PDF
Convoutional sequence to sequence
PDF
Neural module Network
PDF
댓글 감성 분석 상용화 개발기(Ver. 2)
PDF
PR12 논문 리뷰 Distributed Representations of Sentences and Documents
(Papers Review)CNN for sentence classification
CNN for sentence classification
Natural Language Processing(NLP) - Basic
Deep Learning for Chatbot (1/4)
[224] backend 개발자의 neural machine translation 개발기 김상경
Papago/N2MT 개발이야기
Deep Learning for Chatbot (2/4)
[싸이그램즈 2018] 텍스트 데이터 전처리로 시작하는 NLP
파이썬을 활용한 챗봇 서비스 개발 3일차
문자 단위의 Neural Machine Translation
[222]neural machine translation (nmt) 동작의 시각화 및 분석 방법
딥러닝 기반 자연어 언어모델 BERT
[study] character aware neural language models
파이썬을 활용한 자연어 분석
[Paper Review] Image captioning with semantic attention
Convoutional sequence to sequence
Neural module Network
댓글 감성 분석 상용화 개발기(Ver. 2)
PR12 논문 리뷰 Distributed Representations of Sentences and Documents
Ad

More from keunbong kwak (11)

PDF
그로스해킹 기초
PDF
NBT 그로스해킹 교육 자료
PPTX
PR-099: MRNet-Product2Vec
PDF
Wide&Deep Learning for Recommender Systems
PDF
논문리뷰: Deep Neural Networks for YouTube Recommendations
PPTX
Ad Tech 개요
PDF
Ask me anything: Dynamic memory networks for natural language processing
PPTX
딥러닝 논문 리뷰 Learning phrase representations using rnn encoder decoder for stati...
PPTX
에디터스랩 발표
PDF
NBT 유클라우드 사례 발표
PDF
Window manager활용하기 곽근봉
그로스해킹 기초
NBT 그로스해킹 교육 자료
PR-099: MRNet-Product2Vec
Wide&Deep Learning for Recommender Systems
논문리뷰: Deep Neural Networks for YouTube Recommendations
Ad Tech 개요
Ask me anything: Dynamic memory networks for natural language processing
딥러닝 논문 리뷰 Learning phrase representations using rnn encoder decoder for stati...
에디터스랩 발표
NBT 유클라우드 사례 발표
Window manager활용하기 곽근봉

Convolutional neural networks for sentence classification