SlideShare a Scribd company logo
MRNet-Product2Vec:
AMulti-taskRecurrentNeural
NetworkforProductEmbeddings
(2017) Arijit Biswas et al.
발표: 곽근봉
© NBT All Rights Reserved.
이논문을선정한이유
온라인 쇼핑몰에서는 딥러닝을
어떻게 활용하고 있을까?
© NBT All Rights Reserved.
이논문을선정한이유
• 상품 추천
• 상품 분류
• 중복 상품 필터링
• 적정 가격 설정
© NBT All Rights Reserved.
이논문을선정한이유
컨텐츠에서의 활용 방안과 거의 비슷!
그렇다면 딥러닝을 활용하기 위해서
상품을 어떤식으로 표현해야할까?
© NBT All Rights Reserved.
이논문을선정한이유
Product Embedding?!
© NBT All Rights Reserved.
참고 자료
저자 발표 자료
https://mukulbhutani.files.wordpress.com/2018/01/ecml-final-slides.pdf
Product Embeddings
• Prod2Vec [Grbovic, KDD 2015]
• Meta-Prod2Vec [Vasile, Recsys 2016]
© NBT All Rights Reserved.
개요
Multi-taskRNN을활용한ProductEmbedding
• 범용적으로 사용 가능한 Product Embedding
• Multi-task RNN
• Dense, Low Dimension Embedding
© NBT All Rights Reserved.
기존방법
TF-IDF
• Bag-of-words
• Title, Description 등을 단어 단위로 끊어서 사용
• 상품의 Title을 단어 단위로 끊어서 구축
• 30만개의 상품으로 구축시 dimension이 약 2만 정도 됨
• 이 중 0.05% 만이 non-zero
© NBT All Rights Reserved.
기존방법의문제점
TF-IDF
• Overfitting
• 해당 데이터셋에 특화됨. 새로운 데이터셋에 적용이 어려
움
• 계산 혹은 저장에 비효율적
• 의미를 포함시키지 못함
• 일반적인 DNN에 활용하기 어려움
© NBT All Rights Reserved.
제안하는방법
그래서Dense,Low-dimensionalEmbedding이필요함
• Bidirectional RNN
• Multi-task
© NBT All Rights Reserved.
MRNet-Product2Vec
© NBT All Rights Reserved.
MRNet-Product2Vec(BidirectionalRNN)
© NBT All Rights Reserved.
MRNet-Product2Vec(MultiTask)
© NBT All Rights Reserved.
두가지Optimization방법
• Joint Optimization
• 매 Iteration 마다 모든 task들의 loss를 구하고 한번에
weight를 업데이트 시키는 방법
• 모든 task들의 output이 있어야 가능
• Alternating Optimization
• 매 Iteration 마다 랜덤하게 하나의 task를 선정하고 그 부
분만 업데이트 시키는 방법
• Bias가 생길 수 있음
© NBT All Rights Reserved.
실험
다양한데이터셋
• Plugs : 해당 상품에 plug가 있는지 없는지
• SIOC : 자체 포장되어 있는지 아닌지
• Browse Categories : 장난감의 75가지 세부 분류
• Ingestible Classification : 먹을 수 있는지 없는지
© NBT All Rights Reserved.
실험
다양한데이터셋
© NBT All Rights Reserved.
Nearestneighbor
상품유사도분석
© NBT All Rights Reserved.
결론
• Product Embedding을 위한 새로운 방법 제안
• 다양한 feature들은 embedding에 넣을 수 있더라
• 기존 방법보다 우수한 성능을 보이면서 효율적이더라
• 상품 이미지까지 활용해서 조금 더 범용적으로 만들어봐야겠다
© NBT All Rights Reserved.
감사합니
다.

More Related Content

PDF
NBT 유클라우드 사례 발표
PDF
논문리뷰: Deep Neural Networks for YouTube Recommendations
PDF
그로스해킹 기초
PDF
Ask me anything: Dynamic memory networks for natural language processing
PDF
PR12 논문 리뷰 Distributed Representations of Sentences and Documents
PDF
AdverTiming Matters : Examining User Ad Consumption for Effective Ad Allocati...
PDF
[4차]넷플릭스 알고리즘 분석(151106)
PPTX
Deep neural networks for You-Tube recommendations
NBT 유클라우드 사례 발표
논문리뷰: Deep Neural Networks for YouTube Recommendations
그로스해킹 기초
Ask me anything: Dynamic memory networks for natural language processing
PR12 논문 리뷰 Distributed Representations of Sentences and Documents
AdverTiming Matters : Examining User Ad Consumption for Effective Ad Allocati...
[4차]넷플릭스 알고리즘 분석(151106)
Deep neural networks for You-Tube recommendations

Similar to PR-099: MRNet-Product2Vec (20)

PDF
Wide&Deep Learning for Recommender Systems
PDF
[226]대용량 텍스트마이닝 기술 하정우
PDF
Recommendation System History
PDF
Standardization of item_data_by_ai_decryption
PDF
Neural Graph Collaborative Filtering paper review
PDF
eCommerce Recommendation project
PDF
100% Serverless big data scale production Deep Learning System
PPTX
Multiple vector encoding (KOR. version)
PDF
델켐매거진5호
PDF
Chapter 12 applications - 2
PDF
Closet engine
PPTX
Session based rcommendations with recurrent neural networks
PDF
DeepAR:Probabilistic Forecasting with Autogressive Recurrent Networks
PDF
E-commerce BigData Scale AI Journey
PPTX
권기훈_포트폴리오
PDF
머신러닝으로 쏟아지는 유저 CS 답변하기 DEVIEW 2017
PDF
제 8회 BOAZ 빅데이터 컨퍼런스 -03 리뷰왕 딥리뷰
PDF
One-Shot Learning
PDF
Final project v0.84
PDF
밑바닥부터 시작하는딥러닝 8장
Wide&Deep Learning for Recommender Systems
[226]대용량 텍스트마이닝 기술 하정우
Recommendation System History
Standardization of item_data_by_ai_decryption
Neural Graph Collaborative Filtering paper review
eCommerce Recommendation project
100% Serverless big data scale production Deep Learning System
Multiple vector encoding (KOR. version)
델켐매거진5호
Chapter 12 applications - 2
Closet engine
Session based rcommendations with recurrent neural networks
DeepAR:Probabilistic Forecasting with Autogressive Recurrent Networks
E-commerce BigData Scale AI Journey
권기훈_포트폴리오
머신러닝으로 쏟아지는 유저 CS 답변하기 DEVIEW 2017
제 8회 BOAZ 빅데이터 컨퍼런스 -03 리뷰왕 딥리뷰
One-Shot Learning
Final project v0.84
밑바닥부터 시작하는딥러닝 8장
Ad

More from keunbong kwak (7)

PDF
NBT 그로스해킹 교육 자료
PPTX
Ad Tech 개요
PDF
GloVe:Global vectors for word representation
PPTX
딥러닝 논문 리뷰 Learning phrase representations using rnn encoder decoder for stati...
PPTX
에디터스랩 발표
PPTX
Convolutional neural networks for sentence classification
PDF
Window manager활용하기 곽근봉
NBT 그로스해킹 교육 자료
Ad Tech 개요
GloVe:Global vectors for word representation
딥러닝 논문 리뷰 Learning phrase representations using rnn encoder decoder for stati...
에디터스랩 발표
Convolutional neural networks for sentence classification
Window manager활용하기 곽근봉
Ad

PR-099: MRNet-Product2Vec

  • 2. © NBT All Rights Reserved. 이논문을선정한이유 온라인 쇼핑몰에서는 딥러닝을 어떻게 활용하고 있을까?
  • 3. © NBT All Rights Reserved. 이논문을선정한이유 • 상품 추천 • 상품 분류 • 중복 상품 필터링 • 적정 가격 설정
  • 4. © NBT All Rights Reserved. 이논문을선정한이유 컨텐츠에서의 활용 방안과 거의 비슷! 그렇다면 딥러닝을 활용하기 위해서 상품을 어떤식으로 표현해야할까?
  • 5. © NBT All Rights Reserved. 이논문을선정한이유 Product Embedding?!
  • 6. © NBT All Rights Reserved. 참고 자료 저자 발표 자료 https://mukulbhutani.files.wordpress.com/2018/01/ecml-final-slides.pdf Product Embeddings • Prod2Vec [Grbovic, KDD 2015] • Meta-Prod2Vec [Vasile, Recsys 2016]
  • 7. © NBT All Rights Reserved. 개요 Multi-taskRNN을활용한ProductEmbedding • 범용적으로 사용 가능한 Product Embedding • Multi-task RNN • Dense, Low Dimension Embedding
  • 8. © NBT All Rights Reserved. 기존방법 TF-IDF • Bag-of-words • Title, Description 등을 단어 단위로 끊어서 사용 • 상품의 Title을 단어 단위로 끊어서 구축 • 30만개의 상품으로 구축시 dimension이 약 2만 정도 됨 • 이 중 0.05% 만이 non-zero
  • 9. © NBT All Rights Reserved. 기존방법의문제점 TF-IDF • Overfitting • 해당 데이터셋에 특화됨. 새로운 데이터셋에 적용이 어려 움 • 계산 혹은 저장에 비효율적 • 의미를 포함시키지 못함 • 일반적인 DNN에 활용하기 어려움
  • 10. © NBT All Rights Reserved. 제안하는방법 그래서Dense,Low-dimensionalEmbedding이필요함 • Bidirectional RNN • Multi-task
  • 11. © NBT All Rights Reserved. MRNet-Product2Vec
  • 12. © NBT All Rights Reserved. MRNet-Product2Vec(BidirectionalRNN)
  • 13. © NBT All Rights Reserved. MRNet-Product2Vec(MultiTask)
  • 14. © NBT All Rights Reserved. 두가지Optimization방법 • Joint Optimization • 매 Iteration 마다 모든 task들의 loss를 구하고 한번에 weight를 업데이트 시키는 방법 • 모든 task들의 output이 있어야 가능 • Alternating Optimization • 매 Iteration 마다 랜덤하게 하나의 task를 선정하고 그 부 분만 업데이트 시키는 방법 • Bias가 생길 수 있음
  • 15. © NBT All Rights Reserved. 실험 다양한데이터셋 • Plugs : 해당 상품에 plug가 있는지 없는지 • SIOC : 자체 포장되어 있는지 아닌지 • Browse Categories : 장난감의 75가지 세부 분류 • Ingestible Classification : 먹을 수 있는지 없는지
  • 16. © NBT All Rights Reserved. 실험 다양한데이터셋
  • 17. © NBT All Rights Reserved. Nearestneighbor 상품유사도분석
  • 18. © NBT All Rights Reserved. 결론 • Product Embedding을 위한 새로운 방법 제안 • 다양한 feature들은 embedding에 넣을 수 있더라 • 기존 방법보다 우수한 성능을 보이면서 효율적이더라 • 상품 이미지까지 활용해서 조금 더 범용적으로 만들어봐야겠다
  • 19. © NBT All Rights Reserved. 감사합니 다.