발표자: 안혜민(서울대학교 박사과정)
발표일: 2017.11.
현: Ph.D. Student Cyber Physical Systems Laboratory Department of Electrical and Computer Engineering ASRI, Seoul National University
관심분야: Human Robot Interaction, Machine Learning
해외 저널: Hyemin Ahn, Yoonseon Oh, Sungjoon Choi, Claire J. Tomlin, and Songhwai Oh, ”Online Learning to Approach a Person with No-Regret,” in IEEE Robotics and Automation Letters, 2017.
개요:
본 세미나에선 사람의 언어와 행동 사이의 연관관계를 학습해, 사람의 행동을 묘사하는 문장이 입력으로 들어왔을 때 입력 문장에 해당하는 행동을 생성해 낼 수 있는 Text2Action 네트워크를 소개한다.
제시하는 네트워크는 Sequence to Sequence (Seq2Seq) 기반의 Generative Adversarial Network(GAN) 으로, 문장 입력을 해석하는 Recurrent Neural Network(RNN) 기반의 인코더와 인코딩된 문장 정보를 해석해 사람의 행동으로 출력해내는 RNN 기반의 디코더로 구성되어 있다.
해당 네트워크를 학습시키기 위해 마이크로소프트사의 MSR-VTT 데이터셋을 사용하였으며, 본 세미나에선 다양한 실험 결과를 통해 제시하는 네트워크가 입력되는 사람의 언어를 이해해 그에 해당하는 사람의 행동을 적절히 생성해 낼 수 있었음을 보일 예정이다.