Introduction of team 'NUGO' standing for "None of Us Go through being left Out".
We achieve the most friendly AI ever.
We create module converting standard language to dialect of Korean based on seq2seq and attention neural network model.
4. Goal of the project
단어 레벨 90%이상 정확도를 가진 표준어 to 사투리 변환기를 만들자
5. Reasons for the project
● 스마트 스피커 보급률 상승
● 다양한 버전의 스마트 스피커 필요
성 대두
6. SWOT analysis
해커톤이나 기업 인턴을 통해 큰
프로젝트 개발을 경험해본 팀원들이
있음
사투리 관련 데이터 수집의 문제, 좋은
하드웨어가 필요
언어 처리 관련 전문가에게 조언을 받
을 수 있는 환경이 조성
잠재적 경쟁자가 많음 - 수많은 인공지
능 스피커 관련 대기업이 존재
Strength Weakness
Opportunity Threat
7. Technical background of the project
Character level에서 seq2seq + attention 신경망 모델 - 사투리 변환기
LSTM + RNN 신경망 모델 - g2p 변환기
인공지능 스피커를 이용한 음성인식과 음성합성
8. Specific goals
높은 정확도를 가진 사투리 변환기 모
듈 개발
g2p, seq2seq 언어 모델에 대한 이해
신경망 모델에 대한 학습
구체적이고 읽기 쉬운 documentation 한국정보과학회 논문 제출
Product Individual
Management Award
12. Usecase I
Name 데이터 전처리
Summary 주어진 데이터를 학습에 사용할 수 있는 심볼로 변환한다.
Actor 연구자
Dependency 없음
Precondition 1. 주어진 데이터가 미리 정의한 json 형식이어야한다.
Description 1. 연구자는 전처리할 데이터를 입력한다.
2. 데이터 전처리를 수행한다.
3. 전처리가 완료되면, 결과를 출력한다.
Alternative 1-a. 형식에 맞지 않는 데이터일 경우, 에러메세지를 출력하고 종료한다.
Postcondition 1. 학습에 사용할 수 있는 심볼로 데이터가 변환된다.
13. Usecase II
Name 신경망 모델 학습
Summary 주어진 데이터로 신경망 모델을 학습시킨다.
Actor 연구자
Dependency 데이터 전처리
Precondition 1. 학습에 사용될 데이터가 존재해야한다.
2. 주어진 데이터가 학습에 사용할 수 있는 형식이어야한다.
Description 1. 연구자는 학습 데이터를 입력한다.
2. 신경망 모델 학습을 수행한다.
3. 학습이 수행되는 동안 평가결과를 출력한다.
4. 학습이 완료되면, 결과를 출력한다.
Alternative 1-a. 형식에 맞지 않는 데이터일 경우, 에러메세지를 출력하고 종료한다.
2-a. 일정 횟수 이상 accuracy가 감소하면, 메세지를 출력하고 종료한다.
Postcondition 1. 신경망 모델이 학습된다.
14. Usecase III
Name 신경망 모델 평가
Summary 학습된 신경망 모델의 accuracy를 평가한다.
Actor 연구자
Dependency 없음
Precondition 1. 평가를 수행할 신경망 모델이 존재해야한다.
2. 평가에 사용할 데이터가 존재해야한다.
3. 주어진 데이터가 평가에 사용할 수 있는 형식이어야한다.
Description 1. 연구자는 평가 데이터를 입력한다.
2. 신경망 모델의 평가를 수행한다.
3. 평가가 완료되면, 결과를 출력한다.
Alternative 1-a. 형식에 맞지 않는 데이터일 경우, 에러메세지를 출력하고 종료한다.
Postcondition 1. 주어진 신경망 모델의 평가 데이터에 대한 accuracy가 출력된다.
15. Usecase IV
Name 대화형 변환
Summary 대화형으로 주어지는 표준어 문장을 사투리 문장으로 변환한다.
Actor 음성인식기, 음성합성기
Dependency 없음
Precondition 1. 주어진 데이터가 변환 가능한 형식이어야한다.
Description 1. 음성인식기가 생성한 데이터를 입력한다.
2. 표준어 문장을 사투리 문장으로 변환한다.
3. 변환이 완료되면, 음성합성기에 결과를 반환한다.
Alternative 1-a. 형식에 맞지 않는 데이터일 경우, 에러메세지를 출력하고 종료한다.
Postcondition 1. 사투리로 변환된 한국어 문장이 생성된다.
16. 3.2.
Schedule
MON, WED
10:00pm - 10:20pm
Google Hangout
FRI
10:00am - 12:30pm
Offline meeting
Teamwork
Schedule
FRI
4:30pm - 5:30pm
Offline meeting
Mentoring
주간 진행 상황
보고
리스크 관리
스크럼 회의 및
기술 세미나
17. Our Team
박성규
Project
Manager
개발 환경 구축, 일정 관리, 업
무 분배, 모듈 개발, 개발 프로
세스 관리
윤기영
Lead Software
Engineer
신경망 모델 설계, 신경망 모
델 개발, 리서치, 데이터 전처
리 및 파이프라인 설계
Software
Engineer
신경망 모델 개발, 리서치
Software
Engineer
신경망 모델 개발, 리서치
이호재 손정연