SlideShare a Scribd company logo
NSML:
머신러닝 플랫폼 서비스하기
& 모델 튜닝 자동화하기
김민규, 김진웅
NSML
Contents
NSML: Machine Learning as a Service
CHOPT: 하이퍼파라미터 튜닝 자동화하기
NSML:
Machine Learning as a Service
머신러닝
What I think I do What I actually do
머신러닝
What really happens
Dependency Hell
협업 및 재실험이 어려움
github에서 받은 코드는 돌아가지도 않는다
힘들게 라이브러리 설치했더니, 버전이 다르다고 한다
MLaaS (Machine Learning as a Service)
MLaaS 목표는 최고의 모델을 만들어서 서비스하기
NSML을 통해서 진입장벽을 없애고, 협업과 경쟁이 가능해짐으로써 좋은 모델
학습부터 모델 서비스까지 쉽다
MLaaS:
진입장벽 없애기
나만의 머신러닝 모델 만들기
Mnist예제
다운받기
실행 성공!GPU 셋업파이썬 설치
텐서플로우
설치
…
 가장 쉬운 머신러닝 모델 학습하는데 필요한 단계가 많음
나만의 머신러닝 모델 만들기 (w/ NSML)
 지저분한 환경 세팅은 nsml통해서 처리
 커맨드 한 줄로 머신러닝 모델 학습 가능
Mnist예제
다운받기
실행 성공!
Almost-Zero Dependency
Containerized ML
 리눅스 컨테이너를 이용한 빠르고 정확한 환경 세팅
 컨테이너 이미지를 통해 reproduce 할 수 있다
Engineering issue
Scalability Stability
Linux Container
Modularization
Fault-tolerance
Monitoring
Security
Authentication / Authorization
Isolation
MLaaS:
Cluster sharing
공유지의 비극
Install
Cluster sharing via container
Container를 통해 버전에 상관없이 서버 공유가 가능하다.
On demand로 관리하는 자원 할당 시스템을 통해 자원을 효율적으로
사용한다
-> 실제 연구원들에게 적용해보자
NSML is in service now!
사용자 별 다양한 목적 지원
 data preprocessing
 state-of-the-art 구현
 새로운 아이디어 실험
 모델 최적화
 모델 서비스
NSML로 인한 변화
 전체 자원 utilization 증가
 궁극적으로, ML연구 속도가 빨라졌다
MLaaS:
Hackathon
Naver AI Hackathon 2018
 영화 리뷰 평점 예측 / 지식인 질문 유사도 예측의 두 문제로 진행
 영화 리뷰 평점: 문장으로 된 영화 리뷰를 보고 점수 예측
 지식인 질문 유사도: 두 지식인 질문이 같은 질문인지 아닌지 판별
 총 250+명 참여
 한 달 동안 총 3라운드로 진행 (Online 2라운드, Offline 1라운드)
Leaderboard
 같은 데이터, 같은 태스크에 대해
서 어떤 모델이 좋은 성능을 내는
지 평가하는 UI
 실시간 업데이트
현장 사진
시스템 안정성
MLaaS:
Competition to service
문서의 회전 각도 예측
 주어진 문서의 기울어진 각도 예측
 OCR엔진에서 사용하는 데이터 preprocessing에 적용 가능한 모델이 필요
45도
최종 결과
 99.8% 정확도를 보이는 모델 학습
 내부에서 data preprocessing에 사용할 수 있는 수준의 모델 학습
최종 결과
키보드 오타교정
 키보드 입력 시퀀스를 받아, 오타 여부 판단 및 교정하는 문제
 Naver SmartBoard에 탑재할 수 있는 수준의 모델이 필요
최종 결과
 실제로 사용 가능한 수준의 모델 생성
 Naver SmartBoard (http://keyboard.naver.com/)에 탑재
MLaaS:
모델 서비스하기
모델 서비스 파이프라인 (AS-IS)
 NSML에서 모델 학습은 끝냈는데, 다시 서버 구축을 새로 해야한다
 혹시 더 좋은 모델을 나중에 발견하면? -> 2번부터 다시 해야 한다
데이터 수집 모델 학습
모델
다운로드
서비스용
서버 구축
Application
연결
모델 서비스 파이프라인 (w/ NSML)
 서버 구축까지 NSML에서 대신해주며, 사용자는 앱만 만들면 된다
 혹시 더 좋은 모델을 나중에 발견하면? -> 단순히 NSML에 저장되어 있는
모델 이름만 변경하면 새로 구축 끝
데이터 수집 모델 학습
모델
다운로드
서비스용
서버 구축
Application
연결
Engineering issues
Scalability Stability
Scale in/out
Batch Scheduler
백업 DB
Monitoring
모델 튜닝 자동화하기
최고의 튜닝 방법?
- GSD Optimization
최고의 튜닝 방법?
- Graduate Student Descent (GSD) Optimization
최고의 튜닝 방법?
- Graduate Student Descent (GSD) Optimization
최고의 튜닝 방법?
최근 기법들
- Population Based Training (Deepmind, 2017)
- Hyperband (CMU, UW, Google, 2016)
- BOHB (University of Freiburg, 2018)
- 그 외 다수 …
다 좋은데...
언제 구현하고, 언제 적용하지…?
어느 최적화 기법이 제일 좋은지 어떻게 알지..?
모델, 알고리즘 연구하기에도 시간이 없는데 ...
CHOPT를 이용해 하이퍼파라미터
“쉽고” “빠르게” 튜닝 하기
“쉽게”
스크립트?
= 남에게 맡기는 것
최근 논문 구현?
Third-party library?
가장 쉬운 방식이란?
CHOPT agent (Graduate Student)
- 사용자를 대신해 configuration file을 토대로 하이퍼파라미터를 튜닝!
(Graduate Student)
Configuration File
- Dictionary-based file
what to tune ?
how to tune ?
Select best hyperparameters
Select best hyperparameters
Show best hyperparameters
“빠르게”
How to make it fast?
사실…
최적의 하이퍼파라미터를 찾는건 튜닝 메소드에 의존적
자원 몰아주기 !
Under-utilization
: CHOPT session 에게 자원 추가 할당 !
Over-utilization
: nsml 세션이 자원 요구시 반납 !
GPU(%)
3.5 배 빠르게 최적화 !
“진짜 되나요?”
네. 됩니다.
- 저자들이 피땀흘려 얻은 결과를, 쉽고 빠르게 갱신 할 수 있습니다!
● Image Classification with CIFAR-100[1]
● Reasoning-QA with SQuAD 1.1[2]
One “More” Thing ...
Fine Tuning
- Expanding : 하이퍼파라미터를 하나씩 추가해 나가며 최적화 하는 방식
- Shrinking : 하이퍼파라미터의 범위를 점차 좁혀나가며 최적화 하는 방식
Fine Tuning (Expanding)
- 하이퍼파라미터를 하나씩 추가해 나가며 최적화 하는 방식
Fine Tuning (Expanding)
- 하이퍼파라미터를 하나씩 추가해 나가며 최적화 하는 방식
Fine Tuning (Shrinking)
- 하이퍼파라미터의 범위를 점차 좁혀나가며 최적화 하는 방식
range를 좁힌 후 rerun!
CHOPT demo.
Publication
● CHOPT : Automated Hyperparameter Optimization
Framework for Cloud-Based Machine Learning
Platforms
○ Cloud-based Hyperparameter OPTimization (CHOPT)
○ https://arxiv.org/abs/1810.03527
We are Hiring!!
Domains
•Speech Recognition
•Speech Synthesis
•Computer Vision
•Natural Language
•NSML / AutoML
•Finance AI
•App/Web Services
Positions
•Research Scientist
•Research Engineer
•SW Engineer
•Android / iOS Engineer
•Backend Engineer
•Data Engineer
•UI/UX Engineer
•Internship Member
•Global Residency
clova-jobs@navercorp.com
Q & A
질문은 Slido에 남겨주세요.
sli.do
#deview
TRACK 2

More Related Content

PDF
[MLOps KR 행사] MLOps 춘추 전국 시대 정리(210605)
PDF
인공지능추천시스템 airs개발기_모델링과시스템
PDF
Little Big Data #1. 바닥부터 시작하는 데이터 인프라
PDF
MSA 전략 1: 마이크로서비스, 어떻게 디자인 할 것인가?
PPTX
ECS+Locust로 부하 테스트 진행하기
PDF
[224]nsml 상상하는 모든 것이 이루어지는 클라우드 머신러닝 플랫폼
PDF
[NDC18] 야생의 땅 듀랑고의 데이터 엔지니어링 이야기: 로그 시스템 구축 경험 공유
PDF
데브시스터즈 데이터 레이크 구축 이야기 : Data Lake architecture case study (박주홍 데이터 분석 및 인프라 팀...
[MLOps KR 행사] MLOps 춘추 전국 시대 정리(210605)
인공지능추천시스템 airs개발기_모델링과시스템
Little Big Data #1. 바닥부터 시작하는 데이터 인프라
MSA 전략 1: 마이크로서비스, 어떻게 디자인 할 것인가?
ECS+Locust로 부하 테스트 진행하기
[224]nsml 상상하는 모든 것이 이루어지는 클라우드 머신러닝 플랫폼
[NDC18] 야생의 땅 듀랑고의 데이터 엔지니어링 이야기: 로그 시스템 구축 경험 공유
데브시스터즈 데이터 레이크 구축 이야기 : Data Lake architecture case study (박주홍 데이터 분석 및 인프라 팀...

What's hot (20)

PDF
[부스트캠프 Tech Talk] 진명훈_datasets로 협업하기
PDF
[236] 카카오의데이터파이프라인 윤도영
PPTX
[DevGround] 린하게 구축하는 스타트업 데이터파이프라인
PDF
TF에서 팀 빌딩까지 9개월의 기록 : 성장하는 조직을 만드는 여정
PPTX
Airflow를 이용한 데이터 Workflow 관리
PDF
Understanding MLOps
PPTX
글로벌 기업들의 효과적인 데이터 분석을 위한 Data Lake 구축 및 분석 사례 - 김준형 (AWS 솔루션즈 아키텍트)
PPTX
Data pipeline and data lake
PDF
LLM 모델 기반 서비스 실전 가이드
PPTX
4. 대용량 아키텍쳐 설계 패턴
PDF
Data Engineering 101
PDF
[PYCON Korea 2018] Python Application Server for Recommender System
PDF
성장을 좋아하는 사람이, 성장하고 싶은 사람에게
PDF
How to build massive service for advance
PPTX
엘라스틱 서치 세미나
PDF
카카오의 광고지능 (Intelligence on Kakao Advertising)
PDF
고려대학교 컴퓨터학과 특강 - 대학생 때 알았더라면 좋았을 것들
PDF
Spark 의 핵심은 무엇인가? RDD! (RDD paper review)
PDF
인프라 벤치마크 테스트 잘 해보기 윤서율.pdf
PPTX
Micro Service Architecture의 이해
[부스트캠프 Tech Talk] 진명훈_datasets로 협업하기
[236] 카카오의데이터파이프라인 윤도영
[DevGround] 린하게 구축하는 스타트업 데이터파이프라인
TF에서 팀 빌딩까지 9개월의 기록 : 성장하는 조직을 만드는 여정
Airflow를 이용한 데이터 Workflow 관리
Understanding MLOps
글로벌 기업들의 효과적인 데이터 분석을 위한 Data Lake 구축 및 분석 사례 - 김준형 (AWS 솔루션즈 아키텍트)
Data pipeline and data lake
LLM 모델 기반 서비스 실전 가이드
4. 대용량 아키텍쳐 설계 패턴
Data Engineering 101
[PYCON Korea 2018] Python Application Server for Recommender System
성장을 좋아하는 사람이, 성장하고 싶은 사람에게
How to build massive service for advance
엘라스틱 서치 세미나
카카오의 광고지능 (Intelligence on Kakao Advertising)
고려대학교 컴퓨터학과 특강 - 대학생 때 알았더라면 좋았을 것들
Spark 의 핵심은 무엇인가? RDD! (RDD paper review)
인프라 벤치마크 테스트 잘 해보기 윤서율.pdf
Micro Service Architecture의 이해
Ad

Similar to [225]NSML: 머신러닝 플랫폼 서비스하기 & 모델 튜닝 자동화하기 (20)

PDF
검색엔진에 적용된 ChatGPT
PDF
딥러닝 세계에 입문하기 위반 분투
PDF
[PYCON Korea 2018] Python Application Server for Recommender System
PDF
PYCON KR 2017 - 구름이 하늘의 일이라면 (윤상웅)
PDF
AWS CLOUD 2018- AWS의 새로운 통합 머신러닝 플랫폼 서비스, Amazon SageMaker (김무현 솔루션즈 아키텍트)
PPTX
Chapter 11 Practical Methodology
PPTX
링크드인의 Big Data Recommendation Products - 어제의 데이터를 통해 내일을 예측한다
PDF
[AWS Innovate 온라인 컨퍼런스] 수백만 사용자 대상 기계 학습 서비스를 위한 확장 비법 - 윤석찬, AWS 테크 에반젤리스트
PDF
검색엔진에 적용된 딥러닝 모델 방법론
PDF
제 20회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [B01Z] HAP-PY_음성 인식 기반 AI 면접 솔루...
PDF
2021-11-16 모두콘 딥러닝 경량화 발표
PDF
스마트폰 위의 딥러닝
PDF
파이썬으로 익히는 딥러닝 기본 (18년)
PDF
경희대학교_Usay_송효섭_모의면접_플랫폼_연구_최종보고서.pdf
PDF
[Td 2015]개발하기 바쁜데 푸시서버와 메시지큐는 있는거 쓸래요(김영재)
PDF
A future that integrates LLMs and LAMs (Symposium)
PPTX
제03장 Introduction to 머신러닝 자동화도구 AI Wonder.pptx
PDF
『클라우드 시스템을 관리하는 기술』 - 맛보기
PDF
The bleeding edge of machine learning stream in 2017 - APAC ML/DS Community ...
PDF
Auto Scalable 한 Deep Learning Production 을 위한 AI Serving Infra 구성 및 AI DevOps...
검색엔진에 적용된 ChatGPT
딥러닝 세계에 입문하기 위반 분투
[PYCON Korea 2018] Python Application Server for Recommender System
PYCON KR 2017 - 구름이 하늘의 일이라면 (윤상웅)
AWS CLOUD 2018- AWS의 새로운 통합 머신러닝 플랫폼 서비스, Amazon SageMaker (김무현 솔루션즈 아키텍트)
Chapter 11 Practical Methodology
링크드인의 Big Data Recommendation Products - 어제의 데이터를 통해 내일을 예측한다
[AWS Innovate 온라인 컨퍼런스] 수백만 사용자 대상 기계 학습 서비스를 위한 확장 비법 - 윤석찬, AWS 테크 에반젤리스트
검색엔진에 적용된 딥러닝 모델 방법론
제 20회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [B01Z] HAP-PY_음성 인식 기반 AI 면접 솔루...
2021-11-16 모두콘 딥러닝 경량화 발표
스마트폰 위의 딥러닝
파이썬으로 익히는 딥러닝 기본 (18년)
경희대학교_Usay_송효섭_모의면접_플랫폼_연구_최종보고서.pdf
[Td 2015]개발하기 바쁜데 푸시서버와 메시지큐는 있는거 쓸래요(김영재)
A future that integrates LLMs and LAMs (Symposium)
제03장 Introduction to 머신러닝 자동화도구 AI Wonder.pptx
『클라우드 시스템을 관리하는 기술』 - 맛보기
The bleeding edge of machine learning stream in 2017 - APAC ML/DS Community ...
Auto Scalable 한 Deep Learning Production 을 위한 AI Serving Infra 구성 및 AI DevOps...
Ad

More from NAVER D2 (20)

PDF
[211] 인공지능이 인공지능 챗봇을 만든다
PDF
[233] 대형 컨테이너 클러스터에서의 고가용성 Network Load Balancing: Maglev Hashing Scheduler i...
PDF
[215] Druid로 쉽고 빠르게 데이터 분석하기
PDF
[245]Papago Internals: 모델분석과 응용기술 개발
PDF
[236] 스트림 저장소 최적화 이야기: 아파치 드루이드로부터 얻은 교훈
PDF
[235]Wikipedia-scale Q&A
PDF
[244]로봇이 현실 세계에 대해 학습하도록 만들기
PDF
[243] Deep Learning to help student’s Deep Learning
PDF
[234]Fast & Accurate Data Annotation Pipeline for AI applications
PDF
Old version: [233]대형 컨테이너 클러스터에서의 고가용성 Network Load Balancing
PDF
[226]NAVER 광고 deep click prediction: 모델링부터 서빙까지
PDF
[224]네이버 검색과 개인화
PDF
[216]Search Reliability Engineering (부제: 지진에도 흔들리지 않는 네이버 검색시스템)
PDF
[214] Ai Serving Platform: 하루 수 억 건의 인퍼런스를 처리하기 위한 고군분투기
PDF
[213] Fashion Visual Search
PDF
[232] TensorRT를 활용한 딥러닝 Inference 최적화
PDF
[242]컴퓨터 비전을 이용한 실내 지도 자동 업데이트 방법: 딥러닝을 통한 POI 변화 탐지
PDF
[212]C3, 데이터 처리에서 서빙까지 가능한 하둡 클러스터
PDF
[223]기계독해 QA: 검색인가, NLP인가?
PDF
[231] Clova 화자인식
[211] 인공지능이 인공지능 챗봇을 만든다
[233] 대형 컨테이너 클러스터에서의 고가용성 Network Load Balancing: Maglev Hashing Scheduler i...
[215] Druid로 쉽고 빠르게 데이터 분석하기
[245]Papago Internals: 모델분석과 응용기술 개발
[236] 스트림 저장소 최적화 이야기: 아파치 드루이드로부터 얻은 교훈
[235]Wikipedia-scale Q&A
[244]로봇이 현실 세계에 대해 학습하도록 만들기
[243] Deep Learning to help student’s Deep Learning
[234]Fast & Accurate Data Annotation Pipeline for AI applications
Old version: [233]대형 컨테이너 클러스터에서의 고가용성 Network Load Balancing
[226]NAVER 광고 deep click prediction: 모델링부터 서빙까지
[224]네이버 검색과 개인화
[216]Search Reliability Engineering (부제: 지진에도 흔들리지 않는 네이버 검색시스템)
[214] Ai Serving Platform: 하루 수 억 건의 인퍼런스를 처리하기 위한 고군분투기
[213] Fashion Visual Search
[232] TensorRT를 활용한 딥러닝 Inference 최적화
[242]컴퓨터 비전을 이용한 실내 지도 자동 업데이트 방법: 딥러닝을 통한 POI 변화 탐지
[212]C3, 데이터 처리에서 서빙까지 가능한 하둡 클러스터
[223]기계독해 QA: 검색인가, NLP인가?
[231] Clova 화자인식

[225]NSML: 머신러닝 플랫폼 서비스하기 & 모델 튜닝 자동화하기