SlideShare a Scribd company logo
A Vietnamese Language Model
Based on
Recurrent Neural Network
Viet-Trung Tran, Kiem-Hieu Nguyen, Duc-Hanh Bui
Hanoi University of Science and Technology
1Friday, October 7, 16
Outline
Statistical language model
Current state of the art
RNN for Vietnamese language model
Experimental results
Conclusion
2
Friday, October 7, 16
Statistical language
model
A probability distribution of word sequence
E.g. “go to the airport”
? = P(“airport”|“go to the”)
Applications:
Spelling checkers, smart keyboards
Enhance speed recognition/machine translation
LABAN KEY
3
Friday, October 7, 16
Challenges
Meaningful
grammatically correct
understandable
Context-aware
E.g. I am from Vietnam. My mother-tongue is Vietnamese
Out of vocabulary
Slang, abbreviations, etc.
4
Friday, October 7, 16
Common approach
N-gram language model
Katz's back-off: estimates the conditional
probability of a word given its history in the n-gram
When trigram unavailable -> back-off to bi-gram
-> uni-gram
SOURCE: HTTPS://EN.WIKIPEDIA.ORG/WIKI/KATZ%27S_BACK-OFF_MODEL
5
Friday, October 7, 16
N-gram language model
Only see a few words back
Only predict words seen in the same context
6
Friday, October 7, 16
Deep learning for NLP
Word embedding
(SOCHER ET AL. (2013A))
MIKOLOV ET AL. (2013B).
7
Friday, October 7, 16
Recurrent neural
network for text
8
INPUT : GO TO THE
OUTPUT : TO THE SCHOOL
PROBABILITY (SCHOOL | GO TO THE)
Friday, October 7, 16
RNN vs. N-gram
Foldable word context vs. fix n-gam context
Personalization through continuous learning
More meaningful text suggestions
Naturally support phrase, terms suggestions
9
Friday, October 7, 16
RNN for Vietnamese
language model
Character level language model
{previous characters} -> next characters
Syllable level language model
{previous syllables} -> next syllables
10
Friday, October 7, 16
LSTM cell
SOURCE: HTTP://COLAH.GITHUB.IO/POSTS/2015-08-
UNDERSTANDING-LSTMS/
11
Friday, October 7, 16
Stacking multiple layers
12
Friday, October 7, 16
Experiments
1,500 MOVIES - 2.056.308 SENTENCES
13
Friday, October 7, 16
Experimental results
14
Friday, October 7, 16
15
Friday, October 7, 16
Conclusion
First neural language model for Vietnamese
Largest experimental dataset
Future work
Word embedding
Neural net compression
Conversational neural machine translation
16
Friday, October 7, 16
Thank you for your
attention
17
Friday, October 7, 16
Conversational
Chú hoài linh đẹp trai. Chú hoài linh
Chào buổi sáng
chị hát hay wa!! nghe thick a.
chị khởi my ơi e rất la hâm mộ
chú hoài linh thật đẹp zai và chú Trấn thành đẹp
qá
18
Friday, October 7, 16
lịch sử ghi nhớ năm 1979
tại hội nghị, đồng chí Phạm Ngọc Thủy Võ Văn
Kiệt
tại hội nghị, đồng chí Hồ Chí Minh nói
tại hội nghị, đồng chí Võ Nguyên Giáp và đồng chí
Hồ Chí Minh đã ngồi ở
tại đại hội Đảng lần thứ nhất vào năm 1945,
Ngay từ những ngày đầu, Đúng như nhận xét của
Giáo sư Nguyễn Văn Linh
19
Friday, October 7, 16

More Related Content

PDF
BA DAY: 5 bước phân tích yêu cầu nghiệp vụ
PPTX
Hướng dẫn sử dụng YOLO v5.pptx
PDF
Bai tap access
PDF
Introduction to BigData @TCTK2015
PPT
Chuong 1. Lập trình hướng đối tượng trong java
PDF
Báo cáo tốt nghiệp - XÂY DỰNG CHƯƠNG TRÌNH QUẢN LÝ NHÀ HÀNG VỪA VÀ NHỎ SỬ DỤ...
PDF
Phân lớp dữ liệu số bằng giải thuật K-NN
PDF
Đề tài: Xây dựng hệ thống thông tin quản lý quầy thuốc tại bệnh viện
BA DAY: 5 bước phân tích yêu cầu nghiệp vụ
Hướng dẫn sử dụng YOLO v5.pptx
Bai tap access
Introduction to BigData @TCTK2015
Chuong 1. Lập trình hướng đối tượng trong java
Báo cáo tốt nghiệp - XÂY DỰNG CHƯƠNG TRÌNH QUẢN LÝ NHÀ HÀNG VỪA VÀ NHỎ SỬ DỤ...
Phân lớp dữ liệu số bằng giải thuật K-NN
Đề tài: Xây dựng hệ thống thông tin quản lý quầy thuốc tại bệnh viện

What's hot (20)

DOC
Luận văn: Nhận dạng mặt người trên matlab, HAY, 9Đ
PDF
Đề tài: Xây dựng phần mềm quản lý nhà hàng ăn uống
PPT
Phương pháp nhánh cận
PPTX
Hệ thống phân tích tình trạng giao thông: Ứng dụng công cụ xử lý dữ liệu lớn...
PDF
Luận văn: Nhận dạng và phân loại hoa quả trong ảnh màu, HAY
PDF
Tiểu luận Kiến trúc và thiết kế phần mềm PTIT - Software Architecture & Design
PPT
ERD - Database Design
DOCX
Đề tài: Nghiên cứu thuật toán K-nearest neighbor, HAY, 9đ
PDF
Artificial intelligence ai l1-gioi thieu
PDF
Bài 2: Các khái niệm trong CSDL quan hệ - Giáo trình FPT
DOCX
Hoàn thiện qui trình tuyển dụng nhân sự tại công ty Đức Việt.docx
DOC
BÀI GIẢNG LẬP TRÌNH HƯỚNG ĐỐI TƯỢNG
PPT
Slide Hệ Quản Trị Cơ sở dữ liệu - CHƯƠNG 1
PDF
Ứng dụng khai phá dữ liệu xây dựng hệ hỗ trợ chẩn đoán y khoa
PPTX
Thuat toan pca full 24-5-2017
DOCX
Nhận dạng mặt người bằng thuật toán PCA trên Matlab
DOCX
Đồ Án Xây Dựng Hệ Thống Nhận Diện Khuôn Mặt.docx
PDF
Luận văn: Bài tập Cơ sở dữ liệu quan hệ, HAY
PDF
Chap1+2-OS.pdf
PDF
Luận văn: Nghiên cứu thiết kế bộ điều khiển PID mờ, HOT
Luận văn: Nhận dạng mặt người trên matlab, HAY, 9Đ
Đề tài: Xây dựng phần mềm quản lý nhà hàng ăn uống
Phương pháp nhánh cận
Hệ thống phân tích tình trạng giao thông: Ứng dụng công cụ xử lý dữ liệu lớn...
Luận văn: Nhận dạng và phân loại hoa quả trong ảnh màu, HAY
Tiểu luận Kiến trúc và thiết kế phần mềm PTIT - Software Architecture & Design
ERD - Database Design
Đề tài: Nghiên cứu thuật toán K-nearest neighbor, HAY, 9đ
Artificial intelligence ai l1-gioi thieu
Bài 2: Các khái niệm trong CSDL quan hệ - Giáo trình FPT
Hoàn thiện qui trình tuyển dụng nhân sự tại công ty Đức Việt.docx
BÀI GIẢNG LẬP TRÌNH HƯỚNG ĐỐI TƯỢNG
Slide Hệ Quản Trị Cơ sở dữ liệu - CHƯƠNG 1
Ứng dụng khai phá dữ liệu xây dựng hệ hỗ trợ chẩn đoán y khoa
Thuat toan pca full 24-5-2017
Nhận dạng mặt người bằng thuật toán PCA trên Matlab
Đồ Án Xây Dựng Hệ Thống Nhận Diện Khuôn Mặt.docx
Luận văn: Bài tập Cơ sở dữ liệu quan hệ, HAY
Chap1+2-OS.pdf
Luận văn: Nghiên cứu thiết kế bộ điều khiển PID mờ, HOT
Ad

Similar to A Vietnamese Language Model Based on Recurrent Neural Network (11)

PDF
A Vietnamese Language Model Based on Recurrent Neural Network
PPTX
Sequence to Sequence Learning with Neural Networks
PPTX
Deep Dialog System Review
PDF
AINL 2016: Nikolenko
PPTX
Deep Learning for Natural Language Processing_FDP on 16 June 2025 MITS.pptx
PDF
企業における自然言語処理技術利用の最先端
PDF
5_RNN_LSTM.pdf
 
PDF
Video captioning in Vietnamese using deep learning
PDF
Deep-learning based Language Understanding and Emotion extractions
PDF
Language Model (D3L1 Deep Learning for Speech and Language UPC 2017)
PDF
Video caption generation via seq-to-seq model (TensorFlow implementation)
A Vietnamese Language Model Based on Recurrent Neural Network
Sequence to Sequence Learning with Neural Networks
Deep Dialog System Review
AINL 2016: Nikolenko
Deep Learning for Natural Language Processing_FDP on 16 June 2025 MITS.pptx
企業における自然言語処理技術利用の最先端
5_RNN_LSTM.pdf
 
Video captioning in Vietnamese using deep learning
Deep-learning based Language Understanding and Emotion extractions
Language Model (D3L1 Deep Learning for Speech and Language UPC 2017)
Video caption generation via seq-to-seq model (TensorFlow implementation)
Ad

More from Viet-Trung TRAN (20)

PDF
Bắt đầu tìm hiểu về dữ liệu lớn như thế nào - 2017
PDF
Dynamo: Amazon’s Highly Available Key-value Store
PDF
Pregel: Hệ thống xử lý đồ thị lớn
PDF
Mapreduce simplified-data-processing
PDF
Tìm kiếm needle trong Haystack: Hệ thống lưu trữ ảnh của Facebook
PPTX
giasan.vn real-estate analytics: a Vietnam case study
PDF
Giasan.vn @rstars
PPTX
Large-Scale Geographically Weighted Regression on Spark
PDF
Recent progress on distributing deep learning
PDF
success factors for project proposals
PDF
GPSinsights poster
PPTX
OCR processing with deep learning: Apply to Vietnamese documents
PDF
Paper@Soict2015: GPSInsights: towards a scalable framework for mining massive...
PDF
Deep learning for nlp
PDF
From neural networks to deep learning
PDF
From decision trees to random forests
PPTX
Recommender systems: Content-based and collaborative filtering
PPTX
3 - Finding similar items
PPTX
Dimensionality reduction: SVD and its applications
PDF
Introduction to mining massive datasets
Bắt đầu tìm hiểu về dữ liệu lớn như thế nào - 2017
Dynamo: Amazon’s Highly Available Key-value Store
Pregel: Hệ thống xử lý đồ thị lớn
Mapreduce simplified-data-processing
Tìm kiếm needle trong Haystack: Hệ thống lưu trữ ảnh của Facebook
giasan.vn real-estate analytics: a Vietnam case study
Giasan.vn @rstars
Large-Scale Geographically Weighted Regression on Spark
Recent progress on distributing deep learning
success factors for project proposals
GPSinsights poster
OCR processing with deep learning: Apply to Vietnamese documents
Paper@Soict2015: GPSInsights: towards a scalable framework for mining massive...
Deep learning for nlp
From neural networks to deep learning
From decision trees to random forests
Recommender systems: Content-based and collaborative filtering
3 - Finding similar items
Dimensionality reduction: SVD and its applications
Introduction to mining massive datasets

Recently uploaded (20)

PPTX
IB Computer Science - Internal Assessment.pptx
PPT
Quality review (1)_presentation of this 21
PPTX
Introduction to Basics of Ethical Hacking and Penetration Testing -Unit No. 1...
PPTX
Global journeys: estimating international migration
PDF
.pdf is not working space design for the following data for the following dat...
PDF
22.Patil - Early prediction of Alzheimer’s disease using convolutional neural...
PPTX
Moving the Public Sector (Government) to a Digital Adoption
PDF
168300704-gasification-ppt.pdfhghhhsjsjhsuxush
PDF
Introduction to Business Data Analytics.
PPTX
Introduction-to-Cloud-ComputingFinal.pptx
PPTX
STUDY DESIGN details- Lt Col Maksud (21).pptx
PPTX
oil_refinery_comprehensive_20250804084928 (1).pptx
PDF
BF and FI - Blockchain, fintech and Financial Innovation Lesson 2.pdf
PPTX
CEE 2 REPORT G7.pptxbdbshjdgsgjgsjfiuhsd
PPTX
Introduction to Knowledge Engineering Part 1
PPTX
Business Acumen Training GuidePresentation.pptx
PPT
Chapter 2 METAL FORMINGhhhhhhhjjjjmmmmmmmmm
PPTX
1_Introduction to advance data techniques.pptx
PDF
TRAFFIC-MANAGEMENT-AND-ACCIDENT-INVESTIGATION-WITH-DRIVING-PDF-FILE.pdf
PPTX
Introduction to Firewall Analytics - Interfirewall and Transfirewall.pptx
IB Computer Science - Internal Assessment.pptx
Quality review (1)_presentation of this 21
Introduction to Basics of Ethical Hacking and Penetration Testing -Unit No. 1...
Global journeys: estimating international migration
.pdf is not working space design for the following data for the following dat...
22.Patil - Early prediction of Alzheimer’s disease using convolutional neural...
Moving the Public Sector (Government) to a Digital Adoption
168300704-gasification-ppt.pdfhghhhsjsjhsuxush
Introduction to Business Data Analytics.
Introduction-to-Cloud-ComputingFinal.pptx
STUDY DESIGN details- Lt Col Maksud (21).pptx
oil_refinery_comprehensive_20250804084928 (1).pptx
BF and FI - Blockchain, fintech and Financial Innovation Lesson 2.pdf
CEE 2 REPORT G7.pptxbdbshjdgsgjgsjfiuhsd
Introduction to Knowledge Engineering Part 1
Business Acumen Training GuidePresentation.pptx
Chapter 2 METAL FORMINGhhhhhhhjjjjmmmmmmmmm
1_Introduction to advance data techniques.pptx
TRAFFIC-MANAGEMENT-AND-ACCIDENT-INVESTIGATION-WITH-DRIVING-PDF-FILE.pdf
Introduction to Firewall Analytics - Interfirewall and Transfirewall.pptx

A Vietnamese Language Model Based on Recurrent Neural Network