SlideShare a Scribd company logo
2
Most read
4
Most read
H I S T O R Y O F T E X T
S U M M A R I Z AT I O N
FA N G YA TA N & W E N L I
PRESENTATION FLOW
• Introduction of Text Summarization History
~Hans Peter Luhn in the late 1950s, titled “The automatic creation
of literature abstracts”
• Fundamental Question of Text Summarization?
~ Select the essential content , Express the selected
content
• Two Main Types of Text summarization Methods
~ extractive and abstractive
• Interesting Text Summarization Example:
~ A Dream in the Red Chamber
• Q and A
INTRODUCTION
• What is Text Summarization?
Automatic summarization is the process of
shortening a text document with software, to
create a summary with the major points of
the original document. –Wikipedia
• Why it is Important?
It can quickly extract accurate content and help
reader understand large volume of information.
(reviews, news headline, biography)
History: Automation Summarization 1950,
Text Analysis conferences 2000,
Today& Future: Automation with AI
Algorithm: CNN, RNN, HAN
S ELECT S E NTENCE O R E X PRESS T H E
CO N TENT?
Evaluation:
• Summarization Goal
Syntactically accurate
Semantically coherent
Logically organized
Without redundancy
Measure System
ROUGE: Recall- Oriented
Understudy for Gist Evaluation
Pyramid
Automatic Evaluation with
Machine Learning (supervised or
unsuperised)
Challenges :
How to select the essential content of a document ?
How to express the selected content in a condensed
manner?
FUNDAMENTAL TYPES TEXT SUMMARIZATION METHODS
EXTRACTIVE SUMMARIZATION
• important sentences are selected from
the input text to form a summary
• Input document → sentences similarity
→ weight sentences → select sentences
with higher rank
• Application: Easier to use
• Challenges: Identify the right sentence
• Weakness: Low readability
ABSTRACTIVE SUMMARIZATION
• Model generate text summarization
from its main ideas like human.
• Input document → understand context
→ semantics → create own summary
• Application: English & Arabics
• Approaches: Structured, Semantic
• Challenges: Need complex capabilities
like generalization, paraphrasing and
incorporating real-world knowledge.
Based on the output type, we can classify text summarization into
Tools: Python, NLTK
A DREAM OF THE RED CHAMBER:
FIRST 80 VS LAST 40 CHAPTERS?
WORD FREQUENCY FIRST 80
VS L AST 40:
• T H R O U G H N L P I R PAC K AG E , T H E R E S E A R C H E R S A P P L I E D K L D I V E R G E N C E A N D P C A D I M E N S I O N ( 1 3 8 )
R E D U C T I O N D E M O N S T R AT E D A S I G N I F I C A N T D I F F E R E N C E B E T W E E N F I R S T 8 0 A N D L A S T 4 0 C H A P T E R S
R E F E R E N C E :
H T T P S : / / W W W . A N A L Y T I C S V I D H Y A . C O M / B L O G / 2 0 1 8 / 1
1 / I N T R O D U C T I O N - T E X T - S U M M A R I Z A T I O N - T E X T R A N K -
P Y T H O N /
A U T O M A T I C T E X T S U M M A R I Z A T I O N P A S T P R E S E N T
A N D F U T U R E
H T T P S : / / E N . W I K I P E D I A . O R G / W I K I / A U T O M A T I C _ S U M
M A R I Z A T I O N
H T T P S : / / W W W . Z H I H U . C O M / Q U E S T I O N / 1 9 7 6 8 8 9 8
H T T P S : / / F R E E W E C H A T . C O M / A / M Z I 5 N D Q 5 M J I 5 O Q = = / 2
2 4 7 4 8 4 5 9 4 / 3
H T T P S : / / W W W . I D A T A L O O P . C O M / 1 4 2 6 0 . H T M L
T H A N K Y O U !

More Related Content

PDF
Hướng dẫn tự học Linux
DOC
Đồ Án tốt nghiệp Nghiên Cứu Về Nhà Máy Điện Gió, 9 Điểm.doc
PDF
Luận văn: Nhận dạng cảm xúc khuôn mặt người, HAY, 9đ
PDF
Hệ thống điều khiển thiết bị điện trong nhà và cảnh báo chống trộm
PPTX
Tổng quan,ứng dụng mạng cảm biến không dây
PDF
[123doc] - bai-thuc-hanh-chuyen-sau-ptit.pdf
PDF
Đề tài: Thiết kế bãi giữ xe ứng dụng công nghệ RFID và xử lý ảnh
PDF
Nghiên Cứu Phân Hệ Thông Tin Vệ Tinh VINASAT1
Hướng dẫn tự học Linux
Đồ Án tốt nghiệp Nghiên Cứu Về Nhà Máy Điện Gió, 9 Điểm.doc
Luận văn: Nhận dạng cảm xúc khuôn mặt người, HAY, 9đ
Hệ thống điều khiển thiết bị điện trong nhà và cảnh báo chống trộm
Tổng quan,ứng dụng mạng cảm biến không dây
[123doc] - bai-thuc-hanh-chuyen-sau-ptit.pdf
Đề tài: Thiết kế bãi giữ xe ứng dụng công nghệ RFID và xử lý ảnh
Nghiên Cứu Phân Hệ Thông Tin Vệ Tinh VINASAT1

What's hot (20)

DOCX
Đồ Án Tốt Nghiệp Lưu Đồ Giải Thuật Và Chương Trình Điều Khiển.docx
PDF
TỔNG HỢP ĐỀ THI CHÍNH THỨC VÀ ĐỀ XUẤT KỲ THI CHỌN HỌC SINH GIỎI CÁC TRƯỜNG CH...
PPTX
Hệ thống quản lý bán hàng online
PDF
Báo cáo phân tích thiết kế mạng
DOCX
Báo Cáo Thực Tập Ứng Dụng Công Nghệ Thông Tin Vào Công Tác Quản Lý
DOCX
Báo cáo môn mô hình hóa
DOCX
Đề tài: Nhận dạng, phân loại, xử lý ảnh biển số xe bằng phần mềm
PPT
Bai 2 thong tin va du lieu
PDF
Sự khác nhau giữa phần mềm portable và installer
PDF
Khóa luận nghiên cứu bài toán phân tích cảm xúc của người hùng 9166421
PPT
Giáo trình Phân tích và thiết kế giải thuật - CHAP 1
DOCX
Đề tài: Thiết bị cảnh báo khí gas & phòng chống cháy nổ, HAY
PDF
Đề tài: Thiết kế hộp điều khiển thiết bị bằng sóng hồng ngoại
PDF
Cẩm nang luyện thi TOPIK I
PDF
Bài 7 THIẾT BỊ VÀO RA
PDF
Đề tài: Xây dựng website giới thiệu sản phẩm phần mềm, HOT
PDF
Do an xay_dung_website_thuong_mai_dien_tu
PDF
đồ áN xây dựng website bán laptop 1129155
DOCX
storage-area-network
PDF
TỔNG HỢP 30 ĐỀ THI CHỌN HSG CÁC TRƯỜNG THPT CHUYÊN VÙNG DUYÊN HẢI & ĐỒNG BẰNG...
Đồ Án Tốt Nghiệp Lưu Đồ Giải Thuật Và Chương Trình Điều Khiển.docx
TỔNG HỢP ĐỀ THI CHÍNH THỨC VÀ ĐỀ XUẤT KỲ THI CHỌN HỌC SINH GIỎI CÁC TRƯỜNG CH...
Hệ thống quản lý bán hàng online
Báo cáo phân tích thiết kế mạng
Báo Cáo Thực Tập Ứng Dụng Công Nghệ Thông Tin Vào Công Tác Quản Lý
Báo cáo môn mô hình hóa
Đề tài: Nhận dạng, phân loại, xử lý ảnh biển số xe bằng phần mềm
Bai 2 thong tin va du lieu
Sự khác nhau giữa phần mềm portable và installer
Khóa luận nghiên cứu bài toán phân tích cảm xúc của người hùng 9166421
Giáo trình Phân tích và thiết kế giải thuật - CHAP 1
Đề tài: Thiết bị cảnh báo khí gas & phòng chống cháy nổ, HAY
Đề tài: Thiết kế hộp điều khiển thiết bị bằng sóng hồng ngoại
Cẩm nang luyện thi TOPIK I
Bài 7 THIẾT BỊ VÀO RA
Đề tài: Xây dựng website giới thiệu sản phẩm phần mềm, HOT
Do an xay_dung_website_thuong_mai_dien_tu
đồ áN xây dựng website bán laptop 1129155
storage-area-network
TỔNG HỢP 30 ĐỀ THI CHỌN HSG CÁC TRƯỜNG THPT CHUYÊN VÙNG DUYÊN HẢI & ĐỒNG BẰNG...
Ad

Similar to History of text summarization (20)

PPTX
text summarization
PPTX
Automatic keyword extraction.pptx
PPTX
Comparative Analysis of Text Summarization Techniques
PPTX
Text summarization.pptx
PDF
IRJET - Text Summarizer.
PDF
A domain specific automatic text summarization using fuzzy logic
PDF
Automatic Text Summarization Using Natural Language Processing (1)
PDF
IRJET- A Survey Paper on Text Summarization Methods
PPTX
PPTX
Text Summarization in natural language processing.pptx
PPTX
Text Summarization Using AI Tools.pptx
PPTX
E21CSEU09.pptx
PDF
Text summarization
PDF
Automatic Text Summarization: A Critical Review
PDF
A Newly Proposed Technique for Summarizing the Abstractive Newspapers’ Articl...
PDF
A Newly Proposed Technique for Summarizing the Abstractive Newspapers’ Articl...
PDF
Evaluation of Techniques for Automatic Text Extraction
PDF
Automatic Text Summarization
PDF
A Newly Proposed Technique for Summarizing the Abstractive Newspapers’ Articl...
PPTX
3__Python - Tool Text summarization.pptx
text summarization
Automatic keyword extraction.pptx
Comparative Analysis of Text Summarization Techniques
Text summarization.pptx
IRJET - Text Summarizer.
A domain specific automatic text summarization using fuzzy logic
Automatic Text Summarization Using Natural Language Processing (1)
IRJET- A Survey Paper on Text Summarization Methods
Text Summarization in natural language processing.pptx
Text Summarization Using AI Tools.pptx
E21CSEU09.pptx
Text summarization
Automatic Text Summarization: A Critical Review
A Newly Proposed Technique for Summarizing the Abstractive Newspapers’ Articl...
A Newly Proposed Technique for Summarizing the Abstractive Newspapers’ Articl...
Evaluation of Techniques for Automatic Text Extraction
Automatic Text Summarization
A Newly Proposed Technique for Summarizing the Abstractive Newspapers’ Articl...
3__Python - Tool Text summarization.pptx
Ad

Recently uploaded (20)

PPT
Miokarditis (Inflamasi pada Otot Jantung)
PPTX
Market Analysis -202507- Wind-Solar+Hybrid+Street+Lights+for+the+North+Amer...
PPTX
Supervised vs unsupervised machine learning algorithms
PPTX
mbdjdhjjodule 5-1 rhfhhfjtjjhafbrhfnfbbfnb
PDF
[EN] Industrial Machine Downtime Prediction
PPTX
oil_refinery_comprehensive_20250804084928 (1).pptx
PPT
Quality review (1)_presentation of this 21
PPTX
STERILIZATION AND DISINFECTION-1.ppthhhbx
PPTX
Acceptance and paychological effects of mandatory extra coach I classes.pptx
PPTX
01_intro xxxxxxxxxxfffffffffffaaaaaaaaaaafg
PDF
Introduction to the R Programming Language
PPTX
IB Computer Science - Internal Assessment.pptx
PDF
Mega Projects Data Mega Projects Data
PPTX
ALIMENTARY AND BILIARY CONDITIONS 3-1.pptx
PPTX
1_Introduction to advance data techniques.pptx
PPTX
AI Strategy room jwfjksfksfjsjsjsjsjfsjfsj
PPT
ISS -ESG Data flows What is ESG and HowHow
PPTX
Microsoft-Fabric-Unifying-Analytics-for-the-Modern-Enterprise Solution.pptx
PPTX
IBA_Chapter_11_Slides_Final_Accessible.pptx
Miokarditis (Inflamasi pada Otot Jantung)
Market Analysis -202507- Wind-Solar+Hybrid+Street+Lights+for+the+North+Amer...
Supervised vs unsupervised machine learning algorithms
mbdjdhjjodule 5-1 rhfhhfjtjjhafbrhfnfbbfnb
[EN] Industrial Machine Downtime Prediction
oil_refinery_comprehensive_20250804084928 (1).pptx
Quality review (1)_presentation of this 21
STERILIZATION AND DISINFECTION-1.ppthhhbx
Acceptance and paychological effects of mandatory extra coach I classes.pptx
01_intro xxxxxxxxxxfffffffffffaaaaaaaaaaafg
Introduction to the R Programming Language
IB Computer Science - Internal Assessment.pptx
Mega Projects Data Mega Projects Data
ALIMENTARY AND BILIARY CONDITIONS 3-1.pptx
1_Introduction to advance data techniques.pptx
AI Strategy room jwfjksfksfjsjsjsjsjfsjfsj
ISS -ESG Data flows What is ESG and HowHow
Microsoft-Fabric-Unifying-Analytics-for-the-Modern-Enterprise Solution.pptx
IBA_Chapter_11_Slides_Final_Accessible.pptx

History of text summarization

  • 1. H I S T O R Y O F T E X T S U M M A R I Z AT I O N FA N G YA TA N & W E N L I
  • 2. PRESENTATION FLOW • Introduction of Text Summarization History ~Hans Peter Luhn in the late 1950s, titled “The automatic creation of literature abstracts” • Fundamental Question of Text Summarization? ~ Select the essential content , Express the selected content • Two Main Types of Text summarization Methods ~ extractive and abstractive • Interesting Text Summarization Example: ~ A Dream in the Red Chamber • Q and A
  • 3. INTRODUCTION • What is Text Summarization? Automatic summarization is the process of shortening a text document with software, to create a summary with the major points of the original document. –Wikipedia • Why it is Important? It can quickly extract accurate content and help reader understand large volume of information. (reviews, news headline, biography) History: Automation Summarization 1950, Text Analysis conferences 2000, Today& Future: Automation with AI Algorithm: CNN, RNN, HAN
  • 4. S ELECT S E NTENCE O R E X PRESS T H E CO N TENT? Evaluation: • Summarization Goal Syntactically accurate Semantically coherent Logically organized Without redundancy Measure System ROUGE: Recall- Oriented Understudy for Gist Evaluation Pyramid Automatic Evaluation with Machine Learning (supervised or unsuperised) Challenges : How to select the essential content of a document ? How to express the selected content in a condensed manner?
  • 5. FUNDAMENTAL TYPES TEXT SUMMARIZATION METHODS EXTRACTIVE SUMMARIZATION • important sentences are selected from the input text to form a summary • Input document → sentences similarity → weight sentences → select sentences with higher rank • Application: Easier to use • Challenges: Identify the right sentence • Weakness: Low readability ABSTRACTIVE SUMMARIZATION • Model generate text summarization from its main ideas like human. • Input document → understand context → semantics → create own summary • Application: English & Arabics • Approaches: Structured, Semantic • Challenges: Need complex capabilities like generalization, paraphrasing and incorporating real-world knowledge. Based on the output type, we can classify text summarization into Tools: Python, NLTK
  • 6. A DREAM OF THE RED CHAMBER: FIRST 80 VS LAST 40 CHAPTERS? WORD FREQUENCY FIRST 80 VS L AST 40: • T H R O U G H N L P I R PAC K AG E , T H E R E S E A R C H E R S A P P L I E D K L D I V E R G E N C E A N D P C A D I M E N S I O N ( 1 3 8 ) R E D U C T I O N D E M O N S T R AT E D A S I G N I F I C A N T D I F F E R E N C E B E T W E E N F I R S T 8 0 A N D L A S T 4 0 C H A P T E R S
  • 7. R E F E R E N C E : H T T P S : / / W W W . A N A L Y T I C S V I D H Y A . C O M / B L O G / 2 0 1 8 / 1 1 / I N T R O D U C T I O N - T E X T - S U M M A R I Z A T I O N - T E X T R A N K - P Y T H O N / A U T O M A T I C T E X T S U M M A R I Z A T I O N P A S T P R E S E N T A N D F U T U R E H T T P S : / / E N . W I K I P E D I A . O R G / W I K I / A U T O M A T I C _ S U M M A R I Z A T I O N H T T P S : / / W W W . Z H I H U . C O M / Q U E S T I O N / 1 9 7 6 8 8 9 8 H T T P S : / / F R E E W E C H A T . C O M / A / M Z I 5 N D Q 5 M J I 5 O Q = = / 2 2 4 7 4 8 4 5 9 4 / 3 H T T P S : / / W W W . I D A T A L O O P . C O M / 1 4 2 6 0 . H T M L T H A N K Y O U !