SlideShare a Scribd company logo
中華民國圖書館學會 資訊科技委員
陳勇汀
blog@pulipuli.info
2024
https://l.pulipuli.info/24/nsysu
Python自然語言處理應用
命名實體識別
與情緒分析
── 3. 情緒分析篇 ──
政大圖檔 112-2
2
Python自然語言處理應用
1. 環境配置篇
2. 命名實體篇
3. 情緒分析篇
3
4
情緒分析
● 情緒分析、情感分析或意見探勘 (Opinion Mining) 是對人
們在文本中表達的意見、情感、評價、態度以及對實體及其
各個方面的情緒進行計算研究的一種方法。
● 情緒分析不同的範圍:文件層級、句子等級、面向層級
○ 面向層級(aspect-level)是指對於某個實體或目標的情緒分
析,又稱為面向情緒分析(ALSA)
● 情緒分析的極性:三類(正面/負面/中性)
● 情緒分析的做法包括以下幾種:
○ 字典法:以特定關鍵字作為判斷情緒極性的依據
○ 機器學習法 :訓練AI來預測文本的極性
Sentiment Analysis (SA)
情緒分析
5
(Zhang & Liu, 2017)
抱歉,情緒分析只著重文字
6
https://www.instagram.com/agua_line_sticker/p/DCdOXP3ygP3/
「我真的沒有生氣!」
7
情緒分析的應用
顧客回饋意見情感分析
想要知道各種印表機的強項與弱項
8
(Oelke et al., 2009)
bad,
problem
wonderful,
like
格子小: 評價人
少
格子大:評價人多
將命名實體
化為顏色與符號
美國選舉新聞情感變化分析 (1/4)
9
(Wanner et al., 2009)
歐巴馬
拜登
民主黨
只有民主黨
麥卡恩
佩林
共和黨
只有共和黨 兩黨兼俱
美國選舉新聞情感變化分析 (1/4)
10
(Wanner et al., 2009)
一小時內
的新聞
正面形容
負面形容
顏色越深:
越多類似新聞
標亮:使用者選
擇聚焦
美國選舉新聞情感變化分析 (3/4)
11
一小時內
的新聞
正面形容
負面形容
Biden
中立
McCain
正面
民主黨
負面
美國2008年總統大選期間30天內新聞情感變化:10/09~11/08
美國選舉新聞情感變化分析 (4/4)
12
(Wanner et al., 2009)
倫敦的情緒
1700年-1900年倫敦小說中地點與情緒的關聯(1/2)
13
(Heuser, Algee-Hewitt, & Lockhart, 2016)
快樂
(開闊) 矛盾
害怕
(拘禁)
倫敦的情緒
1700年-1900年倫敦小說中地點與情緒的關聯(2/2)
14
(Heuser, Algee-Hewitt, & Lockhart, 2016)
灰底:
人口分佈
各國新聞的不同情感分析 (1/2)
15
(Zhang et al., 2009)
(Joy)
悲傷
快樂
厭惡
驚喜
生氣
接受
期待
害怕
各大洲「伊拉克戰爭」新聞情感分析
各國新聞的不同情感分析 (2/2)
16
(Zhang et al., 2009)
越來越
正向
持續
負面
17
情緒分析的工具
● 主要針對英文:NLTK, TextBlob, VADER
● 跨國語言:SpaCy
● 搭配不同語言模型達到跨國語言:Flair
● 簡體中文:SnowNLP,
Chinese-Sentiment-Analysis-Fund-Direction
注意情緒分析的 可處理語言
18
● sanshizhang 2024年在Hugging Face發佈的模型
● 用10萬筆以上的基金文本實作的中文情感分析模型,能夠
區分負面、正面、中性三類極性。
○ 負面有專人處理,準確度較高
○ 中性有可能不準確
● 採用機器學習法,是基於BERT的架構訓練而成的模型
● 主要處理簡體中文
Chinese-Sentiment-Analysis
-Fund-Direction
19
https://huggingface.co/sanshizhang/Chinese-Sentiment-Analysis-Fund-Direction
正面:0.6408
情緒分析的舉例
20
彰化保安林生态护坡见效
3年监测PM2.5浓度减26%
輸入文字
[0] 負面 [1] 正面 [2] 中性
0.3431 0.6408 0.0161
情緒分析
結果
模型保存庫
21
https://huggingface.co/sanshizhang/Chinese-Sentiment-Analysis-Fund-Direction
https://huggingface.co/sanshizhang/
Chinese-Sentiment-Analysis-Fund-Direction
22
實作3-1. 情緒分析
新聞情緒分析
23
https://news.pts.org.tw/article/727328
輸入文件
24
title
彰化保安林生態護坡見效 3年監測PM2.5濃度減26%
教保員託法警朋友拍片訓話男童 台南教育局認做法不當
text_list.csv
實作3-1. 情緒分析
text_list.csv
任務步驟
25
#SA任務
#讀取text_list.csv
#準備SA工具
#執行SA分析
#儲存output.csv
#準備轉簡中工具
26
情緒分析
1. 開啟Colab
2. 取得並上傳text_list.csv
3. 取得並貼上Code Blocks
4. 執行程式
5. 查看output.csv
WAKU WAKU!
27
1. 開啟Colab
命名為
「情緒分析.ipynb」
2. 取得並上傳 text_list.csv
28
實作3-1. 情緒分析
text_list.csv
檔案名稱
必須是
text_list.csv
1. 讀取text_list.csv
2. 準備SA工具
3. 準備前處理工具
4. 執行SA分析
5. 儲存SA結果到
output.csv
3. 取得並貼上 Code Blocks
29
實作3-1. 情緒分析
Code Blocks
逐步從GitHub複製
並貼上到Colab
4. 執行程式
30
Runtime > Run all
也可以按快速鍵Ctrl + F9
5. 查看output.csv (1/2)
31
1. 如果執行完成
會看到output.csv
滑鼠左鍵雙擊開啟
2. 可以看到
output.csv的內容
5. 查看output.csv (2/2)
32
text_idx predicted_sentiment probabilities
0 positive 0.6408013105392456
1 negative 0.9928398132324219
title
彰化保安林生態護坡見效 3年監測PM2.5濃度減26%
教保員託法警朋友拍片訓話男童 台南教育局認做法不當
text_list.csv
text_ide = 0
text_ide = 1
33
成就
計算出帶感情的數字
理科生墜入情網
,故嘗試證明!
34
深入程式碼細節
中文簡化的影響
深入任務步驟
35
#SA任務
#讀取text_list.csv
#準備SA工具
#執行SA分析
#儲存output.csv
#準備轉簡中工具
執行SA分析 (1/3)
36
程式碼功能:移除標點符號,
並將文字改為簡體中文
執行SA分析 (2/3)
37
加上「#」讓它轉換成註解
不執行看看
執行SA分析 (3/3)
38
title
彰化保安林生態護坡見效 3年監測PM2.5濃度減26%
text_ide = 0
第一份文件
變成負面的了
關閉output.csv預覽,執行程式,
output.csv的結果會是...
想一想
繁體中文轉換成簡體後,
可能帶來那些問題?
39
彰化保安林生態護坡見效
3年監測PM2.5濃度減26%
輸入文字
彰化保安林生态护坡见效
3年监测PM2.5浓度减26%
轉成簡體
40
給輕鬆完成前面實作的同學
額外挑戰
儘管放「蛇」過來!
如果輸入的新聞是英文?
41
title
彰化保安林生態護坡見效 3年監測PM2.5濃度減26%
教保員託法警朋友拍片訓話男童 台南教育局認做法不當
Taiwan president's Hawaii trip draws Chinese anger
text_list.csv
提示在...
實作1-2!
能夠把NER跟SA的結果合併嗎?
42
NER SA
title
彰化保安林生態護坡見效 3年監測PM2.5濃度減26%
教保員託法警朋友拍片訓話男童 台南教育局認做法不當
text_list.csv
43
結語
另一種看待文本的方法
44
NER, SA
只看文本,準嗎?
45
言行不一,是人類的天性
印象管理、認知失調、角色衝突、偽裝性行為
46
?
外在行為 內在想法
科學的基礎來自於實徵證據
47
外在行為
他的確有這樣說,
我都記下來了!
要如何從大數據獲得洞見
48
https://7wdata.be/big-data/have-we-lost-control-of-data/
Insight
大數據 = 客觀?
49
文本太多了,簡化一下...
等等、這是!?
大數據 = 客觀?
50
● 支援語言
● 可處理文字長度
● 如何產生規則/訓練模型
● 未知詞彙的處理方式
● 跟其他工具比較的結果
注意工具的適用範圍
51
自然語言處理
(NER, SA)
不只有「分析」
52
1 擬定問題
2 找尋證據
3 採取行動
文本分析
字詞與主題分析
詞性與命名實體
順序分析
特徵分析
語義分析
你從中學到了什麼!
53
重要的是
54
感謝聆聽
任何問題都可以發問喔!
有什麼問題嗎?
電子信箱
blog@pulipuli.info
BLOG 布丁布丁吃什麼?
blog.pulipuli.info
https://l.pulipuli.info
/24/nsysu
參考文獻 (1/2)
55
● Zhang, L., & Liu, B. (2017). Sentiment Analysis and Opinion
Mining. In C. Sammut & G. I. Webb (Eds.), Encyclopedia of
Machine Learning and Data Mining (pp. 1152–1161).
Springer US.
https://doi.org/10.1007/978-1-4899-7687-1_100512
● Oelke, D., Hao, M., Rohrdantz, C., Keim, D. A., Dayal, U.,
Haug, L., & Janetzko, H. (2009). Visual opinion analysis of
customer feedback data. 2009 IEEE Symposium on Visual
Analytics Science and Technology, 187–194.
https://doi.org/10.1109/VAST.2009.5333919
● Wanner, F., Rohrdantz, C., Mansmann, F., Oelke, D., & Keim,
D. A. (2009). Visual Sentiment Analysis of RSS News Feeds
Featuring the US Presidential Election in 2008. VISSW.
https://kops.uni-konstanz.de/handle/123456789/5946
參考文獻 (2/2)
56
● Heuser, R., Algee-Hewitt, M., & Lockhart, A. (2016).
Mapping the Emotions of London in Fiction, 1700–1900:
A Crowdsourcing Experiment. In Literary Mapping in
the Digital Age (pp. 25–46).
https://doi.org/10.4324/9781315592596-12
● Zhang, J., Kawai, Y., Kumamoto, T., & Tanaka, K. (2009).
A Novel Visualization Method for Distinction of Web
News Sentiment. In G. Vossen, D. D. E. Long, & J. X. Yu
(Eds.), Web Information Systems Engineering—WISE
2009 (pp. 181–194). Springer Berlin Heidelberg.

More Related Content

PPTX
0227心理學史簡介
PPTX
英語短文語意相似度評估演算法
PPTX
質性研究的紮根理論研究設計與結果
PPTX
批改學位論文的甘苦談
PPT
讀e Learning 台師大劉渼
PPTX
科学研究中的文献利用
PPT
Chapter5 the qualitative research methods
PPT
Psychology and Life – Chapter 1 Psychology and Life
0227心理學史簡介
英語短文語意相似度評估演算法
質性研究的紮根理論研究設計與結果
批改學位論文的甘苦談
讀e Learning 台師大劉渼
科学研究中的文献利用
Chapter5 the qualitative research methods
Psychology and Life – Chapter 1 Psychology and Life

Similar to Python 自然語言處理應用 - 3. 情緒分析篇 / Sentiment Analysis (20)

DOCX
課文
PPT
成功領袖養成術 -青創總會中區-詹翔霖教授-第2版
PDF
Cognitive work-analysis (Fidel, et al., 2004)
PPT
Writing
PPT
Writing
DOC
1215論文
PPT
100.00.00 主管職責與管理技巧 -全國球場-詹翔霖教授
PDF
批判性思維在農業科技資源運籌管理之應用
PPTX
從自然語言處理到文字探勘
PPTX
單元一:人力資源管理的基本概念 講義
PPTX
Tpd for primary supervisor
PDF
0301心理學史簡介
PPT
高等組織行為教學大綱
PDF
心理學家的可能性
PDF
质性研究中的数据处理20090922
PPTX
通識心理_1050302_2_心理學史簡介_楊政達
PPTX
0928心理學史簡介
KEY
9.12
KEY
9.12
KEY
9.12
課文
成功領袖養成術 -青創總會中區-詹翔霖教授-第2版
Cognitive work-analysis (Fidel, et al., 2004)
Writing
Writing
1215論文
100.00.00 主管職責與管理技巧 -全國球場-詹翔霖教授
批判性思維在農業科技資源運籌管理之應用
從自然語言處理到文字探勘
單元一:人力資源管理的基本概念 講義
Tpd for primary supervisor
0301心理學史簡介
高等組織行為教學大綱
心理學家的可能性
质性研究中的数据处理20090922
通識心理_1050302_2_心理學史簡介_楊政達
0928心理學史簡介
9.12
9.12
9.12
Ad

More from Yung-Ting Chen (20)

PPTX
RAG應用方案:Google NotebookLM / RAG Application Solutions: Google NotebookLM
PPTX
SeaSalt.AI簡介:SeaMeet、SeaChat - 2025.pptx
PDF
數位化與延展實境工作坊 - 淡江資訊週 - 2024 / Digitalization and Extended Reality Workshop: Ta...
PDF
孤獨 x 國考 x AI讀書會 - 2. AI備考篇(NotebookLM) - 淡江資圖 - 2024.pdf
PDF
孤獨 x 國考 x AI讀書會 - 2. AI備考篇(ChatGPT) - 淡江資圖 - 2024.pdf
PDF
孤獨 x 國考 x AI讀書會 - 1. 館員國考篇 - 淡江資圖 - 2024.pdf
PDF
Python 自然語言處理應用 - 2. 命名實體篇 - 2024 / Naming Entities Recognition
PDF
Python 自然語言處理應用 - 1. 環境配置篇 - 2024 / Environment Configuration
PDF
AI繪圖教學 x 教AI學習繪圖 - 5. 讓AI跟教學看齊 - 2024.pdf
PDF
AI繪圖教學 x 教AI學習繪圖 - 4. 以圖片AI繪圖 - 2024.pdf
PDF
AI繪圖教學 x 教AI學習繪圖 - 3. 教學的繪圖需求 - 2024.pdf
PDF
AI繪圖教學 x 教AI學習繪圖 - 2. 提示詞AI繪圖 - 2024.pdf
PDF
AI繪圖教學 x 教AI學習繪圖 - 1. 生成式AI繪圖 - 2024.pdf
PDF
大型語言模型在工業領域的潛力 - 4. 大型語言模型應用框架 / Frameworks for Large Language Model Applicat...
PDF
大型語言模型在工業領域的潛力 - 3. 檢索增強生成的實作 / Implementation of Retrieval-Augmented Generation
PDF
大型語言模型在工業領域的潛力 - 2. 大型語言模型的應用 / Applications of Large Language Models
PDF
大型語言模型在工業領域的潛力 - 1. 工業與聊天機器人 / Industry and Chatbots
PDF
RAG簡介:現況、原理、發展 / RAG Introduction: Current Status, Mechanisms, and Development
PDF
現代研究需要現代手段:用知識管理和AI輕鬆做研究! Part 2 - 南藝大 - 2024.pdf
PDF
現代研究需要現代手段:用知識管理和AI輕鬆做研究! Part 1 - 南藝大 - 2024.pdf
RAG應用方案:Google NotebookLM / RAG Application Solutions: Google NotebookLM
SeaSalt.AI簡介:SeaMeet、SeaChat - 2025.pptx
數位化與延展實境工作坊 - 淡江資訊週 - 2024 / Digitalization and Extended Reality Workshop: Ta...
孤獨 x 國考 x AI讀書會 - 2. AI備考篇(NotebookLM) - 淡江資圖 - 2024.pdf
孤獨 x 國考 x AI讀書會 - 2. AI備考篇(ChatGPT) - 淡江資圖 - 2024.pdf
孤獨 x 國考 x AI讀書會 - 1. 館員國考篇 - 淡江資圖 - 2024.pdf
Python 自然語言處理應用 - 2. 命名實體篇 - 2024 / Naming Entities Recognition
Python 自然語言處理應用 - 1. 環境配置篇 - 2024 / Environment Configuration
AI繪圖教學 x 教AI學習繪圖 - 5. 讓AI跟教學看齊 - 2024.pdf
AI繪圖教學 x 教AI學習繪圖 - 4. 以圖片AI繪圖 - 2024.pdf
AI繪圖教學 x 教AI學習繪圖 - 3. 教學的繪圖需求 - 2024.pdf
AI繪圖教學 x 教AI學習繪圖 - 2. 提示詞AI繪圖 - 2024.pdf
AI繪圖教學 x 教AI學習繪圖 - 1. 生成式AI繪圖 - 2024.pdf
大型語言模型在工業領域的潛力 - 4. 大型語言模型應用框架 / Frameworks for Large Language Model Applicat...
大型語言模型在工業領域的潛力 - 3. 檢索增強生成的實作 / Implementation of Retrieval-Augmented Generation
大型語言模型在工業領域的潛力 - 2. 大型語言模型的應用 / Applications of Large Language Models
大型語言模型在工業領域的潛力 - 1. 工業與聊天機器人 / Industry and Chatbots
RAG簡介:現況、原理、發展 / RAG Introduction: Current Status, Mechanisms, and Development
現代研究需要現代手段:用知識管理和AI輕鬆做研究! Part 2 - 南藝大 - 2024.pdf
現代研究需要現代手段:用知識管理和AI輕鬆做研究! Part 1 - 南藝大 - 2024.pdf
Ad

Python 自然語言處理應用 - 3. 情緒分析篇 / Sentiment Analysis