SlideShare a Scribd company logo
手把手 Python 資料分析
Terence Huang
自我介紹
學經歷
中山大學 理學博士 (2019/08 ~ )
緯創資通 高級工程師 (2015/03 ~ 2019/04)
長庚醫院 研究助理 (2013/09 ~2014/11)
中山大學 應數系統計碩士 (2011/09 ~ 2013/07)
高雄師大 數學系學士 (2005/09 ~ 2009/07)
獲獎
2017 台南智慧黑客松智慧醫療組第二名
2012 中山高大統計新秀
特殊經歷
訪問 MIT 的工程師 (2017/10 ~ 2018/10)
2019 MOPCON 議程委員
Kaohsiung.py Co-organizer
2
Terence Huang
Slideshare ID: Terence0408
Github ID: Terence0408
Gmail: Terence0408
Outline
3
環境建置
• Pure python 3
• Anaconda 3
jupyter notebook
• Colab
資料整理
• Numpy
• SQL
• Pandas
視覺化、分析
• Sklearn
• Gensim
• matplot
• plotly, …
基本操作
• list / dictionary
• for loop / while
if-else
try-except-finally
• 檔案存取 csv txt
物件存取
• Function
• 爬蟲
環境建置: python 3
• 安裝基本的 python 3
- 缺: 套件都要自行安裝、windows 下常常裝不起來
4
環境建置: Anaconda 3
• 安裝 Anaconda 3
5
環境建置: Colab
• 直接使用 colab 練習
- 優: 打開網頁就可以用,直接存在 google drive 上
- 小缺點:有些套件都要自行安裝
6
Outline
7
環境建置
• Pure python 3
• Anaconda 3
jupyter notebook
• Colab
資料整理
• Numpy
• SQL
• Pandas
視覺化、分析
• Sklearn
• Gensim
• matplot
• plotly, …
基本操作
• list / dictionary
• for loop / while
if-else
try-except-finally
• 檔案存取 csv txt
物件存取
• Function
• 爬蟲
基本操作: list
• https://github.com/Terence0408/Teach_code/blob/master/Basic_operation.ipynb
8
程式
Google: github Terence0408
點選 Teach_code
點選 Basic_operation.ipynb
投影片
Google: Slideshare Terence0408
基本操作: dictionary
• 為什麼存在 Key-Value 的格式
- 以大賣場的資料為例,用 csv 存起來
9
基本操作: dictionary
• 除了用空白、逗號分開的 txt, csv, … 之外
• 還有 Key-Value 的存法
10
firstName lastName
Anna Clayton
Alex Clayton
Excel
套件運用: 爬蟲
• Selenium
11
套件運用: 爬蟲
• Selenium
12
Outline
13
環境建置
• Pure python 3
• Anaconda 3
jupyter notebook
• Colab
資料整理
• Numpy
• SQL
• Pandas
視覺化、分析
• Sklearn
• Gensim
• matplot
• plotly, …
基本操作
• list / dictionary
• for loop / while
if-else
try-except-finally
• 檔案存取 csv txt
物件存取
• Function
• 爬蟲
下次上課前
• 安裝
- PostgreSQL
- pgAdmin
• 帳號: postgres
• 密碼: postgres
• 預習
- SQL 語言簡介 p8 - p18
14
Q&A
Thanks for your attention!
15

More Related Content

PPTX
從統計到資料科學
PDF
python 實戰資料科學工作坊
PDF
參考講義展示版-丘祐瑋-20170617-機器學習python入門者課程
PPTX
一名女科技人的反思
PPTX
洞見未來,用python 與 r 結合深度學習技術預測趨勢
PDF
電影期末簡報
PDF
無中生有 - 利用外部數據打造新商業模式
PDF
Power BI x R
從統計到資料科學
python 實戰資料科學工作坊
參考講義展示版-丘祐瑋-20170617-機器學習python入門者課程
一名女科技人的反思
洞見未來,用python 與 r 結合深度學習技術預測趨勢
電影期末簡報
無中生有 - 利用外部數據打造新商業模式
Power BI x R

What's hot (18)

PPTX
資料科學導論 (simple)
PDF
6 cite space对google scholar数据的分析
PPTX
從人工智慧反思教育現場
PDF
2016台灣資料科學年會開場投影片
PDF
Talk to data science in 10 minutes
PDF
網頁爬蟲入門 Python web crawler at 淡江大學 20170930
PDF
The Data Science Program 讓公共服務變聰明的《資料科學計畫》 (蔣居裕)
PPTX
第四名 4th H3C AI Institute
PDF
【人工智慧學校】2019/11/22 AI 與特徵工程:PM觀點(彭其捷)
PDF
A brief introduction to Machine Learning
PDF
20170430 python爬蟲攻防戰-攻防與金融大數據分析班
PDF
2019/10/27 創造力年會|用設計思考,讓團隊更有創造力|彭其捷
PDF
林峰正/智慧型工程管考系統 : 資料分析經驗談
PPTX
【D4SG】新竹縣環保局-便利資訊看板(雛形)
PDF
資料科學計劃的成果與展望
PPTX
第六名 6th Aurora
PDF
資料科學推廣教育的實踐
PDF
劉正山/世代之爭爭什麼 ? 談談如何從調查資料挖掘出豐厚的意義
資料科學導論 (simple)
6 cite space对google scholar数据的分析
從人工智慧反思教育現場
2016台灣資料科學年會開場投影片
Talk to data science in 10 minutes
網頁爬蟲入門 Python web crawler at 淡江大學 20170930
The Data Science Program 讓公共服務變聰明的《資料科學計畫》 (蔣居裕)
第四名 4th H3C AI Institute
【人工智慧學校】2019/11/22 AI 與特徵工程:PM觀點(彭其捷)
A brief introduction to Machine Learning
20170430 python爬蟲攻防戰-攻防與金融大數據分析班
2019/10/27 創造力年會|用設計思考,讓團隊更有創造力|彭其捷
林峰正/智慧型工程管考系統 : 資料分析經驗談
【D4SG】新竹縣環保局-便利資訊看板(雛形)
資料科學計劃的成果與展望
第六名 6th Aurora
資料科學推廣教育的實踐
劉正山/世代之爭爭什麼 ? 談談如何從調查資料挖掘出豐厚的意義
Ad

Similar to # 手把手 Python 資料分析 I (20)

PDF
Python introduction and data visualization publish
PPTX
ee2022-ist-xietao.pptx
PDF
硅谷的那点事儿
PDF
Laiyao resume
PDF
PPTX
What is data engineer?資料工程師是什麼?
PPTX
2019_5_21 東吳大學經濟系演講(數據分析的前世今生)彭其捷
PDF
AI智慧服務推動經驗分享
PDF
Report 106553012 - copy
PDF
資料科學的第一堂課 Data Science Orientation
PDF
AI智慧山羊飼養管理.pdf
PDF
2023 台科大設計系 高中新生說明會
PPT
第1章-大数据概述.pptBigdataBigdataBigdataBigdata
PDF
4 cite space中节点选择的新方法-g-index
PDF
【天津大学 软件工程】刘洋—简历
PPT
10-17-2008-intro of orientation
PPTX
中原資管系|資管人的數位素養|彭其捷
DOC
數位科技與公民參與 - 科技與社會跨領域教學計畫
DOC
數位科技與公民參與 - 科技與社會跨領域教學計畫
PDF
Python 自然語言處理應用 - 1. 環境配置篇 - 2024 / Environment Configuration
Python introduction and data visualization publish
ee2022-ist-xietao.pptx
硅谷的那点事儿
Laiyao resume
What is data engineer?資料工程師是什麼?
2019_5_21 東吳大學經濟系演講(數據分析的前世今生)彭其捷
AI智慧服務推動經驗分享
Report 106553012 - copy
資料科學的第一堂課 Data Science Orientation
AI智慧山羊飼養管理.pdf
2023 台科大設計系 高中新生說明會
第1章-大数据概述.pptBigdataBigdataBigdataBigdata
4 cite space中节点选择的新方法-g-index
【天津大学 软件工程】刘洋—简历
10-17-2008-intro of orientation
中原資管系|資管人的數位素養|彭其捷
數位科技與公民參與 - 科技與社會跨領域教學計畫
數位科技與公民參與 - 科技與社會跨領域教學計畫
Python 自然語言處理應用 - 1. 環境配置篇 - 2024 / Environment Configuration
Ad

More from Terence Huang (8)

PPTX
# Can we trust ai. the dilemma of model adjustment
PPTX
# From statistics to ai
PPTX
#02 Next RNN
PPTX
Deep Learning Advance: # Capsule net
PPTX
Deep Learning Advance: #01 Domain Adaptation
PPTX
Deep Learning Basic: #01 start from CNN
PPTX
文字分析 Python 入門
PPTX
SQL 語言簡介
# Can we trust ai. the dilemma of model adjustment
# From statistics to ai
#02 Next RNN
Deep Learning Advance: # Capsule net
Deep Learning Advance: #01 Domain Adaptation
Deep Learning Basic: #01 start from CNN
文字分析 Python 入門
SQL 語言簡介

# 手把手 Python 資料分析 I