SlideShare a Scribd company logo
Data
Science
Fundamental
Johannes Christian
Johannes Christian
Teknik Informatika
Data Science
Data Analyst
Classification
Computer Vision
Forecasting
Supply Chain Optimization
Data Scientist
Credit Scoring
Target Marketing
Regional Scoring
Classification
2018 - 2022 2021 - 2022 2022 - Present
Data Science Data Science Data Science Data Science Data Science
Marketing Method Conversion Rate
Data Pipeline 17%
Social Media 13%
Billboard 8%
Data Science Data Science Data Science Data Science Data Science
Apa yang ada di pikiran kalian ketika mendengar…
“Data Science”
Data Science
● Apa itu data science ?
● Bagaimana flow data science di dunia industri ?
● Tools yang digunakan dalam data science ?
POIN
PEMBAHASAN
1
Python
● Introduction to Python
● Hands on - Google Collaboratory
2
What is
Data Science ??
Introduction to Data Science
Data Science
Berdasarkan bisnis, data science adalah Ilmu yang mempelajari data untuk menghasilkan
insights business dan membuat keputusan bisnis lebih baik (Better Decision Making).
“Data is the New Oil”
But data without analytics, insights, and
wisdom, is like an oil field without a pump.
Invest in people, systems, and strategies
that connect the dots.
Nasabah Perbankan yang tidak aktif bertransaksi dalam 6 bulan
terakhir memiliki kecenderungan tidak mampu membayar
pinjaman hingga lunas jika ajuan pinjamannya di setujui.
Pekerjaan Data Science
Pada Grocery Store kita, Customer yang metode
pembayarannya menggunakan e-wallet, debit atau credit card
memiliki potensi berbelanja 15% lebih banyak dibandingkan
menggunakan Cash.
Pekerjaan Data Science (Basic)
Classification
Membangun model machine learning yang mampu
menentukan apakah ajuan pinjaman calon debitur
diterima/ditolak.
Hasil dari model tersebut berupa score.
SCORE
Transaction History
Customer Data
Pekerjaan Data Science (Basic)
Menentukan apakah pelanggan internet provider akan mengganti provider atau tidak
Mendeteksi lebih dini apakah suatu karyawan akan resign atau tidak
Mendeteksi apakah seorang pasien menderita penyakit kanker
Classification
Memprediksi Harga Rumah atau Harga Mobil
Menentukan Jumlah uang yang akan ditarik (Cash Out) pada suatu ATM
Mengelompokkan wilayah indonesia menjadi beberapa kelompok potensial (Business)
Melakukan segmentasi customer kedalam beberapa segment
Regression
Forecasting
Clustering
Pekerjaan Data Science (Advanced)
Face Recognition Text Summarization (NLP) Mobility Analysis
Geospatial Indexing Product Recommendation
Data Science Skills
Data Science Skills
Why Data Science?
User Acquisition?
Why Data Science?
Loan Interest Index
Jumlah Peminjam
Total Pinjaman yang tersalurkan
Demografi (Kabupaten/Kota)
Business and Economic Index
Jumlah UMKM
PDB Wilayah
etc
Why Data Science?
Loan Interest Index
Loan Interest Index merupakan skor yang menunjukkan
ketertarikan suatu wilayah terhadap produk pinjaman
perusahaan kita.
Business and Economics Index
Business and Economics Index merupakan skor yang
menunjukkan tingkat aktivitas bisnis dan perekonomian
suatu wilayah.
Note: Data yang digunakan merupakan data dummy
Why Data Science?
Note: Data yang digunakan merupakan data dummy
Loan Interest Index
Business and
Economics Index
MACHINE
LEARNING
Loan Interest Index
Business
and
Economic
Index
BEST
OCEAN
UNPRODUCTIVE Narrow
Clustering
Why Data Science?
Note: Data yang digunakan merupakan data dummy
USER ACQUISITION
Untuk Akuisisi User Baru
maka region terbaik berada
pada Cluster BEST dan
OCEAN
Framework Data Science
IBM Framework Paper
Identify and Analyze the Business Problem
Collect (Big) Data
Join and Store Data
Data Exploration and Transformation
Data Preparation
Analytics
Data Science Flow
Take
Biz
Decision
Who are most likely
to buy our
products?
Business Team
Data Engineer Data Scientist
Data Science Hierarchy
Data Roles
Data Science is not only about Machine Learning
Gartner Analytic Ascending Data Science
Apa itu
Machine
Learning?
What is machine learning?
Business Needs
Team Business memberikan kebutuhan bisnis
kepada team data untuk mengidentifikasi
transaksi kartu kredit yang terdeteksi
FRAUD sebelum berdampak
buruk kepada perusahaan
What is machine learning?
Classical Programming Approach
Detection
Transaction History
Rules
Problems:
● Programmer harus menerapkan rule kepada system secara manual
● Kasus Fraud yang terjadi hampir tidak bisa dideteksi (Complex Rule)
● Setiap rule yang ditambahkan memperlambat proses deteksi
What is machine learning?
Classical Programming Approach
Detection
Transaction History
Rules
Machine Learning Approach
Model
Transaction History
Customer Data
Most Recent
Transaction Detection
What is machine learning?
Classical Programming Approach
Rules Mutlak
What is machine learning?
Machine Learning Approach
Data
What is machine learning?
Machine Learning Approach
Model
Transaction History
Customer Data
Most Recent
Transaction Detection
Advantage Using Machine Learning:
● Mencari Pola dan Mendefinisikan Rules berdasarkan Data tanpa bantuan manusia
● Mampu beradaptasi terhadap kasus - kasus fraud terbaru
● Model yang dibuat tidak memerlukan waktu komputasi yang lama (Prediksi lebih cepat)
Start
What is machine learning?
Classical Programming Approach
Rule
Based
Transaction History
Rules
New
Transaction
Fraud Not Fraud
Machine Learning Approach
Model
Transaction History
Customer Data
Most Recent
Transaction
Fraud Not Fraud
Start
New
Transaction
What is machine learning?
Labeled Data
Direct Feedback
Predict Outcome / Future
Continues Decision Process
Reward Based Learning
Learn Serief of Action
No Labels
No Feedback
Find Hidden Structure
How about Deep Learning?
Introduction
to Python
Machine Learning Tools
Development Language Framework
Why Python?
Advantage Using Python:
● Memiliki dukungan yang lebih baik untuk pengembangan aplikasi
● Memiliki banyak library untuk pengolahan data dan analisis statistik
(Open Source)
● Lebih populer dan banyak digunakan (Collaborative)
● Lebih cepat dalam eksekusi kode pada beberapa kasus, terutama pada
pengolahan data yang besar
Jupyter Notebook
Introduction
to Python
(Hands On)
Thank you

More Related Content

PDF
ALGORITMA DATA SIENCE GABUNGAN PERTEMUAN SATU SAMPAI PERTEMUAN TUJUH.pdf
PPTX
Big data.pptx
PDF
Kelompok 1_PPT Dasar Dasar Data Science Startup Business NEW FILE.pdf
PDF
Berkenalan Dengan Data Science dan Machine Learning
PDF
LPR Week 1-KEMASTURA Group-2023.Data Analytics
PDF
093-P01.pdf
PPTX
Data Science_Neo Data.pptx
PDF
Preparing_talent_for_Data_Driven_Industry_Nur_Andriansyah_-_2022.pdf
ALGORITMA DATA SIENCE GABUNGAN PERTEMUAN SATU SAMPAI PERTEMUAN TUJUH.pdf
Big data.pptx
Kelompok 1_PPT Dasar Dasar Data Science Startup Business NEW FILE.pdf
Berkenalan Dengan Data Science dan Machine Learning
LPR Week 1-KEMASTURA Group-2023.Data Analytics
093-P01.pdf
Data Science_Neo Data.pptx
Preparing_talent_for_Data_Driven_Industry_Nur_Andriansyah_-_2022.pdf

Recently uploaded (17)

PPTX
ANALISIS DATA FUNGSI INFORMATIKA SMP.pptx
DOCX
PROPOSAL PENGARUH PEMBERIAN MIKRONUTRIEN TERHADAP PENINGKATAN INDEKS MASA TUB...
PPT
Modul-Projek-JAJANAN-PASAR-YANG-MENGHASILKAN-RUPIAH-Fase-C.ppt
PPTX
Pelatihan_Model_Pembinaan_Gen_Z_Dasar_Menengah.pptx
PPTX
Materi Kesiapan Tahapan Pemungutan dan Penghitungan Suara Pemilihan Ulang Tah...
PDF
811848831-PPT-TES-DESKRIPShhhhhhhhhI.pdf
PPTX
Introduction FastAPI for Professional and Student
PPTX
EFEKTIVITAS EKSTRAK DAUN INDIGOFERA.pptx
PDF
c3oYi7NNpW3omVenymVtXLtqfSi2hzugUlVYbGlQ.pdf
PDF
GERUDUK MJKN aplikasi mobile JKN persentation
DOCX
proposal nurul 2.docx Fix dokumen yang penting
PDF
6754aa176b39b (1).pdf data analisis acara
PPTX
Flowchart Pengaplikasian Sistem Arduino.pptx
PPTX
PERENCANAAN MEP PERUM.MULTI CIPTA PERMAI_Type 36.pptx
PDF
LK - SIMULASI SIKLUS INKUIRI KOLABORATIF.pdf
PPTX
Gagal Ginjal Akut GHINA SELVIRA .pptx
PPTX
PRESNTASI pembangunan perumahan komersil dua lantai
ANALISIS DATA FUNGSI INFORMATIKA SMP.pptx
PROPOSAL PENGARUH PEMBERIAN MIKRONUTRIEN TERHADAP PENINGKATAN INDEKS MASA TUB...
Modul-Projek-JAJANAN-PASAR-YANG-MENGHASILKAN-RUPIAH-Fase-C.ppt
Pelatihan_Model_Pembinaan_Gen_Z_Dasar_Menengah.pptx
Materi Kesiapan Tahapan Pemungutan dan Penghitungan Suara Pemilihan Ulang Tah...
811848831-PPT-TES-DESKRIPShhhhhhhhhI.pdf
Introduction FastAPI for Professional and Student
EFEKTIVITAS EKSTRAK DAUN INDIGOFERA.pptx
c3oYi7NNpW3omVenymVtXLtqfSi2hzugUlVYbGlQ.pdf
GERUDUK MJKN aplikasi mobile JKN persentation
proposal nurul 2.docx Fix dokumen yang penting
6754aa176b39b (1).pdf data analisis acara
Flowchart Pengaplikasian Sistem Arduino.pptx
PERENCANAAN MEP PERUM.MULTI CIPTA PERMAI_Type 36.pptx
LK - SIMULASI SIKLUS INKUIRI KOLABORATIF.pdf
Gagal Ginjal Akut GHINA SELVIRA .pptx
PRESNTASI pembangunan perumahan komersil dua lantai

Data Science Data Science Data Science Data Science Data Science

  • 2. Johannes Christian Teknik Informatika Data Science Data Analyst Classification Computer Vision Forecasting Supply Chain Optimization Data Scientist Credit Scoring Target Marketing Regional Scoring Classification 2018 - 2022 2021 - 2022 2022 - Present
  • 4. Marketing Method Conversion Rate Data Pipeline 17% Social Media 13% Billboard 8%
  • 6. Apa yang ada di pikiran kalian ketika mendengar… “Data Science”
  • 7. Data Science ● Apa itu data science ? ● Bagaimana flow data science di dunia industri ? ● Tools yang digunakan dalam data science ? POIN PEMBAHASAN 1 Python ● Introduction to Python ● Hands on - Google Collaboratory 2
  • 8. What is Data Science ?? Introduction to Data Science
  • 9. Data Science Berdasarkan bisnis, data science adalah Ilmu yang mempelajari data untuk menghasilkan insights business dan membuat keputusan bisnis lebih baik (Better Decision Making). “Data is the New Oil” But data without analytics, insights, and wisdom, is like an oil field without a pump. Invest in people, systems, and strategies that connect the dots.
  • 10. Nasabah Perbankan yang tidak aktif bertransaksi dalam 6 bulan terakhir memiliki kecenderungan tidak mampu membayar pinjaman hingga lunas jika ajuan pinjamannya di setujui. Pekerjaan Data Science Pada Grocery Store kita, Customer yang metode pembayarannya menggunakan e-wallet, debit atau credit card memiliki potensi berbelanja 15% lebih banyak dibandingkan menggunakan Cash.
  • 11. Pekerjaan Data Science (Basic) Classification Membangun model machine learning yang mampu menentukan apakah ajuan pinjaman calon debitur diterima/ditolak. Hasil dari model tersebut berupa score. SCORE Transaction History Customer Data
  • 12. Pekerjaan Data Science (Basic) Menentukan apakah pelanggan internet provider akan mengganti provider atau tidak Mendeteksi lebih dini apakah suatu karyawan akan resign atau tidak Mendeteksi apakah seorang pasien menderita penyakit kanker Classification Memprediksi Harga Rumah atau Harga Mobil Menentukan Jumlah uang yang akan ditarik (Cash Out) pada suatu ATM Mengelompokkan wilayah indonesia menjadi beberapa kelompok potensial (Business) Melakukan segmentasi customer kedalam beberapa segment Regression Forecasting Clustering
  • 13. Pekerjaan Data Science (Advanced) Face Recognition Text Summarization (NLP) Mobility Analysis Geospatial Indexing Product Recommendation
  • 16. Why Data Science? User Acquisition?
  • 17. Why Data Science? Loan Interest Index Jumlah Peminjam Total Pinjaman yang tersalurkan Demografi (Kabupaten/Kota) Business and Economic Index Jumlah UMKM PDB Wilayah etc
  • 18. Why Data Science? Loan Interest Index Loan Interest Index merupakan skor yang menunjukkan ketertarikan suatu wilayah terhadap produk pinjaman perusahaan kita. Business and Economics Index Business and Economics Index merupakan skor yang menunjukkan tingkat aktivitas bisnis dan perekonomian suatu wilayah. Note: Data yang digunakan merupakan data dummy
  • 19. Why Data Science? Note: Data yang digunakan merupakan data dummy Loan Interest Index Business and Economics Index MACHINE LEARNING Loan Interest Index Business and Economic Index BEST OCEAN UNPRODUCTIVE Narrow Clustering
  • 20. Why Data Science? Note: Data yang digunakan merupakan data dummy USER ACQUISITION Untuk Akuisisi User Baru maka region terbaik berada pada Cluster BEST dan OCEAN
  • 21. Framework Data Science IBM Framework Paper
  • 22. Identify and Analyze the Business Problem Collect (Big) Data Join and Store Data Data Exploration and Transformation Data Preparation Analytics Data Science Flow Take Biz Decision Who are most likely to buy our products? Business Team Data Engineer Data Scientist
  • 25. Data Science is not only about Machine Learning
  • 28. What is machine learning? Business Needs Team Business memberikan kebutuhan bisnis kepada team data untuk mengidentifikasi transaksi kartu kredit yang terdeteksi FRAUD sebelum berdampak buruk kepada perusahaan
  • 29. What is machine learning? Classical Programming Approach Detection Transaction History Rules Problems: ● Programmer harus menerapkan rule kepada system secara manual ● Kasus Fraud yang terjadi hampir tidak bisa dideteksi (Complex Rule) ● Setiap rule yang ditambahkan memperlambat proses deteksi
  • 30. What is machine learning? Classical Programming Approach Detection Transaction History Rules Machine Learning Approach Model Transaction History Customer Data Most Recent Transaction Detection
  • 31. What is machine learning? Classical Programming Approach Rules Mutlak
  • 32. What is machine learning? Machine Learning Approach Data
  • 33. What is machine learning? Machine Learning Approach Model Transaction History Customer Data Most Recent Transaction Detection Advantage Using Machine Learning: ● Mencari Pola dan Mendefinisikan Rules berdasarkan Data tanpa bantuan manusia ● Mampu beradaptasi terhadap kasus - kasus fraud terbaru ● Model yang dibuat tidak memerlukan waktu komputasi yang lama (Prediksi lebih cepat)
  • 34. Start What is machine learning? Classical Programming Approach Rule Based Transaction History Rules New Transaction Fraud Not Fraud Machine Learning Approach Model Transaction History Customer Data Most Recent Transaction Fraud Not Fraud Start New Transaction
  • 35. What is machine learning? Labeled Data Direct Feedback Predict Outcome / Future Continues Decision Process Reward Based Learning Learn Serief of Action No Labels No Feedback Find Hidden Structure
  • 36. How about Deep Learning?
  • 39. Why Python? Advantage Using Python: ● Memiliki dukungan yang lebih baik untuk pengembangan aplikasi ● Memiliki banyak library untuk pengolahan data dan analisis statistik (Open Source) ● Lebih populer dan banyak digunakan (Collaborative) ● Lebih cepat dalam eksekusi kode pada beberapa kasus, terutama pada pengolahan data yang besar