SlideShare a Scribd company logo
DATA MINING (IF 0407029)
Sesi 1 – 13 September 2022
Problem ledakan data
Tool koleksi data otomatis dan perkembangan teknologi
database menyebabkan banyak sekali data yang bisa
dikumpulkan didalam database, data warehouse, dan alat
penyimpanan informasi lainnya, untuk dianalisis
Kita punya banyak data tapi tidak tahu pengetahuan
yang tersimpan di dalamnya!
Solusi: Penggudangan data dan penambangan data (Data
warehousing and data mining)
Data warehousing dan on-line analytical processing
(OLAP)
Penyaringan pengetahuan yang menarik (kaidah, keberaturan,
pola, kendala) dari data dalam database yang besar
Evolusi atau Perkembangan Teknologi
Database
1960an Koleksi data, pembuatan data, IMS dan network
DBMS
1970an Model data relasional dan implementasi DBMS
relasional
1980an RDBMS, model data lanjut (extended- relational, OO,
deduktif, dsb.) DBMS berorientasi aplikasi(spasial, saintifik,
teknik, dsb.)
1990an - 2000an Data mining dan data warehousing,
database multimedia, teknologi Web
Perolehan pengetahuan dari data
“Ekstraksi informasi atau pola yang menarik (tidak
sepele, implisit, tak diketahui sebelumnya, mungkin
bermanfaat) dari data didalam database yang besar"
Penyelidikan: analisa data semi-otomatis atas
sekumpulan data yang besar
DATA MINING
DATA MINING
Istilah yang agak baku:
Data mining
Biasanya DM adalah salah satu proses KDD
Knowledge discovery in databases (KDD)
Istilah umum yang meliputi, preprocessing data, DM, dan postprocessing
Istilah yang jarang digunakan:
Ekstraksi pengetahuan, analisa data/pola
Publisitas terbaru:
Kecerdasan bisnis (business intelligence), manajemen pengetahuan
(knowledge management)
Ketersediaan data dalam jumlah yang sangat besar:
Tool koleksi data otomatis dan perkembangan teknologi database
menyebabkan banyak sekali data yang bisa dikumpulkan di dalam
database, data warehouse, dan alat peyimpanan informasi lainnya
Pemeriksaan data manual adalah membosankan dan terkadang tidak
masuk akal
MENGAPA DATA MINING?
Database
Marketing
Data
Warehousing
KDD &
Data Mining
Meningkatkan pengetahuan agar bisa
membuat keputusan berdasarkan:
Misal, pengaruh pada marketing
Peran dan pengaruh DM yang
bertumbuh pesat dan masih bertumbuh!
Tetapi DM tidaklah sekedar marketing...
marketing
MANFAAT DATA MINING?
Analisis database dan dukungan keputusan:
Analisis dan manajemen pasar
Target pasar, manajemen relasi customer (CRM), analisis
keranjang belanja, penjualan silang, segmentasi pasar
Analisis dan manajemen resiko
Peramalan, tindakan mempertahankan customer,
peningkatan asuransi, kontrol kualitas, analisis kompetitif
Potensi Aplikasi
• Dari mana data berasal?
Transaksi kartu kredit, loyalty cards, kupon discount, keluhan customer,
kajian lifestyle publik
• Target Pasar
Mendapatkan kelompok model customer yang berbagi karakteristik
yang sama: minat, tingkat pendapatan, kebiasaan belanja, dsb.
Menentukan pola pembelian customer berdasarkan waktu
• Analisis lintas pasar
Asosiasi/korelasi antara penjualan produk & taksiran berdasarkan asosiasi
demikian
Analisis dan Manajemen Pasar
• Profil customer
Tipe customer apa membeli produk apa (pengelompokan atau
klasifikasi)
• Analisa kebutuhan customer
Mengenali produk terbaik untuk customer berbeda
Meramalkan faktor apa yang akan memikat customer baru
• Penyediaan rangkuman informasi
Rangkuman laporan multidimensi
Rangkuman informasi statistik (kecenderungan data terpusat dan variasi)
Analisis dan Manajemen Pasar
• Perencanaan keuangan dan evaluasi aset
–Analisis dan peramalan cash flow
–Analisis ganti rugi yang mungkin untuk
mengevaluasi aset
–Analisis cross-sectional dan time series (financial- ratio,
analisa trend, dsb.)
• Perencanaan sumberdaya
Merangkum dan membandingkan sumberdaya dan pengeluaran
Analisis dan Manajemen Resiko Perusahaan
Analisis dan Manajemen Resiko Perusahaan
• Kompetisi
– Memantau pesaing dan arah pasar
– Mengelompokkan customer kedalam kelas dan prosedur
harga berbasis kelas
– Menetapkan strategi harga dalam suatu pasar dengan
kompetitif tinggi
Anda seorang petugas asuransi dan anda harus
mendefinisikan suatu pembayaran bulanan yang
pantas untuk seorang pemuda berusia 18 tahun
yang membeli sebuah Ferrari … apa yang anda
akan lakukan?
CONTOH CASE DATA MINING?
CONTOH CASE DATA MINING?
• Kaji seluruh data customer dan data kompensasi pembayaran
sebelumnya
• Kaji peluang penyebab kecelakaan paling banyak berdasarkan
dugaan…
– Jenis Kelamin pengendara (pria/wanita) dan usia
– Model dan usia mobil, tempat tinggal
– dsb.
• Jika peluang kecelakaan lebih besar dari rata-rata, aturlah
pembayaran bulanan yang sesuai!
Data Mining Intro Universitas Muhammadiyah Jakarta
Data Mining Intro Universitas Muhammadiyah Jakarta
1. Skalabilitas, penyimpanan dari data biasanya memakan kapasitas yang besar, singkatnya
semakin banyak data yang disimpan maka akan semakin besar juga kapasitas yang
diperlukan.
2. Ketidaktersedianya data atau akses terhadap data yang sulit, anggap saja kalian mau
mencari suatu data rahasia yang hanya dipegang oleh agen-agen CIA atau bahkan MI6
seperti yang ada di film James Bond, tentu sulit bukan?
3. Kualitas data yang kurang baik, apabila kalian disuruh untuk melakukan "Mining" terhadap
suatu hal dan harus disediakan dalam bentuk video 4K HD atau 720p, namun sayangnya
data yang kalian dapat merupakan video yang kualitas nya seperti gambar pada perang
dunia ke 2.
4. Biaya yang mahal sampai ke perawatannya, bayangkan kalian disuruh mencari data dan
harus menyimpannya tetapi data tersebut memiliki ukuran sampai 100 Terabyte! Tentu nya
dibutuhkan Hard disk yang kapasitas penyimpanan nya sangat besar.5. Data yang heterogen
& kompleks, contoh kumpulan hal web yg terdiri atas teks yg semi terstruktur dan banyak
terdapat link.
MASALAH UMUM DATA MINING?
PROSES DATA MINING - KDD
Peningkatan potensi
untuk mendukung
keputusan bisnis End User
Business
Analyst
Data
Analyst
DBA
Pembuatan
keputusan
Penyajian Data
Teknik Visualisasi
Data Mining
Penemuan informasi
Eksplorasi data
Analisa statistik, query, dan pelaporan
Data Warehouses / Data Marts
OLAP, MDA
Sumber data
Kertas, Files, Penyedia informasi, Sistem database, OLTP
PROSES DATA MINING - DSS
Data
• Data customer
• Simpanan data
• Data grafis
• Data geografis
Informasi
• X tinggal di Z
• S berumur Y tahun
• X dan S pindah
• W punya uang di Z
Keputusan
• Promosikan produk A di Z.
• Kirim iklan ke keluarga dengan
profil P
• Jual silang layanan B ke klien
C
Pengetahuan
• Sebanyak Y produk A
digunakan
di Z
• Customer dari kelas Y
menggunakan
x% dari C selama periode D
VALUE CHAIN
TUGAS !!

More Related Content

PPT
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
PPTX
P1 data mining
PDF
15015 2 konsep dasar data mining
PPTX
Pengantar Big Data dan Data Mining.pptx
PPT
Pengantar_Data_Mining.ppt
PPT
Pengantar_Data_Mining.ppt
PPT
Pengantar dan Konsep dalam Data Mining.ppt
PPT
Pengantar_Data_Mining.ppt
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
P1 data mining
15015 2 konsep dasar data mining
Pengantar Big Data dan Data Mining.pptx
Pengantar_Data_Mining.ppt
Pengantar_Data_Mining.ppt
Pengantar dan Konsep dalam Data Mining.ppt
Pengantar_Data_Mining.ppt

Similar to Data Mining Intro Universitas Muhammadiyah Jakarta (20)

PPT
data mining untuk algoritma knn dengan studi kasus
PPT
sdfs kguatan dokumenet kguatan dokumenet
PPT
PPT Pengantar Data Mining Pertemuan 2 .ppt
PDF
Pertemuan 1 Pengantar DW
PPT
Data mining week 1 - pengantar data mining
PDF
Yudho datamining
PPTX
1 - Analisis Dengan Data Mining-perkuliahan sistem informasi.pptx
PPT
Pengantar Materi Data Mining di Era Digital.ppt
PPTX
DATABASE AND CUSTOMER DATA DEVELOPMENT
PPTX
Kecerdasan bisnis- Sistem Penunjang Keputusan
PPT
pertemuan 1(ELA)rev.ppt
PPT
data-mining- for business intelligent.ppt
PPT
BAB_5_Data_Mining.ppt
PPTX
PENGANTAR DAN PENDAHULUAN MATA KULIAH DATA MINING
PPTX
1 data mining-dm2016
PPTX
Data-Mining-Pertemuan-perkuliahan sistem informasi.pptx
PPTX
Sekilas Tentang Data Mining
PDF
2. Pengantar Data Mining
PPTX
minggu ke 5 data mining dan kdd oke sipp
PPTX
Kecerdasan bisnis
data mining untuk algoritma knn dengan studi kasus
sdfs kguatan dokumenet kguatan dokumenet
PPT Pengantar Data Mining Pertemuan 2 .ppt
Pertemuan 1 Pengantar DW
Data mining week 1 - pengantar data mining
Yudho datamining
1 - Analisis Dengan Data Mining-perkuliahan sistem informasi.pptx
Pengantar Materi Data Mining di Era Digital.ppt
DATABASE AND CUSTOMER DATA DEVELOPMENT
Kecerdasan bisnis- Sistem Penunjang Keputusan
pertemuan 1(ELA)rev.ppt
data-mining- for business intelligent.ppt
BAB_5_Data_Mining.ppt
PENGANTAR DAN PENDAHULUAN MATA KULIAH DATA MINING
1 data mining-dm2016
Data-Mining-Pertemuan-perkuliahan sistem informasi.pptx
Sekilas Tentang Data Mining
2. Pengantar Data Mining
minggu ke 5 data mining dan kdd oke sipp
Kecerdasan bisnis
Ad

Recently uploaded (11)

PDF
GERUDUK MJKN aplikasi mobile JKN persentation
PPTX
Introduction FastAPI for Professional and Student
PDF
6754aa176b39b (1).pdf data analisis acara
PPTX
Gagal Ginjal Akut GHINA SELVIRA .pptx
PPTX
Dokter):6:’syaksudysnnwysydyejeushx bshske ueie
PPTX
Paper sirosis hepatis dr siti taqwa.jdusp
PDF
Llama Implementations from Scratch - Avalon AI.pdf
PDF
LK - SIMULASI SIKLUS INKUIRI KOLABORATIF.pdf
PPTX
PRESNTASI pembangunan perumahan komersil dua lantai
PPTX
EFEKTIVITAS EKSTRAK DAUN INDIGOFERA.pptx
PPTX
Flowchart Pengaplikasian Sistem Arduino.pptx
GERUDUK MJKN aplikasi mobile JKN persentation
Introduction FastAPI for Professional and Student
6754aa176b39b (1).pdf data analisis acara
Gagal Ginjal Akut GHINA SELVIRA .pptx
Dokter):6:’syaksudysnnwysydyejeushx bshske ueie
Paper sirosis hepatis dr siti taqwa.jdusp
Llama Implementations from Scratch - Avalon AI.pdf
LK - SIMULASI SIKLUS INKUIRI KOLABORATIF.pdf
PRESNTASI pembangunan perumahan komersil dua lantai
EFEKTIVITAS EKSTRAK DAUN INDIGOFERA.pptx
Flowchart Pengaplikasian Sistem Arduino.pptx
Ad

Data Mining Intro Universitas Muhammadiyah Jakarta

  • 1. DATA MINING (IF 0407029) Sesi 1 – 13 September 2022
  • 2. Problem ledakan data Tool koleksi data otomatis dan perkembangan teknologi database menyebabkan banyak sekali data yang bisa dikumpulkan didalam database, data warehouse, dan alat penyimpanan informasi lainnya, untuk dianalisis Kita punya banyak data tapi tidak tahu pengetahuan yang tersimpan di dalamnya!
  • 3. Solusi: Penggudangan data dan penambangan data (Data warehousing and data mining) Data warehousing dan on-line analytical processing (OLAP) Penyaringan pengetahuan yang menarik (kaidah, keberaturan, pola, kendala) dari data dalam database yang besar
  • 4. Evolusi atau Perkembangan Teknologi Database 1960an Koleksi data, pembuatan data, IMS dan network DBMS 1970an Model data relasional dan implementasi DBMS relasional 1980an RDBMS, model data lanjut (extended- relational, OO, deduktif, dsb.) DBMS berorientasi aplikasi(spasial, saintifik, teknik, dsb.) 1990an - 2000an Data mining dan data warehousing, database multimedia, teknologi Web
  • 5. Perolehan pengetahuan dari data “Ekstraksi informasi atau pola yang menarik (tidak sepele, implisit, tak diketahui sebelumnya, mungkin bermanfaat) dari data didalam database yang besar" Penyelidikan: analisa data semi-otomatis atas sekumpulan data yang besar DATA MINING
  • 6. DATA MINING Istilah yang agak baku: Data mining Biasanya DM adalah salah satu proses KDD Knowledge discovery in databases (KDD) Istilah umum yang meliputi, preprocessing data, DM, dan postprocessing Istilah yang jarang digunakan: Ekstraksi pengetahuan, analisa data/pola Publisitas terbaru: Kecerdasan bisnis (business intelligence), manajemen pengetahuan (knowledge management)
  • 7. Ketersediaan data dalam jumlah yang sangat besar: Tool koleksi data otomatis dan perkembangan teknologi database menyebabkan banyak sekali data yang bisa dikumpulkan di dalam database, data warehouse, dan alat peyimpanan informasi lainnya Pemeriksaan data manual adalah membosankan dan terkadang tidak masuk akal MENGAPA DATA MINING?
  • 8. Database Marketing Data Warehousing KDD & Data Mining Meningkatkan pengetahuan agar bisa membuat keputusan berdasarkan: Misal, pengaruh pada marketing Peran dan pengaruh DM yang bertumbuh pesat dan masih bertumbuh! Tetapi DM tidaklah sekedar marketing... marketing MANFAAT DATA MINING?
  • 9. Analisis database dan dukungan keputusan: Analisis dan manajemen pasar Target pasar, manajemen relasi customer (CRM), analisis keranjang belanja, penjualan silang, segmentasi pasar Analisis dan manajemen resiko Peramalan, tindakan mempertahankan customer, peningkatan asuransi, kontrol kualitas, analisis kompetitif Potensi Aplikasi
  • 10. • Dari mana data berasal? Transaksi kartu kredit, loyalty cards, kupon discount, keluhan customer, kajian lifestyle publik • Target Pasar Mendapatkan kelompok model customer yang berbagi karakteristik yang sama: minat, tingkat pendapatan, kebiasaan belanja, dsb. Menentukan pola pembelian customer berdasarkan waktu • Analisis lintas pasar Asosiasi/korelasi antara penjualan produk & taksiran berdasarkan asosiasi demikian Analisis dan Manajemen Pasar
  • 11. • Profil customer Tipe customer apa membeli produk apa (pengelompokan atau klasifikasi) • Analisa kebutuhan customer Mengenali produk terbaik untuk customer berbeda Meramalkan faktor apa yang akan memikat customer baru • Penyediaan rangkuman informasi Rangkuman laporan multidimensi Rangkuman informasi statistik (kecenderungan data terpusat dan variasi) Analisis dan Manajemen Pasar
  • 12. • Perencanaan keuangan dan evaluasi aset –Analisis dan peramalan cash flow –Analisis ganti rugi yang mungkin untuk mengevaluasi aset –Analisis cross-sectional dan time series (financial- ratio, analisa trend, dsb.) • Perencanaan sumberdaya Merangkum dan membandingkan sumberdaya dan pengeluaran Analisis dan Manajemen Resiko Perusahaan
  • 13. Analisis dan Manajemen Resiko Perusahaan • Kompetisi – Memantau pesaing dan arah pasar – Mengelompokkan customer kedalam kelas dan prosedur harga berbasis kelas – Menetapkan strategi harga dalam suatu pasar dengan kompetitif tinggi
  • 14. Anda seorang petugas asuransi dan anda harus mendefinisikan suatu pembayaran bulanan yang pantas untuk seorang pemuda berusia 18 tahun yang membeli sebuah Ferrari … apa yang anda akan lakukan? CONTOH CASE DATA MINING?
  • 15. CONTOH CASE DATA MINING? • Kaji seluruh data customer dan data kompensasi pembayaran sebelumnya • Kaji peluang penyebab kecelakaan paling banyak berdasarkan dugaan… – Jenis Kelamin pengendara (pria/wanita) dan usia – Model dan usia mobil, tempat tinggal – dsb. • Jika peluang kecelakaan lebih besar dari rata-rata, aturlah pembayaran bulanan yang sesuai!
  • 18. 1. Skalabilitas, penyimpanan dari data biasanya memakan kapasitas yang besar, singkatnya semakin banyak data yang disimpan maka akan semakin besar juga kapasitas yang diperlukan. 2. Ketidaktersedianya data atau akses terhadap data yang sulit, anggap saja kalian mau mencari suatu data rahasia yang hanya dipegang oleh agen-agen CIA atau bahkan MI6 seperti yang ada di film James Bond, tentu sulit bukan? 3. Kualitas data yang kurang baik, apabila kalian disuruh untuk melakukan "Mining" terhadap suatu hal dan harus disediakan dalam bentuk video 4K HD atau 720p, namun sayangnya data yang kalian dapat merupakan video yang kualitas nya seperti gambar pada perang dunia ke 2. 4. Biaya yang mahal sampai ke perawatannya, bayangkan kalian disuruh mencari data dan harus menyimpannya tetapi data tersebut memiliki ukuran sampai 100 Terabyte! Tentu nya dibutuhkan Hard disk yang kapasitas penyimpanan nya sangat besar.5. Data yang heterogen & kompleks, contoh kumpulan hal web yg terdiri atas teks yg semi terstruktur dan banyak terdapat link. MASALAH UMUM DATA MINING?
  • 20. Peningkatan potensi untuk mendukung keputusan bisnis End User Business Analyst Data Analyst DBA Pembuatan keputusan Penyajian Data Teknik Visualisasi Data Mining Penemuan informasi Eksplorasi data Analisa statistik, query, dan pelaporan Data Warehouses / Data Marts OLAP, MDA Sumber data Kertas, Files, Penyedia informasi, Sistem database, OLTP PROSES DATA MINING - DSS
  • 21. Data • Data customer • Simpanan data • Data grafis • Data geografis Informasi • X tinggal di Z • S berumur Y tahun • X dan S pindah • W punya uang di Z Keputusan • Promosikan produk A di Z. • Kirim iklan ke keluarga dengan profil P • Jual silang layanan B ke klien C Pengetahuan • Sebanyak Y produk A digunakan di Z • Customer dari kelas Y menggunakan x% dari C selama periode D VALUE CHAIN