SlideShare a Scribd company logo
DATA MINING
NURLINDASARI TAMSIR
Pengantar Data Mining
 Apa dan Mengapa Data Mining?
Manusia memerlukan melakukan data mining
karena
(1) manusia memproduksi data beragam data
yang jumlah dan ukurannya sangat besar untuk
bidang astronomi, bisnis, kedokteran, ekonomi,
olahraga, cuaca, financial, dan masih banyak
bidang.
(2) Tejadinya pertumbuhan data seperti bidang
astronomi berdasrakan survey yang dilakukan
oleh perusahaan Sloan Digital Sky Survey di
New Mexico pada 2000 bahwa data yang
dihasilkan 140TB selama 10 tahun terakhir.
Sedangkan survey dari perusahaan Large
Synoptic Survey Telescope di Chile pada tahun
2016 bahwa setiap 5 hari dihasilkan data
sebesar 140TB
(3) terjadinya
perubahan kultur dan
perilaku manusia
bahwa tiap detik social
media menghasilkan
data yang fantastis
Pengantar Data Mining
Pengantar Data Mining
(4). Terjadinya tsunami data
 Mobile Electronics market : 7B
smartphone subscriptions in 2015
 Web & Social Networks generates
amount of data
 Google processes 100 PB per day, 3
million servers
 Facebook has 300 PB of user data per
day
 Youtube has 1000PB video storage
Manusia kebanjiran data tetapi miskin
pengetahuan untuk itu diperlukan bagaimana
manusia bisa mengubah data menjadi
pengetahuan.
 Data harus olah menjadi pengetahuan
supaya bisa bermanfaat bagi manusia.
Dengan pengetahuan tersebut, manusia
dapat:
 Melakukan estimasi dan prediksi apa
yang terjadi di depan
 Melakukan analisis tentang asosiasi,
korelasi dan pengelompokan antar data
dan atribut
 Membantu pengambilan keputusan dan
DEFINISI
 Menambang/menggali/menemukan
pengetahuan dari data yang banyak yang
sebelumnya tidak diketahui
 Suatu istilah yang digunakan untuk
menguraikan penemuan pengetahuan di
dalam database
 Proses menggunakan teknik statistika,
matematika, kecerdasan buatan dan machine
learning
 Suatu proses menemukan hubungan, pola
 disiplin ilmu yang mempelajari metode untuk
mengekstrak pengetahuan atau menemukan
pola dari suatu data yang besar
Nama lain data mining
 Knowledge Discovery in Database
(KDD)
 Big data
 Business intelligence
 Knowledge extraction
 Pattern analysis
 Information harvestin
Karateristik data mining
 Data mining berhubungan dengan
penemuan sesuatu yang tersembunyi
dan pola data tertentu yang tidak
diketahui sebelumnya.
 Data mining biasa menggunakan data
yang sangat besar. Biasanya data yang
besar digunakan untuk membuat hasil
lebih dipercaya.
 Data mining berguna untuk membuat
keputusan yang kritis, terutama dalam
strategi
 Ekstraksi dari data ke pengetahuan:
 1. data: fakta yang terekam dan tidak membawa arti
 2. informasi: rekap, rangkuman, penjelasan dan
statistik dari data
 3. pengetahuan: pola, rumus, aturan atau model
yang muncul dari data
Penerapan data mining
 Puluhan ribu data mahasiswa di
kampus yang diambil dari sistem
informasi akademik
 Apakah pernah kita ubah menjadi
pengetahuan yang lebih bermanfaat?
TIDAK!
 Seperti apa pengetahuan itu? Rumus,
Pola, Aturan
Presentation1.pptx
Presentation1.pptx
Penerapan data mining
 Pendidikan
 Data mining membantu tenaga mendidik
dalam mengakses data siswa, memprediksi
tingkat pencapaian dan memberi pandangan
tentang siswa atau kelompok siswa mana
saja yang membutuhkan perhatian ekstra
 Perbankan
 Data mining membantu perusahaan jasa
keuangan untuk mendapatkan pandangan
yang lebih baik tentang risiko pasar,
mendeteksi penipuan, mengelola pemenuhan
peraturan dan untuk mendapatkan return
optimal dari investasi pemasaran.
Penerapan data mining
 Komunikasi
 Data mining digunakan oleh perusahaan
multimedia dan telekomunikasi untuk memahami
banyaknya data pelanggan, memprediksi
perilaku mereka dan menawarkan kampanye
yang sesuai target atau relevan.
 Asuransi
 Penerapan lain data mining adalah pada
industri asuransi. Perusahaan asuransi
umumnya menggunakan teknik data
mining untuk mendeteksi penipuan,
mengidentifikasi faktor risiko pada pengajuan
klaim, analisa pelanggan, hingga untuk
menemukan cara menawarkan produk kompetitif
ke basis pelanggan yang ada.
Penerapan data mining
 kesehatan
 Salah satu pemanfaatan data mining pada
bidang kesehatan adalah penerapan data
mining untuk melakukan klasifikasi prediksi
penyakit ISPA (Infeksi Saluran Pernapasan
Akut). Data pasien yang terkena ISPA dapat
digunakan untuk menunjukkan gejala
penyakit ISPA yang diderita pasien.
Klasifikasi ini bertujuan untuk membentuk
model pohon keputusan untuk memprediksi
penyakit pasien dan melihat variabel yang
paling mempengaruhi penyakit pasien
dengan kategori ISPA. Objek penelitian ini
ialah data pasien, status imunisasi, jenis
kelamin,usia dan kriteria gizi
Penerapan data mining
 Ekonomi dan bisnis : data saham 
kenaikan, penurunan dll
 Cuaca : BMG, data suhu, curah hujan
dll
 Olahraga : CR7 brapa mencetak gol
dalam 1 musim dll
Data set
 Dataset/Himpunan Data/Data
Latih adalah sebuah himpunan data
yang berasal dari informasi masa-masa
lampau dan dikelola menjadi sebuah
informasi untuk melakukan teknik dari
ilmu data mining.
 Sebuah data set dapat dipandang
sebagai sebuah koleksi dari objek- objek
data. Nama lain dari sebuah objek data
adalah record, titik, vektor, pola, event,
case, sample, observasi atau entitas
Jenis data set
 dua jenis dataset yaitu Private dan Public.
 Private Dataset, adalah data set yang dapat
diambil dari sebuah organisasi yang akan kita
lakukan sebagai objek penelitian misalnya
seperti data bank, rumah sakit, universitas,
perusahaan dan lain sebagainya
 Public Dataset, adalag data set yang bisa
kita ambil dari repository publik yang
disepakati oleh ulama-ulama peneliti data
mining, misalnya seperti UCI
Repository (http://www.ics.uci.edu/~mlearn/
MLRepository.html), ACM
KDD (http://www.sigkdd.org/kddcup/).
Data set
 Terdapat bermacam-macam cara untuk
merepresentasikan data set contohnya
yaitu atribut yang digunakan untuk
meng-gambarkan jenis objek
 baris yang menyatakan objek-objek data
dan kolom disebut atribut. Atribut juga
dapat disebut dengan variabel, field, fitur
atau dimensi.
Jenis Atribut
Presentation1.pptx

More Related Content

PPTX
Menambang/menggali/menemukan pengetahuan dari data yang banyak yang sebelumny...
PPTX
PENGANTAR DAN PENDAHULUAN MATA KULIAH DATA MINING
PDF
Konsep Data Mining
PPTX
Pertemuan 1.pptx
PPTX
PPTX
P1 data mining
PPTX
minggu ke 5 data mining dan kdd oke sipp
PDF
Pengantar Data Mining di Teknik Lingkungan
Menambang/menggali/menemukan pengetahuan dari data yang banyak yang sebelumny...
PENGANTAR DAN PENDAHULUAN MATA KULIAH DATA MINING
Konsep Data Mining
Pertemuan 1.pptx
P1 data mining
minggu ke 5 data mining dan kdd oke sipp
Pengantar Data Mining di Teknik Lingkungan

Similar to Presentation1.pptx (20)

PPTX
Pengantar Data Mining dan contoh penggunaannya.pptx
PPT
Data mining week 1 - pengantar data mining
PPTX
Data mining 1 pengantar
PPTX
1 data mining-dm2016
PPT
pertemuan 1(ELA)rev.ppt
PDF
01. Pengantar Penambangan Data.pdf
PDF
MODUL DATA MINING
PPTX
Online Education PowerPoint Templates (1).pptx
PPTX
Data-Mining-Pertemuan-perkuliahan sistem informasi.pptx
PPT
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
PPTX
file_2013-10-07_22_18_49_Junta_Zeniarja,_M.Kom,_M.CS__Sesi_1_-_Overview_DM.pptx
PPTX
01.Pertemuan-Ke-1-PengantarDataMining.pptx
PPTX
Pengantar Big Data dan Data Mining.pptx
PPTX
Data mining
PDF
01 - Introduction to Data Mining - Original.pdf
PPTX
Pert 03 introduction dm 2012
PPTX
PPT
Pengantar_Data_Mining.ppt
PPT
Pengantar_Data_Mining.ppt
PPT
Pengantar dan Konsep dalam Data Mining.ppt
Pengantar Data Mining dan contoh penggunaannya.pptx
Data mining week 1 - pengantar data mining
Data mining 1 pengantar
1 data mining-dm2016
pertemuan 1(ELA)rev.ppt
01. Pengantar Penambangan Data.pdf
MODUL DATA MINING
Online Education PowerPoint Templates (1).pptx
Data-Mining-Pertemuan-perkuliahan sistem informasi.pptx
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
file_2013-10-07_22_18_49_Junta_Zeniarja,_M.Kom,_M.CS__Sesi_1_-_Overview_DM.pptx
01.Pertemuan-Ke-1-PengantarDataMining.pptx
Pengantar Big Data dan Data Mining.pptx
Data mining
01 - Introduction to Data Mining - Original.pdf
Pert 03 introduction dm 2012
Pengantar_Data_Mining.ppt
Pengantar_Data_Mining.ppt
Pengantar dan Konsep dalam Data Mining.ppt
Ad

Recently uploaded (20)

PDF
RPP PEMBELAJARAN MENDALAM BAHASA INDONESIA _SariIndah_DEWI SINTA (1).pdf
PDF
GUIDE BOOK DMH SCHOLARSHIP...............................
DOCX
Modul Ajar Pembelajaran Mendalam PJOK Kelas XII Terbaru 2025
DOCX
Modul Ajar Pembelajaran Mendalam PJOK Kelas X Terbaru 2025
PDF
Ilmu tentang pengembangan teknologi pembelajaran
DOCX
Modul Ajar Pembelajaran Mendalam PAI & BP Kelas X Terbaru 2025
PPTX
SEJARAH BENDERA MERAH PUTIH - MATERI PRAMUKA
DOCX
LK 1.1.a.2_Modul 2 Pelatihan Koding dan Artifisial
PPTX
Sistem Pencernaan Manusia IPAS Presentasi Pendidikan Hijau Kuning Bingkai Ilu...
PDF
KKA-Kelas X-BAB 1- Pemecahan Masalah Kompleks dalam Kehidupan.pdf
PDF
12. KSP SD Runiah Makassar OK School.pdf
PDF
PPT Yudisium Ceremony Agusus 2025 - new. pdf
DOCX
Modul Ajar Pembelajaran Mendalam Bahasa Inggris Kelas XII SMA Terbaru 2025
PPTX
Slide_Berpikir_Komputasional_Pola_Algoritma_Kelas5SD.pptx
PDF
RPP PEMBELAJARAN MENDALAM BAHASA INDONESIA _SariIndah_DEWI SINTA (1).pdf
DOCX
Modul Ajar Pembelajaran Mendalam PKN Kelas X Terbaru 2025
PPTX
Konsep & Strategi Penyusunan HPS _Pelatihan "Ketentuan TERBARU Pengadaan" (...
PPTX
Materi-Geografi-Pendekatan-Konsep-dan-Prinsip-Geografi-Kelas-10.pptx
PDF
[1]_120325_Penyamaan Persepsi Kepmen 63_M_KEP_2025.pdf
DOCX
Modul Ajar Pembelajaran Mendalam PKWU Kerajinan Kelas XII SMA Terbaru 2025
RPP PEMBELAJARAN MENDALAM BAHASA INDONESIA _SariIndah_DEWI SINTA (1).pdf
GUIDE BOOK DMH SCHOLARSHIP...............................
Modul Ajar Pembelajaran Mendalam PJOK Kelas XII Terbaru 2025
Modul Ajar Pembelajaran Mendalam PJOK Kelas X Terbaru 2025
Ilmu tentang pengembangan teknologi pembelajaran
Modul Ajar Pembelajaran Mendalam PAI & BP Kelas X Terbaru 2025
SEJARAH BENDERA MERAH PUTIH - MATERI PRAMUKA
LK 1.1.a.2_Modul 2 Pelatihan Koding dan Artifisial
Sistem Pencernaan Manusia IPAS Presentasi Pendidikan Hijau Kuning Bingkai Ilu...
KKA-Kelas X-BAB 1- Pemecahan Masalah Kompleks dalam Kehidupan.pdf
12. KSP SD Runiah Makassar OK School.pdf
PPT Yudisium Ceremony Agusus 2025 - new. pdf
Modul Ajar Pembelajaran Mendalam Bahasa Inggris Kelas XII SMA Terbaru 2025
Slide_Berpikir_Komputasional_Pola_Algoritma_Kelas5SD.pptx
RPP PEMBELAJARAN MENDALAM BAHASA INDONESIA _SariIndah_DEWI SINTA (1).pdf
Modul Ajar Pembelajaran Mendalam PKN Kelas X Terbaru 2025
Konsep & Strategi Penyusunan HPS _Pelatihan "Ketentuan TERBARU Pengadaan" (...
Materi-Geografi-Pendekatan-Konsep-dan-Prinsip-Geografi-Kelas-10.pptx
[1]_120325_Penyamaan Persepsi Kepmen 63_M_KEP_2025.pdf
Modul Ajar Pembelajaran Mendalam PKWU Kerajinan Kelas XII SMA Terbaru 2025
Ad

Presentation1.pptx

  • 2. Pengantar Data Mining  Apa dan Mengapa Data Mining? Manusia memerlukan melakukan data mining karena (1) manusia memproduksi data beragam data yang jumlah dan ukurannya sangat besar untuk bidang astronomi, bisnis, kedokteran, ekonomi, olahraga, cuaca, financial, dan masih banyak bidang. (2) Tejadinya pertumbuhan data seperti bidang astronomi berdasrakan survey yang dilakukan oleh perusahaan Sloan Digital Sky Survey di New Mexico pada 2000 bahwa data yang dihasilkan 140TB selama 10 tahun terakhir. Sedangkan survey dari perusahaan Large Synoptic Survey Telescope di Chile pada tahun 2016 bahwa setiap 5 hari dihasilkan data sebesar 140TB
  • 3. (3) terjadinya perubahan kultur dan perilaku manusia bahwa tiap detik social media menghasilkan data yang fantastis Pengantar Data Mining
  • 4. Pengantar Data Mining (4). Terjadinya tsunami data  Mobile Electronics market : 7B smartphone subscriptions in 2015  Web & Social Networks generates amount of data  Google processes 100 PB per day, 3 million servers  Facebook has 300 PB of user data per day  Youtube has 1000PB video storage
  • 5. Manusia kebanjiran data tetapi miskin pengetahuan untuk itu diperlukan bagaimana manusia bisa mengubah data menjadi pengetahuan.  Data harus olah menjadi pengetahuan supaya bisa bermanfaat bagi manusia. Dengan pengetahuan tersebut, manusia dapat:  Melakukan estimasi dan prediksi apa yang terjadi di depan  Melakukan analisis tentang asosiasi, korelasi dan pengelompokan antar data dan atribut  Membantu pengambilan keputusan dan
  • 6. DEFINISI  Menambang/menggali/menemukan pengetahuan dari data yang banyak yang sebelumnya tidak diketahui  Suatu istilah yang digunakan untuk menguraikan penemuan pengetahuan di dalam database  Proses menggunakan teknik statistika, matematika, kecerdasan buatan dan machine learning  Suatu proses menemukan hubungan, pola  disiplin ilmu yang mempelajari metode untuk mengekstrak pengetahuan atau menemukan pola dari suatu data yang besar
  • 7. Nama lain data mining  Knowledge Discovery in Database (KDD)  Big data  Business intelligence  Knowledge extraction  Pattern analysis  Information harvestin
  • 8. Karateristik data mining  Data mining berhubungan dengan penemuan sesuatu yang tersembunyi dan pola data tertentu yang tidak diketahui sebelumnya.  Data mining biasa menggunakan data yang sangat besar. Biasanya data yang besar digunakan untuk membuat hasil lebih dipercaya.  Data mining berguna untuk membuat keputusan yang kritis, terutama dalam strategi
  • 9.  Ekstraksi dari data ke pengetahuan:  1. data: fakta yang terekam dan tidak membawa arti  2. informasi: rekap, rangkuman, penjelasan dan statistik dari data  3. pengetahuan: pola, rumus, aturan atau model yang muncul dari data
  • 10. Penerapan data mining  Puluhan ribu data mahasiswa di kampus yang diambil dari sistem informasi akademik  Apakah pernah kita ubah menjadi pengetahuan yang lebih bermanfaat? TIDAK!  Seperti apa pengetahuan itu? Rumus, Pola, Aturan
  • 13. Penerapan data mining  Pendidikan  Data mining membantu tenaga mendidik dalam mengakses data siswa, memprediksi tingkat pencapaian dan memberi pandangan tentang siswa atau kelompok siswa mana saja yang membutuhkan perhatian ekstra  Perbankan  Data mining membantu perusahaan jasa keuangan untuk mendapatkan pandangan yang lebih baik tentang risiko pasar, mendeteksi penipuan, mengelola pemenuhan peraturan dan untuk mendapatkan return optimal dari investasi pemasaran.
  • 14. Penerapan data mining  Komunikasi  Data mining digunakan oleh perusahaan multimedia dan telekomunikasi untuk memahami banyaknya data pelanggan, memprediksi perilaku mereka dan menawarkan kampanye yang sesuai target atau relevan.  Asuransi  Penerapan lain data mining adalah pada industri asuransi. Perusahaan asuransi umumnya menggunakan teknik data mining untuk mendeteksi penipuan, mengidentifikasi faktor risiko pada pengajuan klaim, analisa pelanggan, hingga untuk menemukan cara menawarkan produk kompetitif ke basis pelanggan yang ada.
  • 15. Penerapan data mining  kesehatan  Salah satu pemanfaatan data mining pada bidang kesehatan adalah penerapan data mining untuk melakukan klasifikasi prediksi penyakit ISPA (Infeksi Saluran Pernapasan Akut). Data pasien yang terkena ISPA dapat digunakan untuk menunjukkan gejala penyakit ISPA yang diderita pasien. Klasifikasi ini bertujuan untuk membentuk model pohon keputusan untuk memprediksi penyakit pasien dan melihat variabel yang paling mempengaruhi penyakit pasien dengan kategori ISPA. Objek penelitian ini ialah data pasien, status imunisasi, jenis kelamin,usia dan kriteria gizi
  • 16. Penerapan data mining  Ekonomi dan bisnis : data saham  kenaikan, penurunan dll  Cuaca : BMG, data suhu, curah hujan dll  Olahraga : CR7 brapa mencetak gol dalam 1 musim dll
  • 17. Data set  Dataset/Himpunan Data/Data Latih adalah sebuah himpunan data yang berasal dari informasi masa-masa lampau dan dikelola menjadi sebuah informasi untuk melakukan teknik dari ilmu data mining.  Sebuah data set dapat dipandang sebagai sebuah koleksi dari objek- objek data. Nama lain dari sebuah objek data adalah record, titik, vektor, pola, event, case, sample, observasi atau entitas
  • 18. Jenis data set  dua jenis dataset yaitu Private dan Public.  Private Dataset, adalah data set yang dapat diambil dari sebuah organisasi yang akan kita lakukan sebagai objek penelitian misalnya seperti data bank, rumah sakit, universitas, perusahaan dan lain sebagainya  Public Dataset, adalag data set yang bisa kita ambil dari repository publik yang disepakati oleh ulama-ulama peneliti data mining, misalnya seperti UCI Repository (http://www.ics.uci.edu/~mlearn/ MLRepository.html), ACM KDD (http://www.sigkdd.org/kddcup/).
  • 19. Data set  Terdapat bermacam-macam cara untuk merepresentasikan data set contohnya yaitu atribut yang digunakan untuk meng-gambarkan jenis objek  baris yang menyatakan objek-objek data dan kolom disebut atribut. Atribut juga dapat disebut dengan variabel, field, fitur atau dimensi.