SlideShare a Scribd company logo
DATA MINING DAN DATA
WAREHOUSE
Pertemuan 4 – Model Proses Data Mining
Budiman, S.T., M.Kom.
DATA MINING
● Data Mining adalah kegiatan untuk menemukan informasi atau pengetahuan yang berguna secara
otomatis dari data yang jumlahnya besar.
● Data Mining merupakan salah satu proses dari keseluruhan proses yang ada pada Knowledge Discovery in
Databases (KDD).
KDD
● Knowledge Discovery in Databases (KDD) merupakan sekumpulan proses untuk menemukan
pengetahuan yang bermanfaat dari data.
● Kumpulan proses dalam KDD meliputi : pembersihan data (data cleaning), integrasi data (data
integration), pemilihan data (data selection), transformasi data (data transformation), penambangan
data (data mining), evaluasi pola (pattern evaluation), dan presentasi pengetahuan (knowledge
presentation).
● Berdasarkan definisi ini terlihat bahwa data mining hanya merupakan salah satu proses dari
keseluruhan proses yang ada pada KDD, tetapi merupakan proses yang sangat penting dalam
menemukan pola-pola yang berguna dari sejumlah data yang besar (data tersebut bisa disimpan dalam
basisdata, Data Warehouse, atau media penyimpanan informasi lainnya).
KDD VS DATA MINING
● Menurut Cabena, Data Mining = Knowledge Discovery in Database (KDD).
● Menurut Jiawei Han, Data Mining merupakan Subset atau salah satu tahap dari KDD saja. Sehingga,
batasan ini yang selanjutkan digunakan.
● Data Mining bertujuan mengekplorasi basis data untuk menemukan pola-pola pengetahuan yang
tersembunyi di dalam data tersebut.
TAHAPAN KNOWLEDGE DISCOVERY IN DATABASE
Menurut Peter Cabena, Tahapan – tahapan dalam KDD adalah sebagai berikut :
● Penentuan Sasaran Bisnis (Business Objective Determination)
● Persiapan Data (Preparation Data)
● Data Selection
● Data Preprocessing
● Data Transformation
● Data Mining
● Anaysis of Result
● Assimilation of Knowledge
Business Objective Determination
● Merupakan sebuah tahapan yang mendefinisikan permasalahan atau tantangan bisnis dengan jelas.
Hal ini merupakan aspek yang sangat esensial dalam setiap proyek data mining.
● Contoh Sasaran Bisnis :
Mengembangkan suatu strategi marketing untuk mempertahankan loyalitas customer di Jawa Tengah
dan Jawa Timur untuk produk soft drink dengan brand dan ukuran tertentu (200ml dalam kotak
alumunium) selama bulan April, Mei , Juni yang akan datang. Perusahaan akan menggunakan
kombinasi dari berbagai strategi marketing (mixed marketing), yang salah satunya adalah direct mail
campaign kepada customer yang tampaknya "mudah rusak" loyalitasnya.
Business Objective Determination
● Merupakan sebuah tahapan yang mendefinisikan permasalahan atau tantangan bisnis dengan jelas.
Hal ini merupakan aspek yang sangat esensial dalam setiap proyek data mining.
● Contoh Sasaran Bisnis :
Mengembangkan suatu strategi marketing untuk mempertahankan loyalitas customer di Jawa Tengah
dan Jawa Timur untuk produk soft drink dengan brand dan ukuran tertentu (200ml dalam kotak
alumunium) selama bulan April, Mei , Juni yang akan datang. Perusahaan akan menggunakan
kombinasi dari berbagai strategi marketing (mixed marketing), yang salah satunya adalah direct mail
campaign kepada customer yang tampaknya "mudah rusak" loyalitasnya.
● Sehingga dampak keseluruhan KDD adalah :
– Data Selection: dipilih customers yang membeli produk soft drink 200 ml dalam kotak alumunium di
Jawa Tengah dan Jawa Timur.
– Data Transformation: customers yang membeli produk soft drink 200 ml dalam kotak alumunium
disorting dalam 10 kategori, yang masing-masing membedakan tingkat loyalitasnya: membeli produk
tersebut 0-10%, 11-20%, ..... , 81-90%, 91-100% sepanjang waktu pembeliannya. Selanjutnya data inilah
yang akan dibawa ke tahap data mining.
Persiapan Data (Preparation Data)
● Merupakan tahapan untuk mempersiapkan data yang diperlukan untuk proses data mining. Tujuannya
adalah agar data yang digunakan benar-benar sesuai dengan permasalahan yang akan dipecahkan,
dapat dijamin kebenarannya, dan dalam format yang sesuai/tepat.
● Tahap yang paling banyak mengkonsumsi resources (manusia, biaya, waktu) yang tersedia. Biasanya
mencapai 60% keseluruhan proyek KDD.
● Data Selection: Mengidentifikasi semua sumber informasi internal dan eksternal dan memilih sebagian
saja dari data yang diperlukan untuk aplikasi data mining.
● Data Preprocessing: Meyakinkan kualitas data yang telah dipilih pada tahapan sebelumnya. 2 issue
yang sering dihadapkan pada tahapan ini adalah Noisy Data dan Missing Value.
● Data Transformation: Mengubah data ke dalam model analitis serta memodelkan data agar sesuai
dengan analisa yang diharapkan dan format data yang diperlukan oleh algoritma data mining.
DATA MINING
● Melakukan proses pencarian pengetahuan terhadap data yang ditransformasikan pada tahap
sebelumnya.
● Contoh Pengetahuan berbentuk Association Rule untuk kasus "Soft Drink“:
○ IF soft drink sejenis dengan ukuran yang lebih besar (bukan botol kecil) dibeli lebih dari 58% dalam
sejarah pembelian soft drink seorang consumer
○ THEN consumer tersebut diprediksi Loyal.
● Pemilihan tugas data mining : pemilihan goal dari proses KDD misalnya klasifikasi, regresi, clustering,
dll.
DATA MINING
● Melakukan proses pencarian pengetahuan terhadap data yang ditransformasikan pada tahap
sebelumnya.
● Contoh Pengetahuan berbentuk Association Rule untuk kasus "Soft Drink“:
○ IF soft drink sejenis dengan ukuran yang lebih besar (bukan botol kecil) dibeli lebih dari 58% dalam
sejarah pembelian soft drink seorang consumer
○ THEN consumer tersebut diprediksi Loyal.
● Pemilihan tugas data mining : pemilihan goal dari proses KDD misalnya klasifikasi, regresi, clustering,
dll.
● Proses Data mining yaitu proses mencari pola atau informasi menarik dalam data terpilih dengan
menggunakan teknik atau metode tertentu. Teknik, metode, atau algoritma dalam data mining sangat
bervariasi. Pemilihan metode atau algoritma yang tepat sangat bergantung pada tujuan dan proses
KDD secara keseluruhan.
Analysis of Result
● Menginterpretasikan dan mengevaluasi output dari tahap mining: patterns.
● Pendekatan analisa yang digunakan akan bervariasi menurut operasi data mining yang digunakan,
tetapi biasanya akan melibatkan teknik visualisasi.
Assimilation of Knowledge
● Menggunakan hasil
mining yang telah
dievaluasi ke dalam
perilaku organisasi dan
sistem informasi
perusahaan.
Knowledge Discovery in Database Process
DATA MINING dan PROSES
● Pembersihan data (Data Cleaning)
○ Digunakan untuk membuang data yang tidak konsisten dan noise.
● Intergrasi Data (Data Integration)
○ Data yang diperlukan untuk data mining tidak hanya berasal dari satu database tetapi juga berasal dari
beberapa database atau file teks. Hasil integrasi data sering diwujudkan dalam sebuah data warehouse
karena dengan data warehouse, data dikonsolidasikan dengan struktur khusus yang efisien. Selain itu data
warehouse juga memungkinkan tipe analisa seperti OLAP.
● Transformasi data
○ Transformasi dan pemilihan data ini untuk menentukan kualitas dari hasil data mining, sehingga data
diubah menjadi bentuk sesuai untuk di-Mining.
● Aplikasi Teknik Data Mining
○ Aplikasi teknik data mining sendiri hanya merupakan salah satu bagian dari proses data mining. Ada
beberapa teknik data mining yang sudah umum dipakai.
● Evaluasi pola yang ditemukan
○ Dalam tahap ini hasil dari teknik data mining berupa pola-pola yang khas maupun model prediksi dievaluasi
untuk menilai apakah hipotesa yang ada memang tercapai.
● Presentasi Pengetahuan
○ Presentasi pola yang ditemukan untuk menghasilkan aksi tahap terakhir dari proses data mining adalah
bagaimana memformulasikan keputusan atau aksi dari hasil analisa yang didapat.
CRISP-DM
CRISP-DM
● CRISP-DM adalah singkatan dari Cross Industry Standard Process for Data Mining. Ini adalah model proses
data mining yang menggambarkan pendekatan yang umum digunakan oleh para ahli data mining untuk
mengatasi masalah. Jajak pendapat yang dilakukan pada tahun 2002, 2004, dan 2007 menunjukkan bahwa
CRISP-DM merupakan metodologi utama yang digunakan oleh para penambang data.
● Satu-satunya standar data mining lain yang disebutkan dalam jajak pendapat ini adalah SEMMA.
● Namun, 3-4 kali lebih banyak orang melaporkan menggunakan CRISP-DM. Sebuah tinjauan dan kritik terhadap
model proses penggalian data pada tahun 2009 menyebut CRISP-DM sebagai “standar de facto untuk
mengembangkan proyek penggalian data dan penemuan pengetahuan.”
● Ulasan lain tentang CRISP-DM dan model proses data mining termasuk ulasan Kurgan dan Musilek pada tahun
2006, serta perbandingan CRISP-DM dan SEMMA pada tahun 2008 oleh Azevedo dan Santos.
CRISP-DM
CRISP-DM
● Pemahaman Bisnis(Business Understanding)
Merupakan tahap awal yaitu pemahaman penelitian, penentuan tujuan dan rumusan masalah data mining.
● Pemahaman Data(Data Understanding)
Dalam tahap ini dilakukan pengumpulan data, mengenali lebih lanjut data yang akan digunakan.
● Pengolahan Data(Data Preparation)
Tahap ini adalah pekerjaan berat yang perlu dilaksanakan secara intensif. Memilih kasus atau variable yang ingin dianalisis,
melakukan perubahan pada beberapa variable jika diperlukan sehingga data siap untuk dimodelkan.
● Pemodelan(Modeling)
Memilih teknik pemodelan yang sesuai dan sesuaikan aturan model untuk hasil yang maksimal. Dapat kembali ke tahap
pengolahan untuk menjadikan data ke dalam bentuk yang sesuai dengan model tertentu.
● Evaluasi (Evaluation)
Mengevaluasi satu atau model yang digunakan dan menetapkan apakah terdapat model yang memenuhi tujuan pada tahap
awal. Kemudian menentukan apakah ada permasalahan yang tidak dapat tertangani dengan baik serta mengambil
keputusan hasil penelitian.
● Penyebaran (Deployment)
Menggunakan model yang dihasilkan seperti pembuatan laporan atau penerapan proses data mining pada departemen lain.
SEMMA-DM
KDD VS CRISP-DM VS SEMMA-DM
TERIMA KASIH
“Every morning you have two choices: continue to sleep with
your dreams, or wake up and chase them.”

More Related Content

PPT
data-mining- for business intelligent.ppt
PPTX
01 pengantar kdd
PPT
BAB_5_Data_Mining.ppt
PDF
MIK4237-02.pdf
PPT
Pengantar Materi Data Mining di Era Digital.ppt
PPTX
TUGAS 1 KEL 4 SISTEM LOGISTIK.pptx
PPTX
Pertemuan 10 - Metodologi Data Science - Copy.pptx
PPTX
data-mining- for business intelligent.ppt
01 pengantar kdd
BAB_5_Data_Mining.ppt
MIK4237-02.pdf
Pengantar Materi Data Mining di Era Digital.ppt
TUGAS 1 KEL 4 SISTEM LOGISTIK.pptx
Pertemuan 10 - Metodologi Data Science - Copy.pptx

Similar to Pertemuan 4 - MODEL PROSES DATA MINING.pptx.pdf (20)

PPTX
Made Hedy Sanjaya........ (202261201013).pptx
PPT
Pertemuan 4 Arsitektur dan model data mining
PDF
Arsitektur dan model data mining
PDF
99 1-414-2-10-20190724
PPTX
T2 - Desain Basis Data
PDF
Data Mining Diskusi 3.pdf
PPTX
Pengantar Data Warehouse, Pengertian Data Warehouse
PPTX
Pertemuan 9 data mining dan data ware.pptx
PPT
Data Mart, Warehouse, Mining, OLAP......
PPTX
Pertemuan 4 Konsep Dasar Data Mining dan Algoritma.pptx
PPSX
Materi Sesi 2 - Tayangan 5 - Menentukan Objek Data.ppsx
PPTX
Herwanto_Kuliah_Umum_Big_Data_Analysis.pptx
PPT
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
PPTX
Kelompok 3 Asosiasi Apis Pengolahan Citra Digital.pptx
PPTX
Online Education PowerPoint Templates (1).pptx
PDF
17. sarah fadilah implementasi data mining untuk pengenalan karakteristik t...
PDF
Materi ke 1 Matakuliah Analisis dan Visualisasi Data.pdf
PPTX
Kuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptx
PPTX
Pertemuan 3 - Konsep dan Rancangan Data Warehouse Lanjutan.pptx
PPTX
Kecerdasan bisnis- Sistem Penunjang Keputusan
Made Hedy Sanjaya........ (202261201013).pptx
Pertemuan 4 Arsitektur dan model data mining
Arsitektur dan model data mining
99 1-414-2-10-20190724
T2 - Desain Basis Data
Data Mining Diskusi 3.pdf
Pengantar Data Warehouse, Pengertian Data Warehouse
Pertemuan 9 data mining dan data ware.pptx
Data Mart, Warehouse, Mining, OLAP......
Pertemuan 4 Konsep Dasar Data Mining dan Algoritma.pptx
Materi Sesi 2 - Tayangan 5 - Menentukan Objek Data.ppsx
Herwanto_Kuliah_Umum_Big_Data_Analysis.pptx
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
Kelompok 3 Asosiasi Apis Pengolahan Citra Digital.pptx
Online Education PowerPoint Templates (1).pptx
17. sarah fadilah implementasi data mining untuk pengenalan karakteristik t...
Materi ke 1 Matakuliah Analisis dan Visualisasi Data.pdf
Kuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptx
Pertemuan 3 - Konsep dan Rancangan Data Warehouse Lanjutan.pptx
Kecerdasan bisnis- Sistem Penunjang Keputusan
Ad

More from budiman (11)

PDF
Pertemuan 3 Aljabar Linier (Perkalian Matriks, Vektor, Determinan dan eigenva...
PDF
Pertemuan 2 - Konsep Dasar Deep Learning.pdf
PDF
Pertemuan 4 Feedforward Neural Network.pdf
PDF
Materi Data Mining - Klasifikasi Decision Tree
PDF
Pengenalan Manajemen Proyek Perangkat Lunak
PDF
Graph, Bidirect Graph, Terminologi Graph, Implementasi
PPT
Konsep Array dan Implementasi dalam Bahasa Pemrograman C++
PPSX
Pertemuan 2 - Tipe_Data.ppsx
PPTX
SESI 4 Konsep SDGs.pptx
PDF
10 Association Rule - Apriori (1).pdf
PDF
SESI 2 DATA DEFINITION LANGUAGE.pdf
Pertemuan 3 Aljabar Linier (Perkalian Matriks, Vektor, Determinan dan eigenva...
Pertemuan 2 - Konsep Dasar Deep Learning.pdf
Pertemuan 4 Feedforward Neural Network.pdf
Materi Data Mining - Klasifikasi Decision Tree
Pengenalan Manajemen Proyek Perangkat Lunak
Graph, Bidirect Graph, Terminologi Graph, Implementasi
Konsep Array dan Implementasi dalam Bahasa Pemrograman C++
Pertemuan 2 - Tipe_Data.ppsx
SESI 4 Konsep SDGs.pptx
10 Association Rule - Apriori (1).pdf
SESI 2 DATA DEFINITION LANGUAGE.pdf
Ad

Recently uploaded (9)

PPTX
Materi asdsa asd asd sad sa dsa dsa d sa
PDF
Rekomendasi Riset Lanjutan : perspektif_futurologis.pdf
PPT
pengantar-sistem-informasi manajemen.ppt
PDF
Modul_Pemula_Merakit_Komputer untuk smppdf
DOCX
Antivirus Versi.FULL.JALiN.KB.PRO Keutuhan Aplikasi Konsep dan Praktik dalam ...
DOCX
Keutuhan Aplikasi Konsep dan Praktik dalam Upaya menciptakan aplikasi Anti Vi...
PPTX
Implementasi Microservices pada Manufaktur
PPTX
Materi_Array_Karakter_String untuk kelas XI sma.pptx
PPTX
Peranan AI dalam Dunia Pendidikan dan Industri Aplikasinya
Materi asdsa asd asd sad sa dsa dsa d sa
Rekomendasi Riset Lanjutan : perspektif_futurologis.pdf
pengantar-sistem-informasi manajemen.ppt
Modul_Pemula_Merakit_Komputer untuk smppdf
Antivirus Versi.FULL.JALiN.KB.PRO Keutuhan Aplikasi Konsep dan Praktik dalam ...
Keutuhan Aplikasi Konsep dan Praktik dalam Upaya menciptakan aplikasi Anti Vi...
Implementasi Microservices pada Manufaktur
Materi_Array_Karakter_String untuk kelas XI sma.pptx
Peranan AI dalam Dunia Pendidikan dan Industri Aplikasinya

Pertemuan 4 - MODEL PROSES DATA MINING.pptx.pdf

  • 1. DATA MINING DAN DATA WAREHOUSE Pertemuan 4 – Model Proses Data Mining Budiman, S.T., M.Kom.
  • 2. DATA MINING ● Data Mining adalah kegiatan untuk menemukan informasi atau pengetahuan yang berguna secara otomatis dari data yang jumlahnya besar. ● Data Mining merupakan salah satu proses dari keseluruhan proses yang ada pada Knowledge Discovery in Databases (KDD).
  • 3. KDD ● Knowledge Discovery in Databases (KDD) merupakan sekumpulan proses untuk menemukan pengetahuan yang bermanfaat dari data. ● Kumpulan proses dalam KDD meliputi : pembersihan data (data cleaning), integrasi data (data integration), pemilihan data (data selection), transformasi data (data transformation), penambangan data (data mining), evaluasi pola (pattern evaluation), dan presentasi pengetahuan (knowledge presentation). ● Berdasarkan definisi ini terlihat bahwa data mining hanya merupakan salah satu proses dari keseluruhan proses yang ada pada KDD, tetapi merupakan proses yang sangat penting dalam menemukan pola-pola yang berguna dari sejumlah data yang besar (data tersebut bisa disimpan dalam basisdata, Data Warehouse, atau media penyimpanan informasi lainnya).
  • 4. KDD VS DATA MINING ● Menurut Cabena, Data Mining = Knowledge Discovery in Database (KDD). ● Menurut Jiawei Han, Data Mining merupakan Subset atau salah satu tahap dari KDD saja. Sehingga, batasan ini yang selanjutkan digunakan. ● Data Mining bertujuan mengekplorasi basis data untuk menemukan pola-pola pengetahuan yang tersembunyi di dalam data tersebut.
  • 5. TAHAPAN KNOWLEDGE DISCOVERY IN DATABASE Menurut Peter Cabena, Tahapan – tahapan dalam KDD adalah sebagai berikut : ● Penentuan Sasaran Bisnis (Business Objective Determination) ● Persiapan Data (Preparation Data) ● Data Selection ● Data Preprocessing ● Data Transformation ● Data Mining ● Anaysis of Result ● Assimilation of Knowledge
  • 6. Business Objective Determination ● Merupakan sebuah tahapan yang mendefinisikan permasalahan atau tantangan bisnis dengan jelas. Hal ini merupakan aspek yang sangat esensial dalam setiap proyek data mining. ● Contoh Sasaran Bisnis : Mengembangkan suatu strategi marketing untuk mempertahankan loyalitas customer di Jawa Tengah dan Jawa Timur untuk produk soft drink dengan brand dan ukuran tertentu (200ml dalam kotak alumunium) selama bulan April, Mei , Juni yang akan datang. Perusahaan akan menggunakan kombinasi dari berbagai strategi marketing (mixed marketing), yang salah satunya adalah direct mail campaign kepada customer yang tampaknya "mudah rusak" loyalitasnya.
  • 7. Business Objective Determination ● Merupakan sebuah tahapan yang mendefinisikan permasalahan atau tantangan bisnis dengan jelas. Hal ini merupakan aspek yang sangat esensial dalam setiap proyek data mining. ● Contoh Sasaran Bisnis : Mengembangkan suatu strategi marketing untuk mempertahankan loyalitas customer di Jawa Tengah dan Jawa Timur untuk produk soft drink dengan brand dan ukuran tertentu (200ml dalam kotak alumunium) selama bulan April, Mei , Juni yang akan datang. Perusahaan akan menggunakan kombinasi dari berbagai strategi marketing (mixed marketing), yang salah satunya adalah direct mail campaign kepada customer yang tampaknya "mudah rusak" loyalitasnya. ● Sehingga dampak keseluruhan KDD adalah : – Data Selection: dipilih customers yang membeli produk soft drink 200 ml dalam kotak alumunium di Jawa Tengah dan Jawa Timur. – Data Transformation: customers yang membeli produk soft drink 200 ml dalam kotak alumunium disorting dalam 10 kategori, yang masing-masing membedakan tingkat loyalitasnya: membeli produk tersebut 0-10%, 11-20%, ..... , 81-90%, 91-100% sepanjang waktu pembeliannya. Selanjutnya data inilah yang akan dibawa ke tahap data mining.
  • 8. Persiapan Data (Preparation Data) ● Merupakan tahapan untuk mempersiapkan data yang diperlukan untuk proses data mining. Tujuannya adalah agar data yang digunakan benar-benar sesuai dengan permasalahan yang akan dipecahkan, dapat dijamin kebenarannya, dan dalam format yang sesuai/tepat. ● Tahap yang paling banyak mengkonsumsi resources (manusia, biaya, waktu) yang tersedia. Biasanya mencapai 60% keseluruhan proyek KDD. ● Data Selection: Mengidentifikasi semua sumber informasi internal dan eksternal dan memilih sebagian saja dari data yang diperlukan untuk aplikasi data mining. ● Data Preprocessing: Meyakinkan kualitas data yang telah dipilih pada tahapan sebelumnya. 2 issue yang sering dihadapkan pada tahapan ini adalah Noisy Data dan Missing Value. ● Data Transformation: Mengubah data ke dalam model analitis serta memodelkan data agar sesuai dengan analisa yang diharapkan dan format data yang diperlukan oleh algoritma data mining.
  • 9. DATA MINING ● Melakukan proses pencarian pengetahuan terhadap data yang ditransformasikan pada tahap sebelumnya. ● Contoh Pengetahuan berbentuk Association Rule untuk kasus "Soft Drink“: ○ IF soft drink sejenis dengan ukuran yang lebih besar (bukan botol kecil) dibeli lebih dari 58% dalam sejarah pembelian soft drink seorang consumer ○ THEN consumer tersebut diprediksi Loyal. ● Pemilihan tugas data mining : pemilihan goal dari proses KDD misalnya klasifikasi, regresi, clustering, dll.
  • 10. DATA MINING ● Melakukan proses pencarian pengetahuan terhadap data yang ditransformasikan pada tahap sebelumnya. ● Contoh Pengetahuan berbentuk Association Rule untuk kasus "Soft Drink“: ○ IF soft drink sejenis dengan ukuran yang lebih besar (bukan botol kecil) dibeli lebih dari 58% dalam sejarah pembelian soft drink seorang consumer ○ THEN consumer tersebut diprediksi Loyal. ● Pemilihan tugas data mining : pemilihan goal dari proses KDD misalnya klasifikasi, regresi, clustering, dll. ● Proses Data mining yaitu proses mencari pola atau informasi menarik dalam data terpilih dengan menggunakan teknik atau metode tertentu. Teknik, metode, atau algoritma dalam data mining sangat bervariasi. Pemilihan metode atau algoritma yang tepat sangat bergantung pada tujuan dan proses KDD secara keseluruhan.
  • 11. Analysis of Result ● Menginterpretasikan dan mengevaluasi output dari tahap mining: patterns. ● Pendekatan analisa yang digunakan akan bervariasi menurut operasi data mining yang digunakan, tetapi biasanya akan melibatkan teknik visualisasi.
  • 12. Assimilation of Knowledge ● Menggunakan hasil mining yang telah dievaluasi ke dalam perilaku organisasi dan sistem informasi perusahaan.
  • 13. Knowledge Discovery in Database Process
  • 14. DATA MINING dan PROSES ● Pembersihan data (Data Cleaning) ○ Digunakan untuk membuang data yang tidak konsisten dan noise. ● Intergrasi Data (Data Integration) ○ Data yang diperlukan untuk data mining tidak hanya berasal dari satu database tetapi juga berasal dari beberapa database atau file teks. Hasil integrasi data sering diwujudkan dalam sebuah data warehouse karena dengan data warehouse, data dikonsolidasikan dengan struktur khusus yang efisien. Selain itu data warehouse juga memungkinkan tipe analisa seperti OLAP. ● Transformasi data ○ Transformasi dan pemilihan data ini untuk menentukan kualitas dari hasil data mining, sehingga data diubah menjadi bentuk sesuai untuk di-Mining. ● Aplikasi Teknik Data Mining ○ Aplikasi teknik data mining sendiri hanya merupakan salah satu bagian dari proses data mining. Ada beberapa teknik data mining yang sudah umum dipakai. ● Evaluasi pola yang ditemukan ○ Dalam tahap ini hasil dari teknik data mining berupa pola-pola yang khas maupun model prediksi dievaluasi untuk menilai apakah hipotesa yang ada memang tercapai. ● Presentasi Pengetahuan ○ Presentasi pola yang ditemukan untuk menghasilkan aksi tahap terakhir dari proses data mining adalah bagaimana memformulasikan keputusan atau aksi dari hasil analisa yang didapat.
  • 16. CRISP-DM ● CRISP-DM adalah singkatan dari Cross Industry Standard Process for Data Mining. Ini adalah model proses data mining yang menggambarkan pendekatan yang umum digunakan oleh para ahli data mining untuk mengatasi masalah. Jajak pendapat yang dilakukan pada tahun 2002, 2004, dan 2007 menunjukkan bahwa CRISP-DM merupakan metodologi utama yang digunakan oleh para penambang data. ● Satu-satunya standar data mining lain yang disebutkan dalam jajak pendapat ini adalah SEMMA. ● Namun, 3-4 kali lebih banyak orang melaporkan menggunakan CRISP-DM. Sebuah tinjauan dan kritik terhadap model proses penggalian data pada tahun 2009 menyebut CRISP-DM sebagai “standar de facto untuk mengembangkan proyek penggalian data dan penemuan pengetahuan.” ● Ulasan lain tentang CRISP-DM dan model proses data mining termasuk ulasan Kurgan dan Musilek pada tahun 2006, serta perbandingan CRISP-DM dan SEMMA pada tahun 2008 oleh Azevedo dan Santos.
  • 18. CRISP-DM ● Pemahaman Bisnis(Business Understanding) Merupakan tahap awal yaitu pemahaman penelitian, penentuan tujuan dan rumusan masalah data mining. ● Pemahaman Data(Data Understanding) Dalam tahap ini dilakukan pengumpulan data, mengenali lebih lanjut data yang akan digunakan. ● Pengolahan Data(Data Preparation) Tahap ini adalah pekerjaan berat yang perlu dilaksanakan secara intensif. Memilih kasus atau variable yang ingin dianalisis, melakukan perubahan pada beberapa variable jika diperlukan sehingga data siap untuk dimodelkan. ● Pemodelan(Modeling) Memilih teknik pemodelan yang sesuai dan sesuaikan aturan model untuk hasil yang maksimal. Dapat kembali ke tahap pengolahan untuk menjadikan data ke dalam bentuk yang sesuai dengan model tertentu. ● Evaluasi (Evaluation) Mengevaluasi satu atau model yang digunakan dan menetapkan apakah terdapat model yang memenuhi tujuan pada tahap awal. Kemudian menentukan apakah ada permasalahan yang tidak dapat tertangani dengan baik serta mengambil keputusan hasil penelitian. ● Penyebaran (Deployment) Menggunakan model yang dihasilkan seperti pembuatan laporan atau penerapan proses data mining pada departemen lain.
  • 20. KDD VS CRISP-DM VS SEMMA-DM
  • 21. TERIMA KASIH “Every morning you have two choices: continue to sleep with your dreams, or wake up and chase them.”