SlideShare a Scribd company logo
Big Data & Data
Analytics
Pertemuan 6
Manipulasi Data
Operator Cut
Operator
Split
Operator
Merge
Operator Set
Data
Menggunakan Operator Cut
• Operator Cut digunakan untuk menghilangkan beberapa karakter dalam
suatu kata pada suatu attribute.
• Misal pada Data Set “Iris” terdapat attribute label yang berisi Jenis bunga
Iris yaitu “Iris-setosa”, “Iris-versicolor” dan “Iris-virginica”.
• Kita akan hilangkan nama genus dari bunga Iris tersebut yaitu “Iris-”
sehingga didapat nama spesiesnya saja “setosa”, “versicolor” dan “virginica”
Retrieve Data Set “Iris” ke panel proses
Pilih operator “Cut” – klik
Pada Parameter, Isikan :
• Attribute filter type : pilih Single
• Attribute : pilih Label
• First character Index : Isilah dengan 6 (karena karakternya dimulai dari digit ke 6)
• Last character index : isilah dengan 20
• Klik include special attributes
Klik
Manipulasi Data Rapid Miner BigData Analytics
Hasil
Menggunakan Operator Split
• Operator Cut digunakan untuk memisahkan nilai suatu attribute
menjadi beberapa attribute.
• Misal pada Data Set “Iris” terdapat attribute label yang berisi Jenis
bunga Iris yaitu “Iris-setosa”, “Iris-versicolor” dan “Iris-virginica”.
• Kita akan pisahkan nama genus dari bunga Iris tersebut yaitu “Iris”
dengan nama Spesiesnya yaitu “setosa”, “versicolor” dan “virginica”
 Retrieve Data Set “Iris” ke panel proses
 Pilih operator “Split” – klik
 Pada Parameter, Isikan :
• Attribute filter type : pilih Single
• Attribute : pilih Label
• Split Pattern : Isilah dengan - (karena separator antar kata adalah -)
• Split Mode : Pilih Ordered_split
• Klik include special attributes
 Klik
Manipulasi Data Rapid Miner BigData Analytics
Hasil
Menggunakan Operator Merge
• Operator Merge digunakan untuk menggabungkan 2 nilai nominal
pada suatu attribute.
• Misal pada Data Set “Golf” akan ditambahkan kata “hot” di belakang
kata “Sunny” pada attribute “Outlook” sehingga diperoleh kata
“Sunny_hot”.
 Retrieve Data Set “Golf” ke panel proses
 Pilih operator “Merge” – klik
 Pada Parameter, Isikan :
• Attribute name : pilih attribute “Outlook”
• First value : ketikkan “sunny”
• Last value : ketikkan “hot”
 Klik
Manipulasi Data Rapid Miner BigData Analytics
Hasil
Menggunakan Operator Set Data
• Operator Merge digunakan untuk menyetting data pada salah satu
atau beberapa attribute pada baris tertentu.
• Misal pada Data Set “Golf”, data baris pertama pada attribute
“Temperature” diganti dengan nilai 50 dan “Wind” diganti dengan
“fast”
 Retrieve Data Set “Golf” ke panel proses
 Pilih operator “Set Data” – klik
 Pada Parameter, Isikan :
• Example Index : isikan dengan 1
• Attribute name : Pilih attribute “Temperature”
• Value : ketikkan “50”
• Additional values : klik edit list – pada attribute name : pilih “Wind” dan
value isilah dengan “fast”
• Klik apply
 Klik
Manipulasi Data Rapid Miner BigData Analytics
Manipulasi Data Rapid Miner BigData Analytics
Hasil
Operator Aggregate
Aggregate
• Operator aggregate dapat digunaan untuk memperlihatkan fungsi agregasi dari
suatu SQL. Operator ini dapat menghasilkan berbagai fungsi seperti rata-rata,
nilai max atau min, dsb. Selain itu juga dapat digunakan untuk melakukan
pengelompokan data.
Contoh Kasus
Misalkan digunakan dataset “Golf”
1. Akan ditambahkan baris / examples dengan nilai-nilai pada attribute “Outlook”
2. Akan dikelompokkan baris yang tersisa pada data set tersebut dengan nilai yang
ada pada “Play” dan “Wind”
3. Selanjutnya, akan dicari rata-rata Temperature dan rata-rata “Humidity” untuk
data tersebut.
4. Akan dilihat rata-rata Temperature yang kurang dari 71 dan akan dilihat secara
urutan menaik (ascending)
Jawaban Kasus 1
Retrieve data set “Golf” ke panel proses
Pilih operator “filter Examples” – klik
Pada parameter , Isikan :
 Filters : Klik Add filters – pilih “outlook” lalu “equals” lalu “overcast” - Klik
OK
 Condition class : pilih custom_filters
Klik
Manipulasi Data Rapid Miner BigData Analytics
Manipulasi Data Rapid Miner BigData Analytics
Manipulasi Data Rapid Miner BigData Analytics
Jawaban Kasus 2
Pilih operator “aggregate” – klik
Pada parameter, Isikan :
 Aggregation attributes : Pilih “Temperature” dengan attribute functions “average”
 Klik add entry
 Aggregation attributes : Pilih “Humidity” dengan attribute functions “average”
 Klik Apply
 Lalu, pada group by attributes : klik Select attributes
 Pindahkan attribute yang dikehendaki
Klik
Manipulasi Data Rapid Miner BigData Analytics
Manipulasi Data Rapid Miner BigData Analytics
Manipulasi Data Rapid Miner BigData Analytics
Manipulasi Data Rapid Miner BigData Analytics
Jawaban Kasus 3
Pilih operator “filter Examples” – klik
Pada parameter Isikan :
 Filters : klik add filters – pilih average (Temperature) – pilih < (di
tengah)- ketikkan 71 (paling kanan)
Klik
Manipulasi Data Rapid Miner BigData Analytics
Manipulasi Data Rapid Miner BigData Analytics
Manipulasi Data Rapid Miner BigData Analytics
Jawaban Kasus 4
Pilih operator “sort”- klik
Pada parameter, sort by :
-> klik Edit list – attribute name : pilih average(Temperature)
- sorting order : pilih Ascending
- klik apply
Klik
Manipulasi Data Rapid Miner BigData Analytics
Manipulasi Data Rapid Miner BigData Analytics
Manipulasi Data Rapid Miner BigData Analytics
Operator PIVOT
Menggunakan Operator Pivot
• Operator pivot digunakan untuk membentuk suatu table pivot, meringkas data
dalam table yang lebih besar dengan mengelompokkannya dalam beberapa grup
dan melakukan penghitungan jumlah, rata-rata, dan statistic lainnya untuk setiap
grupnya.
• Misalkan akan ditentukan peluang penumpang selamat (survived) dari data
Titanic berdasarkan kelompok “passenger class” dan “sex” serta membentuk
suatu attribute baru “Family Size” dan melakukan penghitungan terhadapnya
menggunakan operator pivot.
Menentukan Penumpang Selamat Berdasarkan Kelompok Kelas & Jenis
Kelamin
• Retrieve data “Titanic” ke panel proses
• Karena pada attribute “survived” masih bertipe nominal maka harus diubah
menjadi “numeric” menggunakan Operator “Nominal to Numerical”
• Pada parameter, isilah :
a. Attribute filter type : Pilih Single
b. Attribute : pilih Survived
c. Unexpected value handling : pilih all 0 and warning
Manipulasi Data Rapid Miner BigData Analytics
Manipulasi Data Rapid Miner BigData Analytics
• Pilih Operator “Pivot”- klik
• Pada Parameter, Isikan dengan :
a. Group by attributes : Klik Select Attributes – pindahkan “Passenger Class” ke
kanan – klik apply
b. Column grouping attributes : pilih Sex
c. Aggregation attributes : Klik Edit List – aggregation attributes : Survived = YES
aggregation functions : average
d. Klik Apply
* Klik
Manipulasi Data Rapid Miner BigData Analytics
Manipulasi Data Rapid Miner BigData Analytics
Manipulasi Data Rapid Miner BigData Analytics
Menentukan Family Size dari Data Titanic
• Retrieve data “Titanic” ke panel proses
• Dibentuk attribute baru dengan nama “Family Size” menggunakan operator Generate Attribute
• Pada parameter, isilah :
a. Function attribute : Klik Edit List
b. Attribute name : Ketikkan nama attribute baru “Family Size “
c. Function Expressions : klik gambar kalkulator – definisikan fungsi berikut :
d. Klik Apply
* Klik
Manipulasi Data Rapid Miner BigData Analytics
Manipulasi Data Rapid Miner BigData Analytics
Manipulasi Data Rapid Miner BigData Analytics
Manipulasi Data Rapid Miner BigData Analytics
• Pilih Operator “Pivot”- klik
• Pada Parameter, Isikan dengan :
a. Group by attributes : Klik Select Attributes – pindahkan “Passenger Class” dan “Sex” ke
kanan – klik apply
b. Column grouping attributes : pilih “Survived”
c. Aggregation attributes : Klik Edit List
– aggregation attributes : Family Size & aggregation functions : average
- aggregation attributes : Family Size & aggregation functions : count
d. Klik Apply
* Klik
Manipulasi Data Rapid Miner BigData Analytics
Manipulasi Data Rapid Miner BigData Analytics
Manipulasi Data Rapid Miner BigData Analytics
Hasil
TUGAS
Manipulasi Data Rapid Miner BigData Analytics
Manipulasi Data Rapid Miner BigData Analytics
Manipulasi Data Rapid Miner BigData Analytics
Manipulasi Data Rapid Miner BigData Analytics
Manipulasi Data Rapid Miner BigData Analytics
Ketentuan Tugas
• Kerjakan Semua tugas tersebut secara mandiri
• Kerjakan tugas – tugas tersebut dalam format pdf
• Setiap jawaban dari semua soal wajib disertai dengan
screen shoot Langkah-Langkah yang dilakukan dan hasil
yang diperoleh menggunakan Rapidminer Studio
• Kumpulkan tugas tersebut paling lambat hari Selasa, 23
Oktober 2024 pukul 23.59 WIB di elearning

More Related Content

PPTX
Rapid Miner Preprocessing BigData Analytics
PDF
Guideline Submission GitHub BFAA Dicoding
PPTX
Web GIS using OpenGeo Suite
PPTX
Weighted Overlay tutor.pptx
PPTX
STATA-Part-1-Basic-Menggunakan-STATA.pptx
PDF
filter data pada datatables server side 5 menggunakan yajra laravel adminlte
PPTX
06 Data Vektor, Sistem Proyeksi & Transformasi pada QGIS 2.4
PPTX
Software Gretl peramalan ekonometrika
Rapid Miner Preprocessing BigData Analytics
Guideline Submission GitHub BFAA Dicoding
Web GIS using OpenGeo Suite
Weighted Overlay tutor.pptx
STATA-Part-1-Basic-Menggunakan-STATA.pptx
filter data pada datatables server side 5 menggunakan yajra laravel adminlte
06 Data Vektor, Sistem Proyeksi & Transformasi pada QGIS 2.4
Software Gretl peramalan ekonometrika

Recently uploaded (17)

PDF
LK - SIMULASI SIKLUS INKUIRI KOLABORATIF.pdf
PDF
6754aa176b39b (1).pdf data analisis acara
DOCX
proposal nurul 2.docx Fix dokumen yang penting
PPTX
Flowchart Pengaplikasian Sistem Arduino.pptx
PPTX
Pelatihan_Model_Pembinaan_Gen_Z_Dasar_Menengah.pptx
PPTX
Materi Kesiapan Tahapan Pemungutan dan Penghitungan Suara Pemilihan Ulang Tah...
PPTX
Gagal Ginjal Akut GHINA SELVIRA .pptx
PPTX
PERENCANAAN MEP PERUM.MULTI CIPTA PERMAI_Type 36.pptx
PDF
c3oYi7NNpW3omVenymVtXLtqfSi2hzugUlVYbGlQ.pdf
PDF
GERUDUK MJKN aplikasi mobile JKN persentation
DOCX
PROPOSAL PENGARUH PEMBERIAN MIKRONUTRIEN TERHADAP PENINGKATAN INDEKS MASA TUB...
PPTX
PRESNTASI pembangunan perumahan komersil dua lantai
PPT
Modul-Projek-JAJANAN-PASAR-YANG-MENGHASILKAN-RUPIAH-Fase-C.ppt
PDF
811848831-PPT-TES-DESKRIPShhhhhhhhhI.pdf
PPTX
ANALISIS DATA FUNGSI INFORMATIKA SMP.pptx
PPTX
EFEKTIVITAS EKSTRAK DAUN INDIGOFERA.pptx
PPTX
Introduction FastAPI for Professional and Student
LK - SIMULASI SIKLUS INKUIRI KOLABORATIF.pdf
6754aa176b39b (1).pdf data analisis acara
proposal nurul 2.docx Fix dokumen yang penting
Flowchart Pengaplikasian Sistem Arduino.pptx
Pelatihan_Model_Pembinaan_Gen_Z_Dasar_Menengah.pptx
Materi Kesiapan Tahapan Pemungutan dan Penghitungan Suara Pemilihan Ulang Tah...
Gagal Ginjal Akut GHINA SELVIRA .pptx
PERENCANAAN MEP PERUM.MULTI CIPTA PERMAI_Type 36.pptx
c3oYi7NNpW3omVenymVtXLtqfSi2hzugUlVYbGlQ.pdf
GERUDUK MJKN aplikasi mobile JKN persentation
PROPOSAL PENGARUH PEMBERIAN MIKRONUTRIEN TERHADAP PENINGKATAN INDEKS MASA TUB...
PRESNTASI pembangunan perumahan komersil dua lantai
Modul-Projek-JAJANAN-PASAR-YANG-MENGHASILKAN-RUPIAH-Fase-C.ppt
811848831-PPT-TES-DESKRIPShhhhhhhhhI.pdf
ANALISIS DATA FUNGSI INFORMATIKA SMP.pptx
EFEKTIVITAS EKSTRAK DAUN INDIGOFERA.pptx
Introduction FastAPI for Professional and Student
Ad
Ad

Manipulasi Data Rapid Miner BigData Analytics

  • 1. Big Data & Data Analytics Pertemuan 6
  • 3. Menggunakan Operator Cut • Operator Cut digunakan untuk menghilangkan beberapa karakter dalam suatu kata pada suatu attribute. • Misal pada Data Set “Iris” terdapat attribute label yang berisi Jenis bunga Iris yaitu “Iris-setosa”, “Iris-versicolor” dan “Iris-virginica”. • Kita akan hilangkan nama genus dari bunga Iris tersebut yaitu “Iris-” sehingga didapat nama spesiesnya saja “setosa”, “versicolor” dan “virginica”
  • 4. Retrieve Data Set “Iris” ke panel proses Pilih operator “Cut” – klik Pada Parameter, Isikan : • Attribute filter type : pilih Single • Attribute : pilih Label • First character Index : Isilah dengan 6 (karena karakternya dimulai dari digit ke 6) • Last character index : isilah dengan 20 • Klik include special attributes Klik
  • 7. Menggunakan Operator Split • Operator Cut digunakan untuk memisahkan nilai suatu attribute menjadi beberapa attribute. • Misal pada Data Set “Iris” terdapat attribute label yang berisi Jenis bunga Iris yaitu “Iris-setosa”, “Iris-versicolor” dan “Iris-virginica”. • Kita akan pisahkan nama genus dari bunga Iris tersebut yaitu “Iris” dengan nama Spesiesnya yaitu “setosa”, “versicolor” dan “virginica”
  • 8.  Retrieve Data Set “Iris” ke panel proses  Pilih operator “Split” – klik  Pada Parameter, Isikan : • Attribute filter type : pilih Single • Attribute : pilih Label • Split Pattern : Isilah dengan - (karena separator antar kata adalah -) • Split Mode : Pilih Ordered_split • Klik include special attributes  Klik
  • 10. Hasil
  • 11. Menggunakan Operator Merge • Operator Merge digunakan untuk menggabungkan 2 nilai nominal pada suatu attribute. • Misal pada Data Set “Golf” akan ditambahkan kata “hot” di belakang kata “Sunny” pada attribute “Outlook” sehingga diperoleh kata “Sunny_hot”.
  • 12.  Retrieve Data Set “Golf” ke panel proses  Pilih operator “Merge” – klik  Pada Parameter, Isikan : • Attribute name : pilih attribute “Outlook” • First value : ketikkan “sunny” • Last value : ketikkan “hot”  Klik
  • 14. Hasil
  • 15. Menggunakan Operator Set Data • Operator Merge digunakan untuk menyetting data pada salah satu atau beberapa attribute pada baris tertentu. • Misal pada Data Set “Golf”, data baris pertama pada attribute “Temperature” diganti dengan nilai 50 dan “Wind” diganti dengan “fast”
  • 16.  Retrieve Data Set “Golf” ke panel proses  Pilih operator “Set Data” – klik  Pada Parameter, Isikan : • Example Index : isikan dengan 1 • Attribute name : Pilih attribute “Temperature” • Value : ketikkan “50” • Additional values : klik edit list – pada attribute name : pilih “Wind” dan value isilah dengan “fast” • Klik apply  Klik
  • 19. Hasil
  • 21. Aggregate • Operator aggregate dapat digunaan untuk memperlihatkan fungsi agregasi dari suatu SQL. Operator ini dapat menghasilkan berbagai fungsi seperti rata-rata, nilai max atau min, dsb. Selain itu juga dapat digunakan untuk melakukan pengelompokan data.
  • 22. Contoh Kasus Misalkan digunakan dataset “Golf” 1. Akan ditambahkan baris / examples dengan nilai-nilai pada attribute “Outlook” 2. Akan dikelompokkan baris yang tersisa pada data set tersebut dengan nilai yang ada pada “Play” dan “Wind” 3. Selanjutnya, akan dicari rata-rata Temperature dan rata-rata “Humidity” untuk data tersebut. 4. Akan dilihat rata-rata Temperature yang kurang dari 71 dan akan dilihat secara urutan menaik (ascending)
  • 23. Jawaban Kasus 1 Retrieve data set “Golf” ke panel proses Pilih operator “filter Examples” – klik Pada parameter , Isikan :  Filters : Klik Add filters – pilih “outlook” lalu “equals” lalu “overcast” - Klik OK  Condition class : pilih custom_filters Klik
  • 27. Jawaban Kasus 2 Pilih operator “aggregate” – klik Pada parameter, Isikan :  Aggregation attributes : Pilih “Temperature” dengan attribute functions “average”  Klik add entry  Aggregation attributes : Pilih “Humidity” dengan attribute functions “average”  Klik Apply  Lalu, pada group by attributes : klik Select attributes  Pindahkan attribute yang dikehendaki Klik
  • 32. Jawaban Kasus 3 Pilih operator “filter Examples” – klik Pada parameter Isikan :  Filters : klik add filters – pilih average (Temperature) – pilih < (di tengah)- ketikkan 71 (paling kanan) Klik
  • 36. Jawaban Kasus 4 Pilih operator “sort”- klik Pada parameter, sort by : -> klik Edit list – attribute name : pilih average(Temperature) - sorting order : pilih Ascending - klik apply Klik
  • 41. Menggunakan Operator Pivot • Operator pivot digunakan untuk membentuk suatu table pivot, meringkas data dalam table yang lebih besar dengan mengelompokkannya dalam beberapa grup dan melakukan penghitungan jumlah, rata-rata, dan statistic lainnya untuk setiap grupnya. • Misalkan akan ditentukan peluang penumpang selamat (survived) dari data Titanic berdasarkan kelompok “passenger class” dan “sex” serta membentuk suatu attribute baru “Family Size” dan melakukan penghitungan terhadapnya menggunakan operator pivot.
  • 42. Menentukan Penumpang Selamat Berdasarkan Kelompok Kelas & Jenis Kelamin • Retrieve data “Titanic” ke panel proses • Karena pada attribute “survived” masih bertipe nominal maka harus diubah menjadi “numeric” menggunakan Operator “Nominal to Numerical” • Pada parameter, isilah : a. Attribute filter type : Pilih Single b. Attribute : pilih Survived c. Unexpected value handling : pilih all 0 and warning
  • 45. • Pilih Operator “Pivot”- klik • Pada Parameter, Isikan dengan : a. Group by attributes : Klik Select Attributes – pindahkan “Passenger Class” ke kanan – klik apply b. Column grouping attributes : pilih Sex c. Aggregation attributes : Klik Edit List – aggregation attributes : Survived = YES aggregation functions : average d. Klik Apply * Klik
  • 49. Menentukan Family Size dari Data Titanic • Retrieve data “Titanic” ke panel proses • Dibentuk attribute baru dengan nama “Family Size” menggunakan operator Generate Attribute • Pada parameter, isilah : a. Function attribute : Klik Edit List b. Attribute name : Ketikkan nama attribute baru “Family Size “ c. Function Expressions : klik gambar kalkulator – definisikan fungsi berikut : d. Klik Apply * Klik
  • 54. • Pilih Operator “Pivot”- klik • Pada Parameter, Isikan dengan : a. Group by attributes : Klik Select Attributes – pindahkan “Passenger Class” dan “Sex” ke kanan – klik apply b. Column grouping attributes : pilih “Survived” c. Aggregation attributes : Klik Edit List – aggregation attributes : Family Size & aggregation functions : average - aggregation attributes : Family Size & aggregation functions : count d. Klik Apply * Klik
  • 58. Hasil
  • 59. TUGAS
  • 65. Ketentuan Tugas • Kerjakan Semua tugas tersebut secara mandiri • Kerjakan tugas – tugas tersebut dalam format pdf • Setiap jawaban dari semua soal wajib disertai dengan screen shoot Langkah-Langkah yang dilakukan dan hasil yang diperoleh menggunakan Rapidminer Studio • Kumpulkan tugas tersebut paling lambat hari Selasa, 23 Oktober 2024 pukul 23.59 WIB di elearning