3. Menggunakan Operator Cut
• Operator Cut digunakan untuk menghilangkan beberapa karakter dalam
suatu kata pada suatu attribute.
• Misal pada Data Set “Iris” terdapat attribute label yang berisi Jenis bunga
Iris yaitu “Iris-setosa”, “Iris-versicolor” dan “Iris-virginica”.
• Kita akan hilangkan nama genus dari bunga Iris tersebut yaitu “Iris-”
sehingga didapat nama spesiesnya saja “setosa”, “versicolor” dan “virginica”
4. Retrieve Data Set “Iris” ke panel proses
Pilih operator “Cut” – klik
Pada Parameter, Isikan :
• Attribute filter type : pilih Single
• Attribute : pilih Label
• First character Index : Isilah dengan 6 (karena karakternya dimulai dari digit ke 6)
• Last character index : isilah dengan 20
• Klik include special attributes
Klik
7. Menggunakan Operator Split
• Operator Cut digunakan untuk memisahkan nilai suatu attribute
menjadi beberapa attribute.
• Misal pada Data Set “Iris” terdapat attribute label yang berisi Jenis
bunga Iris yaitu “Iris-setosa”, “Iris-versicolor” dan “Iris-virginica”.
• Kita akan pisahkan nama genus dari bunga Iris tersebut yaitu “Iris”
dengan nama Spesiesnya yaitu “setosa”, “versicolor” dan “virginica”
8. Retrieve Data Set “Iris” ke panel proses
Pilih operator “Split” – klik
Pada Parameter, Isikan :
• Attribute filter type : pilih Single
• Attribute : pilih Label
• Split Pattern : Isilah dengan - (karena separator antar kata adalah -)
• Split Mode : Pilih Ordered_split
• Klik include special attributes
Klik
11. Menggunakan Operator Merge
• Operator Merge digunakan untuk menggabungkan 2 nilai nominal
pada suatu attribute.
• Misal pada Data Set “Golf” akan ditambahkan kata “hot” di belakang
kata “Sunny” pada attribute “Outlook” sehingga diperoleh kata
“Sunny_hot”.
12. Retrieve Data Set “Golf” ke panel proses
Pilih operator “Merge” – klik
Pada Parameter, Isikan :
• Attribute name : pilih attribute “Outlook”
• First value : ketikkan “sunny”
• Last value : ketikkan “hot”
Klik
15. Menggunakan Operator Set Data
• Operator Merge digunakan untuk menyetting data pada salah satu
atau beberapa attribute pada baris tertentu.
• Misal pada Data Set “Golf”, data baris pertama pada attribute
“Temperature” diganti dengan nilai 50 dan “Wind” diganti dengan
“fast”
16. Retrieve Data Set “Golf” ke panel proses
Pilih operator “Set Data” – klik
Pada Parameter, Isikan :
• Example Index : isikan dengan 1
• Attribute name : Pilih attribute “Temperature”
• Value : ketikkan “50”
• Additional values : klik edit list – pada attribute name : pilih “Wind” dan
value isilah dengan “fast”
• Klik apply
Klik
21. Aggregate
• Operator aggregate dapat digunaan untuk memperlihatkan fungsi agregasi dari
suatu SQL. Operator ini dapat menghasilkan berbagai fungsi seperti rata-rata,
nilai max atau min, dsb. Selain itu juga dapat digunakan untuk melakukan
pengelompokan data.
22. Contoh Kasus
Misalkan digunakan dataset “Golf”
1. Akan ditambahkan baris / examples dengan nilai-nilai pada attribute “Outlook”
2. Akan dikelompokkan baris yang tersisa pada data set tersebut dengan nilai yang
ada pada “Play” dan “Wind”
3. Selanjutnya, akan dicari rata-rata Temperature dan rata-rata “Humidity” untuk
data tersebut.
4. Akan dilihat rata-rata Temperature yang kurang dari 71 dan akan dilihat secara
urutan menaik (ascending)
23. Jawaban Kasus 1
Retrieve data set “Golf” ke panel proses
Pilih operator “filter Examples” – klik
Pada parameter , Isikan :
Filters : Klik Add filters – pilih “outlook” lalu “equals” lalu “overcast” - Klik
OK
Condition class : pilih custom_filters
Klik
27. Jawaban Kasus 2
Pilih operator “aggregate” – klik
Pada parameter, Isikan :
Aggregation attributes : Pilih “Temperature” dengan attribute functions “average”
Klik add entry
Aggregation attributes : Pilih “Humidity” dengan attribute functions “average”
Klik Apply
Lalu, pada group by attributes : klik Select attributes
Pindahkan attribute yang dikehendaki
Klik
41. Menggunakan Operator Pivot
• Operator pivot digunakan untuk membentuk suatu table pivot, meringkas data
dalam table yang lebih besar dengan mengelompokkannya dalam beberapa grup
dan melakukan penghitungan jumlah, rata-rata, dan statistic lainnya untuk setiap
grupnya.
• Misalkan akan ditentukan peluang penumpang selamat (survived) dari data
Titanic berdasarkan kelompok “passenger class” dan “sex” serta membentuk
suatu attribute baru “Family Size” dan melakukan penghitungan terhadapnya
menggunakan operator pivot.
42. Menentukan Penumpang Selamat Berdasarkan Kelompok Kelas & Jenis
Kelamin
• Retrieve data “Titanic” ke panel proses
• Karena pada attribute “survived” masih bertipe nominal maka harus diubah
menjadi “numeric” menggunakan Operator “Nominal to Numerical”
• Pada parameter, isilah :
a. Attribute filter type : Pilih Single
b. Attribute : pilih Survived
c. Unexpected value handling : pilih all 0 and warning
45. • Pilih Operator “Pivot”- klik
• Pada Parameter, Isikan dengan :
a. Group by attributes : Klik Select Attributes – pindahkan “Passenger Class” ke
kanan – klik apply
b. Column grouping attributes : pilih Sex
c. Aggregation attributes : Klik Edit List – aggregation attributes : Survived = YES
aggregation functions : average
d. Klik Apply
* Klik
49. Menentukan Family Size dari Data Titanic
• Retrieve data “Titanic” ke panel proses
• Dibentuk attribute baru dengan nama “Family Size” menggunakan operator Generate Attribute
• Pada parameter, isilah :
a. Function attribute : Klik Edit List
b. Attribute name : Ketikkan nama attribute baru “Family Size “
c. Function Expressions : klik gambar kalkulator – definisikan fungsi berikut :
d. Klik Apply
* Klik
54. • Pilih Operator “Pivot”- klik
• Pada Parameter, Isikan dengan :
a. Group by attributes : Klik Select Attributes – pindahkan “Passenger Class” dan “Sex” ke
kanan – klik apply
b. Column grouping attributes : pilih “Survived”
c. Aggregation attributes : Klik Edit List
– aggregation attributes : Family Size & aggregation functions : average
- aggregation attributes : Family Size & aggregation functions : count
d. Klik Apply
* Klik
65. Ketentuan Tugas
• Kerjakan Semua tugas tersebut secara mandiri
• Kerjakan tugas – tugas tersebut dalam format pdf
• Setiap jawaban dari semua soal wajib disertai dengan
screen shoot Langkah-Langkah yang dilakukan dan hasil
yang diperoleh menggunakan Rapidminer Studio
• Kumpulkan tugas tersebut paling lambat hari Selasa, 23
Oktober 2024 pukul 23.59 WIB di elearning