You are on page 1of 2

DATA MINING EXERCISE

APLIKASI DATA MINING

Nama Anggota Kelompok 2 :


1. Adilla Zikra (14.7946)
2. Anis Khoirun Nisaa (14.7989)
3. Arifin (14.8011)
4. Dannar Kurniawan Ajie Prasetya (14.8061)
5. Dwi Rizky Syaifullah (14.8093)
6. Rahma Ardani (14.8329)
7. Rissa Afrianti Afhan (14.8351)
8. Tonny Arief Juniarta (14.8428)
=================================================================
1. Hasil dan Pembahasan
Penelitian ini menggunakan sebanyak 41.188 dataset yang terdiri dari 20 atribut.
Sebelum melakukan running terhadap data. terlebih dahulu dilakukan tahap preprocessing.
Dalam tahap ini hanya dilakukan uji outlier, dimana dari 41.118 dataset semula, terdapat
outlier sebanyak ….. yang selanjutnya dihapus. “Orangeku ndak bisa buka”
Terdapat empat classifier yang akan diuji untuk mengetahui classifier terbaik dalam
mengklasifikasikan data nasabah bank. Classifier tersebut adalah naïve bayes, decision
tree, svm, dan neural network. Karena jumlah dataset yang besar, akan sulit apabila diolah
secara manual sehingga digunakan aplikasi orange untuk mempermudah dalam
pengerjaan. Berikut syntax dari orange :

Gambar 1. Syntax orange


Dari syntax orange diatas dihasilkan output sebagai berikut:
Tabel 1. Hasil
Dari output diatas dapat disimpulkan bahwa secara keseluruhan metode Neural
Network merupakan metode terbaik dalam mengklasifikasikan data. Dari semua ukuran
yang ada baik itu CA, F1, maupun Precision. Metode Neural Network memiliki nilai
tertinggi.

Gambar 2. Kurva ROC


Kurva ROC juga dapat digunakan dalam menentukan classifier terbaik. Semakin
besar daerah dibawah kurva (AUC) maka classifier semakin baik. Dari tabel 1, dapat dilihat
AUC untuk masing masing metode. Dimana AUC terbesar di dapatkan dengan
menggunakan metode Neural Network.