Академический Документы
Профессиональный Документы
Культура Документы
net/publication/294260664
CITATION READS
1 5,389
3 authors, including:
Some of the authors of this publication are also working on these related projects:
All content following this page was uploaded by Sofi Defiyanti on 29 December 2016.
Abstrak Abstract
Pengelompokan data pelamar beasiswa Bantuan Data grouping scholarship applicants for
Belajar Mahasiswa (BBM) dikelompokan menjadi 3 Student Learning Assistance (BBM) grouped into 3
kelompok yaitu berhak menerima, dipertimbangkan categories are entitled to receive, considered and not
dan tidak berhak menerima beasiswa. eligible to receive the scholarship. Grouping into 3
Pengelompokan menjadi 3 kelompok ini berguna groups is useful to facilitate in determining
untuk memudahkan dalam menentukan penerima scholarship recipients. K-means algorithm is an
beasiswa BBM. Algoritma k-means merupakan algorithm of clustering technique based partitions.
algoritma dari teknik clustering yang berbasis partisi. This technique can categorize student data
Teknik ini dapat mengelompokan data mahasiswa scholarship applicants.
pelamar beasiswa.
The purpose of this research is to determine the
Tujuan dari penelitian ini adalah untuk algorithms for performance measurement, and
pengukuran kinerja algoritma, Pengukuran ini di lihat measurement in view of the results of the cluster by
dari hasil cluster dengan menghitung nilai kemurnian calculating the value of purity (purity measure) of
(purity measure) dari masing – masing cluster yang each - each cluster is generated. The data used in this
di hasilkan. Data yang digunakan dalam penelitian ini research is data of students who apply for a
adalah data mahasiswa yang mengajukan beasiswa scholarship to the School of Computer Science
kepada Fakultas Ilmu Komputer UNSIKA sebanyak UNSIKA many as 36 students. The data will be
36 mahasiswa. Data akan diubah menjadi 3 dataset converted into 3 datasets with different formats, ie
dengan format yang berbeda-beda, yakni data atribut attribute data codification in part, attributes and
kodifikasi sebagian, atribut kodifikasi keseluruhan attribute the overall codification of the original data.
dan atribut data asli. Nilai purity pada dataset data Purity values in a dataset of data codification in part
kodifikasi sebagian untuk hasil cluster algoritma k- to the results of cluster k-means algorithm by
means sebesar 61.11%. Pada dataset kodifikasi 61.11%. At dataset codification overall value of
keseluruhan nilai purity hasil cluster algoritma k- purity results k-means cluster algorithm by 80.56%.
means sebesar 80.56%. Dan untuk dataset data asli And for the original data dataset purity value results
nilai purity hasil cluster algoritma k-means sebesar k-means cluster algorithm by 75%. Then it can be
75%. Maka dapat di simpulkan bahwa algoritma k- concluded that the k-means algorithm is more
means lebih cocok digunakan pada dataset dengan suitable for use in datasets with formatting attributes
format atribut yang dikodifikasi keseluruhan. that codified a whole
Kata kunci : Keywords :
data mining, beasiswa, clustering, k-means, purity data mining, scholarship, clustering, k-means, purity
measure measure
IPK SKS JP
Cluster 1 3.546 83.571 1,719,911.86
V.2 Pembahasan
Cluster 2 3.330 73.5 3,000,000
Cluster 3 3.353 73.926 699,067.26 Berdasarkan penghitung perbandingan nilai
purity measure pada hasil clustering dari algoritma k-
means dengan dataset atribut kodifikasi sebagian clustering hasil cluster algoritma k-means
diketahui sebesar 0.611 atau 61.11%. Dan untuk berdasarkan nilai purity measure, dataset yang
dataset data kodifikasi keseluruhan, hasil cluster dikodifikasi keseluruhan lebih baik dari pada dataset
algoritma k-means memiliki nilai purity (r) sebesar yang di kodifikasi sebagian dan dataset data asli.
0.806 atau 80.56%. Untuk dataset data asli yang pada
VI.2 Saran
penelitian ini mengandung outlier, diketahui nilai
purity (r) untuk hasil cluster algoritma k-means Kriteria pembanding untuk algoritma data
sebesar 0.750 atau 75%. mining khususnya untuk metode clustering yang
dilakukan pada penelitian ini hanya pada pengukuran
Maka dapat disimpulkan bahwa untuk algoritma
hasil clustering. Untuk penelitian selanjutnya kriteria
k-means, dataset dengan atribut data yang
lain dapat ditambahkan misalnya kriteria silhouette
dikodifikasi keseluruhan memiliki hasil cluster yang
coefficient dan error ratio.
lebih baik. Hal ini dikarenakan algoritma k-means
menggunakan mean (rata - rata) sebagai pusat
clusternya (centroid), juga Euclidean sebagai fungsi
jarak untuk menghitung jarak kedekatan antar objek REFERENSI
dengan centroidnya. Selain itu dataset yang
dikodifikasi keseluruhan, persebaran nilai pada
format dataset ini menjadi lebih sederhana, artinya Arifin, S.Pd., M.Si., MOS, M. (2007). Rancang
tidak ada data yang bernilai ekstrim (outlier). Oleh Bangun Sistem Informasi Koperasi (Studi
karena itu algoritma k-means sangat cocok untuk Kasus pada Koperasi Pegawai Republik
mengelompokan data yang tidak mengandung Indonesia"Teknik Sejahtera"). Seminar
outlier. Nasional Teknologi 2007 (SNT 2007), D-1.
DIKTI. (2013, Februari). Retrieved Januari 15,
VI. KESIMPULAN DAN SARAN 2014, from Direktorat Jendral Pendidikan
Tinggi: http://www.dikti.go.id
Hastuti, N. F., Saptono, R., & Suryani, E. (2012).
VI.1 Kesimpulan Pemanfaatan Metode K-Means Clustering
Dalam Penentuan Penerima Beasiswa.
Membandingkan hasil cluster algoritma k-
means berdasarkan hasil clustering dari masing - Jurnal Informatika.
masing format dataset yang berbeda-beda (kodifikasi Loekito, F. R., & Ayub, M. (2011). Aplikasi
sebagian, kodifikasi keseluruhan dan data asli) Pengelolaan Data Sistem Pelayanan
dengan mengukur tingkat akurasi clustering yakni Kesehatan ada Departement Kesehatan PT.
menghitung nilai purity measure dari hasil Ateja Multi Industri. Jurnal Informatika,
clusternya. Semakin besar nilai purity (semakin 145-146.
mendekati 1) semakin baik kualitas cluster yang
dihasilkan oleh suatu algoritma. Nango, D. N. (2012). Penerapan Algoritma K-
Means Untuk Clustering Data Anggaran
Berdasarkan penghitung perbandingan nilai Pendapatan Belanja Daerah di Kabupaten
purity measure pada hasil clustering dari algoritma k- XYZ. Skripsi, 11-12.
means dengan format atribut dataset yang berbeda -
beda (atribut data yang di kodifikasi sebagian, atribut Nisbet, R., Elder IV, J., & Liner, G. (2009).
data yang dikodifikasi seluruhnya dan atribut data Handbook of Statictical Analysis and Data
asli). Diketahui nilai purity pada dataset data Mining Applications. Elsevier Inc.
kodifikasi sebagian untuk hasil cluster algoritma k- Sarwono, Y. T. (n.d.). Aplikasi Model Jaringan
means sebesar 0.611 atau 61.11%. Pada dataset Syaraf Tiruan Dengan Radial Basis
kodifikasi keseluruhan nilai purity hasil cluster Function Untuk Mendeteksi Kelainan Otak
algoritma k-means sebesar 0.806 atau sebesar (Stroke Infark). Jurnal Sistem Informasi, 3-
80.56%. Untuk dataset data asli nilai purity hasil 4.
cluster algoritma k-means sebesar 0.750 atau 75%.
Maka dapat disimpulkan bahwa tingkat akurasi Suwarsa, R. D. (2013). Imlementasi K-Modes Pada