94 13 25 1 10 20170930 PDF

Jurnal Ilmu Komputer dan Bisnis, Volume 8, Nomor 1, Mei 2017
IMPLEMENTASI METODE KLASTERING K-MEANS

UNTUK MENGELOMPOKAN HASIL EVALUASI MAHASISWA
FEBRIZAL ALFARASY SYAM

Dosen STMIK Dharmapala Riau
ABSTRAK
Mengelompokan hasil evaluasi akademik mahasiswa adalah salah satu basis untuk memantau
perkembangan kinerja akademik mahasiswa di suatu universitas. Pengelompokan mahasiswa
ke dalam kategori yang berbeda sesuai dengan kinerja mereka telah menjadi tugas yang rumit.
Dalam mengelola data akademik mahasiswa penulis menggunakan metode Data Mining
dengan Algoritma K-means Clustering. Hasil penelitian ini berupa pengelompokan
mahasiswa berdasarkan cluster mahasiswa berprestasi, cluster mahasiswa berpotensi
berprestasi, cluster mahasiswa berpotensi bermasalah dan cluster mahasiswa bermasalah.
Selanjutnya pengujian dilakukan dengan menggunakan aplikasi RapidMiner, yang hasilnya
sama dengan perhitungan analisa Algoritma K-Means yang dilakukan.
Kata Kunci : Data Mining, Cluster, K-Means Clustering, RapidMiner.
1. PENDAHULUAN cepat dan efisien membantu memantau

Indeks Prestasi Kumulatif (IPK) perkembangan kinerja mahasiswa disuatu
adalah indikator yang umum digunakan instansi pendidikan (Arora & Badal 2013)
untuk mengukur kinerja akademik Dalam penelitian ini, dilakukan
mahasiswa di suatu universitas. Banyak pengelompokan mahasiswa berprestasi dan
universitas menetapkan IPK minimal yang bermasalah dengan metode Klastering K-
harus dipertahankan untuk melanjutkan means. Klastering K-means dilakukan
program sarjana. Mengelompokan hasil untuk mengklaster data akademik
evaluasi akademik mahasiswa adalah mahasiswa menjadi empat buah klaster,
salah satu basis untuk memantau yaitu klaster mahasiswa berprestasi,
perkembangan kinerja akademik berpotensi berprestasi, berpotensi
mahasiswa di suatu universitas. Penelitian bermasalah, dan klaster mahasiswa
yang penulis lakukan adalah di salah satu bermasalah.
Perguruan Tinggi di Pekanbaru-Riau yaitu
Universitas Riau, tepatnya di Fakultas 2. KAJIAN LITERATUR
Keguruan dan Ilmu Pendidikan. Dimana 2.1 Knowledge Discovery in Database
Fakultas tersebut memiliki jumlah (KDD)
mahasiswa hingga tahun 2015 adalah ± Data Mining sering dianggap sebagai
5418 orang. bagian dari knowledge discovery in
Data Mining merupakan database (KDD) yaitu sebuah proses
penggalian makna yang tersembunyi dari mencari pengetahuan yang bermanfaat dari
kumpulan data yang sangat besar. Karena data, proses KDD secara garis besar dapat
itu Data Mining sebenarnya memiliki akar dijelaskan sebagai berikut (Sunjana 2010):
yang panjang dari bidang ilmu seperti
pecerdasan buatan (artificial intelligent), 1. Data Selection
machine learning, statistik dan basis data Pemilihan (Seleksi) data dari
(Aprilla et al. 2013). Penggunaan sekumpulan data operasional perlu
Algoritma K-Means dinilai dapat dengan
STMIK Dharmapala Riau 1857

dilakukan sebelum tahap penggalian mempunyai arti bagi pendukung keputusan

informasi dalam KDD dimulai. (Sunjana 2010).
2. Pre-processing/Cleaning 2.3 Clustering

Sebelum proses Data Mining dapat Adapun tujuan dari data Clustering
dilaksanakan, perlu dilakukan proses ini adalah untuk meminimalisasikan
cleaning pada data yang menjadi fokus objective function yang diset dalam proses
KDD. Proses cleaning mencakup antara Clustering, yang pada umumnya berusaha
lain membuang duplikasi data memeriksa meminimalisasikan variasi di dalam suatu
data yang inkonsisten, dan memperbaiki cluster dan memaksimalisasikan variasi
kesalahan pada data, seperti kesalahan antar cluster (Suwirmayanti et al. 2014).
cetak. Analisis cluster dapat dibagi
menjadi teknik pengelompokan
3. Transformation hierarchical (hirarki) dan teknik
Coding adalah proses transformasi pengelompokan non-hierarchical (non-
pada data yang telah dipilih, sehingga data hirarki). Contoh teknik hirarki adalah
tersebut sesuai untuk proses Data Mining. single linkage, complete linkage, average
Proses coding dalam KDD merupakan linkage, median dan Ward. Sedangkan
proses kreatif dan sangat bergantung pada teknik non-hirarkis yaitu k-means, adaptif
jenis atau pola informasi yang akan dicari k-means, k-medoids, dan fuzzy clustering.
dalam basis data. Untuk menentukan algoritma yang baik
adalah dilihat dari jenis data yang tersedia
4. Data Mining dan tujuan tertentu dari analisis (Oyelade et
Data Mining adalah proses mencari al. 2010).
pola atau informasi menarik dalam data Teknik pengelompokan saat ini
terpilih dengan menggunakan teknik atau dapat diklasifikasikan menjadi tiga
metode tertentu. kategori yaitu partitional, hirarkis dan
berbasis lokalitas algoritma. Terdapat satu
5. Interpretation/Evaluation set objek dan kriteria clustering atau
Pola informasi yang dihasilkan dari pengelompokan, pengelompokan
proses Data Mining perlu ditampilkan partitional mememperoleh partisi objek ke
dalam bentuk yang mudah dimengerti oleh dalam cluster sehingga objek dalam cluster
pihak yang berkepentingan. Tahap ini akan lebih mirip dengan benda-benda yang
merupakan bagian dari proses KDD yang ada di dalam cluster dari pada objek yang
disebut interpretation. Tahap ini mencakup terdapat pada cluster yang berbeda.
pemeriksaaan apakah pola atau informasi Partitional mencoba untuk menguraikan
yang ditemukan bertentangan dengan fakta dataset ke satu set cluster dengan
atau hipotesis yang ada sebelumnya. menentukan jumlah cluster awal yang
diinginkan (Varghese et al. 2011).
2.2 Data Mining
Data Mining adalah proses mencari 2.4 Algoritma K-Means
pola atau informasi menarik dalam data Algoritma K-means merupakan
terpilih menggunakan teknik atau metode salah satu algoritma dengan partitional,
tertentu. Teknik, metode atau algoritma karena K-Means didasarkan pada
dalam Data Mining sangat bervariasi. Data penentuan jumlah awal kelompok dengan
Mining mampu menganalisa data yang mendefinisikan nilai centroid awalnya
besar menjadi informasi berupa pola yang (Madhulatha 2012).

K-Means termasuk dalam metode N : banyaknya objek/jumlah

Data Mining partitioning clustering yaitu objek yang menjadi
setiap data harus masuk dalam cluster anggota cluster
tertentu dan memungkinkan bagi setiap
data yang termasuk dalam cluster tertentu 3. Hitung jarak setiap objek ke masing-
pada suatu tahapan proses, pada tahapan masing centroid dari masing-masing
berikutnya berpindah ke cluster lain. K- cluster. Untuk menghitung jarak
Means memisahkan data ke K daerah antara objek dengan centroid dapat
bagian terkenal karena kemudian dan menggunakan Euclidian Distance
kemampuannya untuk mengklasifikasi data
besar dan outlier dengan sangat cepat d(x,y) = || x – y ||
(Siska 2016). = ; i = 1,2,3,....,n
Dalam penyelesaiannya, algoritma
K-Means akan menghasilkan titik centroid
Di mana xi : objek x ke-i
yang dijadikan tujuan dari algoritma K-
yi : daya y ke-i
Means. Setelah iterasi K-Means berhenti ,
n : banyaknya objek
setiap objek dalam dataset menjadi anggota
dari suatu cluster. Nilai cluster ditentukan
4. Alokasikan masing-masing objek ke
dengan mencari seluruh objek untuk
dalam centroid yang paling dekat.
menemukan cluster dengan jarak terdekat
Untuk melakukan pengalokasian objek
ke objek . Algoritma K -means akan
kedalam masing-masing cluster pada
mengelompokan item data dalam suatu
saat iterasi secara umum dapat
dataset ke suatu cluster berdasarkan jarak
dilakukan dengan cara hard K-Means
terdekat (Bhoomi 2014).
di mana secara tegas setiap objek
Berikut ini langkah-langkah yang
dinyatakan sebagai anggota cluster
terdapat pada algoritma K-Means (Siska
dengan mengukur jarak kedekatan
2016):
sifatnya terhadap titik pusat cluster
1. Tentukan k sebagai jumlah cluster
tersebut.
yang dibentuk
5. Lakukan iterasi, kemudian tentukan
Untuk menentukan banyaknya cluster
posisi centroid baru dengan
k dilakukan dengan beberapa
menggunakan persamaan (1).
pertimbangan seperti pertimbangan
6. Ulangi langkah 3 jika posisi centroid
teoritis dan konseptual yang mungkin
baru tidak sama.
diusulkan untuk menentukan berapa
Pengecekan konvergensi dilakukan
banyak cluster.
dengan membandingkan matriks group
2. Bangkitkan k centroid (titik pusat
assignment pada iterasi sebelumnya
cluster) awal secara random
dengan matrik group assignment pada
Penentuan centroid awal dilakukan
iterasi yang sedang berjalan. Jika
secara random/acak dari objek-objek
hasilnya sama maka algoritma kmeans
yang tersedia sebanyak k cluster,
cluster analysis sudah konvergen,
kemudian untuk menghitung centroid
tetapi jika berbeda maka belum
cluster ke-i berikutnya, digunakan
konvergen sehingga perlu dilakukan
rumus sebagai berikut :
iterasi berikutnya.
v= ; i=1,2,3,...n (1) Pada penerapan metode K-Means

Cluster Analysis, data yang bisa diolah
Di mana  v : centroid pada cluster dalam perhitungan adalah data numerik
Xi : objek ke-i yang berbentuk angka. Sedangkan data

selain angka juga bisa diterapkan tetapi 4. HASIL DAN PEMBAHASAN

terlebih dahulu harus dilakukan
pengkodean untuk mempermudah 4.1 Analisa Pengelompokan Data
perhitungan jarak/kesamaan karakteristik Dalam penelitian ini, dilakukan
yang dimiliki dari setiap objek. Setiap pengelompokan atau klaster mahasiswa
objek dihitung kedekatan jaraknya berprestasi dan bermasalah berdasarkan
berdasarkan karakter yang dimiliki dengan data akademik mahasiswa FKIP
pusat cluster yang sudah ditentukan Universitas Riau. Dilakukan pengklasteran
sebelumnya, jarak terkecil antara objek data akademik mahasiswa menjadi empat
dengan masing-masing cluster merupakan buah klaster, yaitu klaster mahasiswa
anggota cluster yang terdekat. Setelah berprestasi, berpotensi berprestasi,
jumlah cluster ditentukan, selanjutnya berpotensi bermasalah dan mahasiswa
dipilih sebanyak 3 objek secara acak sesuai bermasalah. Jadi pada penelitian ini klaster
jumlah cluster yang dibentuk sebagai pusat yang akan dibentuk adalah sebanyak empat
cluster awal untuk dihitung jarak kelompok atau nilai k = 4. Di mana atribut
kedekatannya terhadap semua objek yang yang digunakan adalah sebanyak 3 buah
ada (Ediyanto et al. 2013). atribut yaitu Indeks Prestasi 1 (IP1), Indeks
Prestasi 2 (IP2), Rata-rata Kehadiran (RK).
3. METODE PENELITIAN Berdasarkan hasil praproses data, jumlah
3.1 Kerangka Kerja data yang diperoleh sebanyak 94 data,
Dalam metodologi penelitian ada kemudian akan dipilih secara acak data
urutan kerangka kerja yang harus diikuti, sebanyak 20 buah. Data tersebut akan
urutan kerangka kerja ini merupakan digunakan sebagai sampel untuk
gambaran dari langkah–langkah yang harus melakukan proses analisa clustering
dilalui agar penelitian ini bisa berjalan algoritma K-Means yang dilakukan
dengan baik. Kerangka kerja yang harus perhitungan secara manual menggunakan
diikuti bisa dilihat pada gambar 3.1. aturan-aturan algoritma K-means yang
telah ditetapkan.
Gambar 3.1 Kerangka Kerja

Tabel 4.1 Sampel Data Akademik Mahasiswa

Indeks Rata-rata
L/
NO NAMA Prestasi (IP) Kehadira
P
IP 1 IP 2 n (%)
D1 ADE ROZALINDA P 3,20 3,16 98,44
D2 AFNI RANDA MUSTIANA P 3,43 3,40 97,67
D3 AHLAKUL KARIMAH P 3,40 3,43 97,71
D4 ALVINI LESTARI P 3,40 3,48 100,00
D5 ANDINI LEONA SUHARDI P 3,42 3,77 98,96
D6 AYU SITI HASANAH P 2,84 3,44 99,34
D7 DAFID ARIANTO L 3,03 3,86 99,69
D8 DESTI SOBRIANI P 2,82 3,28 98,99
D9 DEVI SEPTIANITA P 3,61 3,82 99,65
D10 DHEA DWI JAYANTIS P 3,61 3,88 99,65
FATMA NAULI BUTAR-
D11 P 3,40 3,50 100,00
BUTAR
D12 FEBRINA RAMADHANI P 3,40 3,68 96,56
D13 FRYSCA PRIASTIWI P 3,28 3,43 100,00
D14 HABIB ABDULLAH L 2,76 2,78 98,33
D15 HATUN TARHAN P 1,71 2,98 100,00
MERI DWI CAHYA
D16 P 1,91 2,14 92,67
NINGRUM
SYINTIA DEWI ANANTA
D17 P 3,57 3,76 99,06
SHINTA DEWI
D18 MIA SEPTIANI PUTRI P 3,57 3,60 99,06
D19 MIFTA HURRAHMA P 3,49 3,75 97,01
D20 MIFTAHUL BALAD L 3,13 3,30 95,35
4.2 Perancangan dan Proses Clustering a. Jumlah cluster : 4

b. Jumlah data : 20
Pada tahap ini akan dilakukan proses c. Jumlah atribut : 3
utama yaitu segmentasi atau pengelompokan
data akademik mahasiswa FKIP Universitas
Riau dengan menggunakan metode
clustering algoritma K-Means. Berikut
adalah diagram flowchart dari algoritma
dengan asumsi banyaknya jumlah cluster k
= 4 sesuai dengan penelitian.
Dari banyak data akademik mahasiswa
FKIP Universitas Riau yang diperoleh,
diambil 20 data untuk dijadikan sampel
untuk penerapan algoritma k-means dalam
pengelompokan hasil evaluasi mahasiswa.
Percobaan dilakukan dengan menggunakan
parameter-parameter berikut:

Mulai Di mana:
xi : objek x ke-i
Banyaknya
jumlah yi : daya y ke-i
cluster k=4
n : banyaknya objek
Tentukan Pusat
Berikut ini adalah perhitungan jarak
dengan Euclidean Distance untuk iterasi 0:
Hitung jarak data ke
pusat
Perhitungan jarak data (objek) dengan

Kelompokan data
centroid 1:
D1  3,40  3,20  3,43  3,16  97,71  98,44  0,64  0,80
2 2 2
D2  3,40  3,43  3,43  3,40  97,71  97,67   0,003  0,05

ya 2 2 2
D3  3,40  3,40  3,43  3,43  97,71  97,71  0  0

Ada data yang harus
2 2 2
dipindahkan ?
tidak
Stop
3. Pengelompokan data
Alokasikan masing-masing data ke dalam
Gambar 4.2 Flowchart Proses K-Means centroid yang paling terdekat. Dalam
mengalokasikan kembali data ke dalam
Iterasi ke-0 masing-masing cluster didasarkan pada
1. Menentukan pusat cluster awal. perbandingan jarak antara data dengan
Menentukan centroid awal dilakukan centroid setiap cluster yang ada, data
secara acak dari data/objek yang tersedia dialokasikan secara tegas ke dalam
sebanyak jumlah cluster k. Nilai centroid cluster yang mempunyai jarak ke
awal pada penelitian ini dilakukan centroid terdekat dengan data tersebut.
pemilihan secara acak, di mana jumlah Berikut ini merupakan hasil
centroid awal dilakukan sebanyak empat perbandingan jarak antara data dengan
centroid awal, nilai untuk C1 diambil dari centroid setiap cluster yang ada
baris data ke-3, nilai C2 diambil dari berdasarkan perhitungan jarak dengan
baris ke-6, nilai C3 diambil dari baris Euclidean Distance untuk iterasi 0.
data ke-9, nilai C4 diambil dari baris data
ke-16. Berikut ini nilai centroid awal 4. Lakukan iterasi, kemudian tentukan posisi
pada penelitian: centroid baru dengan menggunakan
persamaan (1).
C1 = (3,40 ; 3,43 ; 97,71)
C2 = (2,84 ; 3,44 ; 99,34) 5. Ulangi langkah 3 jika posisi centroid baru
C3 = (3,61 ; 3,82 ; 99,65) tidak sama.
C4 = (1,91 ; 2,14 ; 92,67) Pengecekan konvergensi dilakukan
dengan membandingkan matriks group
2. Menghitng jarak dengan pusat cluster assignment pada iterasi sebelumnya
Untuk menghitung jarak setiap data yang dengan matrik group assignment pada
ada terhadap pusat cluster dalam iterasi yang sedang berjalan. Jika
penelitian ini penulis menggunakan hasilnya sama maka algoritma kmeans
rumus Euclidean Distance: cluster analysis sudah konvergen, tetapi
jika berbeda maka belum konvergen
d(x,y) = || x – y || sehingga perlu dilakukan iterasi
= ; i = 1,2,3,......,n berikutnya.

Tabel 4.15 Hasil Pengelompokan Data digambarkan menggunakan software

Iterasi 0 Sampai Iterasi 4 RapidMiner dan disamakan dengan
pembuktian dari analisa metode terhadap
permasalahan yang ada pada bab yang
sebelumnya. Berdasarkan hasil
implementasi dan pengujian data sampel
sebanyak 20 record dengan menggunakan
tanagra, menghasilkan cluster yang sama
dengan perhitungan manual menggunakan
algoritma K-Means. Selanjutnya dilakukan
pengujian dengan menggunakan 94 data
record yang menghasilkan cluster sebagai
berikut :
Jumlah
Cluster Anggota
Anggota
Karena pada iterasi ke-4 posisi cluster Cluster 1 38, 47, 60, 63, 66, 78 6
tidak berubah / sama dengan posisi cluster
pada iterasi ke-3, maka dapat disimpulkan 4, 5, 7, 8, 11, 13, 14, 15,
bahawa proses iterasi dapat dihentikan pada 16, 18, 19, 20, 23, 26,
iterasi ke-4 dengan hasil: 27, 29, 31, 34, 35, 36,
Anggota cluster 1 (C1) : Cluster 2 37, 39, 40, 41, 42, 45, 43
{D2, D3, D12, D19, D20} = 5 orang 48, 49, 55, 61, 64, 65,
Anggota cluster 2 (C2) : 67, 70, 73, 74, 79, 80,
{D1, D6, D8, D14, D15} = 5 orang 85, 90, 91, 92
{D4, D5, D7, D9, D10, D11, D13, D17, 24, 25, 30, 32, 33, 44,
D18} = 9 orang Cluster 3 46, 52, 54, 57, 58, 62, 31
{D16} = 1 orang 83, 86, 87, 88, 89, 93, 94
Berdasarkan hasil penelitian ini, 2, 3,6, 28, 43, 50, 51, 53,
Cluster 4 14
kelompok mahasiswa berprestasi terdapat 56, 59, 68, 71,72, 84
pada cluster 3 dan terdiri dari 9 anggota,
untuk kelompok mahasiswa berpotensi
berprestasi terdapat pada cluster 1 dan Berdasarkan tabel di atas dapat kita
terdiri dari 5 anggota, untuk kelompok simpulkan bahwa dari pengelompokan data
mahasiswa berpotensi bermasalah terdapat dapat diketahui kelompok nama mahasiswa
pada cluster 2 dan terdiri dari 5 anggota, dan FKIP Universitas Riau yang berprestasi
untuk kelompok mahasiswa bermasalah terdapat pada cluster 3 dan mahasiswa
terdapat pada cluster 4 dan terdiri dari 1 berpotensi berprestasi terdapat pada cluster
anggota. 1sedangkan mahasiswa berpotensi
bermasalah berada dalam cluster 2 dan
4.3 Implementasi dan Pengujian mahasiswa bermasalah berada dalam cluster
4.
Pada bab ini merupakan tahapan
tentang pembahasan metode menggunakan
software RapidMiner. Pada tahap ini akan

5. KESIMPULAN Madhulatha, T.S., 2012. AN OVERVIEW

ON CLUSTERING METHODS.
Dari uraian yang telah ada pada bab – Journal of Engineering, 2(4),
bab sebelumnya maka dapat ditarik pp.719–725.
kesimpulan sebagai berikut : Oyelade, O.J., Oladipupo, O.O. &
1. Metode Clustering Algoritma K-Means Obagbuwa, I.C., 2010. Application
dapat diterapkan pada pengelompokan of k-Means Clustering algorithm
hasil evaluasi mahasiswa FKIP for prediction of Students ’
Universitas Riau, sehingga metode ini Academic Performance. (IJCSIS)
sangat membantu pihak akademik dalam International Journal of Computer
menentukan mahasiswa berprestasi, Science and Information Security,
berpotensi berprestasi, berpotensi 7, pp.292–295.
bermasalah dan bermasalah. Siska, S.T., 2016. ANALISA DAN
2. Berdasarkan hasil perhitungan manual PENERAPAN DATA MINING
dan pengujian dengan software UNTUK MENENTUKAN
RapidMiner dengan menggunakan data KUBIKASI AIR TERJUAL
akademik mahasiswa mendapatkan hasil BERDASARKAN
yang sama. PENGELOMPOKAN
3. Hasil pengelompokan data akademik PELANGGAN MENGGUNAKAN
mahasiswa dapat berfungsi sebagai acuan ALGORITMA K-MEANS
bagi perencana akademik untuk CLUSTERING. Jurnal Teknologi
memantau dan mengevaluasi Informasi & Pendidikan, 9(1),
perkembangan kinerja akademik setiap pp.86–93.
mahasiswa. Sunjana, 2010. Aplikasi Mining Data
Mahasiswa Dengan Metode
REFERENSI Klasifikasi Decision Tree. Seminar
Nasional Aplikasi Teknologi
Aprilla, D. et al., 2013. Belajar Data Mining Informasi (SNATI), pp.A24–A29.
dengan Rapid Miner. , pp.42–43. Suwirmayanti, P., Putra, I.K.G.D. &
Arora, R.K. & Badal, D.D., 2013. Kumara, I.N.S., 2014. OPTIMASI
Evaluating Student ’ s Performance PUSAT CLUSTER K-
Using k-Means Clustering. IJCST, PROTOTYPE DENGAN
4, pp.553–557. ALGORITMA GENETIKA.
Bhoomi, B., 2014. Enhanced K-Means Teknologi Elektro, 13, pp.16–23.
Clustering Algorithm to Reduce Varghese, B.M. et al., 2011. Clustering
Time Complexity for Numeric Student Data to Characterize
Values. Journal of Computer Performance Patterns. IJACSA,
Science e and Information pp.138–140.
Technologies, 5(1), pp.876–879.
Ediyanto, Mara, M.N. & Satyahadewi, N.,
2013. PENGKLASIFIKASIAN
KARAKTERISTIK DENGAN
METODE K-MEANS CLUSTER
ANALYSIS. , 2(2), pp.133–136.

94 13 25 1 10 20170930 PDF

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

94 13 25 1 10 20170930 PDF

Загружено:

Авторское право:

Доступные форматы

Jurnal Ilmu Komputer dan Bisnis, Volume 8, Nomor 1, Mei 2017

IMPLEMENTASI METODE KLASTERING K-MEANS

FEBRIZAL ALFARASY SYAM

Kata Kunci : Data Mining, Cluster, K-Means Clustering, RapidMiner.

1. PENDAHULUAN cepat dan efisien membantu memantau

STMIK Dharmapala Riau 1857

dilakukan sebelum tahap penggalian mempunyai arti bagi pendukung keputusan

2. Pre-processing/Cleaning 2.3 Clustering

STMIK Dharmapala Riau 1858

K-Means termasuk dalam metode N : banyaknya objek/jumlah

v= ; i=1,2,3,...n (1) Pada penerapan metode K-Means

STMIK Dharmapala Riau 1859

selain angka juga bisa diterapkan tetapi 4. HASIL DAN PEMBAHASAN

Gambar 3.1 Kerangka Kerja

STMIK Dharmapala Riau 1860

Tabel 4.1 Sampel Data Akademik Mahasiswa

4.2 Perancangan dan Proses Clustering a. Jumlah cluster : 4

STMIK Dharmapala Riau 1861

Perhitungan jarak data (objek) dengan

D2  3,40  3,43  3,43  3,40  97,71  97,67   0,003  0,05

D3  3,40  3,40  3,43  3,43  97,71  97,71  0  0

STMIK Dharmapala Riau 1862

Tabel 4.15 Hasil Pengelompokan Data digambarkan menggunakan software

STMIK Dharmapala Riau 1863

5. KESIMPULAN Madhulatha, T.S., 2012. AN OVERVIEW

STMIK Dharmapala Riau 1864

Вам также может понравиться