Академический Документы
Профессиональный Документы
Культура Документы
ABSTRAK
Mengelompokan hasil evaluasi akademik mahasiswa adalah salah satu basis untuk memantau
perkembangan kinerja akademik mahasiswa di suatu universitas. Pengelompokan mahasiswa
ke dalam kategori yang berbeda sesuai dengan kinerja mereka telah menjadi tugas yang rumit.
Dalam mengelola data akademik mahasiswa penulis menggunakan metode Data Mining
dengan Algoritma K-means Clustering. Hasil penelitian ini berupa pengelompokan
mahasiswa berdasarkan cluster mahasiswa berprestasi, cluster mahasiswa berpotensi
berprestasi, cluster mahasiswa berpotensi bermasalah dan cluster mahasiswa bermasalah.
Selanjutnya pengujian dilakukan dengan menggunakan aplikasi RapidMiner, yang hasilnya
sama dengan perhitungan analisa Algoritma K-Means yang dilakukan.
Mulai Di mana:
xi : objek x ke-i
Banyaknya
jumlah yi : daya y ke-i
cluster k=4
n : banyaknya objek
Tentukan Pusat
Berikut ini adalah perhitungan jarak
dengan Euclidean Distance untuk iterasi 0:
Hitung jarak data ke
pusat
tidak
Stop
3. Pengelompokan data
Alokasikan masing-masing data ke dalam
Gambar 4.2 Flowchart Proses K-Means centroid yang paling terdekat. Dalam
mengalokasikan kembali data ke dalam
Iterasi ke-0 masing-masing cluster didasarkan pada
1. Menentukan pusat cluster awal. perbandingan jarak antara data dengan
Menentukan centroid awal dilakukan centroid setiap cluster yang ada, data
secara acak dari data/objek yang tersedia dialokasikan secara tegas ke dalam
sebanyak jumlah cluster k. Nilai centroid cluster yang mempunyai jarak ke
awal pada penelitian ini dilakukan centroid terdekat dengan data tersebut.
pemilihan secara acak, di mana jumlah Berikut ini merupakan hasil
centroid awal dilakukan sebanyak empat perbandingan jarak antara data dengan
centroid awal, nilai untuk C1 diambil dari centroid setiap cluster yang ada
baris data ke-3, nilai C2 diambil dari berdasarkan perhitungan jarak dengan
baris ke-6, nilai C3 diambil dari baris Euclidean Distance untuk iterasi 0.
data ke-9, nilai C4 diambil dari baris data
ke-16. Berikut ini nilai centroid awal 4. Lakukan iterasi, kemudian tentukan posisi
pada penelitian: centroid baru dengan menggunakan
persamaan (1).
C1 = (3,40 ; 3,43 ; 97,71)
C2 = (2,84 ; 3,44 ; 99,34) 5. Ulangi langkah 3 jika posisi centroid baru
C3 = (3,61 ; 3,82 ; 99,65) tidak sama.
C4 = (1,91 ; 2,14 ; 92,67) Pengecekan konvergensi dilakukan
dengan membandingkan matriks group
2. Menghitng jarak dengan pusat cluster assignment pada iterasi sebelumnya
Untuk menghitung jarak setiap data yang dengan matrik group assignment pada
ada terhadap pusat cluster dalam iterasi yang sedang berjalan. Jika
penelitian ini penulis menggunakan hasilnya sama maka algoritma kmeans
rumus Euclidean Distance: cluster analysis sudah konvergen, tetapi
jika berbeda maka belum konvergen
d(x,y) = || x – y || sehingga perlu dilakukan iterasi
= ; i = 1,2,3,......,n berikutnya.
Jumlah
Cluster Anggota
Anggota
Karena pada iterasi ke-4 posisi cluster Cluster 1 38, 47, 60, 63, 66, 78 6
tidak berubah / sama dengan posisi cluster
pada iterasi ke-3, maka dapat disimpulkan 4, 5, 7, 8, 11, 13, 14, 15,
bahawa proses iterasi dapat dihentikan pada 16, 18, 19, 20, 23, 26,
iterasi ke-4 dengan hasil: 27, 29, 31, 34, 35, 36,
Anggota cluster 1 (C1) : Cluster 2 37, 39, 40, 41, 42, 45, 43
{D2, D3, D12, D19, D20} = 5 orang 48, 49, 55, 61, 64, 65,
Anggota cluster 2 (C2) : 67, 70, 73, 74, 79, 80,
{D1, D6, D8, D14, D15} = 5 orang 85, 90, 91, 92
Anggota cluster 3 (C3) : 1, 10, 12, 17, 21, 22,
{D4, D5, D7, D9, D10, D11, D13, D17, 24, 25, 30, 32, 33, 44,
D18} = 9 orang Cluster 3 46, 52, 54, 57, 58, 62, 31
Anggota cluster 4 (C4) : 69, 75, 76, 77, 81, 82,
{D16} = 1 orang 83, 86, 87, 88, 89, 93, 94
Berdasarkan hasil penelitian ini, 2, 3,6, 28, 43, 50, 51, 53,
Cluster 4 14
kelompok mahasiswa berprestasi terdapat 56, 59, 68, 71,72, 84
pada cluster 3 dan terdiri dari 9 anggota,
untuk kelompok mahasiswa berpotensi
berprestasi terdapat pada cluster 1 dan Berdasarkan tabel di atas dapat kita
terdiri dari 5 anggota, untuk kelompok simpulkan bahwa dari pengelompokan data
mahasiswa berpotensi bermasalah terdapat dapat diketahui kelompok nama mahasiswa
pada cluster 2 dan terdiri dari 5 anggota, dan FKIP Universitas Riau yang berprestasi
untuk kelompok mahasiswa bermasalah terdapat pada cluster 3 dan mahasiswa
terdapat pada cluster 4 dan terdiri dari 1 berpotensi berprestasi terdapat pada cluster
anggota. 1sedangkan mahasiswa berpotensi
bermasalah berada dalam cluster 2 dan
4.3 Implementasi dan Pengujian mahasiswa bermasalah berada dalam cluster
4.
Pada bab ini merupakan tahapan
tentang pembahasan metode menggunakan
software RapidMiner. Pada tahap ini akan