Вы находитесь на странице: 1из 6

PROPOSAL

KLASTERING SUARA BERDASARKAN GENDER DENGAN EKSTRAKSI CIRI


BERBASIS DOMAIN WAKTU MENGGUNAKAN K-MEANS

Dosen Pengampu :

Aris Fanani, M.Kom

Oleh :

Era Oktaviana (H02215003)

PROGRAM STUDI MATEMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS ISLAM NEGERI SUNAN AMPEL SURABAYA

2018
BAB I

PENDAHULUAN

A. Latar Belakang
Perkembangan teknologi saat ini semakin pesat salah satunya dalam bidang dari
Artificial Inteligent (AI) yaitu sistem pengenalan pola (Pattern Recognizing). Sistem
pengenalan pola adalah sebuah komponen penting dalam proses peniruan kemampuan
inderawi manusia terutama penglihatan dan pendengaran. Untuk meniru indera
pendengaran manusia, komputer harus mempunyai suatu mekanisme standar dan logis
dalam mengenali pola yang ada pada suara yang sedang diproses sehingga komputer
dapat mengidentifikasi suara tersebut dengan baik. (Arif Setiawan, Putri Kurnia
Handayani, 2012)
Suara manusia memiliki banyak keragaman bentuk yang berbeda-beda.
Keragaman tersebut dapat dilihat dari persepsi fisik manusia terhadap suara seperti jenis
suara, frekuensi, timbre, volume, dan lain sebagainya. Perbedaan tersebut dapat didengar
secara jelas antara suara laki-laki dengan suara perempuan. Kemudahan dalam
mengidentifikasi suara tersebut bertambah ketika seseorang dapat mendengar dan melihat
secara langsung ucapan dan suara dari lawan bicaranya. (Bhaskoro; Susetyo Bagas; W.
D, Altedzar Riedho, 2012)
Pada sistem pengenalan pola atau suara gender menggunakan teknik ekstraksi ciri
yang berbasis domain waktu dan domain frekuensi. Ekstraksi ciri yang digunakan bisa
bermacam-macam, diantaranya adalah dengan Sort Time Energy, Zero Crossing Rate,
Spectral Centroid, dan Spectral Flux. (Setiawan, 2009)
Pada klastering suara, beberapa penelitian menggunakan beberapa algoritma
yaitu: Eko Aditya S, Umar Sagaf, Muhammad Efendi, dkk melakukan penelitian
klastering suara laki-laki dan perempuan dengan menggunakan algoritma K-Means
berdasarkan hasil ekstraksi Fast Fourier Transform (FFT) menghasilkan tingkat akurasi
rata-rata 80%. Ada penelitian lain yang dilakukan oleh Nailul izzah tentang klastering
suara berdasarkan gender penelitian dengan menggunakan algoritma K-Means
berdasarkan hasil ekstraksi Fast Fourier Transform (FFT) menghasilkan tingkat akurasi
rata-rata 100%.
Dengan demikian dalam penelitian ini saya mengambil judul
tentang “Klastering Suara Berdasarkan Gender Dengan Ekstraksi Ciri
Berbasis Domain Waktu Menggunakan K-means”.

B. Rumusan Masalah

Permasalahan utama yang terjadi apabila hendak mengenali suatu pola tertentu
adalah Bagaiman proses ekstraksi suara dari data sampel yang sudah ditentukan dan
Bagaimana akurasi hasil perhitungan clustering menggunakan algoritma K-Means.

C. Tujuan Penelitian

Tujuan utama dalam penelitian ini adalah untuk mengenali suatu pola tertentu
dilakukan proses akuisisi data yang dilakukan sehingga menghasilkan data sejumlah
numerik yang representatif dan konsisten terhadap sampel yang diberikan dan
mengetahui akurasi hasil perhitungan clustering menggunakan algoritma K-Means.

D. Manfaat penelitian

Manfaat yang dapat diperoleh dari penelitian ini adalah Menambah pemahaman
dan pengalaman dalam menggunakan metode clustering dengan algoritma K-Means
dalam memetakan atau mengelompokkan suatu data.
BAB II

TINJAUAN PUSTAKA

A. Clustering (Pengelompokan)

Pada dasarnya, clustering merupakan suatu metode yang digunakan untuk


mencari dan mengelompokkan data yang memiliki kemiripan karakteristik (similarity)
antara satu data dengan data yang lain. Metode clustering ini diterapkan tanpa adanya
arahan atau latihan serta tidak memerlukan adanya target/ hasil. (Santoso, 2010)

Cluster adalah membagi data ke dalam kelompok-kelompok yang mempunyai


objek yang kerakteristiknya sama. Tujuan dari clustering ini adalah untuk
mengelompokkan data kedalam suatu cluster, sehingga objek pada cluster tersebut
memiliki kemiripan yang sangat besar dengan objek lain pada cluster yang sama tetapi
sangat tidak mirip dengan objek pada cluster yang lain (Ginageh, 2008). Cluster berbeda
dengan klasifikasi dan prediksi yang mana tidak adanya variabel target dalam
pengklasteran atau memprediksi nilai dari variabel target. Akan tetapi, algoritma cluster
mencoba untuk melakukan pembagian terhadap keseluruhan data menjadi kelompok-
kelompok yang memiliki kemiripan atau biasa disebut Homogen. Yang mana kemiripan
data dalam satu kelompok akan bernilai maksimal. Sedangkan kemiripan lain dalam
kelompok lain akan bernilai minimal. (Mikael, 2017)

B. Pengenalan Suara

Pengenalan suara adalah suatu proses secara otomatis mengenali siapa yang
sedang berbicara atas dasar informasi individu termasuk dalam gelombang suara. Suara
dikenali melalui ciri-cirinya. Dimana ciri-ciri tersebut digunakan untuk membedakan satu
suara dengan suara lainnya. Ciri yang bagus adalah suatu ciri yang memiliki daya
pembeda tinggi, sehingga pengelompokan suara berdasarkan ciri yang dimiliki tersebut
dapat dilakukan dengan keakuratan yang tinggi pula. Penenalan suara ini dapat
diklasifikasikan delam identifikasi suara yaitu proses pengenalan suara berdasarkan
sampel suara yang telah ditentukan. Dan verifikasi suara yaitu proses penerimaan atau
penolakan terhadap suara yang telah diberikan.
C. Sinyal Audio

Tujuan dari estimasi dalam domain waktu adalah untuk mendapatkan nilai
autokorelasi sinyal audio. Nilai autokorelasi suatu sinyal audio akan menunjukkan
bagaimana gelombang itu membentuk suatu korelasi pada dirinya sendiri sebagai fungsi
perubahan waktu ke waktu. Bentuk-bentuk yang sama atau mirip pada setiap domain
waktu tertentu akan menunjukkan perulangan bentuk atau periodisitas pola sinyal audio.
Dengan demikian akan dapat dilakukan estimasi nilai frekuensi fundamentalnya.

D. Algoritma K-Means

K-Means merupakan salah satu algoritma pengklasteran data mining yang sering
digunakan peneliti untuk mengklaster data. Dalam algoritma K-Means ini, data-data yang
memiliki karakteristik yang sama dicluster dalam satu kelompok dan data yang memiliki
karateristik yang berbeda dikelompokkan dengan kelompok lain yang sesuai dengan
karakteristik data tersebut, sehingga data yang berada dalam satu kelompok memiliki
tingkat variasi yang kecil. Metode K-Means adalah metode yang termasuk dalam
algoritma clustering yang berbasis jarak dengan membagi data ke dalam sejumlah cluster
dan algoritma ini hanya bekerja pada atribut numerik. (Dhuhita, 2015)

Berikut adalah langkah- langkah pengelompokan data dengan algoritma K-


Means, antara lain:

1. Masukkan data yang akan dicluster

2. Tentukan jumlah kelompok (cluster)

3. Ambil sebarang data sebanyak jumlah cluster secara acak sebagai pusat cluster
(centroid)

4. Hitung nilai pusat (centroid/ rata-rata) . pada tahap awal penentuan nilai centroid yang
dilakukan secara random dengan rumus menentukan target awal K-Means yang
digunakan untuk mendapatkan target data atau jarak antara kelompok, yang mana titik
pusat awal untuk menghitung algoritma K-Means pada iterasi 0
DAFTAR PUSTAKA

Arif Setiawan, Putri Kurnia Handayani. (2012). Klastering Suara Berdasarkan Gender Dengan
Ekstraksi Ciri Berbasis Domain Waktu. 1.

Bhaskoro; Susetyo Bagas; W. D, Altedzar Riedho. (2012). Aplikasi Pengenalan Gender


Menggunakan Suara. Seminar Nasional Aplikasi Teknologi Informasi .

Dhuhita, W. M. (2015). CLUSTERING MENGGUNAKAN METODE K-MEANS UNTUK


MENENTUKAN STATUS GIZI BALITA. Jurnal Informatika , vol.15, no. 2, p.164.

Ginageh. (2008). Clustering. Wordpress.com.

Mikael, A. W. (2017). Penerapan Metode K-Means Clustering Untuk Mengelompokkan Potensi


Produksi Buah-buahan. vol.5, no.1.

Santoso, S. (2010). Statistik Multivariat. Jakarta: Elex Media Komputindo.

Setiawan, A. (2009). Analisis Klasifikasi Suara Berdasarkan Gender Dengan Format Wav
Menggunakan Algoritma K-Means. 1.

Вам также может понравиться