Вы находитесь на странице: 1из 10

Jurnal Sistem Informasi (Journal of Information Systems).

1/13 (2017), 1-10


DOI: http://dx.doi.org/10.21609/jsi.v13i1.525

SEGMENTASI PELANGGAN PADA CUSTOMER RELATIONSHIP MANAGEMENT DI


PERUSAHAAN RITEL: STUDI KASUS PT GRAMEDIA ASRI MEDIA

Christina Deni Rumiarti1, Indra Budi2


1,2
Program Studi Magister Teknologi Informasi, Fakultas Ilmu Komputer, Universitas Indonesia, Jl.
Salemba Raya No. 4 Jakarta 10430, Indonesia

Email: 1deni.christina@gmail.com, 2indra@cs.ui.ac.id

Abstract

Advances in information technology produces wide range of choices in accessing information including
reading books. The increase in the number of readers who turning to electronic books making sales of
printed books has decreased in the recent years. PT Gramedia Asri Media is one of book retail company
in Indonesia. Gramedia implement CRM by launching a member card named Kompas Gramedia Value
Card (KGVC). Promotion given has not been able to increase book transaction of KGVC members.This
research focus on make customer segmentation in CRM at PT Gramedia Asri Media. Data mining
process is done by clustering using K-means algorithm for segmenting customers based on RFM, as
well as hierarchical clustering algorithms for segmentation of customers based on the number of books
type. Evaluation is done on cluster result using elbow method, silhouette method, and Calinski-
Harabasz index. Customer segmentation based on the RFM produce two optimal clusters, occasional
customers and dormant customers. Customer segmentation based on the number of types of books
purchased produce 3 optimal cluster, namely low, medium, and high. With these results, it is expected
to help the company classifying KGVC members to determine the appropriate strategies, so company
can increase the number of books transactions.

Keywords: clustering, customer segmentation, hierarchical, K-means, RFM

Abstrak

Kemajuan teknologi informasi menghasilkan berbagai pilihan dalam mengakses informasi termasuk
membaca buku. Peningkatan jumlah pembaca yang beralih ke buku elektronik mengakibatkan angka
penjualan buku cetak mengalami penurunan pada beberapa tahun terakhir. PT Gramedia Asri Media
merupakan salah satu perusahaan ritel buku di Indonesia. Gramedia menerapkan CRM dengan me-
nerbitkan kartu member Kompas Gramedia Value Card (KGVC). Promosi yang diberikan belum mam-
pu meningkatkan transaksi buku member KGVC. Penelitian ini bertujuan untuk membuat segmentasi
pelanggan pada CRM di PT Gramedia Asri Media. Proses data mining dilakukan dengan melakukan
clustering menggunakan algoritma K-means untuk segmentasi pelanggan berdasarkan RFM, serta
algoritma hierarchical clustering untuk segmentasi pelanggan berdasarkan banyaknya jenis buku. Eva-
luasi terhadap hasil cluster menggunakan elbow method, silhouette method, dan Calinski-Harabasz
index. Segmentasi pelanggan berdasarkan RFM menghasilkan 2 cluster yang optimal, yaitu occasional
customers dan dormant customers. Segmentasi pelanggan berdasarkan banyaknya jenis buku yang di-
beli menghasilkan 3 cluster yang optimal, yaitu rendah, sedang, dan tinggi. Dengan hasil penelitian ini,
diharapkan dapat membantu perusahaan mengelompokkan member KGVC dalam menentukan stra-
tegi yang sesuai sehingga dapat meningkatkan jumlah transaksi buku.

Kata Kunci: clustering, segmentasi pelanggan, hierarchical, K-means, RFM

1. Pendahuluan terdapat data mengenai jumlah pembelanjaan oleh


member KGVC berdasarkan umur, tingkat pendi-
Dalam mendukung program CRM, Gramedia dikan, jenis kelamin, lokasi toko, dan produk. Pada-
menggunakan data warehouse untuk mengetahui hal, banyak pola belanja dari pelanggan yang mena-
historis transaksi setiap member KGVC. Data yang rik bagi CRM untuk dianalisis lebih lanjut [2]. Hal
digunakan untuk menganalisis member KGVC ha- ini menunjukkan bahwa data yang dimiliki saat ini
nya sebatas data jumlah distribusi member KGVC belum dimanfaatkan secara maksimal untuk meng-
berdasarkan umur, tingkat pendidikan, jenis kela- analisis karakteristik member KGVC.
min, pekerjaan, lokasi toko tempat registrasi, dan Berdasarkan data CRM, jumlah member
berdasarkan kota di Indonesia [1]. Selain itu, juga KGVC pada bulan Juli 2016 mengalami kenaikan

1
2 Jurnal Sistem Informasi (Journal of Information Systems), Volume 13, Issue 1, April 2017

TABEL 1 RFM Analysis


DAFTAR INSTRUMEN PENELITIAN
Variabel Keterangan Menurut Tsiptsis dan Chorianopoulos [3], analisis
Recency merupakan interval waktu sejak RFM adalah pendekatan yang biasa digunakan di
Recency terakhir kali member KGVC melakukan
transaksi pembelian buku. perusahaan ritel untuk memahami perilaku pembe-
Frequency merupakan seberapa sering lian konsumen. Seperti namanya, analisis RFM
Frequency member KGVC melakukan transaksi melibatkan perhitungan recency, frequency, dan
pembelian buku. monetary. Perhitungan recency menunjukkan wak-
Monetary merupakan seberapa besar jumlah
yang dibayarkan oleh member KGVC pada
tu sejak terakhir transaksi pembelian pelanggan,
Monetary
transaksi dalam periode 1 Januari 2016 – 31 frequency menunjukkan jumlah transaksi pembe-
Juli 2016. lian, sedangkan monetary menunjukkan nilai pem-
belian. Pada penelitian ini, label pelanggan yang
sebanyak 68.587 sejak bulan Januari 2016 [1]. Per- digunakan adalah (1) superstars customers, yaitu
masalahan terjadi ketika jumlah member KGVC pelanggan yang sering melakukan transaksi dan
mengalami kenaikan, tetapi transaksi buku member memiliki nilai transaksi yang tinggi, (2) golden
KGVC mengalami penurunan. Total transaksi buku customers, yaitu pelanggan yang sering melakukan
member KGVC pada bulan Juli 2016 mengalami transaksi dan memiliki nilai transaksi kedua yang
penurunan sembilan milyar rupiah sejak bulan Ja- tinggi, (3) occasional customers, yaitu pelanggan
nuari 2016. Hal ini menunjukkan bahwa kenaikan yang jarang berkunjung tetapi memiliki nilai tran-
jumlah member KGVC ternyata tidak berkorelasi saksi rata-rata yang tinggi, (4) everyday shoppers,
dengan kenaikan jumlah transaksi buku. Semakin yaitu pelanggan yang sering melakukan transaksi
bertambahnya jumlah member KGVC seharusnya tetapi memiliki nilai transaksi yang rendah, dan (5)
nilai transaksi buku yang dilakukan member KGVC dormant customers, yaitu pelanggan dengan ting-
juga mengalami peningkatan. kat pembelian yang sangat rendah dan sudah lama
Berdasarkan kondisi dan permasalahan yang tidak melakukan transaksi.
telah diuraikan di atas, diidentifikasi mengenai fak-
tor-faktor yang memengaruhi transaksi buku mem- Data Mining pada Customer Relationship
ber KGVC mengalami penurunan, yaitu (1) produk Management
(adanya buku-buku bajakan yang beredar di pasar-
an), (2) harga (perbandingan harga buku dan kua- Data mining memberikan pemahaman yang lebih
litas buku yang relatif sama dengan toko buku lain, mendalam tentang pelanggan yang sangat penting
serta munculnya toko buku online yang menjual untuk membangun strategi CRM yang efektif [3].
buku cetak dengan harga yang kompetitif), dan (3) Aktivitas CRM yang dapat didukung melalui peng-
teknologi (belum memanfaatkan perkembangan gunaan data mining meliputi: (1) customer seg-
teknologi untuk menganalisis pelanggan pada mentation akan menghasilkan segmen pelanggan
CRM, belum adanya sistem rekomendasi buku, berdasarkan karakteristik perilaku pelanggan, (2)
dan belum memiliki sistem untuk mengetahui seg- direct marketing campaigns untuk berkomunikasi
men pelanggan yang dimiliki). Akar masalah yang secara langsung dengan pelanggan dalam mening-
menjadi dasar penelitian ini adalah belum adanya katkan jumlah pelanggan baru dan pembelian pro-
segmentasi pelanggan pada CRM untuk menen- duk, dan (3) market basket analysis untuk mengi-
tukan strategi promosi yang sesuai dengan segmen dentifikasi produk-produk terkait yang biasanya
pelanggan. Penelitian ini bertujuan untuk mengha- dibeli secara bersama-sama.
silkan segmentasi pelanggan pada Customer Rela-
tionship Management di PT Gramedia Asri Media.

Gambar 1. Visualisasi Data berdasarkan Analisis RFM Gambar 2. Visualisasi Log-transformed RFM
Christina Deni Rumiarti, et al., Segmentasi Pelanggan pada Customer Relationship Management 3

TABEL 2 dan menentukan setiap record yang paling dekat


HASIL CLUSTERING PADA 2 CLUSTER, 3 CLUSTER, DAN 4 dengan cluster. Record baru ditambahkan ke clus-
CLUSTER ter, cluster center dihitung ulang untuk mencer-
Persent Rec Fre
ase enc que Monetary
minkan anggota baru mereka. Prosedur iterasi ini
Clu Label diulang sampai konvergen dan migrasi record de-
Jumlah y ncy (ribu
ster Pelanggan
Pelangg (ha (kal rupiah) ngan cluster tidak lagi menyaring solusinya.
an (%) ri) i)
2 Cluster
Hierarchical Clustering
Occasional
1 40,58 22 4 759
customers
Dormant Dalam hierarchical clustering, dendrogram diha-
2 59,42 99 1 177
customers silkan melalui partisi rekursif (metode divisive)
3 Cluster atau menggabungkan agglomerative cluster yang
Dormant
1 35,90 107 1 132,5
customers
ada. Metode agglomerative clustering mengini-
Golden sialisasi setiap pengamatan menjadi cluster yang
2 43,62 9 6 982,05 kecil. Kemudian, dua cluster terdekat dikumpul-
customers
3 20,48 59 3 487
Everyday kan ke dalam cluster gabungan baru. Dengan cara
shoppers ini, jumlah cluster dalam kumpulan data berku-
4 Cluster
Dormant
rang satu di setiap langkah. Akhirnya, semua re-
1 31,10 122 1 131,9 cord digabungkan menjadi cluster besar yang
customers
Golden tunggal. Divisive methods dimulai dengan semua
2 16,77 12 7 1217,65
customers record dalam satu cluster yang besar. Record yang
Dormant berbeda memisahkan diri secara rekursif dalam
3 37,74 10 2 245
customers
Occasional cluster yang terpisah sampai setiap record mewa-
4 14,39 67 3 509.5 kili kelompoknya sendiri. Kebanyakan program
customers
komputer menerapkan metode agglomerative pada
Metodologi Data Mining hierarchical clustering [5].

Industri data mining mengusulkan proses standar Elbow Method


data mining yang disebut dengan Cross-Industry
Standard Process for Data Mining (CRISP-DM). Menurut Kodinariya dan Makwana [6], elbow me-
Menurut Maheshwari [4], CRISP-DM memiliki thod digunakan untuk menentukan jumlah cluster
urutan fase yang adaptif, dimana tahap berikutnya dari dataset. Ide dasar dari unsupervised model
dalam urutan tergantung hasil dari tahap sebe- (misal: K-means clustering) adalah untuk menen-
lumnya. CRISP-DM memiliki siklus hidup yang tukan cluster sehingga total intra-cluster variation
terdiri dari enam fase, yaitu [5]: business under- (dikenal sebagai total within-cluster variation atau
standing, data understanding, data preparation, total within-cluster sum of square) diminimalkan.
modeling, evaluation, dan deployment. Metode ini merupakan metode visual. Idenya ada-
lah dimulai dengan k = 2, dan terus meningkat da-
K-means Clustering lam setiap langkah dengan ditambah 1 pada nilai k.
Pada nilai k=3, apabila terjadi perubahan drastis
Menurut Tsiptsis dan Chorianopoulos [3], K-means yang berbanding terbalik dengan nilai sebelumnya,
menggunakan ukuran Euclidean distance dan se- maka nilai sebelum terjadinya perubahan tersebut
cara iteratif menentukan tiap record dari cluster dianggap sebagai jumlah cluster yang paling tepat.
asal. Prosedur dimulai dengan memilih k dengan
initial records sebagai pusat cluster (initial seed)

Gambar 3. Visualisasi Standarisasi data variabel RFM Gambar 4. Jumlah Optimal Cluster berdasarkan Elbow Method
4 Jurnal Sistem Informasi (Journal of Information Systems), Volume 13, Issue 1, April 2017

Silhouette Method Data Preparation (Persiapan Data): Variabel re-


cency, frequency, dan monetary digunakan untuk
Nilai silhouette digunakan untuk mengukur sebe- mengidentifikasi perilaku belanja pelanggan. Ke-
rapa baik cluster pada titik tertentu [5]. Nilai positif mudian, tahap preprocessing dilakukan untuk
menunjukkan hasil yang baik, dengan nilai yang transformasi data.
lebih tinggi lebih baik daripada nilai yang lebih
rendah. Sebuah nilai yang mendekati nol dianggap Modeling (Pembentukan Model): Algoritma K-
tidak bagus. Nilai silhouette negatif dianggap seba- means digunakan untuk segmentasi pelanggan ber-
gai kesalahan klasifikasi. dasarkan variabel RFM. Algoritma hierarchical di-
gunakan untuk segmentasi berdasarkan jenis buku
Calinski-Harabasz Index yang dibeli.

Menurut Liu dkk. [7], Calinski-Harabasz index Evaluation (Evaluasi Model): Evaluasi clustering
(CH) mengevaluasi validitas cluster berdasarkan menggunakan tiga metode yaitu, elbow method,
perhitungan between sum of squares dan within silhouette method, dan Calinski-Harabasz index.
sum of squares. CH mengukur ratio dari separation
berdasarkan jarak maksimum between cluster cen- Kesimpulan dan Saran: Penyusunan kesimpulan
ters, dan mengukur compactness berdasarkan jum- dan saran dilakukan berdasarkan analisis dan pem-
lah jarak antara objek dan pusat cluster. Konfi- bahasan yang dilakukan penulis untuk menjawab
gurasi compact dan well-separated dari cluster di- pertanyaan penelitian terkait segmentasi pelanggan
harapkan memiliki nilai inter-cluster variance pada CRM di PT Gramedia Asri Media.
yang tinggi dan intra-cluster variance yang relatif
rendah [8]. Pengumpulan data dilakukan dengan obser-
vasi terlebih dahulu terhadap data yang dibutuhkan
2. Metode Penelitian penelitian ini. Data yang dikumpulkan adalah data
member KGVC dan data transaksi yang berasal
Tahapan penelitian dilakukan berdasarkan pada dari basisdata Oracle. Data tersebut kemudian di-
metodologi data mining, yaitu CRISP-DM. Taha- ubah ke dalam format file .csv agar dapat diolah
pan deployment dalam CRISP-DM tidak dibahas lebih lanjut untuk pembentukan clustering. Tahap
pada penelitian ini. Berikut ini penjelasan tahapan preprocessing, pembentukan cluster, dan evaluasi
penelitian yang dilakukan penulis: hasil cluster dilakukan menggunakan software R
Version 3.3.1.
Business Understanding (Pemahaman Bisnis): Ta- Instrumen penelitian yang dikaji oleh penulis
hap ini bertujuan untuk memahami kondisi perusa- berdasarkan pada variabel RFM (recency, frequ-
haan dan permasalahan yang dihadapi saat ini. ency, dan monetary). Tabel I menunjukkan daftar
instrumen penelitian yang menjadi acuan penulis
Tinjauan Pustaka: Penulis melakukan tinjauan pus- pada saat pembentukan cluster menggunakan algo-
taka dengan studi literatur terkait teori yang relevan ritma K-means.
dan melakukan kajian terhadap penelitian sebelum-
nya yang relevan. 4. Hasil dan Pembahasan

Data Understanding (Pemahaman Data): Pengum- Data Understanding


pulan data yang dibutuhkan penelitian dilakukan
pada tahap pemahaman data.

Gambar 6. Jumlah Optimal Cluster berdasarkan Calinski-Harabasz Gambar 5. Jumlah Optimal Cluster berdasarkan Average
index Silhouette
Christina Deni Rumiarti, et al., Segmentasi Pelanggan pada Customer Relationship Management 5

TABEL 3 TABEL 4
CONTOH DATASET BUKU CONTOH DATASET BUKU
CHIL- FICTION AGRI- ART_ Persentase Label
Mean / Rata-rata
CUSTID DRENS LITERA- CUL- ARCHI- Jumlah Pelanggan
Cluster Jumlah
BOOKS TURE TURE TECTURE Pelanggan
Pembelian Buku
97244478 1 1 0 0 (%)
742689 1 82,80 2 Rendah
85499161 1 0 0 0 2 16,66 5 Medium
76318 3 0,54 7 Tinggi
33788457 1 0 0 0
573423
adalah Rp 1.000–Rp 453.657.000. Semakin besar
Data yang dikumpulkan adalah data member nilainya mengindikasikan bahwa member KGVC
KGVC dan data transaksi. Pelanggan yang masih semakin banyak nilai pembelanjaannya pada perio-
aktif per tanggal 1 Agustus 2016 diolah untuk seg- de 1 Januari 2016–31 Juli 2016.
mentasi. Data member KGVC diambil dari data pe- Seperti terlihat pada Gambar 1, nilai mone-
langgan seluruh toko Gramedia yang masih aktif tary pelanggan berada pada sumbu y dan frequency
pada tanggal 31 Juli 2016. Sedangkan data transaksi pembelian berada pada sumbu x. Nilai recency di-
merupakan transaksi produk buku dari member visualisasikan dalam 80/20, yaitu 80 persen dan 20
KGVC pada periode 1 Januari 2016 sampai 31 Juli persen berdasarkan total nilai pembelanjaan. Nilai
2016. Data transaksi yang digunakan dalam pene- RFM tidak terdistribusi secara normal, yaitu dis-
litian adalah seluruh data transaksi buku dari mem- tribusi miring (skewed distribution).
ber KGVC yang masih aktif pada tanggal 31 Juli Menurut Zumel dan Mount [9], distribusi data
2016. Data yang diambil merupakan transaksi de- positif yang sangat miring, seperti nilai pelanggan,
ngan jumlah nilai lebih dari nol rupiah. Dengan kata pendapatan, penjualan, dan harga saham dapat di-
lain, transaksi pengembalian buku tidak diambil pa- modelkan sebagai lognormal distribution. Untuk
da tahap pengumpulan data. Berdasarkan 389.686 keperluan modeling, penggunaan natural loga-
pelanggan yang masih aktif pada tanggal 31 Juli rithm, yaitu log base 10, atau log base 2 umumnya
2016, jumlah transaksi pada periode 1 Januari – 31 tidak bermasalah dan tidak memengaruhi nilai ha-
Juli 2016 adalah 1.535.002 transaksi. Berdasarkan sil. Pada penelitian ini, supaya nilai RFM terdis-
transaksi tersebut, hanya 153.347 pelanggan yang tribusi normal, maka nilai RFM tersebut diubah
melakukan transaksi pada periode tersebut. menjadi lognormal distribution terlebih dahulu se-
belum dilakukan modeling.
Data Preparation Berdasarkan Gambar 2, terlihat bahwa penye-
baran data lebih baik dibandingkan Gambar 1, ya-
Variabel input yang digunakan untuk analisis clus- itu sebelum data RFM ditransformasikan menjadi
ter adalah recency (R), frequency (F), dan mone- lognormal distribution. Pelanggan dengan frequen-
tary (M). Rentang nilai variabel recency adalah 1– cy tinggi dan monetary tinggi dapat terlihat pada
213 hari. Semakin kecil nilainya mengindikasikan sudut kanan atas grafik. Sedangkan pelanggan de-
bahwa aktivitas transaksi terbaru yang dilakukan ngan frequency rendah dan monetary rendah ter-
oleh member KGVC. Rentang nilai variabel fre- lihat pada sudut kiri grafik.
quency adalah 1–222 transaksi/pelanggan. Sema- Langkah ter akhir data preparation adalah
kin besar nilainya mengindikasikan bahwa member standarisasi data. Standarisasi akan membuat va-
KGVC semakin sering berbelanja pada periode 1 riabel RFM sebanding satu sama lain dalam per-
Januari 2016–31 Juli 2016. Dalam kurun waktu 7 hitungan algoritma clustering. Visualisasi standari-
bulan, ada pelanggan yang baru berbelanja satu ka- sasi data variabel RFM dapat dilihat pada Gambar
li dan ada juga pelanggan yang sudah berbelanja 3. Pada penelitian ini, variabel RFM memiliki skala
sebanyak 222 kali. Rentang nilai variabel monetary

(a) (b)
Gambar 7. (a) Persentase Jumlah Member KGVC dan (b) Gambar 8. Persentase Jumlah Member KGVC berdasarkan
Nilai Transaksi Buku Member KGVC Tiap Cluster Umur pada Segmentasi RFM
6 Jurnal Sistem Informasi (Journal of Information Systems), Volume 13, Issue 1, April 2017

yang berbeda, yaitu recency = hari, frequency =


jumlah, dan monetary = rupiah. Skala pada setiap Berdasarkan Gambar 6, dua cluster adalah cluster
variabel RFM pada dataset diubah menjadi zero yang optimal. Cluster dengan k=2 memiliki Ca-
means dan unit standard deviation (z-scores). Hal linski-Harabasz index paling tinggi dibandingkan
ini dilakukan untuk mencegah salah satu atribut cluster yang lain. Calinski-Harabasz index pada
dengan rentang nilai yang besar akan mendominasi dua cluster adalah 1.31.
variabel yang lain dalam perhitungan jarak. Berdasarkan tahap evaluasi, jumlah cluster
yang optimal berdasarkan elbow method adalah
Segmentasi Pelanggan berdasarkan RFM k=4, sedangkan jumlah cluster yang optimal ber-
dasarkan silhouette method dan Calinski-Harabasz
Pada penelitian ini, algoritma K-means digunakan index adalah k=2. Pelanggan pada 2 cluster terdiri
untuk pembentukan cluster berdasarkan variabel dari occasional customers dan dormant customers.
RFM. Tahap pembentukan model dilakukan meng- Pada penelitian ini, k=2 dipilih penulis untuk dia-
gunakan software R Version 3.3.1. Cluster yang nalisis lebih lanjut. Hal ini dikarenakan 2 cluster
diuji coba adalah k=2 sampai k=10. Hasil cluste- merupakan cluster yang optimal berdasarkan dua
ring menggunakan algoritma K-means pada k=2 metode evaluasi.
sampai k=4 dapat dilihat pada Gambar 3. Persentase jumlah member KGVC diban-
Metode yang digunakan untuk penentuan dingkan nilai transaksi pada setiap cluster ditun-
jumlah cluster optimal berdasarkan RFM ada tiga, jukkan pada Gambar 7. Occasional customers ter-
yaitu elbow method, silhouette method, dan Calin- diri dari 40,58 persen member KGVC, sedangkan
ski-Harabasz index. Berikut ini penjelasan lebih dormant customers terdiri dari 59,42 persen mem-
lanjut metode evaluasi cluster pada algoritma K- ber KGVC. Meskipun occasional customers me-
Means: miliki persentase pelanggan yang lebih sedikit, na-
mun nilai transaksi justru lebih besar yaitu 77,46
Elbow Method persen dari total transaksi buku member KGVC.
Member KGVC pada occasional customers meru-
Tujuan dari elbow method adalah untuk memilih pakan pelanggan yang sangat potensial bagi Gra-
nilai k yang kecil dan masih memiliki nilai withinss media.
yang rendah. Nilai withinss cenderung menurun Persentase jumlah member KGVC ditinjau
menuju 0 (nol) ketika nilai k ditingkatkan. Berda- dari segi umur pada setiap cluster ditunjukkan pada
sarkan Gambar 4, nilai k=4 dengan persentase va- Gambar 8. Pelanggan terbagi menjadi kategori
riance = 66,8 persen dan total within-cluster sum umur 0-10 tahun, 11-20 tahun, 21-30 tahun, 31-40
of square = 152913,93 adalah cluster yang optimal. tahun, 41-50 tahun, 51-60 tahun, dan pelanggan
yang tidak diketahui umurnya dimasukkan dalam
Silhouette Method kategori lebih dari 60 tahun. Pelanggan yang tidak
diketahui umurnya mendominasi masing-masing
Jumlah optimal cluster k dengan nilai average sil- cluster, yaitu cluster 1 sebanyak 20,53 persen dan
houette yang tinggi mengindikasikan cluster yang cluster 2 sebanyak 23,82 persen. Segmen pelang-
baik. Cluster dengan k=2 memiliki nilai ave-rage gan berdasarkan umur pada masing-masing cluster
silhouette paling tinggi dibandingkan cluster yang memiliki persentase populasi yang hampir sama
lain. Nilai average silhouette pada dua cluster ada- pada masing-masing cluster dengan persentase
lah 0.42. Berdasarkan Gambar 5, dua cluster adalah jumlah member KGVC pada cluster 1 lebih banyak
cluster yang optimal. dibandingkan cluster 2.

Calinski-Harabasz Index

Gambar 10. Persentase Jumlah Member KGVC berdasarkan Gambar 9. Persentase Jumlah Member KGVC berdasarkan
Jenis Kelamin pada Segmentasi RFM Tingkat Pendidikan pada Segmentasi RFM
Christina Deni Rumiarti, et al., Segmentasi Pelanggan pada Customer Relationship Management 7

Persentase jumlah member KGVC ditinjau tecture & photography, business & economics,
dari segi jenis kelamin ditunjukkan pada Gambar children`s books, computing & internet, cooking,
10. Member KGVC yang termasuk dalam diet & health, education & teaching, engineering,
occasion-nal customers lebih banyak pelanggan entertainment, fiction & literature, home & gar-
perempuan dengan persentase 64,03. Sedangkan den, law, magazines.tabloid and journal, medical,
member KGVC yang termasuk dalam dormant others, parenting & family, philosophy, psycho-
customers lebih banyak pelanggan laki-laki dengan logy, reference & dictionary, religion & spiritua-
persen-tase 64,32. Berdasarkan perbandingan ini lity, schoolbooks indonesia curriculum, school-
menun-jukkan bahwa member KGVC berjenis books singapore curriculum, science & nature,
kelamin perempuan lebih potensial dibandingkan self-improvement, social sciences, dan sports &
pelang-gan laki-laki. adventure. Contoh dataset yang digunakan pada
Persentase jumlah member KGVC ditinjau penelitian ini seperti yang ditunjukkan pada
dari segi tingkat pendidikan ditunjukkan pada TABEL 3.
Gambar 9. Member KGVC dengan tingkat pendi- Data yang digunakan adalah variabel Y dan N
dikan universitas mendominasi masing-masing pe- seperti ditunjukkan Gambar 11. Y adalah jumlah
langgan pada cluster 1 dan 2. Sebanyak 55,47 per- pelanggan yang membeli buku jenis tertentu, se-
sen pelanggan dengan tingkat pendidikan univer- dangkan N adalah jumlah pelanggan yang tidak
sitas merupakan occasional customers. Demikian membeli buku jenis tertentu.
juga sebanyak 50,64 persen pelanggan dengan Sebelum dilakukan clustering, terlebih dahu-
tingkat pendidikan universitas merupakan domant lu dihitung nilai varian pada dataset yang terdiri
customers. Segmen member KGVC dengan tingkat dari categorical data. Berdasarkan elbow method,
pendidikan berbeda memiliki persentase populasi seperti terlihat pada Gambar 13, nilai k=3 dengan
yang hampir sama pada masing-masing cluster. persentase varian = 4,63 persen adalah cluster yang
Persentase jumlah member KGVC ditinjau optimal.
dari segi jenis pekerjaan ditunjukkan pada Gambar
12. Pelanggan yang tidak diketahui jenis pekerjaan Visualisasi hasil pembentukan cluster meng-
mendominasi masing-masing cluster, yaitu cluster gunakan algoritma hierarchical clustering dapat
1 sebanyak 31,22 persen sedangkan cluster 2 se- dilihat pada Gambar 14. Hasil cluster yang optimal
banyak 32,22 persen. Occasional customers terdiri pada segmentasi pembelian buku adalah 3 cluster.
dari pelanggan dengan sebagian besar variasi jenis TABEL 4 menunjukkan persentase jumlah pelang-
pekerjaan dan persentase jumlah member KGVC gan, dan nilai mean setiap cluster yang terbentuk
lebih banyak dibandingkan dormant customers. dari hasil segmentasi pembelian buku pada 3 clus-
Sedangkan persentase member KGVC yang masih ter. Cluster 1 dengan label pelanggan pembelian
pelajar (students) justru lebih banyak berada pada
segmen dormants customer.

Segmentasi Pelanggan berdasarkan Pembelian


Buku

Dataset yang digunakan untuk segmentasi pelang-


gan berdasarkan pembelian buku adalah sebanyak
28 kolom, yaitu kode pelanggan, dan 27 jenis buku
yang masing-masing berupa categorical data. Je-
nis buku tersebut adalah agriculture, art. Archi-

Gambar 12. Persentase Jumlah Member KGVC berdasarkan


Jenis Pekerjaan pada Segmentasi RFM Gambar 11. Contoh Distribusi Pelanggan berdasarkan Jenis Buku
8 Jurnal Sistem Informasi (Journal of Information Systems), Volume 13, Issue 1, April 2017

rendah terdiri dari 82,80 persen pelanggan dan III. Member KGVC dengan tingkat pendidikan uni-
rata-rata pembelian 2 jenis buku. Cluster 2 dengan versitas mendominasi masing-masing pelanggan
label pelanggan pembelian sedang terdiri dari pada cluster pembelian buku “rendah”, “sedang”,
16,66 persen pelanggan dan rata-rata pembelian 5 dan “tinggi”. Persentase pelanggan dengan tingkat
jenis buku. Cluster 3 dengan label pelanggan pem- pendidikan universitas pada segmen “tinggi” me-
belian tinggi terdiri dari 0,54 persen pelanggan dan miliki persentase paling tinggi, yaitu 70,59 persen.
rata-rata pembelian 7 jenis buku. Tetapi, pelanggan dengan tingkat pendidikan SMP
Persentase jumlah member KGVC berdasar- dan SMA tidak termasuk pada segmen pelanggan
kan umur pada segmentasi pembelian buku ditun- “tinggi”.
jukkan pada Lampiran Gambar ILampiran Gambar. Persentase jumlah member KGVC berdasar-
Pelanggan beru-mur 41-50 tahun merupakan kan jenis pekerjaan pada segmentasi pembelian bu-
mayoritas pelanggan yang berada pada segmen ku ditunjukkan pada Lampiran Gambar IV. Pelang-
pelanggan dengan pem-belian jenis buku yang gan yang tidak diketahui jenis pekerjaan (others)
“tinggi”, yaitu sebesar 32,35 persen. Pelanggan mendominasi masing-masing cluster, yaitu cluster
berumur > 60 tahun merupakan pelanggan yang 1 sebanyak 51,99 persen, cluster 2 sebanyak 49,81
tidak diketahui umur sebenarnya. Pelanggan persen, dan cluster 3 sebanyak 50,00 persen. Se-
tersebut merupakan mayoritas pelang-gan yang mentara itu, persentase member KGVC yang masih
berada pada segmen pelanggan dengan pembelian pelajar (students) tidak termasuk pada cluster 3.
jenis buku “rendah” dan “sedang”. Per-sentase
jumlah pelanggan pada cluster “rendah” se-besar Rekomendasi Strategi Marketing
33,59 persen, sedangkan persentase jumlah
pelanggan pada cluster “sedang” sebesar 29,87 per- Berdasarkan segmentasi pelanggan yang dihasil-
sen. kan, diperlukan strategi marketing untuk mening-
Persentase jumlah member KGVC berdasar- katkan profit perusahaan dan loyalitas pelanggan.
kan umur pada segmentasi pembelian buku ditun- Rekomendasi strategi marketing yang diusulkan
jukkan pada Lampiran Gambar II. Member KGVC oleh penulis adalah segmen pelanggan berdasarkan
yang ter-masuk dalam segmen pelanggan dengan nilai RFM. Hal ini dikarenakan variabel yang di-
pembelian buku “rendah” dan “tinggi” adalah ma- ambil terdiri dari kapan pelanggan terakhir kali
yoritas pelanggan dengan jenis kelamin perem- berbelanja, frekuensi kunjungan, dan nilai transak-
puan. Persentase jumlah pelanggan pada cluster si buku yang dibeli. Penulis tidak merekomenda-
“rendah” sebesar 62,93 persen, sedangkan persen- sikan strategi marketing terhadap segmen pelang-
tase jumlah pelanggan pada cluster “tinggi” sebe- gan berdasarkan pembelian jenis buku dikarenakan
sar 52,94 persen. Member KGVC yang termasuk segmen pelanggan ini hanya berdasarkan jenis
dalam segmen pelanggan dengan pembelian buku buku yang dibeli oleh pelanggan. Berikut penjela-
“sedang” adalah mayoritas pelanggan laki-laki de- san lebih lanjut terkait beberapa rekomendasi stra-
ngan persentase 52,08 persen. Berdasarkan perban- tegi marketing untuk occasional customers dan
dingan ini menunjukkan bahwa member KGVC dormant customers.
berjenis kelamin perempuan lebih potensial diban-
dingkan pelanggan laki-laki. Occasional Customers
Persentase jumlah member KGVC berdasar-
kan tingkat pendidikan pada segmentasi pembelian Pelanggan occasional merupakan pelanggan yang
buku seperti ditunjukkan pada Lampiran Gambar memiliki KGVC dengan frekuensi kunjungan yang
jarang tetapi memiliki nilai transaksi rata-rata yang
tinggi. Gramedia perlu mengembangkan aktivitas
promosi untuk meningkatkan frekuensi kunjungan
pelanggan pada cluster ini. Selain itu, loyalitas
pelanggan harus tetap dijaga dan ditingkatkan de-
ngan memberikan benefit terhadap pelanggan se-
tiap kali pelanggan tersebut melakukan kunjungan.
Strategi marketing tersebut misalnya dengan mem-
berikan pelanggan reward, yaitu diskon atau hadi-
ah tertentu setelah mengumpulkan struk tran-saksi
dengan nilai rupiah tertentu pada periode tertentu.
Peningkatan nilai transaksi pada pelanggan
occasional dapat dilakukan dengan mengembang-
kan berbagai aktivitas promosi. Informasi terkait
Gambar 13. Persentase Varian pada Setiap Dimensi jenis buku baru yang sering dibeli oleh pelanggan
berdasarkan Dataset Buku KGVC perlu diinformasikan oleh Gramedia kepa-
Christina Deni Rumiarti, et al., Segmentasi Pelanggan pada Customer Relationship Management 9

Gambar 14. Segmentasi Pembelian Buku menggunakan Hierarchical Clustering

da pelanggan secara periodik. Selain itu, peningka- kunjung tetapi memiliki nilai transaksi rata-rata
tan nilai transaksi ini dapat dikembangkan dengan yang tinggi. Dormant customers merupakan pe-
metode data mining dalam cross-/up-selling cam- langgan yang tidak potensial. Sedangkan jumlah
paign dan market basket analysis. Cross-/up-sel- cluster optimal berdasarkan pembelian buku se-
ling campaign bertujuan untuk menjual buku tam- banyak tiga cluster.
bahan atau alternatif buku yang lebih memberikan Jumlah cluster optimal pada segmentasi nilai
benefit yang lebih banyak kepada pelanggan. Mar- pelanggan yang dihasilkan dalam penelitian ini
ket basket analysis bertujuan untuk menawarkan berdasarkan pada nilai tertinggi silhouette method
buku yang biasanya dibeli secara bersama-sama dan calinski-harabasz index. Nilai average silhou-
oleh pelanggan. ette pada dua cluster adalah 0.42. Nilai Calinski-
Harabasz index pada dua cluster adalah 1.31.
Dormant Customers Faktor penting yang harus diperhitungkan ke-
tika mengembangkan strategi pemasaran adalah
Pelanggan dormant merupakan pelanggan yang segmentasi pelanggan. Segmentasi pelanggan ini
kurang potensial karena memiliki nilai RFM paling merupakan langkah awal dalam menganalisis pe-
rendah. Aktivitas promosi untuk mempertahankan langgan supaya dapat meningkatkan transaksi bu-
pelanggan yang kurang potensial memang tidaklah ku yang dilakukan oleh member KGVC. Segmen-
mudah. Gramedia perlu mengidentifikasi terlebih tasi pelanggan yang dihasilkan dalam penelitian ini
dahulu pelanggan KGVC yang lebih memberikan adalah segmentasi nilai pelanggan dan segmentasi
kontribusi dan dapat ditingkatkan tingkat kunju- pembelian buku. Dengan adanya segmentasi ini di-
ngannya. Hal ini dapat dilakukan dengan meng- harapkan dapat membantu perusahaan dalam me-
analisis faktor-faktor yang menyebabkan pelang- ngelompokkan member KGVC sehingga perusa-
gan pada segmen ini kurang potensial. Pelanggan haan dapat menentukan strategi yang sesuai untuk
dormant perlu diberikan perhatian dan Gramedia setiap kelompok pelanggan.
harus meningkatkan komunikasi untuk memper- Penelitian ini masih memiliki kekurangan
tahankan pelanggan supaya tetapi setia berbelanja yang dapat disempurnakan pada penelitian selan-
menggunakan KGVC di Gramedia. Misalnya, jutnya. Berdasarkan hasil penelitian dan kesim-
pemberian diskon khusus bagi pelanggan KGVC pulan yang telah dibuat, penulis memberikan saran
tertentu untuk meningkatkan frekuensi dan minat untuk penelitian selanjutnya. Segmentasi pelang-
berbelanja. gan pada penelitian ini menggunakan satu algo-
ritma clustering, yaitu algoritma K-means. Pene-
5. Kesimpulan litian selanjutnya dapat bereksperimen mengguna-
kan berbagai algoritma clustering.
Kesimpulan yang diperoleh berdasarkan analisis Penelitian selanjutnya dapat dikembangkan
dan pembahasan adalah bahwa segmentasi pelang- dengan metode data mining yang lain untuk me-
gan yang dihasilkan pada CRM di PT Gramedia lakukan cross-/up-selling campaign dan market
Asri Media sebanyak 2 cluster, yaitu occasional basket analysis. Cross-/up-selling campaign digu-
customers, dan dormant customers. Occasional nakan untuk menjual produk tambahan atau alter-
customers merupakan pelanggan yang jarang ber- natif produk yang lebih menguntungkan pelang-
10 Jurnal Sistem Informasi (Journal of Information Systems), Volume 13, Issue 1, April 2017

gan. Market basket analysis digunakan untuk me- [5] Larose, D. T., & Larose, C. D. (2015). Data
ngidentifikasi produk-produk terkait yang biasanya Mining and Predictive Analytics. New Jersey:
dibeli secara bersama-sama oleh pelanggan. John Wiley & Sons.
[6] Kodinariya, T. M., & Makwana, P. R. (2013).
Referensi Review on Determining Number of Cluster in
K-Means Clustering. International Journal of
[1] Kompas Gramedia. (2016). Data Warehouse. Advance Research in Computer Science and
Jakarta: Kompas Gramedia. Management Studies, 90-95.
[2] Berry, M. J., & Linoff, G. S. (2004). Data Mi- [7] Liu, Y., Li, Z., Xiong, H., Gao, X., & Wu, J.
ning Techniques for Marketing, Sales, and (2010). Understanding of Internal Clustering
Customer Relationship Management Second Validation Measures. International Conferen-
Edition. Indianapolis, Indiana: Wiley Publish- ce on Data Mining (pp. 911-916). Beijing:
ing. IEEE.
[3] Tsiptsis, K., & Chorianopoulos, A. (2009). [8] Celebi, M. E., & Aydin, K. (2016). Clustering
Data Mining Techniques in CRM: Inside Cus- Evaluation in High-Dimensional Data. In N.
tomer Segmentation. West Sussex: John Wiley Tomašev, & M. Radovanović, Unsupervised
& Sons Ltd. Learning Algorithms (pp. 71-107). Switzer-
[4] Maheshwari, A. K. (2015). Business Intelli- land: Springer International Publishing.
gence and Data Mining. New York: Business [9] Zumel, N., & Mount, J. (2014). Practical Data
Expert Press. Science with R. Shelter Island: Manning Pu-
blications Co.

Lampiran

Lampiran Gambar I. Persentase Jumlah Member KGVC Lampiran Gambar II. Persentase Jumlah Member KGVC
berdasarkan Umur pada Segmentasi Pembelian Buku berdasarkan Jenis Kelamin pada Segmentasi Pembelian Buku

Lampiran Gambar III. Persentase Jumlah Member KGVC Lampiran Gambar IV. Persentase Jumlah Member KGVC
berdasarkan Tingkat Pendidikan pada Segmentasi Pembelian berdasarkan Jenis Pekerjaan pada Segmentasi Pembelian Buku

Вам также может понравиться