Analisa Tingkat Kesadaran Masyarakat Pen (1)

Seminar Nasional Teknologi Informasi dan Komunikasi (SNASTIKOM)

ISBN : 978-602-61039-0-1

Analisa Tingkat Kesadaran Masyarakat Pengguna Asuransi Jiwa dengan
Metode Clustering
Akmal Nasution
Sekolah Tinggi Manajemen Informatika dan Kompter (STMIK ROYAL) Kisaran
Jalan Prof. H.M. Yamin No. 173 Kisaran Kab. Asahan
Pos-el : [email protected]

Abstract
Kecepatan dan ketepatan informasi merupakan salah
satu faktor penentu keberhasilan perusahaan dalam
memenuhi kebutuhan pelanggan. Pengolahan data
dengan ilmu komputer sangat membantu segala
kegiatan pada perusahaan/organisasi lebih efektif dan
efisien. Data mining menjadi salah satu ilmu dari
bidang komputer yang sangat berpengaruh dalam
pengolahan data, dimana dengan menggunakan salah
satu teknik data mining dalam pengolahan data, dapat

diperoleh informasi-informasi penting untuk kemajuan
perusahaan. Tidak terkecuali untuk pengolahan data
pada asuransi jiwa. Tujuan utama dari penelitian ini
adalah untuk pengolahan data asuransi jiwa
berdasarkan tingkat kesadaran masyarakat pada PT.
Jasaraharja Putera. Dari data tahun 2009 dan 2010
yang tersedia dapat diperoleh informasi bahwa terjadi
peningkatan paket yang diambil dari paket Standard ke
paket Exclusive. Hal ini menunjukkan kesadaran
masyarakat dalam berasuransi sudah cukup tinggi.
Dalam penelitian ini metode clustering dilakukan
secara hirarki menggunakan metode pautan tunggal
atau single linkage. Proses komputasi yang digunakan
untuk mengolah data adalah aplikasi TANAGRA. Data
di ambil dari PT Asuransi Jasaraharja Putera Padang
Sumatera Barat yaitu data tentang Produk ASPRI.

1.

Pendahuluan


Pada masa sekarang ini perkembangan teknologi
dan komunikasi dari waktu ke waktu dirasakan
meningkat pesat, terlebih lagi perkembangan di bidang
teknologi komputer yang mendorong penggunaan dan
pemanfaatan perkembangan teknologi tersebut secara
luas di berbagai bidang dan aspek kehidupan, sehingga
memudahkan masyarakat pada umumnya dan individu
pada khususnya dalam menunjang kegiatan mereka
sehari-hari.
Salah satu contoh dari pemanfaatan dan
penggunaan perkembangan teknologi komputer itu
sendiri adalah dalam pengolahan data asuransi jiwa

dengan konsep data mining, yang mana teknologi
seperti ini diharapkan dapat mempermudah user untuk
memahami kebiasaan masyarakat dalam berasuransi
jiwa, sehingga akan diperoleh kesimpulan dan
informasi yang berguna untuk kedepannya.
Berdasarkan uraian singkat diatas peninjauan

sementara pada perusahaan yang bergerak dibidang
bisnis ini pun tidak mau ketinggalan untuk
memanfaatkan
teknologi
dalam
penyelesaian
pekerjaannya, termasuk untuk menganalisa pola dan
kebiasaan masyarakat dalam berasuransi. Dengan
memanfaatkan data pada tahun-tahun sebelumnya,
dapat diperoleh informasi penting mengenai kebiasaan
dan pola pikir masyarakat dalam berasuransi. Oleh
karena itu dilakukanlah penelitian yang berjudul
Analisa Tingkat Kesadaran Masyarakat Pengguna
Asuransi Jiwa dengan Metode Clustering.

2.

Landasan Teori

2.1


Data Mining
Data Mining merupakan salah satu proses
eksplorasi dan analisis data yang memiliki banyak
metode yang sesuai dengan kegunannya. Clustering
dan Assosiation Rules merupakan dua diantara metode
tersebut. Proses Data Mining mencakup proses mencari
pola atau informasi menarik dalam data terpilih dengan
menggunakan teknik, metode atau algoritma tertentu
yang bervariasi. Secara sederhana data mining bisa
dikatakan sebagai proses menyaring pengetahuan dari
sejumlah data yang besar.
2.2

Metode dan Sifat Data Mining
Beberapa alat dan metode yang digunakan
seperti:
1. Sampling : menyeleksi subset representatif dari
populasi data yang besar.
2. Transformation : memanipulasi data mentah

untuk menghasilkan input tunggal.
3. Denoising : menghilangkan noise dari data
4. Normalization : mengorganisasi data untuk
pengaksesan yang lebih spesifik

90 | Data Mining

Seminar Nasional Teknologi Informasi dan Komunikasi (SNASTIKOM)

5.

Feature Extraction : membuka spesifikasi data
yang signifikan dalam konteks tertentu.

Clustering
Clustering juga dikenal sebagai unsupervised
learning yang membagi data menjadi kelompok –
kelompok atau cluster berdasarkan kemiripan atribut di
antara data tersebut. Karakteristik dari tiap cluster tidak
ditentukan sebelumnya melainkan tercermin dari

kemiripan data yang terkelompok didalamnya. Selain
digunakan sebagai metode yang independen dalam data
mining, clustering juga digunakan dalam prapremrosesan data sebelum data diolah dengan metode
data mining lain untuk meningkatkan pemahaman
terhadap domain data.

ISBN : 978-602-61039-0-1

Di sini besaran-besaran
dUW dan dVW
berturut-turut adalah jarak terpendek antara clustercluster U dan W dan juga cluster-cluster V dan W.

2.3

3.

Analisa dan Pembahasan

Hierarchical Clustering
Kategori algoritma clustering yang banyak

dikenal adalah Hierarchical Clustering. Hierarchical
Clustering adalah salah satu algoritma clustering yang
dapat digunakan untuk meng-cluster dokumen
(document clustering). Dari teknik hierarchical
clustering, dapat dihasilkan suatu kumpulan partisi
yang berurutan, dimana dalam kumpulan tersebut
terdapat :
a.
Cluster – cluster yang mempunyai poin – poin
individu. Cluster – cluster ini berada di level
yang paling bawah.
b.
Sebuah cluster yang didalamnya terdapat poin –
poin yang dipunyai semua cluster didalamnya.
Single cluster ini berada di level yang paling
atas.

3.1 Analisis Data dan Cluster
Tahap analisa merupakan tahap yang penting
dalam pengolahan data, untuk itu perlu adanya

gambaran lengkap mengenai sistem yang dipakai dan
gambaran lengkap mengenai data yang akan diolah.
Perlu juga dianalisis hubungannya dengan masyarakat
di kota Padang pada umumnya, untuk memperoleh
hasil analisis yang sesuai dengan tujuan.
.
3.1.1
Analisa Data
Kesadaran masyarakat di kota padang dalam
berasuransi khususnya asuransi jiwa, penulis telah
mendapatkan data dari sebuah asuransi yang bernaung
di kota padang yaitu P.T JasaRaharja Putera yang
merupakan anak dari perusaahan JasaRaharja. Jasa
Raharja Putera adalah perseroan yang sudah ada sejak
tahun 1997 dan memiliki cabang di berbagai kota.
JasaRaharja Putera memiliki berbagai macam produk
dan yang digunakan dalam penelitian ini khusus pada
produk yang berhubungan dengan jiwa yaitu produk
ASPRI.
Dari data yang ada, terdapat data nasabah yang

berupa tanggal mereka berasuransi, pemilihan paket
asuransi serta jangka waktunya. Dengan data yang ada
tersebut bisa di olah dengan menggunakan metode data
mining untuk mencari kesimpulan, pola tersembunyi
serta pengetahuan yang nanti nya sangat berguna.

2.5

3.1.2

2.4

Metode Single Lingkage
Input untuk algoritma single linkage bisa berujud
jarak atau similarities antara pasangan-pasangan dari
objek-objek. Kelompok-kelompok dibentuk dari
entities individu dengan menggabungkan jarak paling
pendek atau similarities (kemiripan) yang paling besar.
Pada awalnya, kita harus menemukan jarak
terpendek dalam D = {dik} dan menggabungkan

objek-objek yang bersesuaian misalnya, U dan V ,
untuk mendapatkan cluster (UV). Untuk langkah (3)
dari algoritma di atas jarak-jarak antara (UV) dan
cluster W yang lain dihitung dengan cara

d(UV)W = min {dUW, dVW }

Analisis Cluster
Tujuan
dari
Analisis
Cluster
adalah
mengelompokkan obyek berdasarkan kesamaan
karakteristik di antara obyek-obyek tersebut. Langkah
pengelompokan dalam analisis cluster mencakup 3 hal
berikut :
1. Mengukur kesamaan jarak
2. Membentuk cluster secara hirarkis
3. Menentukan jumlah cluster.

Konsep dari metode hirarkis ini dimulai dengan
menggabungkan 2 obyek yang paling mirip, kemudian
gabungan 2 obyek tersebut akan bergabung lagi dengan
satu atau lebih obyek yang paling mirip lainnya. Proses
clustering ini pada akhirnya akan ‘menggumpal’

91 | Data Mining

Seminar Nasional Teknologi Informasi dan Komunikasi (SNASTIKOM)

menjadi satu cluster besar yang mencakup semua
obyek. Metode ini disebut juga sebagai ”aglomerative”
yang digambarkan dengan dendogram.
Langkah-langkah dalam algoritma clustering
hirarki agglomerative untuk mengelompokkan N objek
(item/variabel) :
1. Mulai dengan N cluster, setiap cluster mengandung
entiti tunggal dan sebuah matriks simetrik dari
jarak (similarities) D = {dik} dengan tipe NxN.
2. Cari matriks jarak untuk pasangan cluster yang
terdekat (paling mirip). Misalkan jarak antara
cluster U dan V yang paling mirip adalah duv.
3. Gabungkan cluster U dan V. Label cluster yang
baru dibentuk dengan (UV). Update entries pada
matrik jarak dengan cara :
a. Hapus baris dan kolom yang bersesuaian dengan
cluster U dan V
b. Tambahkan baris dan kolom yang memberikan
jarak-jarak antara cluster (UV) dan clustercluster yang tersisa.
4. Ulangi langkah 2 dan 3 sebanyak (N-1) kali.
(Semua objek akan berada dalam cluster tunggal
setelah algoritma berahir). Catat identitas dari
cluster yang digabungkan dan tingkat-tingkat (jarak
atau similaritas) di mana penggabungan terjadi.
3.2 Pembahasan Metode Single Linkage
Input untuk algoritma single linkage bisa
berwujud jarak atau similarity antara pasanganpasangan dari objek-objek. Kelompok-kelompok
dibentuk dari entities individu dengan menggabungkan
jarak paling pendek atau similarity (kemiripan) yang
paling besar.
Pada awalnya, kita harus menemukan jarak
terpendek dalam D = {dik} dan menggabungkan
objek-objek yang bersesuaian misalnya, U dan V ,
untuk mendapatkan cluster (UV). Untuk langkah (3)
dari algoritma di atas jarak-jarak antara (UV) dan
cluster W yang lain dihitung dengan cara
d(UV)W = min {dUW, dVW }
Di sini besaran-besaran dUW dan dVW
berturut-turut adalah jarak terpendek antara clustercluster U dan W dan juga cluster-cluster V dan W .
3.3 Struktur Data Set
Dari file yang diperoleh, terdapat beberapa
record dan field, serta attribute-atribute untuk setiap
fieldnya yang dipakai dalam pengolahan data ini. Ada
12 field dalam laporan penerimaan PA pada JP-

ISBN : 978-602-61039-0-1

Insurance ini yang akan menjadi landasan pengolahan
data, yaitu tanggal penerbitan/tanggal setor, nomor
polis, nomor regis, nama tertanggung, PA HP A, PA
HP B, PA HP D, ND (natural dead), premi, premi ND,
periode awal asuransi, dan periode akhir asuransi.

4.

Implementasi dan Pengujian

4.1

Perkenalan Tanagra
Tanagra adalah software DATA MINING untuk
keperluan akademik dan riset. Di dalamnya disediakan
beberapa metoda data mining mulai dari mengekplorasi
analisis data, pembelajaran statistik, pembelajaran
mesin, dan database.
4.2

Hasil Pengujian Data dengan Tanagra
Dalam penggunaan Tanagra, terlebih dahulu
sediakan file masukannya atau datasetnya. Dalam hal
ini digunakan file berformat xls (Excel) sesuai dengan
data yang tersedia (gambar 1).

Gambar 1 Pilih Dataset
Informasi awal tentang dataset yang pilih akan
ditampilkan. Terlihat bahwa dataset (Data Tahun 2009)
terdiri dari 12 attribute dan 444 example (gambar 2).

Gambar 2 Informasi Dataset

92 | Data Mining

Seminar Nasional Teknologi Informasi dan Komunikasi (SNASTIKOM)

Kemudian diperoleh laporan akhirnya dalam 3 buah
cluster, lihat gambar 3, gambar 4, dan gambar 5.

Gambar 3 Cluster 1 Tahun 2009

ISBN : 978-602-61039-0-1

HP.B, 10 juta HP.D. Semua paket dalam cluster ini,
53% nya diterbitkan pada akhir bulan.
Cluster kedua (C_HAC_2) menyatakan paket
terendah masyarakat dalam berasuransi di kota Padang
(Paket Standard). Hal ini terlihat dari rata-rata PA
HP.D yang hanya 900 ribu-an dan rata-rata PA HP.B,
PA HP.A hanya sekitar 6 juta. Sesuai dengan
pembahasan sebelumnya, bahwa Paket Standard
tertinggi adalah 10 juta HP.A, 10 juta HP.B, 1 juta
HP.D sedangkan paket Standard terkecil adalah 2,5 juta
HP.A, 2,5 juta HP.B, dan 0,25 juta HP.D. Sementara
itu semua paket dalam cluster ini, 33,7% nya
diterbitkan pada awal bulan.
Cluster ketiga (C_HAC_3) menyatakan paket
menengah masyarakat dalam berasuransi dikota Padang
(Paket Exclusive Gold dan Silver). Hal ini terlihat dari
rata-rata PA HP.A dan PA HP.B yang mencapai 34
juta-an dan PA HP.D mencapai 3,5 juta. Sesuai dengan
pembahasan sebelumnya, bahwa Paket Exclusive
Gold, maksimumnya adalah 50 juta HP.A, 50 juta
HP.B, 5 juta HP.D sedangkan paket Exclusive Silver,
maksimumnya adalah 25 juta HP.A, 25 juta HP.B, dan
2,5 juta HP.D. Sementara itu semua paket dalam cluster
ini, 16,5% nya diterbitkan pada pertengahan bulan. Hal
yang sama juga dilakukan untuk data tahun 2010.

Gambar 4 Cluster 2 Tahun 2009

5.

Gambar 5 Cluster 3 Tahun 2009
Dari laporan Data Tahun 2009 yang diperoleh, dapat
disimpulkan bahwa, Cluster pertama (C_HAC_1)
menyatakan paket tertinggi masyarakat dalam
berasuransi di kota Padang (Paket Exclusive Platinum).
Hal ini terlihat dari PA HP.B dan PA HP.A yang
tinggi, mencapai 100 juta, sedangkan PA HP.D 10 juta.
Sesuai dengan pembahasan sebelumnya, bahwa paket
exclusive Platinum adalah 100 juta HP.A, 100 juta

Penutup

Setelah semua data (laporan 2009 dan 2010)
diproses, diperoleh poin-poin penting sebagai berikut :
1. Proses cluster secara hirarki dengan menggunakan
metode single linkage mampu menunjukkan
tingkatan paket asuransi yang di ambil oleh
masyarakat kota Padang.
2. Dari hasil cluster analisis data tahun 2009 dapat
disimpulkan nasabah lebih cenderung berasuransi
di awal bulan daripada di akhir atau di tengah
bulan. Hal tersebut menggambarkan tingkat
kesadaran masyarakat cukup tinggi dalam
berasuransi dengan menjadikan asuransi sebagai
kebutuhan pokok, lihat gambar 6.
3. Dari hasil cluster analisis data tahun 2010 dapat
disimpulkan nasabah lebih cenderung berasuransi
di tengah bulan daripada di akhir atau di awal
bulan dan kebanyakan nasabah juga mulai
berasuransi pada awal tahun, khususnya bulan
Februari dan Maret. Lihat gambar 7.

93 | Data Mining

Seminar Nasional Teknologi Informasi dan Komunikasi (SNASTIKOM)

7.

Silver ke bawah (Standard Melati, Standard
Mawar, Standard Cempaka).
Dari data tahun 2009 dan 2010 nasabah lebih
cenderung mengambil paket Standard dengan
Premi yang relative lebih murah. Hal ini
menggambarkan tingkat ekonomi menengah
kebawah lebih banyak bersuransi dan menjadikan
asuransi sebagai kebutuhan pokok.
Dari perbandingan data tahun 2009 dan 2010
dapat disimpulkan bahwa tingkat kesadaran
masyarakat kota padang dalam berasuransi sudah
cukup tinggi, hal ini terlihat dari peningkatan
paket yang diambil antara tahun 2009 dan 2010.
Pada 2009, kebanyakan mengambil paket
standard kebawah saja, sedangkan pada 2010,
telah banyak yang mengambil paket exclusive dan
standard.

6.

References

6.

Gambar 6 Cluster Analisis Tanggal Terbit
Tahun 2009

Gambar 7 Cluster Analisis Tanggal Terbit
Tahun 2010
4.

Dari hasil cluster analisis data tahun 2009, sekitar
76% masyarakat kota Padang yang berasuransi di
Jasaraharja Putera mengambil paket Standard
seperti terlihat pada gambar 8.

ISBN : 978-602-61039-0-1

[1]Han, Jiawei, Micheline Kamber, 2001, Data Mining
: Concepts and Techniques. Morgan Kaufmann.
[2]Johan Oscar Ong, "Implementasi Algoritma KMeans Clustering Untuk Menentukan Strategi
Marketing President University," Jurnal Ilmiah Teknik
Industri, vol. 12, no. 1, pp. 10-13, Juni 2013.
[3]Larose, Daniel T, Discovering Knowledge in Data:
An Introduction to Data Mining.: John Willey & Sons.
Inc, 2005.
[4] Rendy Handoyo, dkk, “Perbandingan Metode
Clustering Menggunakan Metode Single Linkage dan
K - Means pada Pengelompokan Dokumen”, Jurnal
Sifo Mikroskil, Vol. 15, No.2, 2014.

Gambar 8 Cluster Analisis Paket Asuransi
Tahun 2009
5.

Dari hasil cluster analisis data tahun 2010, sekitar
68,7% masyarakat kota Padang yang berasuransi
di Jasaraharja Putera mengambil paket Exclusive

94 | Data Mining