35
4.5. Pengelompokkan Data
Terdapat 384 2x4x48 kombinasi estimasi nilai probabilitas survival karena terdapat 3 variabel yang mempengaruhinya, yaitu variabel age dengan
kategori usia antara 15-62 tahun, variabel smoking dengan kategori merokok dan tidak merokok, dan terakhir adalah variabel medical test dengan kategori
tertanggung dengan hasil medical test penyakit ringan, penyakit sedang dan penyakit berat. Sehingga diperlukan pengelompokkan data untuk mempermudah
interpretasi data. Pertama-tama dilakukan hierarchical clustering untuk memperoleh
pengelompokkan yang sesuai dengan data, pada dendogram lampiran 6 menunjukkan bahwa pengelompokkan 2 cluster merupakan pengelompokkan
terbaik karena mempunyai jarak pengelompokkan terjauh dibandingkan kelompok cluster lainnya, jarak terjauh kedua adalah pada pengelompokkan 3 cluster.
Sehingga dibentuk pengelompokkan 2 cluster dengan metode K-Means Cluster, namun setelah dibentuk 2 cluster terdapat kesulitan untuk memberi nama cluster
karena dilihat dari cluster membership pengelompokkan yang dihasilkan masih belum spesifik. Sehingga dilakukan percobaan kedua dengan membentuk
pengelompokkan menjadi 3 cluster, diperoleh pengelompokkan data dengan spesifikasi yang lebih jelas dibandingkan 2 cluster. Pada akhirnya dibentuklah 3
cluster dengan cluster 1 adalah tertanggung dengan nilai survival rata-rata yang tertinggi kedua pada setiap t, cluster 2 adalah tertanggung dengan nilai survival
rata-rata yang tertinggi pada setiap t dan cluster 3 adalah tertanggung dengan nilai survival rata-rata yang terendah pada setiap t.
36
Cluster 1 diberi nama kelompok dengan pengajuan waktu klaim sedang, cluster 2 diberi nama kelompok tertanggung dengan pengajuan waktu klaim
terpanjang, dan cluster 3 diberi nama kelompok tertanggung dengan pengajuan waktu klaim terpendek. Keanggotaan masing-masing cluster dapat dilihat pada
lampiran 7. Kelompok tertanggung dengan pengajuan waktu klaim terpanjang
mempunyai nilai probabilitas survival 90.32 untuk waktu satu tahun pertama, artinya sampai waktu satu tahun pertama terdapat kemungkinan 9.68 dari
jumlah tertanggung yang terjadi event, sehingga jika terdapat 100 tertanggung, hanya 10 tertanggung yang berkemungkinan mengajukkan klaim asuransi. Dan
sampai waktu dua tahun pertama terdapat 85.26 tertanggung yang survive atau tidak terjadi event. Sehingga jika pada tahun pertama sudah terjadi 10 tertanggung
yang terjadi event, tahun ke dua hanya terdapat 5 tertanggung yang berkemungkinan terjadi event.
Kelompok tertanggung dengan pengajuan waktu klaim sedang mempunyai nilai probabilitas survival 51.17 untuk waktu delapan bulan pertama, artinya
sampai waktu delapan bulan pertama terdapat kemungkinan hampir 50 atau tepatnya 48.83 dari tertanggung yang ada akan mengajukan klaim, sehingga jika
terdapat 100 tertanggung, ada 49 tertanggung yang berkemungkinan mengajukkan klaim asuransi. Dan sampai waktu dua tahun pertama terdapat kemungkinan
26.88 tertanggung yang survive atau tidak terjadi event. Sehingga jika pada tahun pertama sudah terjadi 49 tertanggung yang mengajukan klaim, pada tahun
ke dua terdapat 24 tertanggung yang berkemungkinan mengajukan klaim.
37
Dan untuk kelompok tertanggung dengan pengajuan waktu klaim terpendek mempunyai nilai probabilitas survival 50.35 dalam waktu tiga bulan
pertama, artinya sampai waktu tiga bulan pertama sudah terdapat kemungkinan 50 atau tepatnya 49.65 dari jumlah tertanggung yang akan mengajukan klaim,
sehingga jika terdapat 100 tertanggung, ada 50 tertanggung yang berkemungkinan mengajukkan klaim asuransi. Dan sampai waktu satu tahun pertama hanya
mencapai kemungkinan sekitar 1 tertanggung yang survive atau tidak terjadi event. Sehingga pada tahun pertama saja kelompok tertanggung yang
dikhawatirkan hanya mempunyai 1 tertanggung yang survive atau tidak mengajukan klaim Lampiran 8.
38
BAB V KESIMPULAN DAN SARAN