Pengelompokkan Data HASIL DAN PEMBAHASAN

35

4.5. Pengelompokkan Data

Terdapat 384 2x4x48 kombinasi estimasi nilai probabilitas survival karena terdapat 3 variabel yang mempengaruhinya, yaitu variabel age dengan kategori usia antara 15-62 tahun, variabel smoking dengan kategori merokok dan tidak merokok, dan terakhir adalah variabel medical test dengan kategori tertanggung dengan hasil medical test penyakit ringan, penyakit sedang dan penyakit berat. Sehingga diperlukan pengelompokkan data untuk mempermudah interpretasi data. Pertama-tama dilakukan hierarchical clustering untuk memperoleh pengelompokkan yang sesuai dengan data, pada dendogram lampiran 6 menunjukkan bahwa pengelompokkan 2 cluster merupakan pengelompokkan terbaik karena mempunyai jarak pengelompokkan terjauh dibandingkan kelompok cluster lainnya, jarak terjauh kedua adalah pada pengelompokkan 3 cluster. Sehingga dibentuk pengelompokkan 2 cluster dengan metode K-Means Cluster, namun setelah dibentuk 2 cluster terdapat kesulitan untuk memberi nama cluster karena dilihat dari cluster membership pengelompokkan yang dihasilkan masih belum spesifik. Sehingga dilakukan percobaan kedua dengan membentuk pengelompokkan menjadi 3 cluster, diperoleh pengelompokkan data dengan spesifikasi yang lebih jelas dibandingkan 2 cluster. Pada akhirnya dibentuklah 3 cluster dengan cluster 1 adalah tertanggung dengan nilai survival rata-rata yang tertinggi kedua pada setiap t, cluster 2 adalah tertanggung dengan nilai survival rata-rata yang tertinggi pada setiap t dan cluster 3 adalah tertanggung dengan nilai survival rata-rata yang terendah pada setiap t. 36 Cluster 1 diberi nama kelompok dengan pengajuan waktu klaim sedang, cluster 2 diberi nama kelompok tertanggung dengan pengajuan waktu klaim terpanjang, dan cluster 3 diberi nama kelompok tertanggung dengan pengajuan waktu klaim terpendek. Keanggotaan masing-masing cluster dapat dilihat pada lampiran 7. Kelompok tertanggung dengan pengajuan waktu klaim terpanjang mempunyai nilai probabilitas survival 90.32 untuk waktu satu tahun pertama, artinya sampai waktu satu tahun pertama terdapat kemungkinan 9.68 dari jumlah tertanggung yang terjadi event, sehingga jika terdapat 100 tertanggung, hanya 10 tertanggung yang berkemungkinan mengajukkan klaim asuransi. Dan sampai waktu dua tahun pertama terdapat 85.26 tertanggung yang survive atau tidak terjadi event. Sehingga jika pada tahun pertama sudah terjadi 10 tertanggung yang terjadi event, tahun ke dua hanya terdapat 5 tertanggung yang berkemungkinan terjadi event. Kelompok tertanggung dengan pengajuan waktu klaim sedang mempunyai nilai probabilitas survival 51.17 untuk waktu delapan bulan pertama, artinya sampai waktu delapan bulan pertama terdapat kemungkinan hampir 50 atau tepatnya 48.83 dari tertanggung yang ada akan mengajukan klaim, sehingga jika terdapat 100 tertanggung, ada 49 tertanggung yang berkemungkinan mengajukkan klaim asuransi. Dan sampai waktu dua tahun pertama terdapat kemungkinan 26.88 tertanggung yang survive atau tidak terjadi event. Sehingga jika pada tahun pertama sudah terjadi 49 tertanggung yang mengajukan klaim, pada tahun ke dua terdapat 24 tertanggung yang berkemungkinan mengajukan klaim. 37 Dan untuk kelompok tertanggung dengan pengajuan waktu klaim terpendek mempunyai nilai probabilitas survival 50.35 dalam waktu tiga bulan pertama, artinya sampai waktu tiga bulan pertama sudah terdapat kemungkinan 50 atau tepatnya 49.65 dari jumlah tertanggung yang akan mengajukan klaim, sehingga jika terdapat 100 tertanggung, ada 50 tertanggung yang berkemungkinan mengajukkan klaim asuransi. Dan sampai waktu satu tahun pertama hanya mencapai kemungkinan sekitar 1 tertanggung yang survive atau tidak terjadi event. Sehingga pada tahun pertama saja kelompok tertanggung yang dikhawatirkan hanya mempunyai 1 tertanggung yang survive atau tidak mengajukan klaim Lampiran 8. 38

BAB V KESIMPULAN DAN SARAN