Bahan Penelitian Alur Rencana Penelitian Langkah-Langkah Penelitian

BAB III METODE PENELITIAN

3.1 Bahan Penelitian

Penelitian ini menggunakan data Afifi dari paket SPSS. Data Afifi merupakan data yang dibuat oleh Afifi dan Azen 1972 pada Los Angeles Shock Unit. Data ini menggambarkan pengelompokkan pasien yang mengalami shock. Data ini memiliki 108 pasien dengan peubah-peubah sebagai berikut: Tabel 1 Daftar peubah-peubah data Afifi Peubah Kode Keterangan IdNum IDN Id Number Age X 1 Usia tahun Height X 2 Tinggi cm SBP1 SBP2 X 3 X 10 Systolic Blood Pressure mm Hg adalah tekanan darah ketika jantung memompa darah MAP1 MAP2 X 4 X 11 Mean Arterial Pressure mm Hg adalah tekanan arteri rata-rata HRT1 HRT2 X 5 X 12 Heart rate beats per minute adalah banyaknya jantung berdenyut CI1 CI2 X 6 X 13 Cardiac Index 1minmin square adalah indeks jantung UR1 UR2 X 8 X 15 Urinary Output adalah kandungan urine yang dikeluarkan HGB1 HGB2 X 9 X 16 Hemoglobin gm adalah banyaknya protein dalam sel darah merah TIME1 TIME2 X 7 X 14 Waktu 1=awal, 2 akhir Data ini akan dievaluasi dengan algoritma k-means, fuzzy-kmeans, dan two step clustering, sebagaimana yang dinyatakan pada tujuan penelitian yang akan digunakan untuk mengevaluasi metode dengan mencoba berbagai jumlah penggerombolan.

3.2 Alur Rencana Penelitian

Gambar 2 Alur rencana penelitian Pengelompokkan dengan berbagai metode Fuzzy k -means Two Step Clustering k-means k k k Perbandingan Hasil penggerombolan dengan berbagai k = 2,3,4 • Distribusi jumlah gerombol • Jumlah anggota identik • Misclustering • Variansi gerombol - Variance within cluster - Variance between cluster Pembahasan Kesimpulan Standarisasi Analisis Komponen Utama Visualisasi dua dimensi Pengecekan kelengkapan Data Data

3.3 Langkah-Langkah Penelitian

Terkait dengan tujuan penelitian yang telah dikemukakan, maka beberapa tahapan diperlukan untuk dapat menjawab tujuan tersebut, yaitu : 1 Menentukan jenis variabel dari data. 2 Menggerombolkan data dengan mencobakan berbagai nilai k. Dalam penelitian ini dicobakan k = 2,3, dan 4. 3 Memilih ukuran jarak pada data tersebut. 4 Menerapkan metode k-means pada data dengan langkah-langkah sebagai berikut: 5 Menerapkan metode fuzzy k- means pada data dengan langkah-langkah sebagai berikut: a Mentukan k sebagai jumlah gerombol yang ingin dibentuk. b Membangkitkan k titik pusat gerombol awal secara random. c Menghitung jarak setiap data ke masing-masing gerombol. d Memilih gerombol yang terdekat untuk setiap data. e Menentukan posisi gerombol baru dengan cara menghitung nilai rata-rata dari data yang terletak pada gerombol yang sama. f Kembali ke langkah c jika posisi gerombol baru dengan gerombol lama tidak sama. a Menentukan jumlah gerombol. b Mengalokasikan data sesuai dengan jumlah gerombol yang ditentukan. c Menghitung nilai titik pusat dari masing-masing gerombol. d Menghitung nilai fungsi keanggotaan masing-masing data ke masing- masing gerombol. e Kembali ke langkah c, apabila perubahan nilai fungsi keanggotaan masih di atas nilai wilayah penerimaan yang ditentukan, atau apabila perubahan pada nilai titik pusat gerombol masih di atas nilai wilayah penerimaan yang ditentukan, atau apabila perubahan pada nilai fungsi objektif masih di atas nilai wilayah penerimaan yang ditentukan. 6 Menerapkan metode two step clustering pada data dengan langkah-langkah sebagai berikut: 7 Menghitung variansi gerombol pada masing-masing metode. 8 Membandingkan hasil penggerombolan yang terbentuk pada data dengan k- means, fuzzy k-means, dan two step clustering. 9 Menarik kesimpulan. a Penggerombolan awal Preclustering. b Penggerombolan akhir. DAFTAR PUSTAKA Agusta Y, 2007. K-Means-Penerapan, Permasalahan dan Metode Terkait. Jurnal Sistem dan Informatika Vol 3. STIMIK. Bali. Anderberg MR. 1973. Cluster Analysis for Application. Academic Press, New York. Anonimous. 2001. The SPSS TwoStep Cluster Component. A scalable component to segment your costumers more effectifely. White paper-technical report, SPSS Inc Chicago. Anonimous. 2004. TwoStep Cluster Analysis. Technical Report, SPSS Inc. Chicago. Bacher, J., K. Wenzig and M. Vogler. 2004. SPSS TwoStep Cluster : A First Evaluation. Friedrich-Alexander-Universitat Erlangen-Nunberg. Dillon WR, M. Goldstein. 1984. Multivariate Analysis Method and Applications. John Wiley Sons. Canada. Graham J Williams, 2008. Data Mining Algorithms Cluster Analysis. Adjunct Associate Professor, ANU. Hong SL, 2006. Experiment With K-Means, Fuzzy C-Means And Approaches To Choose K And C. University of Central Florida. Orlando. Johnson RA, DW Wichern. 1998. Applied Multivariate Statistical Analysis 4 th ed. Prantice- Hall Int. Kusdiati. 2006. Pengkajian Keakuratan TwoStep Cluster dalam menentukan Banyaknya Gerombol Populasi. Tesis. Departemen Statistika Institut Pertanian Bogor: IPB. Kusumadewi, dkk. 2006. Fuzzy Multi-Attribute Decision Making FUZZY MADM. Yogyakarta. Graha Ilmu. Santosa B, 2007. Data Mining. Teknik Pemanfaatan Data Untuk Keperluan Bisnis. Graha Ilmu. Yogyakarta. Serban G, Grigoreta SM. 2006. A Comparison of Clustering Teqniques In Aspect Mining. Studia Univ. Babes-Bolyai, Informatica, Volume L1. Teknomo, Kardi. 2007. K-means Clutering Tutorial.http :\\people. revolude .com \kardi \tutorial\kMean\ .[31 Januari 2009]

BAB IV HASIL DAN PEMBAHASAN

4.1 Deskripsi Data

Setelah melalui proses pengecekan kelengkapan data, terdapat data hilang pada objek pengamatan untuk beberapa peubah. Objek pengamatan yang memiliki data hilang tersebut tidak diikutsertakan dalam analisis. Untuk memberikan gambaran data dari masing-masing peubah maka digunakanlah Boxplot, yang disajikan pada gambar dibawah ini: 9 0 8 0 7 0 6 0 5 0 4 0 3 0 2 0 1 0 D a ta Box plot X1 Gambar 3 Boxplot data Afifi Keterangan: X 1 : Age X 9 : Hemoglobin1 X 2 : Height X 10 : Systolic Blood Pressure2 X 3 : Systolic Blood Pressure1 X 11 : Mean Arterial Pressure 2 X 4 : Mean Arterial Pressure 1 X 12 : Heart Rate 2 X 5 : Heart Rate1 X 13 : Cardiac 2 X 6 : Cardiac1 X 14 : CTime 2 X 7 : CTime2 X 15 : Urine 2 X 8 : Urine 1 X 16 : Hemoglobin 2 200 150 100 50 D a ta Boxplot X5 1 9 0 1 8 0 1 7 0 1 6 0 1 5 0 1 4 0 D a ta Bo x p lo t X 2 1 8 0 1 6 0 1 4 0 1 2 0 1 0 0 8 0 6 0 4 0 2 0 D a ta Boxplot X3 1 2 0 1 0 0 8 0 6 0 4 0 2 0 D a ta Box plot X4 8 7 6 5 4 3 2 1 D a ta Boxplot X6 60 50 40 30 20 10 D a ta Boxplot X7 500 400 300 200 100 D a ta Boxplot X8 17,5 15,0 12,5 10,0 7,5 5,0 D a ta Boxplot X9 200 175 150 125 100 75 50 D a ta Boxplot X10 120 100 80 60 40 20 D a ta Boxplot X11 250 200 150 100 50 D a ta Boxplot X12 8 7 6 5 4 3 2 1 D a ta Boxplot X13 60 50 40 30 20 10 D a ta Boxplot of X14 900 800 700 600 500 400 300 200 100 D a ta Boxplot X15 15,0 12,5 10,0 7,5 5,0 D a ta Boxplot X16 Gambar 3 memperlihatkan bahwa sebaran data untuk masing-masing peubah tidak semuanya mempunyai pencilan. Gambar 3 juga memperlihatkan bahwa keragaman peubah X 15 lebih besar dari keragaman peubah lainnya, sedangkan peubah X 13 mempunyai keragaman yang paling kecil dibandingkan peubah lainnya. Tabel 2 Deskripsi data Afifi Sedangkan untuk memberikan gambaran data yang sudah distandarisasi, dapat dilihat pada gambar berikut: X16 X15 X14 X13 X12 X11 X10 X9 X8 X7 X6 X5 X4 X3 X2 X1 6 5 4 3 2 1 -1 -2 -3 D a ta Gambar 4 Boxplot data Afifi standarisasi Peubah Rata-Rata Standar Deviasi Min Max Age Height Sbp1 Map1 Heart1 Cardiac1 Ctime1 Urine1 Hgb1 Sbp2 Map2 Heart2 Cardiac2 Ctime2 Urine2 Hgb2 54.55 164.55 105.67 73.03 105.11 2.54 22.83 56.19 11.40 110.53 72.97 96.87 2.92 20.42 77.93 10.48 16.75 9.14 30.83 21.90 30.01 1.46 10.50 114.55 2.52 37.01 26.96 30.05 1.34 9.95 137.90 1.95 16 140 26 15 25 0.2 8 6.6 38 22 25 0.7 7 5.9 90 187 171 124 217 7.6 59 510 18.0 182 117 221 7.9 55 850 15.5