BAB III METODE PENELITIAN
3.1 Bahan Penelitian
Penelitian ini menggunakan data Afifi dari paket SPSS. Data Afifi merupakan data yang dibuat oleh Afifi dan Azen 1972 pada Los Angeles Shock
Unit. Data ini menggambarkan pengelompokkan pasien yang mengalami shock. Data ini memiliki 108 pasien dengan peubah-peubah sebagai berikut:
Tabel 1 Daftar peubah-peubah data Afifi Peubah Kode
Keterangan IdNum IDN
Id Number Age X
1
Usia tahun Height X
2
Tinggi cm SBP1
SBP2 X
3
X
10
Systolic Blood Pressure mm Hg adalah tekanan darah ketika jantung memompa darah
MAP1 MAP2
X
4
X
11
Mean Arterial Pressure mm Hg adalah tekanan arteri rata-rata
HRT1 HRT2
X
5
X
12
Heart rate beats per minute adalah banyaknya jantung berdenyut
CI1 CI2
X
6
X
13
Cardiac Index 1minmin square adalah indeks jantung
UR1 UR2
X
8
X
15
Urinary Output adalah kandungan urine yang dikeluarkan
HGB1 HGB2
X
9
X
16
Hemoglobin gm adalah banyaknya protein dalam sel darah merah
TIME1 TIME2
X
7
X
14
Waktu 1=awal, 2 akhir
Data ini akan dievaluasi dengan algoritma k-means, fuzzy-kmeans, dan two step clustering, sebagaimana yang dinyatakan pada tujuan penelitian yang akan
digunakan untuk mengevaluasi metode dengan mencoba berbagai jumlah penggerombolan.
3.2 Alur Rencana Penelitian
Gambar 2 Alur rencana penelitian Pengelompokkan dengan
berbagai metode
Fuzzy k -means Two Step
Clustering k-means
k k
k
Perbandingan
Hasil penggerombolan dengan berbagai k = 2,3,4
• Distribusi jumlah gerombol • Jumlah anggota identik
• Misclustering • Variansi gerombol
- Variance within cluster -
Variance between cluster
Pembahasan
Kesimpulan Standarisasi
Analisis Komponen Utama
Visualisasi dua dimensi Pengecekan kelengkapan Data
Data
3.3 Langkah-Langkah Penelitian
Terkait dengan tujuan penelitian yang telah dikemukakan, maka beberapa tahapan diperlukan untuk dapat menjawab tujuan tersebut, yaitu :
1 Menentukan jenis variabel dari data. 2 Menggerombolkan data dengan mencobakan berbagai nilai k. Dalam penelitian
ini dicobakan k = 2,3, dan 4. 3 Memilih ukuran jarak pada data tersebut.
4 Menerapkan metode k-means pada data dengan langkah-langkah sebagai berikut:
5 Menerapkan metode fuzzy k- means pada data dengan langkah-langkah sebagai berikut:
a Mentukan k sebagai jumlah gerombol yang ingin dibentuk. b Membangkitkan k titik pusat gerombol awal secara random.
c Menghitung jarak setiap data ke masing-masing gerombol. d Memilih gerombol yang terdekat untuk setiap data.
e Menentukan posisi gerombol baru dengan cara menghitung nilai rata-rata dari data yang terletak pada gerombol yang sama.
f Kembali ke langkah c jika posisi gerombol baru dengan gerombol lama tidak sama.
a Menentukan jumlah gerombol. b Mengalokasikan data sesuai dengan jumlah gerombol yang ditentukan.
c Menghitung nilai titik pusat dari masing-masing gerombol. d Menghitung nilai fungsi keanggotaan masing-masing data ke masing-
masing gerombol. e Kembali ke langkah c, apabila perubahan nilai fungsi keanggotaan masih di
atas nilai wilayah penerimaan yang ditentukan, atau apabila perubahan pada nilai titik pusat gerombol masih di atas nilai wilayah penerimaan yang
ditentukan, atau apabila perubahan pada nilai fungsi objektif masih di atas nilai wilayah penerimaan yang ditentukan.
6 Menerapkan metode two step clustering pada data dengan langkah-langkah sebagai berikut:
7 Menghitung variansi gerombol pada masing-masing metode. 8 Membandingkan hasil penggerombolan yang terbentuk pada data dengan k-
means, fuzzy k-means, dan two step clustering. 9 Menarik kesimpulan.
a Penggerombolan awal Preclustering. b Penggerombolan akhir.
DAFTAR PUSTAKA
Agusta Y, 2007. K-Means-Penerapan, Permasalahan dan Metode Terkait. Jurnal
Sistem dan Informatika Vol 3. STIMIK. Bali. Anderberg MR. 1973. Cluster Analysis for Application. Academic Press, New
York. Anonimous. 2001. The SPSS TwoStep Cluster Component. A scalable component
to segment your costumers more effectifely. White paper-technical report, SPSS Inc Chicago.
Anonimous. 2004. TwoStep Cluster Analysis. Technical Report, SPSS Inc. Chicago.
Bacher, J., K. Wenzig and M. Vogler. 2004. SPSS TwoStep Cluster : A First Evaluation. Friedrich-Alexander-Universitat Erlangen-Nunberg.
Dillon WR, M. Goldstein. 1984. Multivariate Analysis Method and Applications. John Wiley Sons. Canada.
Graham J Williams, 2008. Data Mining Algorithms Cluster Analysis. Adjunct Associate Professor, ANU.
Hong SL, 2006. Experiment With K-Means, Fuzzy C-Means And Approaches To Choose K And C. University of Central Florida. Orlando.
Johnson RA, DW Wichern. 1998. Applied Multivariate Statistical Analysis 4
th
ed. Prantice- Hall Int.
Kusdiati. 2006. Pengkajian Keakuratan TwoStep Cluster dalam menentukan Banyaknya Gerombol Populasi. Tesis. Departemen Statistika Institut
Pertanian Bogor: IPB. Kusumadewi, dkk. 2006. Fuzzy Multi-Attribute Decision Making FUZZY
MADM. Yogyakarta. Graha Ilmu. Santosa B, 2007. Data Mining. Teknik Pemanfaatan Data Untuk Keperluan
Bisnis. Graha Ilmu. Yogyakarta. Serban G, Grigoreta SM. 2006. A Comparison of Clustering Teqniques In
Aspect Mining. Studia Univ. Babes-Bolyai, Informatica, Volume L1. Teknomo, Kardi. 2007. K-means Clutering Tutorial.http :\\people. revolude .com
\kardi \tutorial\kMean\ .[31 Januari 2009]
BAB IV HASIL DAN PEMBAHASAN
4.1 Deskripsi Data
Setelah melalui proses pengecekan kelengkapan data, terdapat data hilang pada objek pengamatan untuk beberapa peubah. Objek pengamatan yang memiliki
data hilang tersebut tidak diikutsertakan dalam analisis. Untuk memberikan
gambaran data dari masing-masing peubah maka digunakanlah Boxplot, yang disajikan pada gambar dibawah ini:
9 0 8 0
7 0 6 0
5 0 4 0
3 0 2 0
1 0
D a
ta Box plot X1
Gambar 3 Boxplot data Afifi
Keterangan: X
1
: Age X
9
: Hemoglobin1 X
2
: Height
X
10
: Systolic Blood Pressure2 X
3
: Systolic Blood Pressure1 X
11
: Mean Arterial Pressure 2 X
4
: Mean Arterial Pressure 1 X
12
: Heart Rate 2 X
5
: Heart Rate1 X
13
: Cardiac 2 X
6
: Cardiac1 X
14
: CTime 2 X
7
: CTime2
X
15
: Urine 2 X
8
: Urine
1 X
16
: Hemoglobin 2
200 150
100 50
D a
ta Boxplot X5
1 9 0 1 8 0
1 7 0 1 6 0
1 5 0 1 4 0
D a
ta Bo x p lo t X 2
1 8 0 1 6 0
1 4 0 1 2 0
1 0 0 8 0
6 0 4 0
2 0
D a
ta Boxplot X3
1 2 0 1 0 0
8 0 6 0
4 0 2 0
D a
ta Box plot X4
8 7
6 5
4 3
2 1
D a
ta Boxplot X6
60 50
40 30
20 10
D a
ta Boxplot X7
500 400
300 200
100
D a
ta Boxplot X8
17,5 15,0
12,5 10,0
7,5 5,0
D a
ta Boxplot X9
200 175
150 125
100 75
50
D a
ta Boxplot X10
120 100
80 60
40 20
D a
ta Boxplot X11
250 200
150 100
50
D a
ta Boxplot X12
8 7
6 5
4 3
2 1
D a
ta Boxplot X13
60 50
40 30
20 10
D a
ta Boxplot of X14
900 800
700 600
500 400
300 200
100
D a
ta Boxplot X15
15,0 12,5
10,0 7,5
5,0
D a
ta Boxplot X16
Gambar 3 memperlihatkan bahwa sebaran data untuk masing-masing peubah tidak semuanya mempunyai pencilan.
Gambar 3 juga memperlihatkan bahwa keragaman peubah X
15
lebih besar dari keragaman peubah lainnya, sedangkan peubah X
13
mempunyai keragaman yang paling kecil dibandingkan peubah lainnya.
Tabel 2 Deskripsi data Afifi
Sedangkan untuk memberikan gambaran data yang sudah distandarisasi, dapat dilihat pada gambar berikut:
X16 X15
X14 X13
X12 X11
X10 X9
X8 X7
X6 X5
X4 X3
X2 X1
6 5
4 3
2 1
-1 -2
-3
D a
ta
Gambar 4 Boxplot data Afifi standarisasi
Peubah Rata-Rata
Standar Deviasi Min
Max Age
Height Sbp1
Map1 Heart1
Cardiac1 Ctime1
Urine1 Hgb1
Sbp2 Map2
Heart2 Cardiac2
Ctime2 Urine2
Hgb2 54.55
164.55 105.67
73.03 105.11
2.54 22.83
56.19 11.40
110.53 72.97
96.87 2.92
20.42 77.93
10.48 16.75
9.14 30.83
21.90 30.01
1.46 10.50
114.55 2.52
37.01 26.96
30.05 1.34
9.95 137.90
1.95 16
140 26
15 25
0.2 8
6.6 38
22 25
0.7 7
5.9 90
187 171
124 217
7.6 59
510 18.0
182 117
221 7.9
55 850
15.5