Cluster Analysis merupakan suatu teknik penggerombolan objek responden sehingga terbentuk beberapa kelompok, disebut cluster, dimana
obyek di dalam suatu cluster lebih mirip dibandingkan antar cluster. Kemiripan ini sudah didasarkan pada sekumpulan variabel secara simultan bersama-sama.
Langkah-langkah pengelompokan dilakukan dengan cara :
20
1. Tujuan analisis cluster Dalam pembentukan kelompok dapat dicapai tiga tujuan, yaitu deskripsi
klasifikasi, penyederhanaan data, dan identifikasi hubungan. Dengan demikian, ciri-ciri suatu cluster yang baik yaitu mepunyai :
a. Homogenitas internal within cluster; yaitu kesamaan antar anggota
dalam satu cluster.
b. Heterogenitas external between cluster; yaitu perbedaan antara cluster
yang satu dengan cluster yang lain. 2. Desain penelitian dalam analisis cluster
Tiga hal penting dalam tahap ini adalah pendeteksian outlier, mengukur kesamaan dan standarisasi data.
a. Pendeteksian outlier yaitu suatu objek yang sangat berbeda dengan objek lainnya. Outlier dapat digambarkan sebagai observasi yang secara nyata
tidak mewakili populasi umum. Dan adanya undersampling dapat pula memunculkan outlier. Outlier menyebabkan struktur yang tidak benar dan
cluster yang terbentuk menjadi tidak representatif. Data outlier dideteksi
20
Dhiani Thresna A, Sistem Penunjang Keputusan dengan Metode Clustering, Proceedings, Auditorium Universitas Gunadarma, 2004, Hal. 45-52
Universitas Sumatera Utara
dengan melihat mean dan standar deviasi untuk data inteval dan rasio yaitu bila :
Standard deviation mean, berarti terdapat data outlier. Standard deviation mean, berarti tidak terdapat data outlier.
b. Standarisasi data. Standarisasi data yang akan dikelompokkan dilakukan agar data
mempunyai skala yang sama, sehingga pengelompokan akan stabil. Rumus standarisasi adalah sebagai berikut :
n X
X
n i
i
∑
−
=
1
1
1 2
− −
=
∑
−
n X
X X
Std
n i
i
X Std
X X
Z
i i
− =
Dimana : X
= rata-rata data X X
i
n = banyak data X
= data X ke-i
Std X = standar deviasi data X Z
i
1 Standarisasi variabel : bentuk paling umum dalam standarisasi variabel adalah konversi setiap variabel terhadap skor standar dikenal
= data standar X ke-i
Universitas Sumatera Utara
dengan Z-score dengan melakukan substraksi nilai tengah dan membaginya dengan standar deviasi tiap variabel.
2 Standarisasi data : melakukan substraksi yang sama dengan standarisasi variabel, akan tetapi standarisasi data dilakukan terhadap
observasi objek yang akan dikelompokkan. c. Mengukur kesamaan antar objek dengan tiga penerapan yaitu ukuran
korelasi, ukuran jarak dan ukuran asosiasi. 1 Ukuran korelasi diterapkan pada data dengan skala metrik. Kesamaan
antar objek dapat dilihat dari koefisien korelasi antar pasangan objek yang diukur dengan beberapa variabel. Pengukuran ini lebih sering
dipakai untuk data biner. 2 Ukuran jarak adalah ukuran yang paling sering digunakan. Diterapkan
untuk data berskala metrik. Sebenarnya ukuran jarak merupakan ukuran ketidakmiripan dimana jarak yang besar menunjukkan sedikit
kesamaan sebaliknya jarak yang pendek kecil menunjukkan bahwa suatu objek makin mirip dengan objek lain. Untuk menyatakan suatu
observasi atau variabel menpunyai sifat yang lebih dekat dengan observasi tertentu daripada dengan observasi yang lain digunakan
fungsi yang disebut jarak distance atau perbedaan dissimilarity antar objek. Hasil fungsi jarak semakin besar maka kedua objek yang
dievaluasi dianggap bebeda. Namun, semakin kecil hasil fungsi jarak maka kedua objek dianggap semakin mirip. Suatu fungsi disebut jarak
jika mempunyai sifat :
Universitas Sumatera Utara
Tidak negatif
≥
ij
d
dan
=
ij
d
jika i=j Simetri
ji ij
d d
=
jk ik
ij
d d
d +
≤
panjang salah satu sisi segitiga selalu lebih kecil atau sama-dengan jumlah dua sisi yang lain.
Ada beberapa tipe ukuran jarak antara lain jarak Euclidean, jarak Koefisien Korelasi, jarak City-Box, dan jarak Mahalanobis. Ukuran
yang paling sering digunakan adalah Euclidean untuk mengukur distance sedangkan untuk mengukur similarity kemiripan digunakan
Koefisien Korelasi. Jarak Euclidean adalah besarnya jarak suatu garis lurus yang menghubungkan antar objek. Misalkan ada dua objek yaitu
A dengan koordinat i dan B dengan koordinat j maka jarak antar kedua objek tersebut dapat diukur dengan rumus berikut.
Rumus Euclidean untuk pengukuran jarak :
{ }
2 1
∑
=
− =
n k
jk ik
ij
x x
d
Rumus Koefisien Korelasi untuk pengukuran kemiripan similarity :
2 1
1 2
1 2
1
. .
− −
− −
=
∑ ∑
∑
= =
= n
k j
jk n
k i
ik j
jk n
k i
ik ij
x x
x x
x x
x x
S
Dimana : d
ij
= S
ij
i = objek ke-i = Jarak antara objek i dan j
j = objek ke-j
Universitas Sumatera Utara
n = jumlah objek x
ik
= nilai parameter objek i x
jk
x = nilai parameter objek j
= rata-rata nilai objek i,j 3 Ukuran asosiasi dipakai untuk mengukur data berskala nonmetrik
nominal atau ordinal. 3. Proses mendapatkan cluster dan menilai kelayakan secara keseluruhan
Ada dua proses penting yaitu algoritma cluster dalam pembentukan cluster dan menentukan jumlah cluster yang akan dibentuk. Algoritma cluster harus
dapat memaksimalkan perbedaan relatif cluster terhadap variasi dalam cluster. Dua metode paling umum dalam algoritma cluster adalah metode
hirarki dan metode non hirarki. Proses mendapatkan jumlah cluster yang layak ditentukan dengan mencari
nilai eigen dari matriks koefisien korelasi yang terbentuk. a. Nilai eigen dan vektor eigen
21
. Apabila sebuah matriks A yang berukuran n x n dan sebuah vektor x pada R
n
21
G. Tejosutikno, Aljabar Matriks untuk Para Insinyur, Erlangga, Jakarta, 1987, Hal. 125-131
, maka biasanya secara umum tidak ada hubungan geometris antara vektor x dengan vektor Ax Gambar 3.1a.
Namun, ada beberapa vektor x tak nol sehingga x dan Ax merupakan penggandaan satu sama lainnya Gambar 3.1b.
Universitas Sumatera Utara
Gambar 3.1. Hubungan Vektor x dengan Vektor Ax
Misalkan A adalah matriks n x n, maka vektor x yang tidak nol di R
n
Ax = λx
disebut vektor eigen eigen vector dari A jika Ax adalah kelipatan skalar dari x, yaitu :
untuk suatu skalar λ. Skalar λ dinamakan nilai eigen eigen value dari A dan x disebut suatu vektor eigen eigen vector dari A yang berpadanan
dengan λ. b. Persamaan karakteristik. Untuk mencari nilai eigen dari matriks A yang
berukuran n x n, maka perlu diperhatikan kembali definisi vektor eigen dan nilai eigen, yaitu Ax = λx. Bentuk ini dapat ditulis sebagai berikut:
Ax = λ I x Atau
λ I –A x = 0 A -
λ I x = 0 yang berarti matriks A singular Supaya λ menjadi nilai eigen, maka harus ada penyelesaian yang tidak nol
mempunyai penyelesaian non trivial dari persamaan diatas. Persamaan tersebut akan mempunyai penyelesaian tidak nol jika dan hanya jika:
det λ I – A = 0
Universitas Sumatera Utara
Persamaan det λ I – A = 0 dengan λ sebagai variabel disebut persamaan karakteristik dari matriks A. Akar-akar atau skalar-skalar yang memenuhi
persamaan ini adalah nilai-nilai eigen nilai-nilai karakteristik dari matriks A. Det λ I – A ≡ fλ yaitu berupa polinom dalam λ yang dinamakan
polinom karakteristik. Dari pemahaman definisi di atas, jelas bahwa jika A adalah matriks n x n,
maka persamaan karakteristik dari matriks A mempunyai derajat n dengan bentuk :
det λ I – A = fλ = a
n
x
n
+ a
n-1
x
n - 1
+ a
2
x
2
+ a
1
x + … + a
Menurut teorema dasar aljabar diperoleh bahwa persamaan karakteristik tersebut mempunyai paling banyak n penyelesaian yang berbeda. Jadi
suatu matriks yang berukuran n x n paling banyak mempunyai n-nilai eigen yang berbeda. Nilai eigen yang layak dijadikan acuan penetapan
kelompok adalah nilai eigen yang lebih besar dari 1 = 0
22
4. Tahap pembuatan profil yaitu menggambarkan karakteristik tiap cluster untuk menjelaskan cluster-cluster tersebut dapat berbeda pada dimensi yang
relevan. Titik beratnya pada karakteristik yang secara signifikan berbeda antar cluster dan memprediksi anggota dalam suatu cluster.
. Karena apabila nilai eigen lebih besar dari satu maka semakin representative kelompok tersebut
mewakili objek.
Hasil analisis cluster dapat digunakan untuk berbagai kepentingan sesuai dengan materi yang dianalisis.
22
Johnson, R.A. dan Wichern, Applied Multivariate Statistical Analisys, Prentice-Hall Inc, New Jersey, 1998, Hal. 60
Universitas Sumatera Utara
6.11.1. Algoritma Cluster
23
Clustering adalah suatu cara menganalisa data dengan cara
mengelompokkan objek kedalam kelompok-kelompok berdasar suatu kesamaan tertentu. Dapat juga diartikan sebagai proses untuk mendefenisikan
pemetaanmapping f:D →C dari beberapa data D={t
1
, t
2
,....t
n
} kedalam beberapa cluster C= ={c
1
, c
2
,....c
n
} berdasarkan kesamaan antar t
i
. Sebuah cluster adalah sekumpulan objek yang digabung bersama kerena persamaan atau kedekatannya.
Clustering dapat digunakan pada banyak bidang, seperti : data mining, pattern recognition pengenalan pola, pengklasifikasian gambar, ilmu biologi,
pemasaran, perencanaan kota, pencarian
dokumen
, dan lain sebagainya.
Gambar 3.2. Ilustrasi Clustering
Karakteristik clustering dibagi menjadi empat 4, yaitu : 1. Partitioning clustering
Partitioning clustering disebut juga exclusive clustering, dimana setiap data harus termasuk ke cluster tertentu. Karakteristik tipe ini juga memungkinkan
bagi setiap data yang termasuk cluster tertentu pada suatu tahapan proses,
23
Opcit, Hal : 35
Universitas Sumatera Utara
pada tahapan berikutnya berpindah ke cluster yang lain. Contoh : K-Means, residual analysis.
2. Hierarchical clustering Pada hierarchical clustering, Setiap data harus termasuk ke cluster tertentu.
Dan suatu data yang termasuk ke cluster tertentu pada suatu tahapan proses, tidak dapat berpindah ke cluster lain pada tahapan berikutnya. Contoh: Single
Linkage, Centroid Linkage,Complete Linkage, Average Linkage. 3. Overlapping clustering
Dalam overlapping clustering, setiap data memungkinkan termasuk ke beberapa cluster. Data mempunyai nilai keanggotaan membership pada
beberapa cluster. Contoh: Fuzzy C-means, Gaussian Mixture. 4. Hybrid
Karakteristik hybrid adalah Mengawinkan karakteristik dari partitioning, overlapping dan hierarchical.
Sesungguhnya dua metode paling umum dalam algoritma cluster adalah metode hirarki dan metode non hirarki. Penentuan metode mana yang akan
dipakai tergantung kepada peneliti dan konteks penelitian dengan tidak mengabaikan substansi, teori dan konsep yang berlaku. Keduanya memiliki
kelebihan tersendiri.
6.11.2. Hirarchial Clustering
Hirarki Berjenjang merupakan metode analisis yang outputnya berupa kontruksi pohon atau berdasarkan tingkatan tertentu seperti struktur pohon
Universitas Sumatera Utara
struktur pertandingan yang sering disebut dendogram. Pada hierarchical clustering, setiap data harus termasuk ke cluster tertentu. Dan suatu data yang
termasuk ke cluster tertentu pada suatu tahapan proses, tidak dapat berpindah ke cluster lain pada tahapan berikutnya. Keuntungan metode hirarki adalah cepat
dalam proses pengolahan sehingga menghemat waktu. Dengan metode ini, data tidak langsung dikelompokkan kedalam beberapa
cluster dalam 1 tahap, tetapi dimulai dari 1 cluster yang mempunyai kesamaan, dan berjalan seterusnya selama beberapa iterasi, hingga terbentuk beberapa cluster
tertentu . Arah hierarchical clustering dibagi dua 2, yaitu :
1. Divisive a. Dari 1 cluster ke k cluster
b. Pembagian dari atas ke bawah top to down division 2. Agglomerative
a. Dari N cluster ke k cluster b. Penggabungan dari bawah ke atas down to top merge
Langkah-langkah Algoritma Hierarchical Clustering Agglomerative untuk mengelompokkan N objek item :
1. Setiap data dianggap sebagai cluster. Jika N = jumlah data dan c = jumlah cluster, maka c = N, dan K = jumlah cluster yang ingin dibentuk.
2. Mulai dengan N cluster, setiap cluster mengandung entiti tunggal dan sebuah matriks dari jarak similarities dengan tipe NxN.
Universitas Sumatera Utara
3. Menentukan matriks jarak antar data yang dikelompokkan dengan jarak yang paling minimum atau tergantung metode pengelompokan yang dilakukan.
4. Cari 2 cluster yang mempunyai jarak antar cluster dan digabungkan berarti c = c-1.
5. Jika c K, kembali ke langkah 3.
Gambar 3.3. Ilustrasi Algoritma Hierarchial Clustering
Terdapat empat 4 metode yang sering dipergunakan untuk perhitungan jarak antar cluster dengan objek atau dengan cluster lain di dalam
penggerombolan berjenjang, yaitu : 1. Single lingkage pautan tunggal
Single lingkage adalah proses pengelompokan yang didasarkan pada jarak terdekat antar objeknya minimum distance. Metode ini sangat cocok untuk
melakukan analisa pada tiap tahap pembentukan cluster. Metode ini juga sangat cocok untuk dipakai pada kasus shape independent clustering, karena
kemampuannya untuk membentuk pattern pola tertentu dari cluster. Sedangkan untuk kasus condensed clustering, metode ini tidak bagus.
Universitas Sumatera Utara
Algoritma Single Linkage Hierarchical Method mengelompokkan dua objek yang mempunyai jarak terdekat terlebih dahulu. Jarak antar kelompok i,j
dengan k adalah : d
i,jk
= mind
ik
, d
jk
dimana : d = jarak antara objek i dan j
i = objek ke-i j = objek ke-j
k = nilai parameter objek Untuk menggambarkan algoritma linkage dapat dilihat pada contoh berikut :
1 2
3 4 5
1 2
9 D = d
ij
3 =
3 7
4 6
5 9 0
5 11
10 2 8
Dengan memperlakukan setiap objek sebagai cluster, dimulai pengelompokan dengan menggabungkan dua item yang paling dekat. Karena minimal d
ij
= d
ij
d = 2. Objek 5 dan 3 digabung untuk membentuk cluster 35. Untuk
memperoleh tingkat pengelompokan berikutnya, diperlukan jarak-jarak antara cluster 35 dan objek-objek yang lain yang tersisa yaitu 1, 2 dan 4. Jarak-
jarak yang berdekatan adalah :
35 1
= min {d
31
, d
51
d } = min {3, 11} = 3
35 2
= min {d
32
, d
52
d } = min {7, 10} = 7
35 4
= min {d
34
, d
54
} = min {9, 8} = 8
Universitas Sumatera Utara
Dengan menghapus baris-baris dan kolom-kolom dari D yang bersesuaian dengan objek 3 dan 5 dari baris dan kolom untuk cluster 35, diperoleh
matriks jarak yang baru sebagai berikut : 35 1
2 4
35 1
3 2
7 9
4 8
6 5
Jarak terkecil antara pasangan-pasangan cluster sekarang adalah d
35 1
= 3 dan digabung cluster 1 dengan cluster 35 untuk mendapatkan cluster berikutnya.
Dengan menghitung :
d1
35 2
= min {d
322
, d
12
d1 } = min {7, 9} = 7
35 4
= min {d
354
, d
14
Diperoleh bahwa matrik jarak untuk tingkat pengelompokan berikutnya adalah,
} = min {8, 6} = 6
135 2 4
135 2
7 4
6 5
Jarak terdekat yang paling kecil antara
pasangan cluster adalah d
42
= 5, dan digabungkan objek 4 dan 2 untuk mendapatkan cluster 24. Oleh karena itu, ada
2 cluster yang berlainan, 135 dan 24. Jarak terdekat adalah : d
135 24
= min {d
135 2
, d
135 4
} = min {7, 6} = 6 Matriks jarak yang terakhir menjadi :
Universitas Sumatera Utara
135 24 135
24 6
Jadi cluster 135 dan 24 digabung membentuk cluster tunggal dari semua 5 objek, 12345, jarak terdekat adalah 6.
Dendrogram yang menggambarkan pengelompokan hirarki dapat dilihat pada gambar 3.4.
J a
r a
k
Objek 1
4 2
5 3
2 4
6
Gambar 3.4. Single Linkage dendogram untuk Jarak antara Lima Objek
Hasil pengelompokan akan berbeda sesuai dengan metode Complete linkage, Average linkage dan centroid linkage yang digunakan.
2. Complete linkage pautan lengkap Complete linkage adalah proses pengelompokan yang didasarkan pada jarak
terjauh antar objeknya maksimum distance. Metode ini baik untuk kasus clustering dengan normal data set distribution. Akan tetapi, metode ini tidak
cocok untuk data yang mengandung outlier.
Universitas Sumatera Utara
Algoritma Complete Linkage Hierarchical Method mengelompokkan dua objek yang mempunyai jarak terjauh terlebih dahulu. Jarak antar kelompok
i,j dengan k adalah : d
i,jk
= maxd
ik
, d
jk
3. Average linkage pautan rata-rata Average linkage adalah proses pengclusteran yang didasarkan pada jarak rata-
rata antar objeknya average distance. Metode ini relatif yang terbaik dari metode-metode hierarchical. Namun, hal ini harus dibayar dengan waktu
komputasi yang paling tinggi dibandingkan dengan metode-metode hierarchical yang lain.
Metode ini akan mengelompokkan objek berdasarkan jarak rata-rata yang didapat dengan melakukan rata-rata semua jarak objek terlebih dahulu. Jarak
antar kelompok i,j dengan k adalah : d
i,jk
= averaged
ik
, d
jk
4. Median centroid linkage pautan nilai tengah Centroid linkage adalah proses pengclusteran yang didasarkan pada jarak
antar centroidnya. Metode ini bagus untuk memperkecil variance within cluster karena melibatkan centroid pada saat penggabungan antar cluster.
Metode ini juga baik untuk data yang mengandung outlier. Pada meteode ini, jarak antara dua cluster adalah jarak diantara centroid
cluster tersebut. Centroid adalah rata-rata jarak yang ada pada sebuah cluster yang didapat dengan melakukan rata-rata pada semua anggota suatu cluster
tertentu. Dengan metode ini, setiap terjadi cluster baru, akan terjadi
Universitas Sumatera Utara
perhitungan ulang centroid hingga terbentuk cluster tetap. Jarak antar kelompok i,j dengan k adalah :
d
i,jk
= mediand
ik
, d
jk
6.12. Statistical Product and Service Solutions SPSS Version 16.0
24
Pada awalnya SPSS ditujuakan untuk pengolahan data statistik ilmu sosial. SPSS yang singkatan dari Statistical Package for the Social Sciences adalah
sebuah program pada komputer yang digunakan untuk membuat analisis statistika. Namun sekarang diperluas untuk melayani baerbagai jenis pengguna seperti untuk
prosesproduksi pabrik, riset ilmu-ilmu sains, telekomunikasi, kesehatan, perbankan, lembaga keuangan, asuransi, retail, dan sebagainya sehingga
kepanjangan SPSS dewasa ini adalah Statistical Product and Service Solutions. Untuk memulai program SPSS versi 16.0 dapat dilakukan langkah-langkah
sebagai berikut : 1. Cara memulai SPSS 16.0 ialah sebagai berikut
a. Pilih menu Start dari windows. b. Selanjutnya, pilih menu all programs.
c. Pilih ikon SPSS 16.0 seperti Gambar 3.5.
Gambar 3.5. Ikon SPSS
Statistics 16.0
24
Jonathan Sarwono. Panduan Lengkap Untuk Belajar Komputasi Statistik Menggunakan SPSS : ANDI Yogyakarta, Bandung, 2009, Hal 3-7.
Universitas Sumatera Utara
2. Akan muncul dilayar seperti ditunjukkan pada Gambar 3.6.
Gambar 3.6. Tampilan SPSS
Statistics 16.0
3. Setelah tampilan muncul, klik cancel. Maka lembar kerja SPSS telah tersedia. Perhatikan pada sudut kiri bawah, ada dua sheet seperti Excel yaitu data view
dan variabel view. Untuk memasukkan data, terlebih dahulu tentukan variabel yang kemudian diinput pada variabel view seperti :
a. Name : pilihan ini untuk memasukkan nama variabel, misalnya “penjualan”.
b. Type : pilihan ini untuk mendefenisikan tipe variabel numeric atau string.
c. Width : pilihan ini untuk menuliskan panjang pendek variabel. d. Decimal : pilihan ini untuk menuliskan jumlah desimal di belakang koma.
e. Label : pilihan ini untuk menuliskan label variabel. f. Values : pilihan ini untuk menuliskan nilai kualitatif dari variabel yang
skala pengukurannya ordinal dan nominal bukan scale.
Universitas Sumatera Utara
g. Miissing : pilihan ini untuk menuliskan ada dan tidaknya jawaban kosong. h. Columns : pilihan ini untuk menuliskan lebar kolom.
i. Align : pilihan ini untuk menuliskan rata kanan, kiri, atau tengah penempatan teks atau angka di data view.
j. Measure : pilihan ini untuk menentukan skala pengukuran variabel, misalnya nominal, ordinal, atau scala.
Kemudian ketikkan data pada sheet data view .
Gambar 3.7. Contoh Tampilan Data View dan Variabel View
Ikon berikut untuk setiap variabel yang menyediakan informasi tentang tipe data dan tingkat pengukuran.
Tabel 3.5. Ikon Tipe Data sesuai Level Pengukuran Level
Pengukuran Tipe Data
Numeric String
Data Time
Scale
na
Ordinal Nominal
Universitas Sumatera Utara
4. Beberapa tools dalam SPSS Statistics 16.0 dapat dilihat pada Gambar 3.8.
Pengolahan data dapat dilakukan dengan memanfaatkan tools yang tersedia sesuai dengan yang diinginkan pengguna.
Gambar 3.8. Tools
SPSS Statistics 16.0
6.12.1. Metode Hirarki dengan SPSS
25
Prosedur hirarki digunakan untuk mengidentifikasi kelompok-kelompok yang relatif homogen dari sebuah kasus variabel berdasarkan karakteristik
terpilih, menggunakan algoritma yang dimulai dengan setiap kasus variabel dalam sebuah cluster terpisah dan menggabungkan cluster sampai hanya satu
yang tersisa. Variabel dianalisis atau memilih dari berbagai standarisasi transformasi. Langkah-langkah jarak atau kesamaan dihasilkan dari prosedur
proximities. Statistik yang ditampilkan pada setiap tahap sangat membantu untuk memilih solusi terbaik. Untuk memproleh sebuah analisis cluster hirarki dapat
dimulai dari tampilan menu, klik Anlyze, Classify, dan Hirarchial Cluster. Maka akan muncul tampilan seperti Gmabar 3.9.
25
SPSS Inc. SPSS Statistics Base 16.0 User’s Guide : SPSS Inc, Chicago, 2008, Hal 412-416.
Universitas Sumatera Utara
a b Gambar 3.9. a Tampilan
Hirarchial Cluster b Tampilan
Hirarchial Cluster Method
Pada kotak Label Cases By pilih objek dari data. Pada kolom Variabels pilih variabel-variabel yang telah dimasukkan pada variabel view. Kemudian pilih
statistics metode pengukuran jarak dapat di pilih pada tampilan berikutnya. Ada beberapa alternatif untuk metode cluster yaitu
between-groups linkage, within-groups linkage, nearest neighbor, furthest neighbor, centroid
clustering, median clustering, and Ward’s method. Pengukuran akan memungkinkan untuk membuat spesifikasi pengukuran
keterbedaan dalam analisis yang dilakukan. Caranya dengan memilih satu alternatif dari Measure pengukuran yang berhubungan dengan tipe data.
1. Data Interval, beberapa alternatif pengukuran: Euclidean distances, squared
Euclidean distance, Pearson Corellation, Chebychev, Block Manhattan distance, Minkowski, dan customized.
2. Data Count, pengukuran Chi-square atau Phi-square.
3. Data Binary, pengukuran Euclidean distances, squared Euclidean distance,
Size difference, Pattern difference, Variance, atau Lance dan Williams.
Universitas Sumatera Utara
Pengukuran nilai-nilai yang ditransformasi digunakan : 1.
Z Scores. Semua nilai distandarisasi ke dalam nilai Z, dengan rata-rata sebesar 0 dan simpangan baku sebesar 1.
2. Range -1 to 1. Masing-masing nilai untuk item tertentu yang sedang
distandarisasi dibagi dengan jarak semua nilai. 3.
Range 0 to 1. Prosedur mengurangi nilai minimum dari masing-masing item yang sedang distandarisasi kemudian dibagi dengan jarak.
4. Maximum magnitude of 1. Prosedur untuk membagi masing-masing nilai
untuk item tertentu yang sedang distandarisasi dengan jumlah maksimum semua nilai.
5. Mean of 1. Prosedur untuk membagi masing-masing nilai untuk item tertentu
yang sedang distandarisasi dengan rata-rata semua nilai. 6.
Standard deviation of 1. Prosedur untuk membagi masing-masing nilai untuk variabel atau kasus tertentu yang sedang distandarisasi dengan simpangan
baku semua nilai. Adapun output dari proses pengelompokan adalah Agglomeration schedule
untuk menampilkan proses kombinasi cluster pada setiap tahap dan jarak antara cluster yang digabungkan. Proximity matrix untuk memberi jarak-jarak atau
kemiripan antara item. Cluster membership untuk menunjukkan anggota item dari cluster. Dan dendogram merupakan gambaran yang menunjukkan anggota
cluster yang ada jika akan ditentukan beberapa cluster yang seharusnya dibentuk. Langkah-langkah melakukan analisis dengan cara sebagai berikut :
1. Meng- input data Objek dan Variabel.
Universitas Sumatera Utara
2. Klik Analyze : pilih Descriptives Statistics kemudian pilih Descriptives. Masukkan semua variabel ke kolom Variable s. Klik Save standardized
values as variables. Klik Ok. 3. Klik analyze: pilih Classify kemudian pilih Hierarchial Cluster.
4. Masukkan seluruh variabel yang telah distandardkan Z-score ke dalam kolom Variable s. Isikan objek ke kolom Label Cases by. Klik Cases pada
bagian Cluster. Pada bagian Display pilih Statistics dan Plots. 5. Klik tombol Statistics. Cek aktifkan Agglomeration Schedule dan Proximity
matrix. Pada bagian Cluster Mambership pilih Range of Solutions kemudian ketikkan kelompok yang diinginkan yang kira-kira akan terbentuk pada
kolom Minimum number cluster dan Maximum number cluster. Klik Continue.
6. Klik Plot. Cek Dendogram pada bagian Icicle pilih None. Klik Continue. 7. Klik Method. Pada Cluster Method pilih algoritma pengelompokan. Pada
Measure pilih pengukuran jarak. Pada Transform Value pilih Z-scores. Klik Continue.
8. Klik Ok untuk memulai perhitungan.
6.13. Matrix Laboratory Matlab Versi R2008b
26
Matlab merupakan suatu program komputer yang bisa membantu memecahkan berbagai masalah matematis yang kerap ditemui dalam bidang
teknis. Memanfaatkan kemampuan matlab untuk menemukan solusi dari berbagai
26
Teguh Widiarsono, M.T. Tutorial Praktis Belajar Matlab : Jakarta, 2005, Hal 1-4.
Universitas Sumatera Utara
masalah numerik secara cepat mulai dari hal yang paling mendasar seperti sistem 2 persamaan dengan 2 variabel hingga yang kompleks seperti mencari akar-akar
polinomial, interpolasi dari sejumlah data, perhitungan dengan matriks, pengolahan sinyal, dan metoda numerik.
6.13.1. Memulai Matlab
Memulai matlab dengan mengeksekusi ikon MATLAB di layar komputer ataupun memulai dari tombol start di windows. Setelah proses loading program,
jendela utama matlab akan muncul seperti Gambar 3.10.
Gambar 3.10. Tampilan Matlab
Setelah proses loading selesai maka akan muncul command prompt di dalam command window :
Dari prompt diatas dapat diketikkan berbagai command MATLAB, seperti
halnya command prompt di dalam DOS. Sebagai permulaan, date adalah
Universitas Sumatera Utara
command MATLAB untuk menampilkan tanggal. Berikutnya command clc untuk
membersihkan command window: clc
6.13.2. Pengoperasian Matlab
Hirarki operator mengikuti standar aljabar yang umum dikenal, seperti: 1. Operasi di dalam kurung akan diselesaikan terlebih dahulu
2. Operasi pangkat 3. Operasi perkalian dan pembagian
4. Operasi penjumlahan dan pengurangan
Tabel 3.6. Fungsi Sederhana pada Matlab Simbol
Fungsi
+, -, , : tambah, kurang, kali, bagi
, : kurung
\ : pembagian terbalik
: pangkat
Sebagai contoh : 2.5+0.6
ans = 3.1000
34+34 ans =
12.7500 5\15+35
ans =
Universitas Sumatera Utara
10 16912, 6+14\102
ans = 13
ans = 5
Pada contoh di atas ditemui variabel ans, singkatan dari “answer”, yang
digunakan Matlab untuk menyimpan hasil perhitungan terakhir. Untuk menuliskan matriks dalam matlab dilakukan dengan langkah-
langkah berikut : 1. Menuliskan inisial matriks
2. Dimulai dengan tanda [ 3. Meng-input data elemen matriks, untuk memisahkan elemen-elemen baris
membentuk kolom dengan koma , atau spasi. 4. Menggunakan tanda titik koma ; untuk membentuk baris.
5. Mengakhiri matriks dengan tanda ] 6. Enter
7. Menuliskan inisial untuk mencari polinom karakteristik dari matriks dengan fungsi Poly .
8. Enter, maka outpunya adalah persamaan karakteristik dari matriks. 9. Menuliskan inisial akar-akar persamaan dari polinom karakteristik dengan
fungsi Roots .
Universitas Sumatera Utara
10. Enter, maka outpunya adalah akar-akar persamaan dari persamaan karakteristik.
Ketika selesai dengan sesi MATLAB dan ingin keluar, gunakan command exit atau quit. exit atau quit atau bisa juga dengan menggunakan menu:
File →Exit MATLAB.
6.14. Lingkungan Kerja
27
Semangat dan kegairahan kerja tenaga kerja dalam melaksanakan tugas- tugas dipengaruhi oleh banyak faktor. Faktor-faktor yang dapat mempengaruhi
tersebut antara lain adalah jumlah dan komposisi dari kompensasi yang diberikan, penempatan yang tepat, latihan, rasa aman di masa depan, mutasi, promosi dan
masih banyak faktor-faktor lain. Disamping faktor-faktor di atas masih ada faktor lain yang juga dapat
mempengaruhi semangat dan kegairahan kerja dalam pelaksanaan tugas yaitu lingkungan kerja. Meskipun faktor ini adalah penting dan besar pengaruhnya,
tetapi banyak perusahaan yang tidak memperhatikan faktor tersebut. Misalnya soal musik yang merdu, meskipun kelihatannya remeh tetapi ternyata besar
pengaruhnya terhadap efektivitas dan fisiensi dalam pelaksanaan tugas karena hal tersebut dapat mengurangi rasa kelelahan dari tenaga kerja.
Lingkungan kerja merupakan segala sesuatu yang ada di sekitar para tenaga kerja dimana dapat mempengaruhi pelaksanaan tugas-tugas yang
27
Drs ec. Alex S. Nitisemito. Manajemen Personalia Manajemen Sumberdaya Manusia: Ghalia Indonesia, Jakarta, 1979, Hal 183-184.
Universitas Sumatera Utara
dibebankan. Misalnya kebersihan, keamanan, kebisingan, penerangan, pertukaran udara, pewarnaan, dan suasana kerja.
6.15. Sikap Kerja
28
Sikap merupakan kecenderungan merespon sesuatu secara konsisten untuk mendukung atau tidak mendukung dengan memperhatikan objek tertentu. Sikap
lebih merupakan determinan prilaku sebab, sikap berkaitan dengan persepsi, kepribadian dan motivasi. Sikap dapat berubah dan dapat dipengaruhi, dapat
dibina dalam berbagai bidang kehidupan. Sikap negatif dapat dipengaruhi sehingga menjadi positif, yang awalnya tidak senang menjadi senang, yang
semula antipati menjadi bersimpati dan sebagainya. Sikap mengandung tiga komponen yang membentuk struktur sikap, yaitu :
1. Komponen kognitif perseptual yaitu komponen yang berkaitan dengan pengetahuan, pandangan, keyakinan dan hal-hal yang berhubungan dengan
bagaimana seseorang mempersepsi terhadap objek sikap. 2. Komponen afektif emosional yaitu komponen yang berhubungan dengan
rasa senang atau tidak senang terhadap objek sikap. Rasa senang merupakan hal yang positif, sedangkan rasa tidak senang adalah hal negatif.
3. Komponen konatif perilaku yaitu komponen yang berhubungan dengan kecenderungan bertindak atau berprilaku terhadap objek sikap.
Tipe-tipe sikap yang dibahas pada prilaku organisasi, antara lain : kepuasan kerja, keterlibatan dan komitmen pada organisasi.
28
Alex Nitisemito, Manajeman Personalia; Manajemen Sumber Daya Manusia : Ghalia Indonesia, Jakarta, 2001, Hal 145-147.
Universitas Sumatera Utara
6.16. Kompetensi Kemampuan kerja