Mengukur Kesamaan Antar Obyek similarity Proses Klaster

13 c Pautan Rata-rata Average Linkage Dasarnya adalah jarak rata-rata antar observasi. pengelompokan dimulai dari tengan atau pasangan observasi dengan jarak paling mendekati jarak rata-rata. Pada awalnya harus ditemukan jarak terpendek dalam � = {� �� } dan menggabungkan obyek-obyek yang bersesuaian misalnya, U dan V, untuk mendapat klaster UV. Untuk langkah 3 dari algoritma di atas jarak-jarak antara UV dan klaster W yang lain dihitung dengan cara � = ∑ ∑ � �� � � Dimana � �� adalah jarak antara obyek i dalam klaster UV dan obyek k dalam klaster W, dan dan berturut-turut adalah banyaknya item-item dalam klaster UV dan W. 2 Metode Non-Hirarki Berbeda dengan metode hirarki, metode ini justru dimulai dengan menentukan terlebih dahulu jumlah klaster yang diinginkan. Setelah jumlah klaster diketahui, baru proses klaster dilakukan tanpa mengikuti proses hirarki. Salah satu metode yang masuk dalam metode Non-Hirarki adalah metode K- Means Klaster. Metode ini merupakan metode pengelompokan yang bertujuan mengelompokan obyek sedemikian hingga jarak tiap-tiap obyek ke pusat kelompok di dalam satu kelompok adalah minimum. Algoritma K-Means sebagai berikut. 14 a Tentukan Jumlah K klaster. b Cari data yang lebih dekat dengan pusat klaster. c Hitung jarak Euclidean masing-masing item dari pusat klaster. Tentukan kembali pusat klaster. Ulangi langkah b sampai tidak ada yang berpindah posisi.

2.1.4.3 Uji Variansi

Analisis variansi merupakan teknik analisis yang digunakan untuk menguji tentang perbedaan rata-rata populasi secara univariat Johnson dan Wichern, 2002. Analisis varian bekerja menurut perbedaan varian masing- masing kelompok data. Varian tersebut merupakan rerata kuadrat skor simpangan atau skor deviasinya. Skor simpangan ini adalah perbedaan setiap skor dari rerata kelompoknya. Untuk menguji hipotesis, ANOVA melakukan perbandingan antara variansi antar kelompok Mean of Square Between groups dengan variansi dalam kelompok Mean of Square Within groups. Hasil perbandingan tersebut dinamakan sebagai F hitung kemudian diuji signifikansinya untuk mengetahui penerimaan atau penolakan dari hipotesis yang diajukan. a. Menyusun hipotesis Dalam ANAVA hipotesis nolnya adalah sampel-sampel yang diambil dari populasi-populasi saling independen yang memiliki mean sama. Hipotesis nol dan hipotesis alternatifnya adalah : � = � = � = ⋯ = � � : paling sedikit satu tanda sama dengan tidak berlaku 15 Perlu diperhatikan bahwa jika hipotesis alternatifnya diterima maka dapat disimpulkan bahwa sekurangnya terdapat satu mean populasi yang berbeda dari populasi lainnya. Namun analisis varians tidak dapat mengungkapkan dengan pasti berapa banyak populasi yang meannya berbeda. b. Menentukan statistik penguji Dalam uji ANAVA statistik yang digunakan adalah distribusi F. Nilai-nilai dari distribusi F disajikan dalam bentuk tabel yang dapat ditentukan dengan mengetahui tiga hal sebagai berikut. 1 Tingkat signifikan 2 Derajat kebebasan dk yang digunakan sebagai pembilang dalam rasio uji adalah dk = m – 1 di mana m: jumlah kelompok sampel 3 Derajat kebebasan dk yang digunakan sebagai penyebut dalam rasio uji adalah dk = − � c. Taraf signifikan � Biasanya digunakan taraf signifikan 0,01 atau 0,05. d. Menentukan kriteria pengujian Tolak jika � � � , , di mana � � , didapat dari daftar distribusi F sengan peluang � dan �� = � , � . Di sini � adalah taraf signifikan untuk pengujian. e. Menghitung statistika uji Rumus yang digunakan untuk menghitung nilai F adalah 1 Menghitung JK Total: = ∑ � − ∑ � � � 16 2 Menghitung Jumlah Kuadrat Antar Kelompok , dengan rumus: = ∑ ∑ − ∑ � � � 3 Menghitung Jumlah Kuadrat Dalam Kelompok , dengan rumus: = − 4 Menghitung Mean Kuadrat Antar Kelompok , dengan rumus: = � − 5 Menghitung Mean Kuadrat Dalam Kelompok , dengan rumus: = �− 6 Menghitung F hitung, dengan rumus: � ℎ� = Statistik F inilah yang digunakan untuk menguji . f. Membandingkan dan mengumpulkan hasil 4 dan 5 g. Interpretasi Terima jika � ℎ� � � Pada analisis klaster ini uji variansi dilakukan untuk melihat apakah variabel- variabel yang telah membentuk klaster memiliki perbedaan pada tiap klaster, serta untuk melihat variabel yang paling berpengaruh terhadap pembentukan klaster.

2.1.4.4 Ukuran Kehomogenan Dalam dan Antar Klaster

Salah satu metode yang dapat digunakan untuk mengukur seberapa baik kinerja dari metode-metode pada analisis klaster yaitu dengan mengukur 17 kehomogenan dalam dan antar klaster. Yaitu dengan mengukur simpangan baku dalam dan antar klaster Alam,2010: 5. Rumus simpangan baku dalam kelompok = − ∑ � �= Dimana: K : banyaknya kelompok yang terbentuk � : simpangan baku kelompok ke-k Rumus simpangan baku antar kelompok = [ − 1 − ∑ �̅ � − �̅ �= ] Dimana : K : banyaknya kelompok yang terbentuk �̅ � : rataan kelompok ke-k �̅ : rataan seluruh kelompok Semakin kecil nilai Sw dan semakin besar nilai SB, maka metode tersebut memiliki kenerja yang baik, artinya mempunyai homogenitas yang tinggi. Dengan kata lain metode yang dipilih adalah metode yang mempunyai nilai Sw yang minimum dan nilai SB yang maksimum. Atau bisa juga dibuat rasio � � � � , jika rasio � � � � kecil berarti metode tersebut memiliki kinerja yang baik Bunkers et al., 1996.