Penerapan Analisis Gerombol Dan Teknik Validasi Pada Penggerombolan Klon Teh

(1)

RINGKASAN

LEMMA FIRARI BOER. Penerapan Analisis Gerombol dan Teknik Validasi Pada Penggerombolan Klon Teh. Dibimbing oleh BUNAWAN SUNARLIM dan PIKA SILVIANTI.

Analisis gerombol adalah teknik untuk mengelompokkan objek ke dalam grup berdasarkan ukuran kemiripan atau ketidakmiripan. Analisis gerombol banyak digunakan dalam berbagai bidang disiplin ilmu, salah satunya adalah bidang pemuliaan tanaman. Dalam bidang pemuliaan tanaman penggerombolan digunakan untuk memudahkan dalam pemilihan tetua yang akan disilangkan. Hasil persilangan tersebut diharapkan memiliki rekombinasi sifat yang unggul. Pada penelitian ini metode gerombol yang digunakan adalah metode pautan rataan dan pautan lengkap. Untuk menentukan solusi gerombol yang optimum digunakan metode pseudo-F dan indeks validasi gerombol. Sebagai aplikasi digunakan data morfologi klon teh hasil penelitian kelti pemuliaan tanaman di Pusat Penelitian Tanaman Teh dan Kina (PPTK) Gambung tahun 2007. Hasil penggerombolan dengan metode pautan rataan didapat tujuh gerombol yang optimum sedangkan untuk metode pautan lengkap terdapat delapan gerombol yang optimum, dimana gerombol-gerombol untuk tiap metode memiliki karakteristik yang berbeda. Metode pautan rataan dapat menghasilkan gerombol yang lebih baik daripada metode pautan lengkap, hal ini dapat dilihat dari hasil plot skor komponen utama yang menunjukan gerombol-gerombol yang terpisah cukup baik.

Kata kunci: Analisis Gerombol, Pautan Rataan, Pautan Lengkap, Pseudo-F, Indeks Validasi Gerombol.


(2)

9

PENDAHULUAN

Latar Belakang

Analisis gerombol adalah teknik untuk mengelompokkan objek ke dalam grup berdasarkan ukuran kemiripan atau ketidakmiripan. Saat ini metode penggerombolan digunakan secara luas oleh berbagai bidang disiplin ilmu, salah satunya adalah bidang pemuliaan tanaman.

Salah satu tujuan dari bidang ilmu pemuliaan tanaman adalah menemukan varietas atau klon unggul yang dapat tumbuh baik dan berdaya hasil tinggi. Klon unggul dapat diperoleh dengan persilangan atau penyerbukan silang antar dua tetua yang memiliki keunggulan dalam sifat tertentu. Sifat-sifat unggul ini dapat dilihat dari peubah fisik. Untuk memudahkan dalam pemilihan tetua perlu dilakukan penggerombolan, gerombol-gerombol yang terbentuk akan memiliki ciri tertentu yang menjadi acuan dalam pemilihan tetua.

Karena tidak ada informasi mengenai jumlah gerombol maka metode yang digunakan adalah metode berhirarki. Penentuan jumlah gerombol biasanya dilakukan dengan memotong dendogram pada selisih jarak penggabungan terbesar. Namun cara ini lebih bersifat subjektif karena tidak selalu pada selisih jarak penggabungan terbesar jumlah gerombol dipilih.

Pada penelitian ini jumlah gerombol akan ditentukan dengan mengkombinasikan metode pseudo-f dan indeks validasi gerombol Davies Bouldin. Dengan metode tersebut diharapkan dapat mengurangi masalah subjektifitas dalam penentuan jumlah gerombol.

Tujuan

Tujuan dari penelitian ini adalah menggerombolkan klon-klon teh berdasarkan kemiripan peubah fisik dan menerapkan metode pseudo-f dan indeks validasi gerombol.

TINJAUAN PUSTAKA Tanaman Teh

Tanaman teh (Camellia sinensis (L.) O.Kuntze) adalah tanaman perkebunan yang termasuk bahan penyegar. Hasil tanaman berupa pucuk daun diolah dan dimanfaatkan sebagai bahan minuman. Mengkonsumsi teh selain menyegarkan tubuh, ternyata juga memberi manfaat bagi kesehatan. Senyawa bermanfaat yang dikandung pucuk teh antara lain adalah polifenol dan flourida. Polifenol

bermanfaat sebagai anti kanker dan fluorida bermanfaat bagi kesehatan gigi (Pambudi 2000).

Tanaman teh dapat hidup pada daerah rendah (< 800 m dpl), sedang (800-1200 m dpl), dan tinggi (> 1200 m dpl). Selain itu untuk dapat tumbuh dengan baik tanaman teh membutuhkan suhu 13 – 250 C, kelembapan relatif pada siang hari tidak kurang dari 70%, dan sinar matahari yang cukup dengan curah hujan tidak kurang dari 2000 mm/tahun (PPTK 2006).

Kondisi tanah merupakan faktor cukup untuk pertumbuhan teh, umumnya tanah yang serasi dengan tanaman teh adalah tanah andosol karena banyak mengandung bahan organik, struktur tanah tidak keras dengan pH 4,5-5,5 (PPTK 2006).

Analisis Deskriptif

Analisis deskriptif adalah metode yang berkaitan dengan pengumpulan data dan penyajian gugus data sehingga menghasilkan informasi yang berguna. Penyajian ini dimaksudkan untuk mengungkapkan informasi penting yang terdapat pada data ke dalam bentuk yang lebih ringkas dan sederhana yang akhirnya mengarah pada keperluan adanya penjelasan dan penafsiran (Aunuddin, 1989).

Analisis deskriptif dilakukan untuk keperluan analisis selanjutnya jika diperlukan. Akan tetapi jika dari hasil analisis deskriptif sudah dapat diambil kesimpulan yang tepat., maka tidak perlu menggunakan analisis yang rumit (Aunuddin, 1989).

Korelasi Pearson

Koefisien korelasi Pearson berguna untuk mengetahui hubungan linier antar peubah. Pada contoh berukuran n, koefisien ini dirumuskan sebagai berikut:

= ∑ ௜̅௜̅ ௡ ௜ୀଵ ∑ ௜̅ ଶ ௡

௜ୀଵ ∑ ௜̅

ଶ ௡

௜ୀଵ

Dengan hipotesis:

H0: ρ = 0 (tidak ada korelasi antar peubah).

H1: ρ≠ 0 (terdapat korelasi antar peubah).

Sedangkan statistik ujinya:

ݐ=ݎඨ݊− 2 1 −ݎଶ

Wilayah kritis bagi H1 terletak pada t < -tα/2;v


(3)

9

PENDAHULUAN

Latar Belakang

Analisis gerombol adalah teknik untuk mengelompokkan objek ke dalam grup berdasarkan ukuran kemiripan atau ketidakmiripan. Saat ini metode penggerombolan digunakan secara luas oleh berbagai bidang disiplin ilmu, salah satunya adalah bidang pemuliaan tanaman.

Salah satu tujuan dari bidang ilmu pemuliaan tanaman adalah menemukan varietas atau klon unggul yang dapat tumbuh baik dan berdaya hasil tinggi. Klon unggul dapat diperoleh dengan persilangan atau penyerbukan silang antar dua tetua yang memiliki keunggulan dalam sifat tertentu. Sifat-sifat unggul ini dapat dilihat dari peubah fisik. Untuk memudahkan dalam pemilihan tetua perlu dilakukan penggerombolan, gerombol-gerombol yang terbentuk akan memiliki ciri tertentu yang menjadi acuan dalam pemilihan tetua.

Karena tidak ada informasi mengenai jumlah gerombol maka metode yang digunakan adalah metode berhirarki. Penentuan jumlah gerombol biasanya dilakukan dengan memotong dendogram pada selisih jarak penggabungan terbesar. Namun cara ini lebih bersifat subjektif karena tidak selalu pada selisih jarak penggabungan terbesar jumlah gerombol dipilih.

Pada penelitian ini jumlah gerombol akan ditentukan dengan mengkombinasikan metode pseudo-f dan indeks validasi gerombol Davies Bouldin. Dengan metode tersebut diharapkan dapat mengurangi masalah subjektifitas dalam penentuan jumlah gerombol.

Tujuan

Tujuan dari penelitian ini adalah menggerombolkan klon-klon teh berdasarkan kemiripan peubah fisik dan menerapkan metode pseudo-f dan indeks validasi gerombol.

TINJAUAN PUSTAKA Tanaman Teh

Tanaman teh (Camellia sinensis (L.) O.Kuntze) adalah tanaman perkebunan yang termasuk bahan penyegar. Hasil tanaman berupa pucuk daun diolah dan dimanfaatkan sebagai bahan minuman. Mengkonsumsi teh selain menyegarkan tubuh, ternyata juga memberi manfaat bagi kesehatan. Senyawa bermanfaat yang dikandung pucuk teh antara lain adalah polifenol dan flourida. Polifenol

bermanfaat sebagai anti kanker dan fluorida bermanfaat bagi kesehatan gigi (Pambudi 2000).

Tanaman teh dapat hidup pada daerah rendah (< 800 m dpl), sedang (800-1200 m dpl), dan tinggi (> 1200 m dpl). Selain itu untuk dapat tumbuh dengan baik tanaman teh membutuhkan suhu 13 – 250 C, kelembapan relatif pada siang hari tidak kurang dari 70%, dan sinar matahari yang cukup dengan curah hujan tidak kurang dari 2000 mm/tahun (PPTK 2006).

Kondisi tanah merupakan faktor cukup untuk pertumbuhan teh, umumnya tanah yang serasi dengan tanaman teh adalah tanah andosol karena banyak mengandung bahan organik, struktur tanah tidak keras dengan pH 4,5-5,5 (PPTK 2006).

Analisis Deskriptif

Analisis deskriptif adalah metode yang berkaitan dengan pengumpulan data dan penyajian gugus data sehingga menghasilkan informasi yang berguna. Penyajian ini dimaksudkan untuk mengungkapkan informasi penting yang terdapat pada data ke dalam bentuk yang lebih ringkas dan sederhana yang akhirnya mengarah pada keperluan adanya penjelasan dan penafsiran (Aunuddin, 1989).

Analisis deskriptif dilakukan untuk keperluan analisis selanjutnya jika diperlukan. Akan tetapi jika dari hasil analisis deskriptif sudah dapat diambil kesimpulan yang tepat., maka tidak perlu menggunakan analisis yang rumit (Aunuddin, 1989).

Korelasi Pearson

Koefisien korelasi Pearson berguna untuk mengetahui hubungan linier antar peubah. Pada contoh berukuran n, koefisien ini dirumuskan sebagai berikut:

= ∑ ௜̅௜̅ ௡ ௜ୀଵ ∑ ௜̅ ଶ ௡

௜ୀଵ ∑ ௜̅

ଶ ௡

௜ୀଵ

Dengan hipotesis:

H0: ρ = 0 (tidak ada korelasi antar peubah).

H1: ρ≠ 0 (terdapat korelasi antar peubah).

Sedangkan statistik ujinya:

ݐ=ݎඨ݊− 2 1 −ݎଶ

Wilayah kritis bagi H1 terletak pada t < -tα/2;v


(4)

10

Analisis Komponen Utama

Analisis komponen utama merupakan pendekatan statistika untuk mereduksi gugus peubah asal berdimensi p menjadi gugus peubah baru (komponen utama) berdimensi q dimana (q ≤ p). Sifat dari gugus peubah komponen utama adalah memiliki ragam maksimum, antar peubah komponen utama saling bebas, dan merupakan kombinasi linier dari peubah asal.

Misalkan λ1 ≥ λ2 ≥ … ≥ λp > 0 adalah akar ciri yang berpadanan dengan vektor ciri a1, a2, …, ap dari matriks ragam peragam (ΣΣΣΣ)

atau matriks korelasi (R) dimana matriks ragam peragam (ΣΣΣΣ) digunakan jika satuan peubah sama sedangkan matriks korelasi (R) digunakan jika satuan peubah berbeda. Panjang dari setiap vektor ciri masing masing adalah 1 (ai’ai = 1), untuk i = 1, 2, …, p.

Maka,

KU1 = a1’x, dengan var(KU1) = λ1

…,

KUp = ap’x, dengan var(KUp) = λp

berturut-turut adalah komponen utama pertama, kedua, …, ke-p dari x. Karena total keragaman ditunjukan oleh tr(ΣΣΣΣ) maka total keragaman ini sama dengan jumlah dari seluruh akar cirinya yaitu ∑ . Jadi

persentase total keragaman yang mampu dijelaskan oleh komponen utama ke-i adalah

∑೛೔సభ೔

×100%.

Analisis Gerombol

Analisis gerombol merupakan suatu metode peubah ganda untuk mengelompokkan n objek ke dalam m gerombol (m≤n) berdasarkan karakter-karakternya (Johnson & Wichern 2002).

Analisis gerombol bertujuan untuk mengelompokan sekumpulan objek ke dalam satu atau lebih gerombol sehingga objek-objek yang berada dalam satu gerombol memiliki homogenitas yang tinggi dan memiliki heterogenitas yang tinggi antar gerombol (Sartono 2003).

1. Ukuran Kemiripan atau Ketidakmiripan Untuk bisa menggerombolkan suatu objek, tentunya pertama harus ditentukan dulu ukuran kemiripan atau ketakmiripan antar objek. Dengan memiliki sebuah ukuran kuantitatif maka akan lebih mudah menentukan objek mana yang mirip dan yang tidak mirip, sehingga proses penggerombolan akan lebih mudah.

Jarak Euclid digunakan jika antar peubah memiliki satuan yang sama, keragaman yang

sama, dan tidak saling berkorelasi (Johnson & Wichern 2002). Jarak Euclid dirumuskan sebagai:

,=−′

Sedangkan jika satuan antar peubah tidak sama dapat digunakan jarak Euclid yang telah ditransformasi ke dalam bentuk baku. Jika terdapat korelasi antar peubah maka dapat digunakan jarak Mahalanobis atau jarak Euclid dengan peubah asal yang telah ditransformasi menggunakan analisis komponen utama (Kaufma & Peter 1990). Jarak Mahalonobis dirumuskan sebagai:

,=−′

2. Metode Hirarki

Metode penggerombolan berhirarki digunakan jika banyaknya gerombol yang akan dibentuk belum diketahui sebelumnya. Metode berhirarki dapat dibedakan menjadi metode penggabungan (agglomerative) dan metode pembagian (divisive).

Bila suatu gerombol merupakan penggabungan dari beberapa gerombol sebelumnya, maka diperlukan ukuran ketakmiripan antar gerombol. Terdapat beberapa ukuran ketakmiripan antar gerombol.

1. Metode pautan tunggal (single linkage): jarak antar gerombol adalah jarak tedekat dari dua anggota gerombol yang berbeda.

= min

∈ే

∈ై

d(,)

2. Metode pautan lengkap (complete linkage): jarak antar gerombol adalah jarak terjauh dari dua anggota gerombol yang berbeda.

= max

∈ే

∈ై

d(,)

3. Metode pautan rataan (average linkage): Jarak antar gerombol adalah rataan dari jarak tiap pasangan observasi.

= 1

n n d(,)

∈ై

∈ే

Kaufman dan Peter (1990) mencontohkan jika pengguna memperkirakan memiliki kelompok dengan jarak antar kelompoknya panjang maka digunakan pautan tunggal, tetapi untuk kelompok yang padat yang mana tidak ada dua objek yang saling berjauhan maka digunakan pautan lengkap.


(5)

11

Statistik Pseudo-F Calinski-Harabasz Statistik Pseudo-F Calinski Harabasz bertujuan untuk mendapatkan keketatan dari gerombol, dan merupakan rasio dari kuadrat tengah antar gerombol dengan kuadrat tengah dalam gerombol (Lattin et al. 2003, diacu dalam Lim et al. 2006).

Pseudo-F = ்ି௉ ಸ/(ீିଵ)

ಸ/(௡ିீ)

dimana:

G = jumlah gerombol. T = jumlah kuadrat total. PG = jumlah kuadrat dalam grup.

Nilai pseudo-F yang besar mengindikasi solusi gerombol yang baik namun nilai pseudo-F ini akan semakin besar seiring dengan meningkatnya jumlah gerombol. Sehingga kriteria pemilihan solusi gerombol optimum terdapat pada titik puncak dari nilai pseudo-F (Lattin et al. 2003, diacu dalam Lim et al. 2006).

Validitas Gerombol

Indeks validasi digunakan untuk mengukur seberapa baik hasil penggerombolan dibandingkan hasil lain dengan algoritma yang sama atau berbeda.

Salah satu indeks yang bisa dijadikan tolok ukur dalam pengujian validitas cluster adalah indeks Davies-Bouldin.

Rumus indeks Davies-Bouldin dapat ditulis sebagai:

= 1 max

′+′ , di mana:

n = jumlah kelompok

d(ci,cj) = jarak antar kelompok ci dan cj

d'(ck) = jarak dalam kelompok ck

Nilai indeks Davies-Bouldin yang kecil menunjukkan kelompok yang baik (Su 2003).

METODOLOGI

Data

Data yang digunakan adalah data penelitian pemuliaan tanaman di Pusat Penelitian Teh dan Kina (PPTK) Gambung tahun 2007. Data ini merupakan data rataan dari pengamatan terhadap 50 jenis klon teh, yang disajikan dalam Lampiran 2.

Adapun peubah-peubah yang diamati adalah sebagai berikut:

1. X1 = Panjang Daun (cm). 2. X2 = Lebar Daun (cm). 3. X3 = Luas Daun (cm2).

4. X4 = Panjang Tangkai Daun (cm). 5. X5 = Bobot Peko+2 (gram). 6. X6 = Bobot Peko+3 (gram). 7. X7 = Jumlah Bulu Peko (satuan). 8. X8 = Jumlah Stomata (satuan).

Metode

Langkah-langkah yang dilakukan dalam penelitian ini adalah:

1. Melakukan analisis deskriptif terhadap data yang digunakan.

2. Mencari korelasi antar peubah.

3. Jika diantara peubah-peubah tersebut mengindikasikan adanya korelasi yang nyata pada taraf 5% maka lakukan analisis komponen utama dengan menggunakan matriks korelasi karena satuan peubah berbeda.

4. Mencari matriks jarak Euclid klon yang satu dengan lainnya dari data skor komponen utama kemudian melakukan analisis gerombol dengan metode pautan rataan dan pautan lengkap.

5. Mencari nilai pseudo-F dan uji validitas gerombol untuk mengetahui solusi gerombol yang optimum.

6. Membandingkan hasil akhir gerombol dari tiap metode dengan melihat plot skor komponen utama.

HASIL DAN PEMBAHASAN

Deskripsi Umum

Statistik deskripsi data awal dapat dilihat pada Tabel 1 dan ditampilkan dalam bentuk boxplot dalam Lampiran 3.

Tabel 1 Statistik deskriptif data awal Peubah Min Max Rataan Stdev

X1 7.28 12.29 10.2668 1.1348 X2 3.45 5.48 4.3016 0.5785 X3 17.58 43.93 30.9144 7.2095 X4 0.31 0.51 0.424 0.0473 X5 0.28 1.21 0.6994 0.1764 X6 0.57 2.46 1.2116 0.3914 X7 14.06 65.94 37.6116 12.2406 X8 25.5 53.06 38.3994 5.8697 Pada Lampiran 3 dapat dilihat keragaman dari tiap peubah berdasarkan satuannya. Peubah X3, X7, dan X8 memiliki keragaman yang besar sebaliknya peubah X4 memiliki keragaman yang rendah.


(6)

11

Statistik Pseudo-F Calinski-Harabasz Statistik Pseudo-F Calinski Harabasz bertujuan untuk mendapatkan keketatan dari gerombol, dan merupakan rasio dari kuadrat tengah antar gerombol dengan kuadrat tengah dalam gerombol (Lattin et al. 2003, diacu dalam Lim et al. 2006).

Pseudo-F = ்ି௉ ಸ/(ீିଵ)

ಸ/(௡ିீ)

dimana:

G = jumlah gerombol. T = jumlah kuadrat total. PG = jumlah kuadrat dalam grup.

Nilai pseudo-F yang besar mengindikasi solusi gerombol yang baik namun nilai pseudo-F ini akan semakin besar seiring dengan meningkatnya jumlah gerombol. Sehingga kriteria pemilihan solusi gerombol optimum terdapat pada titik puncak dari nilai pseudo-F (Lattin et al. 2003, diacu dalam Lim et al. 2006).

Validitas Gerombol

Indeks validasi digunakan untuk mengukur seberapa baik hasil penggerombolan dibandingkan hasil lain dengan algoritma yang sama atau berbeda.

Salah satu indeks yang bisa dijadikan tolok ukur dalam pengujian validitas cluster adalah indeks Davies-Bouldin.

Rumus indeks Davies-Bouldin dapat ditulis sebagai:

= 1 max

′+′ , di mana:

n = jumlah kelompok

d(ci,cj) = jarak antar kelompok ci dan cj

d'(ck) = jarak dalam kelompok ck

Nilai indeks Davies-Bouldin yang kecil menunjukkan kelompok yang baik (Su 2003).

METODOLOGI

Data

Data yang digunakan adalah data penelitian pemuliaan tanaman di Pusat Penelitian Teh dan Kina (PPTK) Gambung tahun 2007. Data ini merupakan data rataan dari pengamatan terhadap 50 jenis klon teh, yang disajikan dalam Lampiran 2.

Adapun peubah-peubah yang diamati adalah sebagai berikut:

1. X1 = Panjang Daun (cm). 2. X2 = Lebar Daun (cm). 3. X3 = Luas Daun (cm2).

4. X4 = Panjang Tangkai Daun (cm). 5. X5 = Bobot Peko+2 (gram). 6. X6 = Bobot Peko+3 (gram). 7. X7 = Jumlah Bulu Peko (satuan). 8. X8 = Jumlah Stomata (satuan).

Metode

Langkah-langkah yang dilakukan dalam penelitian ini adalah:

1. Melakukan analisis deskriptif terhadap data yang digunakan.

2. Mencari korelasi antar peubah.

3. Jika diantara peubah-peubah tersebut mengindikasikan adanya korelasi yang nyata pada taraf 5% maka lakukan analisis komponen utama dengan menggunakan matriks korelasi karena satuan peubah berbeda.

4. Mencari matriks jarak Euclid klon yang satu dengan lainnya dari data skor komponen utama kemudian melakukan analisis gerombol dengan metode pautan rataan dan pautan lengkap.

5. Mencari nilai pseudo-F dan uji validitas gerombol untuk mengetahui solusi gerombol yang optimum.

6. Membandingkan hasil akhir gerombol dari tiap metode dengan melihat plot skor komponen utama.

HASIL DAN PEMBAHASAN

Deskripsi Umum

Statistik deskripsi data awal dapat dilihat pada Tabel 1 dan ditampilkan dalam bentuk boxplot dalam Lampiran 3.

Tabel 1 Statistik deskriptif data awal Peubah Min Max Rataan Stdev

X1 7.28 12.29 10.2668 1.1348 X2 3.45 5.48 4.3016 0.5785 X3 17.58 43.93 30.9144 7.2095 X4 0.31 0.51 0.424 0.0473 X5 0.28 1.21 0.6994 0.1764 X6 0.57 2.46 1.2116 0.3914 X7 14.06 65.94 37.6116 12.2406 X8 25.5 53.06 38.3994 5.8697 Pada Lampiran 3 dapat dilihat keragaman dari tiap peubah berdasarkan satuannya. Peubah X3, X7, dan X8 memiliki keragaman yang besar sebaliknya peubah X4 memiliki keragaman yang rendah.


(7)

11

Statistik Pseudo-F Calinski-Harabasz Statistik Pseudo-F Calinski Harabasz bertujuan untuk mendapatkan keketatan dari gerombol, dan merupakan rasio dari kuadrat tengah antar gerombol dengan kuadrat tengah dalam gerombol (Lattin et al. 2003, diacu dalam Lim et al. 2006).

Pseudo-F = ்ି௉ ಸ/(ீିଵ)

ಸ/(௡ିீ)

dimana:

G = jumlah gerombol. T = jumlah kuadrat total. PG = jumlah kuadrat dalam grup.

Nilai pseudo-F yang besar mengindikasi solusi gerombol yang baik namun nilai pseudo-F ini akan semakin besar seiring dengan meningkatnya jumlah gerombol. Sehingga kriteria pemilihan solusi gerombol optimum terdapat pada titik puncak dari nilai pseudo-F (Lattin et al. 2003, diacu dalam Lim et al. 2006).

Validitas Gerombol

Indeks validasi digunakan untuk mengukur seberapa baik hasil penggerombolan dibandingkan hasil lain dengan algoritma yang sama atau berbeda.

Salah satu indeks yang bisa dijadikan tolok ukur dalam pengujian validitas cluster adalah indeks Davies-Bouldin.

Rumus indeks Davies-Bouldin dapat ditulis sebagai:

= 1 max

′+′ , di mana:

n = jumlah kelompok

d(ci,cj) = jarak antar kelompok ci dan cj

d'(ck) = jarak dalam kelompok ck

Nilai indeks Davies-Bouldin yang kecil menunjukkan kelompok yang baik (Su 2003).

METODOLOGI

Data

Data yang digunakan adalah data penelitian pemuliaan tanaman di Pusat Penelitian Teh dan Kina (PPTK) Gambung tahun 2007. Data ini merupakan data rataan dari pengamatan terhadap 50 jenis klon teh, yang disajikan dalam Lampiran 2.

Adapun peubah-peubah yang diamati adalah sebagai berikut:

1. X1 = Panjang Daun (cm). 2. X2 = Lebar Daun (cm). 3. X3 = Luas Daun (cm2).

4. X4 = Panjang Tangkai Daun (cm). 5. X5 = Bobot Peko+2 (gram). 6. X6 = Bobot Peko+3 (gram). 7. X7 = Jumlah Bulu Peko (satuan). 8. X8 = Jumlah Stomata (satuan).

Metode

Langkah-langkah yang dilakukan dalam penelitian ini adalah:

1. Melakukan analisis deskriptif terhadap data yang digunakan.

2. Mencari korelasi antar peubah.

3. Jika diantara peubah-peubah tersebut mengindikasikan adanya korelasi yang nyata pada taraf 5% maka lakukan analisis komponen utama dengan menggunakan matriks korelasi karena satuan peubah berbeda.

4. Mencari matriks jarak Euclid klon yang satu dengan lainnya dari data skor komponen utama kemudian melakukan analisis gerombol dengan metode pautan rataan dan pautan lengkap.

5. Mencari nilai pseudo-F dan uji validitas gerombol untuk mengetahui solusi gerombol yang optimum.

6. Membandingkan hasil akhir gerombol dari tiap metode dengan melihat plot skor komponen utama.

HASIL DAN PEMBAHASAN

Deskripsi Umum

Statistik deskripsi data awal dapat dilihat pada Tabel 1 dan ditampilkan dalam bentuk boxplot dalam Lampiran 3.

Tabel 1 Statistik deskriptif data awal Peubah Min Max Rataan Stdev

X1 7.28 12.29 10.2668 1.1348 X2 3.45 5.48 4.3016 0.5785 X3 17.58 43.93 30.9144 7.2095 X4 0.31 0.51 0.424 0.0473 X5 0.28 1.21 0.6994 0.1764 X6 0.57 2.46 1.2116 0.3914 X7 14.06 65.94 37.6116 12.2406 X8 25.5 53.06 38.3994 5.8697 Pada Lampiran 3 dapat dilihat keragaman dari tiap peubah berdasarkan satuannya. Peubah X3, X7, dan X8 memiliki keragaman yang besar sebaliknya peubah X4 memiliki keragaman yang rendah.


(8)

12

Korelasi Antar Peubah

Korelasi antarpeubah yang digunakan sebagai dasar penggerombolan dapat dilihat pada Lampiran 4. Terdapat 8 pasang peubah yang memiliki korelasi yang nyata pada taraf 5%, dimana korelasi terbesar dan nyata yaitu antara luas daun dengan lebar daun sebesar 0.947 yang menunjukan adanya hubungan linier yang sangat baik antara luas daun dan lebar daun.

Adapun korelasi negatif terkecil dan nyata yaitu antara jumlah bulu peko dengan bobot peko 2 sebesar -0.293 yang berarti kekuatan hubungan linier antara jumlah bulu peko dengan bobot peko 2 lemah.

Analisis Komponen Utama

Untuk mereduksi dimensi peubah tetapi dapat mempertahankan sebagian informasi dari peubah tersebut maka data dianalisis menggunakan analisis komponen utama. Dalam Lampiran 5 dapat dilihat bahwa 2 komponen utama yang pertama dapat menjelaskan total keragaman sebesar 62.5%. Artinya 62.5% informasi yang terkandung dalam peubah asal dapat dijelaskan oleh 2 komponen utama tersebut.

Untuk melihat pola penyebaran klon maka dibentuk plot dua komponen pertama dan kedua seperti pada Lampiran 6. Dari plot tersebut dapat dilihat bahwa pola penyebaran skor klon terlihat padat dan tidak terpisah secara baik.

Hasil dari analisis komponen utama yaitu data skor komponen utama selanjutnya digunakan dalam analisis gerombol. Seluruh peubah komponen utama dimasukan dalam analisis gerombol agar seluruh informasi mengenai peubah asal dapat diperoleh.

Analisis Gerombol dengan Metode Pautan Rataan

Hasil dari komponen utama yaitu data skor komponen selanjutnya digerombolkan menggunakan metode pautan rataan. Dendogram metode pautan rataan dapat dilihat pada Lampiran 7.

Gambar 1 Grafik Pseudo-F untuk metode pautan rataan

Penentuan solusi jumlah gerombol selanjutnya dilakukan dengan menggunakan Pseudo-F dan indeks Davies Bouldin, dari Gambar 1 dapat dilihat bahwa kandidat solusi gerombol yang baik berada pada jumlah gerombol 4, 7, 9, dan 10. kemudian dari empat solusi gerombol tersebut dicari nilai indeks Davies Bouldin untuk mengukur seberapa baik hasil penggerombolan tersebut. Tabel 2 Nilai indeks Davies Bouldin untuk

metode pautan rataan

C 4 7 9 10

Indeks 1,288 1,104 1,214 1,281 Dari Tabel 2 dapat dilihat bahwa jumlah gerombol tujuh memiliki nilai indeks yang terkecil, maka tujuh gerombol adalah solusi optimum yang dihasilkan metode pautan rataan.

Tabel 3 Hasil gerombol dengan metode pautan rataan

Gerombol Anggota Gerombol

1 BD_3 Cin_58 BD_15 Cin_67 Cin_ Cin_69 Cin_25 Cip_19 Cin_28 Wan_24/4 Cin_36 KP_1 Cin_57 PG_3 Skm_18

2 BD_11 PG_5 BD_12 PG_11 BD_13 SA_12 Cin_1 SA_49 Cin_60 PG_7 Cin_66 Bks_6 GP_2 GP_5 Mal_16 Pam_15 Mel_48 SA_64 Mel_49 SA_72 Mel_101 Sin_2 PG_4 Sin_3 Sin_5

3 Cin_13 Cip_31 Cip_18 Mel_108

4 Cin_14 Cin_15

5 Cip_37

6 GH_5

7 GP_4 SA_33 Karakteristik Gerombol

Untuk melihat karakteristik dari tiap gerombol dapat melihat rataan dan standar deviasinya pada Lampiran 9.

Karakteristik dari masing-masing gerombol:

1. Gerombol satu: memiliki daun yang panjang dan luas dari gerombol lain, namun dicirikan pula dengan jumlah stomata yang sedikit.

0 2 4 6

2 3 4 5 6 7 8 9 10

P

S


(9)

13

2. Gerombol dua: memiliki ciri daun yang lebar dan bobot peko dua dan bobot peko tiga yang ringan.

3. Gerombol tiga: memiliki ciri daun yang relatif panjang.

4. Gerombol empat: memiliki lebar daun yang tinggi dan jumlah stomata yang banyak, namun gerombol ini memiliki jumlah bulu peko yang sedikit.

5. Gerombol lima: memiliki bobot peko dua dan bobot peko 3 yang besar. 6. Gerombol enam: memiliki jumlah bulu

peko yang banyak tetapi dengan tangkai daun yang relatif pendek.

7. Gerombol tujuh: dicirikan dengan tangkai daun yang panjang dan luas daun yang kecil.

Analisis Gerombol dengan Metode Pautan Lengkap

Hasil dari analisis komponen utama berupa data skor komponen utama masih dengan cara yang sama diterapkan analisis gerombol dengan metode pautan lengkap. dendogram dari metode ini dapat dilihat pada Lampiran 8.

Gambar 2 Grafik Pseudo-F untuk metode pautan lengkap

Penentuan solusi jumlah gerombol selanjutnya dilakukan dengan menggunakan Pseudo-F dan indeks Davies Bouldin, Dari Gambar 2 dapat dilihat bahwa titik puncak yang merupakan solusi gerombol yang baik berada pada jumlah gerombol 6, 8, 9, 10. kemudian untuk mengetahui solusi gerombol yang optimum dilakukan uji validitas gerombol dengan indeks Davies Bouldin. Tabel 4 Nilai indeks Davies Bouldin untuk

metode pautan lengkap

C 6 8 9 10

Indeks 1,504 1,391 1,437 1.479 Dari Tabel 4 terlihat bahwa jumlah gerombol delapan memiliki indeks yang terkecil maka solusi gerombol optimum yang dihasilkan oleh metode pautan lengkap adalah

delapan gerombol. Hasil dari penggerombolan dapat dilihat pada Tabel 5.

Tabel 5 Hasil gerombol dengan metode pautan lengkap

Gerombol Anggota Gerombol 1 BD_3 PG_3 GP_4 SA_33 2 BD_11 PG_11 BD_12 SA_12

BD_13 SA_49 Cin_1 Bks_6 Cin_60 GP_5 Cin_66 SA_72 Mal_16 Sin_2 Mel_48 Sin_5 3 BD_15 Cin_58 Cin_25

Cin_67 Cin_28 Cin_69 Cin_36 Cip_19 Cin_57 Skm_18

4 Cin_7 Wan_24/4 KP_1 5 Cin_13 Mel_108 Cip_18

PG_4 Cip_31 PG_7 GH_5 6 Cin_14 Cin_15

7 cip 37

8 GP_2 PG_5Mel_49 Pam_15 Mel_101 SA_64 Sin_3 Karakteristik Gerombol

Karakteristik dari tiap gerombol untuk metode pautan lengkap dapat dilihat pada Lampiran 10.

Karakteristik dari masing-masing gerombol:

1. Gerombol satu: dicirikan dengan tangkai daun yang panjang.

2. Gerombol dua: memiliki bobot peko 3 yang ringan.

3. Gerombol tiga: dicirikan dengan daun yang panjang dan luas.

4. Gerombol empat: memiliki jumlah bulu peko yang banyak tetapi dicirikan pula dengan jumlah stomata yang sedikit. 5. Gerombol lima: memiliki tangkai daun

yang pendek

6. Gerombol enam: memiliki daun yang lebar dan jumlah stomata yang banyak namun memiliki jumlah bulu peko yang sedikit.

7. Gerombol tujuh: memiliki bobot peko 2 dan bobot peko 3 yang ringan.

8. Gerombol delapan: memiliki daun yang relatif kecil serta bobot peko 2 yang ringan.

0 2 4 6

2 3 4 5 6 7 8 9 10

P

S


(10)

14

Perbandingan Metode

Hasil penggerombolan yang didapat dari metode pautan rataan dan lengkap dapat dibandingkan dengan melihat plot skor komponen utama.

Pada Gambar 3 dapat dilihat bahwa metode pautan rataan menghasilkan gerombol-gerombol yang terpisah cukup baik daripada metode pautan lengkap.

Gambar 3 Plot skor komponen utama

Hal ini menunjukan bahwa penggerombolan dengan metode pautan rataan lebih baik daripada metode pautan lengkap.

KESIMPULAN DAN SARAN

Kesimpulan

Analisis gerombol dari 50 klon teh contoh dengan metode pautan rataan menghasilkan tujuh gerombol yang optimum sedangkan metode pautan lengkap menghasilkan delapan gerombol yang optimum.

Dilihat dari keterpisahan gerombol melalui plot skor komponen utama penggerombolan 50 klon teh dengan metode pautan rataan menghasilkan gerombol yang lebih baik daripada metode pautan lengkap.

Saran

Penelitian selanjutnya sebaiknya terdapat informasi spesifik dari klon teh yang

dapat dijadikan acuan dalam menentukan jumlah gerombol.

DAFTAR PUSTAKA

Aunuddin. 1989. Analisis Data. Bogor: PAU Ilmu Hayat IPB.

Johnson RA, Wichern DW. 1988. Applied Multivariate Statistical Analysis, Ed ke-2. New Jersey: Prentice-Hall International, Inc.

Kaufma L, Peter JR. 1990. Finding Groups in Data, An Introduction to Cluster Analysis. New York: A John Wiley & Sons, Inc. Lim LKS, Acito F, Rusetski A. 2006.

Development of Arctypes of International Marketing Strategy. http://d.yimg.com /Lim,%2520Acito%2520%2526amp%253 B%2520Rusetski,%2520(2006)%2520JIB S.pdf. [16 Februari 2011].

[PPTK]. Pusat Penelitian Tanaman Teh dan Kina. 2006. Petunjuk Kultur Teknis Tanaman Teh. Gambung: PPTK.

Romesburg H. 1990. Cluster Analysis For Researchers. Florida: Robert E. Krieger Publishing Company, Inc.

Sartono B et al. 2003. Modul Teori Analisis Peubah Ganda. Bogor: Departemen Statistika, Institut Pertanian Bogor

Siswadi, Suharjo B. 1998. Analisis Eksplorasi Data peubah Ganda. Jurusan Matematika. Bogor: FMIPA, Institut Pertanian Bogor. Su MC. 2003. A New Index of Cluster

Validity.http://www.cs.missouri.edu/~skub icm/8820/ClusterValid.pdf. [16 Februari 2011]. 3 2 1 0 -1 -2 -3 -4 3 2 1 0 -1 -2 -3 -4 KU2 K U 1 1 2 3 4 5 6 7 avg7 Pautan Rataan 3 2 1 0 -1 -2 -3 -4 3 2 1 0 -1 -2 -3 -4 KU2 K U 1 1 2 3 4 5 6 7 8 co mp Pautan Lengkap


(11)

14

Perbandingan Metode

Hasil penggerombolan yang didapat dari metode pautan rataan dan lengkap dapat dibandingkan dengan melihat plot skor komponen utama.

Pada Gambar 3 dapat dilihat bahwa metode pautan rataan menghasilkan gerombol-gerombol yang terpisah cukup baik daripada metode pautan lengkap.

Gambar 3 Plot skor komponen utama

Hal ini menunjukan bahwa penggerombolan dengan metode pautan rataan lebih baik daripada metode pautan lengkap.

KESIMPULAN DAN SARAN

Kesimpulan

Analisis gerombol dari 50 klon teh contoh dengan metode pautan rataan menghasilkan tujuh gerombol yang optimum sedangkan metode pautan lengkap menghasilkan delapan gerombol yang optimum.

Dilihat dari keterpisahan gerombol melalui plot skor komponen utama penggerombolan 50 klon teh dengan metode pautan rataan menghasilkan gerombol yang lebih baik daripada metode pautan lengkap.

Saran

Penelitian selanjutnya sebaiknya terdapat informasi spesifik dari klon teh yang

dapat dijadikan acuan dalam menentukan jumlah gerombol.

DAFTAR PUSTAKA

Aunuddin. 1989. Analisis Data. Bogor: PAU Ilmu Hayat IPB.

Johnson RA, Wichern DW. 1988. Applied Multivariate Statistical Analysis, Ed ke-2. New Jersey: Prentice-Hall International, Inc.

Kaufma L, Peter JR. 1990. Finding Groups in Data, An Introduction to Cluster Analysis. New York: A John Wiley & Sons, Inc. Lim LKS, Acito F, Rusetski A. 2006.

Development of Arctypes of International Marketing Strategy. http://d.yimg.com /Lim,%2520Acito%2520%2526amp%253 B%2520Rusetski,%2520(2006)%2520JIB S.pdf. [16 Februari 2011].

[PPTK]. Pusat Penelitian Tanaman Teh dan Kina. 2006. Petunjuk Kultur Teknis Tanaman Teh. Gambung: PPTK.

Romesburg H. 1990. Cluster Analysis For Researchers. Florida: Robert E. Krieger Publishing Company, Inc.

Sartono B et al. 2003. Modul Teori Analisis Peubah Ganda. Bogor: Departemen Statistika, Institut Pertanian Bogor

Siswadi, Suharjo B. 1998. Analisis Eksplorasi Data peubah Ganda. Jurusan Matematika. Bogor: FMIPA, Institut Pertanian Bogor. Su MC. 2003. A New Index of Cluster

Validity.http://www.cs.missouri.edu/~skub icm/8820/ClusterValid.pdf. [16 Februari 2011]. 3 2 1 0 -1 -2 -3 -4 3 2 1 0 -1 -2 -3 -4 KU2 K U 1 1 2 3 4 5 6 7 avg7 Pautan Rataan 3 2 1 0 -1 -2 -3 -4 3 2 1 0 -1 -2 -3 -4 KU2 K U 1 1 2 3 4 5 6 7 8 co mp Pautan Lengkap


(12)

PENERAPAN ANALISIS GEROMBOL DAN TEKNIK

VALIDASI PADA PENGGEROMBOLAN KLON TEH

LEMMA FIRARI BOER

DEPARTEMEN STATISTIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR

BOGOR

2011


(13)

14

Perbandingan Metode

Hasil penggerombolan yang didapat dari metode pautan rataan dan lengkap dapat dibandingkan dengan melihat plot skor komponen utama.

Pada Gambar 3 dapat dilihat bahwa metode pautan rataan menghasilkan gerombol-gerombol yang terpisah cukup baik daripada metode pautan lengkap.

Gambar 3 Plot skor komponen utama

Hal ini menunjukan bahwa penggerombolan dengan metode pautan rataan lebih baik daripada metode pautan lengkap.

KESIMPULAN DAN SARAN

Kesimpulan

Analisis gerombol dari 50 klon teh contoh dengan metode pautan rataan menghasilkan tujuh gerombol yang optimum sedangkan metode pautan lengkap menghasilkan delapan gerombol yang optimum.

Dilihat dari keterpisahan gerombol melalui plot skor komponen utama penggerombolan 50 klon teh dengan metode pautan rataan menghasilkan gerombol yang lebih baik daripada metode pautan lengkap.

Saran

Penelitian selanjutnya sebaiknya terdapat informasi spesifik dari klon teh yang

dapat dijadikan acuan dalam menentukan jumlah gerombol.

DAFTAR PUSTAKA

Aunuddin. 1989. Analisis Data. Bogor: PAU Ilmu Hayat IPB.

Johnson RA, Wichern DW. 1988. Applied Multivariate Statistical Analysis, Ed ke-2. New Jersey: Prentice-Hall International, Inc.

Kaufma L, Peter JR. 1990. Finding Groups in Data, An Introduction to Cluster Analysis. New York: A John Wiley & Sons, Inc. Lim LKS, Acito F, Rusetski A. 2006.

Development of Arctypes of International Marketing Strategy. http://d.yimg.com /Lim,%2520Acito%2520%2526amp%253 B%2520Rusetski,%2520(2006)%2520JIB S.pdf. [16 Februari 2011].

[PPTK]. Pusat Penelitian Tanaman Teh dan Kina. 2006. Petunjuk Kultur Teknis Tanaman Teh. Gambung: PPTK.

Romesburg H. 1990. Cluster Analysis For Researchers. Florida: Robert E. Krieger Publishing Company, Inc.

Sartono B et al. 2003. Modul Teori Analisis Peubah Ganda. Bogor: Departemen Statistika, Institut Pertanian Bogor

Siswadi, Suharjo B. 1998. Analisis Eksplorasi Data peubah Ganda. Jurusan Matematika. Bogor: FMIPA, Institut Pertanian Bogor. Su MC. 2003. A New Index of Cluster

Validity.http://www.cs.missouri.edu/~skub icm/8820/ClusterValid.pdf. [16 Februari 2011]. 3 2 1 0 -1 -2 -3 -4 3 2 1 0 -1 -2 -3 -4 KU2 K U 1 1 2 3 4 5 6 7 avg7 Pautan Rataan 3 2 1 0 -1 -2 -3 -4 3 2 1 0 -1 -2 -3 -4 KU2 K U 1 1 2 3 4 5 6 7 8 co mp Pautan Lengkap


(14)

PENERAPAN ANALISIS GEROMBOL DAN TEKNIK

VALIDASI PADA PENGGEROMBOLAN KLON TEH

LEMMA FIRARI BOER

DEPARTEMEN STATISTIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR

BOGOR

2011


(15)

RINGKASAN

LEMMA FIRARI BOER. Penerapan Analisis Gerombol dan Teknik Validasi Pada Penggerombolan Klon Teh. Dibimbing oleh BUNAWAN SUNARLIM dan PIKA SILVIANTI.

Analisis gerombol adalah teknik untuk mengelompokkan objek ke dalam grup berdasarkan ukuran kemiripan atau ketidakmiripan. Analisis gerombol banyak digunakan dalam berbagai bidang disiplin ilmu, salah satunya adalah bidang pemuliaan tanaman. Dalam bidang pemuliaan tanaman penggerombolan digunakan untuk memudahkan dalam pemilihan tetua yang akan disilangkan. Hasil persilangan tersebut diharapkan memiliki rekombinasi sifat yang unggul. Pada penelitian ini metode gerombol yang digunakan adalah metode pautan rataan dan pautan lengkap. Untuk menentukan solusi gerombol yang optimum digunakan metode pseudo-F dan indeks validasi gerombol. Sebagai aplikasi digunakan data morfologi klon teh hasil penelitian kelti pemuliaan tanaman di Pusat Penelitian Tanaman Teh dan Kina (PPTK) Gambung tahun 2007. Hasil penggerombolan dengan metode pautan rataan didapat tujuh gerombol yang optimum sedangkan untuk metode pautan lengkap terdapat delapan gerombol yang optimum, dimana gerombol-gerombol untuk tiap metode memiliki karakteristik yang berbeda. Metode pautan rataan dapat menghasilkan gerombol yang lebih baik daripada metode pautan lengkap, hal ini dapat dilihat dari hasil plot skor komponen utama yang menunjukan gerombol-gerombol yang terpisah cukup baik.

Kata kunci: Analisis Gerombol, Pautan Rataan, Pautan Lengkap, Pseudo-F, Indeks Validasi Gerombol.


(16)

PENERAPAN ANALISIS GEROMBOL DAN TEKNIK

VALIDASI PADA PENGGEROMBOLAN KLON TEH

LEMMA FIRARI BOER

Skripsi Sebagai Salah Satu Syarat untuk Memperoleh

Gelar Sarjana Statistika pada Departemen Statistika

DEPARTEMEN STATISTIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR

BOGOR

2011


(17)

Judul :

Penerapan Analisis Gerombol dan Teknik Validasi pada Penggerombolan

Klon Teh

Nama :

Lemma Firari Boer

NRP

:

G14062578

Menyetujui,

Pembimbing I

Pembimbing II

(Ir. Bunawan Sunarlim, MS)

(Pika Silvianti, S.Si, M.Si)

NIP. 19471024 197303 1 001

Mengetahui,

Ketua Departemen Statistika

Fakultas Matematika dan Ilmu Pengetahuan Alam

Institut Pertanian Bogor

(Dr. Ir. Hari Wijayanto)

NIP. 19650421 1990021001


(18)

KATA PENGANTAR

Puji syukur penulis panjatkan kehadirat Allah SWT karena hanya atas rahmat dan karunia-Nya karya ilmiah ini dapat diselesaikan.

Terima kasih penulis ucapkan kepada berbagai pihak yang telah membantu penyelesaian karya ilmiah ini:

1. Bapak Ir. Bunawan Sunarlim, MS dan ibu Pika Silvianti, M.Si selaku pembimbing yang telah meluangkan waktu, serta memberikan saran dan masukan yang bermanfaat bagi penulis.

2. Bapak Bambang Sriyadi atas data penelitian serta saran dan arahan yang di berikan. 3. Papa, Mama, Pak de, oma, dan tante vi serta kepada seluruh keluarga penulis yang telah

sabar mendidik penulis dan memberi dorongan, doa, dan semangat.

4. Yogi Yunianto, atas dukungan, bantuan, dan masukan, yang telah diberikan kepada penulis.

5. Teman Seperjuangan:Tw, Apri, Dea, Anita, Defri, Nia, Nadia, dan semua teman STK 43 atas semangat dan bantuannya serta masukan yang diberikan.

6. Teman – teman GTM atas dukungan dan doanya.

7. Serta kepada semua pihak yang telah membantu penulis dalam proses penyusunan karya ilmiah ini, yang tidak dapat penulis tuliskan satu per satu.

Akhir kata, penulis meminta maaf apabila dalam proses penyusunan karya ilmiah ini terdapat kesalahan – kesalahan yang dilakukan oleh penulis. Semoga karya ilmiah ini bermanfaat.

Bogor, April 2011


(19)

RIWAYAT HIDUP

Penulis dilahirkan di kota Bogor pada tanggal 26 April 1988 sebagai anak pertama dari empat bersaudara dari pasangan Dirvamena Boer dan Dedeh Jubaedah.

Pada tahun 2000 penulis lulus dari SD Negeri I Kambu Kendari, dan melanjutkan ke sekolah menengah pertama SLTP Negeri 19 Bandung. Penulis menyelesaikan studi di SMU Kornita Bogor pada tahun 2006 dan pada tahun yang sama penulis diterima di Institut Pertanian Bogor melalui jalur Undangan Seleksi Masuk IPB (USMI). Pada tahun 2007, penulis diterima di departemen Statistika Institut Pertanian Bogor.

Selama mengikuti perkuliahan, penulis aktif mengikuti kepanitiaan acara yang menjadi Program Kerja GSB, antara lain Statistika Ria, SAS, SG dan lain-lain serta pernah mengikuti kegiatan survey yang dilaksanakan PT. ACA dan beberapa acara pentas seni IPB. Penulis mengikuti kegiatan praktik lapang di Pusat Penelitian Tanaman Teh dan Kina pada bulan Februari 2010 - April 2010.


(20)

DAFTAR ISI

Hal

DAFTAR TABEL………... viii

DAFTAR GAMBAR……… viii

DAFTAR LAMPIRAN………. viii

PENDAHULUAN Latar Belakang………. 1

Tujuan……….. 1

TINJAUAN PUSTAKA Tanaman Teh...….………...……...………...…………...……… 1

Analisis Deskriptif……….……….. 1

Korelasi Pearson.………. 1

Analisis Komponen Utama...……….. 1

Analisis Gerombol….……….. 2

Statistik Pseudo-F Calinski-Harabasz………...……….. 3

Validitas Gerombol……… 3

METODOLOGI Data………... 3

Metode……….. 3

HASIL DAN PEMBAHASAN Deskripsi Umum……….. 3

Korelasi Antar Peubah……….……… 4

Analisis Komponen Utama……….…….……… 4

Analisis Gerombol dengan Metode Pautan Rataan………..………... 4

Analisis Gerombol dengan Metode Pautan Lengkap………. 5

Perbandingan Metode……….………... 6

KESIMPULAN DAN SARAN Kesimpulan………... 6

Saran………. 6

DAFTAR PUSTAKA……… 6


(21)

DAFTAR TABEL

Hal

1. Statistik deskriptif data awal….……….. 3

2. Nilai indeks davies bouldin untuk metode pautan rataan……….. 4

3. Hasil gerombol dengan metode pautan rataan ……….. 4

4. Nilai indeks davies bouldin untuk metode pautan lengkap…..………... 5

5. Hasil gerombol dengan metode pautan lengkap……….... 5

DAFTAR GAMBAR

Hal 1. Grafik Pseudo-F untuk metode pautan rataan………. 4

2. Grafik Pseudo-F untuk metode pautan lengkap……….. 5

3. Plot skor komponen utama……….. 6

DAFTAR LAMPIRAN

Hal 1. Diagram alir tahapan analisis……… 8

2. Kode untuk masing-masing klon teh………. 9

3. Boxplot dari tiap peubah……….……….. 10

4. Korelasi antar peubah………..………. 10

5. Hasil analisis komponen utama………..……….. 11

6. Plot peubah komponen pertama dan kedua………..……….... 11

7. Dendogram metode pautan rataan……….... 11

8. Dendogram metode pautan lengkap………. 12

9. Rataan dan standar deviasi dari metode pautan rataan………. 12


(22)

9

PENDAHULUAN

Latar Belakang

Analisis gerombol adalah teknik untuk mengelompokkan objek ke dalam grup berdasarkan ukuran kemiripan atau ketidakmiripan. Saat ini metode penggerombolan digunakan secara luas oleh berbagai bidang disiplin ilmu, salah satunya adalah bidang pemuliaan tanaman.

Salah satu tujuan dari bidang ilmu pemuliaan tanaman adalah menemukan varietas atau klon unggul yang dapat tumbuh baik dan berdaya hasil tinggi. Klon unggul dapat diperoleh dengan persilangan atau penyerbukan silang antar dua tetua yang memiliki keunggulan dalam sifat tertentu. Sifat-sifat unggul ini dapat dilihat dari peubah fisik. Untuk memudahkan dalam pemilihan tetua perlu dilakukan penggerombolan, gerombol-gerombol yang terbentuk akan memiliki ciri tertentu yang menjadi acuan dalam pemilihan tetua.

Karena tidak ada informasi mengenai jumlah gerombol maka metode yang digunakan adalah metode berhirarki. Penentuan jumlah gerombol biasanya dilakukan dengan memotong dendogram pada selisih jarak penggabungan terbesar. Namun cara ini lebih bersifat subjektif karena tidak selalu pada selisih jarak penggabungan terbesar jumlah gerombol dipilih.

Pada penelitian ini jumlah gerombol akan ditentukan dengan mengkombinasikan metode pseudo-f dan indeks validasi gerombol Davies Bouldin. Dengan metode tersebut diharapkan dapat mengurangi masalah subjektifitas dalam penentuan jumlah gerombol.

Tujuan

Tujuan dari penelitian ini adalah menggerombolkan klon-klon teh berdasarkan kemiripan peubah fisik dan menerapkan metode pseudo-f dan indeks validasi gerombol.

TINJAUAN PUSTAKA Tanaman Teh

Tanaman teh (Camellia sinensis (L.) O.Kuntze) adalah tanaman perkebunan yang termasuk bahan penyegar. Hasil tanaman berupa pucuk daun diolah dan dimanfaatkan sebagai bahan minuman. Mengkonsumsi teh selain menyegarkan tubuh, ternyata juga memberi manfaat bagi kesehatan. Senyawa bermanfaat yang dikandung pucuk teh antara lain adalah polifenol dan flourida. Polifenol

bermanfaat sebagai anti kanker dan fluorida bermanfaat bagi kesehatan gigi (Pambudi 2000).

Tanaman teh dapat hidup pada daerah rendah (< 800 m dpl), sedang (800-1200 m dpl), dan tinggi (> 1200 m dpl). Selain itu untuk dapat tumbuh dengan baik tanaman teh membutuhkan suhu 13 – 250 C, kelembapan relatif pada siang hari tidak kurang dari 70%, dan sinar matahari yang cukup dengan curah hujan tidak kurang dari 2000 mm/tahun (PPTK 2006).

Kondisi tanah merupakan faktor cukup untuk pertumbuhan teh, umumnya tanah yang serasi dengan tanaman teh adalah tanah andosol karena banyak mengandung bahan organik, struktur tanah tidak keras dengan pH 4,5-5,5 (PPTK 2006).

Analisis Deskriptif

Analisis deskriptif adalah metode yang berkaitan dengan pengumpulan data dan penyajian gugus data sehingga menghasilkan informasi yang berguna. Penyajian ini dimaksudkan untuk mengungkapkan informasi penting yang terdapat pada data ke dalam bentuk yang lebih ringkas dan sederhana yang akhirnya mengarah pada keperluan adanya penjelasan dan penafsiran (Aunuddin, 1989).

Analisis deskriptif dilakukan untuk keperluan analisis selanjutnya jika diperlukan. Akan tetapi jika dari hasil analisis deskriptif sudah dapat diambil kesimpulan yang tepat., maka tidak perlu menggunakan analisis yang rumit (Aunuddin, 1989).

Korelasi Pearson

Koefisien korelasi Pearson berguna untuk mengetahui hubungan linier antar peubah. Pada contoh berukuran n, koefisien ini dirumuskan sebagai berikut:

= ∑ ௜̅௜̅ ௡ ௜ୀଵ ∑ ௜̅ ଶ ௡

௜ୀଵ ∑ ௜̅

ଶ ௡

௜ୀଵ

Dengan hipotesis:

H0: ρ = 0 (tidak ada korelasi antar peubah).

H1: ρ≠ 0 (terdapat korelasi antar peubah).

Sedangkan statistik ujinya:

ݐ=ݎඨ݊− 2 1 −ݎଶ

Wilayah kritis bagi H1 terletak pada t < -tα/2;v


(23)

10

Analisis Komponen Utama

Analisis komponen utama merupakan pendekatan statistika untuk mereduksi gugus peubah asal berdimensi p menjadi gugus peubah baru (komponen utama) berdimensi q dimana (q ≤ p). Sifat dari gugus peubah komponen utama adalah memiliki ragam maksimum, antar peubah komponen utama saling bebas, dan merupakan kombinasi linier dari peubah asal.

Misalkan λ1 ≥ λ2 ≥ … ≥ λp > 0 adalah akar ciri yang berpadanan dengan vektor ciri a1, a2, …, ap dari matriks ragam peragam (ΣΣΣΣ)

atau matriks korelasi (R) dimana matriks ragam peragam (ΣΣΣΣ) digunakan jika satuan peubah sama sedangkan matriks korelasi (R) digunakan jika satuan peubah berbeda. Panjang dari setiap vektor ciri masing masing adalah 1 (ai’ai = 1), untuk i = 1, 2, …, p.

Maka,

KU1 = a1’x, dengan var(KU1) = λ1

…,

KUp = ap’x, dengan var(KUp) = λp

berturut-turut adalah komponen utama pertama, kedua, …, ke-p dari x. Karena total keragaman ditunjukan oleh tr(ΣΣΣΣ) maka total keragaman ini sama dengan jumlah dari seluruh akar cirinya yaitu ∑ . Jadi

persentase total keragaman yang mampu dijelaskan oleh komponen utama ke-i adalah

∑೛೔సభ೔

×100%.

Analisis Gerombol

Analisis gerombol merupakan suatu metode peubah ganda untuk mengelompokkan n objek ke dalam m gerombol (m≤n) berdasarkan karakter-karakternya (Johnson & Wichern 2002).

Analisis gerombol bertujuan untuk mengelompokan sekumpulan objek ke dalam satu atau lebih gerombol sehingga objek-objek yang berada dalam satu gerombol memiliki homogenitas yang tinggi dan memiliki heterogenitas yang tinggi antar gerombol (Sartono 2003).

1. Ukuran Kemiripan atau Ketidakmiripan Untuk bisa menggerombolkan suatu objek, tentunya pertama harus ditentukan dulu ukuran kemiripan atau ketakmiripan antar objek. Dengan memiliki sebuah ukuran kuantitatif maka akan lebih mudah menentukan objek mana yang mirip dan yang tidak mirip, sehingga proses penggerombolan akan lebih mudah.

Jarak Euclid digunakan jika antar peubah memiliki satuan yang sama, keragaman yang

sama, dan tidak saling berkorelasi (Johnson & Wichern 2002). Jarak Euclid dirumuskan sebagai:

,=−′

Sedangkan jika satuan antar peubah tidak sama dapat digunakan jarak Euclid yang telah ditransformasi ke dalam bentuk baku. Jika terdapat korelasi antar peubah maka dapat digunakan jarak Mahalanobis atau jarak Euclid dengan peubah asal yang telah ditransformasi menggunakan analisis komponen utama (Kaufma & Peter 1990). Jarak Mahalonobis dirumuskan sebagai:

,=−′

2. Metode Hirarki

Metode penggerombolan berhirarki digunakan jika banyaknya gerombol yang akan dibentuk belum diketahui sebelumnya. Metode berhirarki dapat dibedakan menjadi metode penggabungan (agglomerative) dan metode pembagian (divisive).

Bila suatu gerombol merupakan penggabungan dari beberapa gerombol sebelumnya, maka diperlukan ukuran ketakmiripan antar gerombol. Terdapat beberapa ukuran ketakmiripan antar gerombol.

1. Metode pautan tunggal (single linkage): jarak antar gerombol adalah jarak tedekat dari dua anggota gerombol yang berbeda.

= min

∈ే

∈ై

d(,)

2. Metode pautan lengkap (complete linkage): jarak antar gerombol adalah jarak terjauh dari dua anggota gerombol yang berbeda.

= max

∈ే

∈ై

d(,)

3. Metode pautan rataan (average linkage): Jarak antar gerombol adalah rataan dari jarak tiap pasangan observasi.

= 1

n n d(,)

∈ై

∈ే

Kaufman dan Peter (1990) mencontohkan jika pengguna memperkirakan memiliki kelompok dengan jarak antar kelompoknya panjang maka digunakan pautan tunggal, tetapi untuk kelompok yang padat yang mana tidak ada dua objek yang saling berjauhan maka digunakan pautan lengkap.


(24)

11

Statistik Pseudo-F Calinski-Harabasz Statistik Pseudo-F Calinski Harabasz bertujuan untuk mendapatkan keketatan dari gerombol, dan merupakan rasio dari kuadrat tengah antar gerombol dengan kuadrat tengah dalam gerombol (Lattin et al. 2003, diacu dalam Lim et al. 2006).

Pseudo-F = ்ି௉ ಸ/(ீିଵ)

ಸ/(௡ିீ)

dimana:

G = jumlah gerombol. T = jumlah kuadrat total. PG = jumlah kuadrat dalam grup.

Nilai pseudo-F yang besar mengindikasi solusi gerombol yang baik namun nilai pseudo-F ini akan semakin besar seiring dengan meningkatnya jumlah gerombol. Sehingga kriteria pemilihan solusi gerombol optimum terdapat pada titik puncak dari nilai pseudo-F (Lattin et al. 2003, diacu dalam Lim et al. 2006).

Validitas Gerombol

Indeks validasi digunakan untuk mengukur seberapa baik hasil penggerombolan dibandingkan hasil lain dengan algoritma yang sama atau berbeda.

Salah satu indeks yang bisa dijadikan tolok ukur dalam pengujian validitas cluster adalah indeks Davies-Bouldin.

Rumus indeks Davies-Bouldin dapat ditulis sebagai:

= 1 max

′+′ , di mana:

n = jumlah kelompok

d(ci,cj) = jarak antar kelompok ci dan cj

d'(ck) = jarak dalam kelompok ck

Nilai indeks Davies-Bouldin yang kecil menunjukkan kelompok yang baik (Su 2003).

METODOLOGI

Data

Data yang digunakan adalah data penelitian pemuliaan tanaman di Pusat Penelitian Teh dan Kina (PPTK) Gambung tahun 2007. Data ini merupakan data rataan dari pengamatan terhadap 50 jenis klon teh, yang disajikan dalam Lampiran 2.

Adapun peubah-peubah yang diamati adalah sebagai berikut:

1. X1 = Panjang Daun (cm). 2. X2 = Lebar Daun (cm). 3. X3 = Luas Daun (cm2).

4. X4 = Panjang Tangkai Daun (cm). 5. X5 = Bobot Peko+2 (gram). 6. X6 = Bobot Peko+3 (gram). 7. X7 = Jumlah Bulu Peko (satuan). 8. X8 = Jumlah Stomata (satuan).

Metode

Langkah-langkah yang dilakukan dalam penelitian ini adalah:

1. Melakukan analisis deskriptif terhadap data yang digunakan.

2. Mencari korelasi antar peubah.

3. Jika diantara peubah-peubah tersebut mengindikasikan adanya korelasi yang nyata pada taraf 5% maka lakukan analisis komponen utama dengan menggunakan matriks korelasi karena satuan peubah berbeda.

4. Mencari matriks jarak Euclid klon yang satu dengan lainnya dari data skor komponen utama kemudian melakukan analisis gerombol dengan metode pautan rataan dan pautan lengkap.

5. Mencari nilai pseudo-F dan uji validitas gerombol untuk mengetahui solusi gerombol yang optimum.

6. Membandingkan hasil akhir gerombol dari tiap metode dengan melihat plot skor komponen utama.

HASIL DAN PEMBAHASAN

Deskripsi Umum

Statistik deskripsi data awal dapat dilihat pada Tabel 1 dan ditampilkan dalam bentuk boxplot dalam Lampiran 3.

Tabel 1 Statistik deskriptif data awal Peubah Min Max Rataan Stdev

X1 7.28 12.29 10.2668 1.1348 X2 3.45 5.48 4.3016 0.5785 X3 17.58 43.93 30.9144 7.2095 X4 0.31 0.51 0.424 0.0473 X5 0.28 1.21 0.6994 0.1764 X6 0.57 2.46 1.2116 0.3914 X7 14.06 65.94 37.6116 12.2406 X8 25.5 53.06 38.3994 5.8697 Pada Lampiran 3 dapat dilihat keragaman dari tiap peubah berdasarkan satuannya. Peubah X3, X7, dan X8 memiliki keragaman yang besar sebaliknya peubah X4 memiliki keragaman yang rendah.


(25)

12

Korelasi Antar Peubah

Korelasi antarpeubah yang digunakan sebagai dasar penggerombolan dapat dilihat pada Lampiran 4. Terdapat 8 pasang peubah yang memiliki korelasi yang nyata pada taraf 5%, dimana korelasi terbesar dan nyata yaitu antara luas daun dengan lebar daun sebesar 0.947 yang menunjukan adanya hubungan linier yang sangat baik antara luas daun dan lebar daun.

Adapun korelasi negatif terkecil dan nyata yaitu antara jumlah bulu peko dengan bobot peko 2 sebesar -0.293 yang berarti kekuatan hubungan linier antara jumlah bulu peko dengan bobot peko 2 lemah.

Analisis Komponen Utama

Untuk mereduksi dimensi peubah tetapi dapat mempertahankan sebagian informasi dari peubah tersebut maka data dianalisis menggunakan analisis komponen utama. Dalam Lampiran 5 dapat dilihat bahwa 2 komponen utama yang pertama dapat menjelaskan total keragaman sebesar 62.5%. Artinya 62.5% informasi yang terkandung dalam peubah asal dapat dijelaskan oleh 2 komponen utama tersebut.

Untuk melihat pola penyebaran klon maka dibentuk plot dua komponen pertama dan kedua seperti pada Lampiran 6. Dari plot tersebut dapat dilihat bahwa pola penyebaran skor klon terlihat padat dan tidak terpisah secara baik.

Hasil dari analisis komponen utama yaitu data skor komponen utama selanjutnya digunakan dalam analisis gerombol. Seluruh peubah komponen utama dimasukan dalam analisis gerombol agar seluruh informasi mengenai peubah asal dapat diperoleh.

Analisis Gerombol dengan Metode Pautan Rataan

Hasil dari komponen utama yaitu data skor komponen selanjutnya digerombolkan menggunakan metode pautan rataan. Dendogram metode pautan rataan dapat dilihat pada Lampiran 7.

Gambar 1 Grafik Pseudo-F untuk metode pautan rataan

Penentuan solusi jumlah gerombol selanjutnya dilakukan dengan menggunakan Pseudo-F dan indeks Davies Bouldin, dari Gambar 1 dapat dilihat bahwa kandidat solusi gerombol yang baik berada pada jumlah gerombol 4, 7, 9, dan 10. kemudian dari empat solusi gerombol tersebut dicari nilai indeks Davies Bouldin untuk mengukur seberapa baik hasil penggerombolan tersebut. Tabel 2 Nilai indeks Davies Bouldin untuk

metode pautan rataan

C 4 7 9 10

Indeks 1,288 1,104 1,214 1,281 Dari Tabel 2 dapat dilihat bahwa jumlah gerombol tujuh memiliki nilai indeks yang terkecil, maka tujuh gerombol adalah solusi optimum yang dihasilkan metode pautan rataan.

Tabel 3 Hasil gerombol dengan metode pautan rataan

Gerombol Anggota Gerombol

1 BD_3 Cin_58 BD_15 Cin_67 Cin_ Cin_69 Cin_25 Cip_19 Cin_28 Wan_24/4 Cin_36 KP_1 Cin_57 PG_3 Skm_18

2 BD_11 PG_5 BD_12 PG_11 BD_13 SA_12 Cin_1 SA_49 Cin_60 PG_7 Cin_66 Bks_6 GP_2 GP_5 Mal_16 Pam_15 Mel_48 SA_64 Mel_49 SA_72 Mel_101 Sin_2 PG_4 Sin_3 Sin_5

3 Cin_13 Cip_31 Cip_18 Mel_108

4 Cin_14 Cin_15

5 Cip_37

6 GH_5

7 GP_4 SA_33 Karakteristik Gerombol

Untuk melihat karakteristik dari tiap gerombol dapat melihat rataan dan standar deviasinya pada Lampiran 9.

Karakteristik dari masing-masing gerombol:

1. Gerombol satu: memiliki daun yang panjang dan luas dari gerombol lain, namun dicirikan pula dengan jumlah stomata yang sedikit.

0 2 4 6

2 3 4 5 6 7 8 9 10

P

S


(26)

13

2. Gerombol dua: memiliki ciri daun yang lebar dan bobot peko dua dan bobot peko tiga yang ringan.

3. Gerombol tiga: memiliki ciri daun yang relatif panjang.

4. Gerombol empat: memiliki lebar daun yang tinggi dan jumlah stomata yang banyak, namun gerombol ini memiliki jumlah bulu peko yang sedikit.

5. Gerombol lima: memiliki bobot peko dua dan bobot peko 3 yang besar. 6. Gerombol enam: memiliki jumlah bulu

peko yang banyak tetapi dengan tangkai daun yang relatif pendek.

7. Gerombol tujuh: dicirikan dengan tangkai daun yang panjang dan luas daun yang kecil.

Analisis Gerombol dengan Metode Pautan Lengkap

Hasil dari analisis komponen utama berupa data skor komponen utama masih dengan cara yang sama diterapkan analisis gerombol dengan metode pautan lengkap. dendogram dari metode ini dapat dilihat pada Lampiran 8.

Gambar 2 Grafik Pseudo-F untuk metode pautan lengkap

Penentuan solusi jumlah gerombol selanjutnya dilakukan dengan menggunakan Pseudo-F dan indeks Davies Bouldin, Dari Gambar 2 dapat dilihat bahwa titik puncak yang merupakan solusi gerombol yang baik berada pada jumlah gerombol 6, 8, 9, 10. kemudian untuk mengetahui solusi gerombol yang optimum dilakukan uji validitas gerombol dengan indeks Davies Bouldin. Tabel 4 Nilai indeks Davies Bouldin untuk

metode pautan lengkap

C 6 8 9 10

Indeks 1,504 1,391 1,437 1.479 Dari Tabel 4 terlihat bahwa jumlah gerombol delapan memiliki indeks yang terkecil maka solusi gerombol optimum yang dihasilkan oleh metode pautan lengkap adalah

delapan gerombol. Hasil dari penggerombolan dapat dilihat pada Tabel 5.

Tabel 5 Hasil gerombol dengan metode pautan lengkap

Gerombol Anggota Gerombol 1 BD_3 PG_3 GP_4 SA_33 2 BD_11 PG_11 BD_12 SA_12

BD_13 SA_49 Cin_1 Bks_6 Cin_60 GP_5 Cin_66 SA_72 Mal_16 Sin_2 Mel_48 Sin_5 3 BD_15 Cin_58 Cin_25

Cin_67 Cin_28 Cin_69 Cin_36 Cip_19 Cin_57 Skm_18

4 Cin_7 Wan_24/4 KP_1 5 Cin_13 Mel_108 Cip_18

PG_4 Cip_31 PG_7 GH_5 6 Cin_14 Cin_15

7 cip 37

8 GP_2 PG_5Mel_49 Pam_15 Mel_101 SA_64 Sin_3 Karakteristik Gerombol

Karakteristik dari tiap gerombol untuk metode pautan lengkap dapat dilihat pada Lampiran 10.

Karakteristik dari masing-masing gerombol:

1. Gerombol satu: dicirikan dengan tangkai daun yang panjang.

2. Gerombol dua: memiliki bobot peko 3 yang ringan.

3. Gerombol tiga: dicirikan dengan daun yang panjang dan luas.

4. Gerombol empat: memiliki jumlah bulu peko yang banyak tetapi dicirikan pula dengan jumlah stomata yang sedikit. 5. Gerombol lima: memiliki tangkai daun

yang pendek

6. Gerombol enam: memiliki daun yang lebar dan jumlah stomata yang banyak namun memiliki jumlah bulu peko yang sedikit.

7. Gerombol tujuh: memiliki bobot peko 2 dan bobot peko 3 yang ringan.

8. Gerombol delapan: memiliki daun yang relatif kecil serta bobot peko 2 yang ringan.

0 2 4 6

2 3 4 5 6 7 8 9 10

P

S


(27)

14

Perbandingan Metode

Hasil penggerombolan yang didapat dari metode pautan rataan dan lengkap dapat dibandingkan dengan melihat plot skor komponen utama.

Pada Gambar 3 dapat dilihat bahwa metode pautan rataan menghasilkan gerombol-gerombol yang terpisah cukup baik daripada metode pautan lengkap.

Gambar 3 Plot skor komponen utama

Hal ini menunjukan bahwa penggerombolan dengan metode pautan rataan lebih baik daripada metode pautan lengkap.

KESIMPULAN DAN SARAN

Kesimpulan

Analisis gerombol dari 50 klon teh contoh dengan metode pautan rataan menghasilkan tujuh gerombol yang optimum sedangkan metode pautan lengkap menghasilkan delapan gerombol yang optimum.

Dilihat dari keterpisahan gerombol melalui plot skor komponen utama penggerombolan 50 klon teh dengan metode pautan rataan menghasilkan gerombol yang lebih baik daripada metode pautan lengkap.

Saran

Penelitian selanjutnya sebaiknya terdapat informasi spesifik dari klon teh yang

dapat dijadikan acuan dalam menentukan jumlah gerombol.

DAFTAR PUSTAKA

Aunuddin. 1989. Analisis Data. Bogor: PAU Ilmu Hayat IPB.

Johnson RA, Wichern DW. 1988. Applied Multivariate Statistical Analysis, Ed ke-2. New Jersey: Prentice-Hall International, Inc.

Kaufma L, Peter JR. 1990. Finding Groups in Data, An Introduction to Cluster Analysis. New York: A John Wiley & Sons, Inc. Lim LKS, Acito F, Rusetski A. 2006.

Development of Arctypes of International Marketing Strategy. http://d.yimg.com /Lim,%2520Acito%2520%2526amp%253 B%2520Rusetski,%2520(2006)%2520JIB S.pdf. [16 Februari 2011].

[PPTK]. Pusat Penelitian Tanaman Teh dan Kina. 2006. Petunjuk Kultur Teknis Tanaman Teh. Gambung: PPTK.

Romesburg H. 1990. Cluster Analysis For Researchers. Florida: Robert E. Krieger Publishing Company, Inc.

Sartono B et al. 2003. Modul Teori Analisis Peubah Ganda. Bogor: Departemen Statistika, Institut Pertanian Bogor

Siswadi, Suharjo B. 1998. Analisis Eksplorasi Data peubah Ganda. Jurusan Matematika. Bogor: FMIPA, Institut Pertanian Bogor. Su MC. 2003. A New Index of Cluster

Validity.http://www.cs.missouri.edu/~skub icm/8820/ClusterValid.pdf. [16 Februari 2011]. 3 2 1 0 -1 -2 -3 -4 3 2 1 0 -1 -2 -3 -4 KU2 K U 1 1 2 3 4 5 6 7 avg7 Pautan Rataan 3 2 1 0 -1 -2 -3 -4 3 2 1 0 -1 -2 -3 -4 KU2 K U 1 1 2 3 4 5 6 7 8 co mp Pautan Lengkap


(28)

(29)

Lampiran 1. Diagram Alirlir Tahapan Analisis

Data Teh

Analisis Deskriptif

Korelasi Pearson

AKU

Data Skor Komponen

Analisis Gerombol Hirarki

Pseudo-F

Uji Validitas Gerombol

Jumlah Gerombol Optimum


(30)

Lampiran 2. Kode Untuk Masing-masing Klon Teh No.Klon Jenis Klon No.Klon Jenis Klon

1 BD_3 26 Mel_48

2 BD_11 27 Mel_49

3 BD_12 28 Mel_101

4 BD_13 29 Mel_108

5 BD_15 30 PG_4

6 Cin_1 31 PG_5

7 Cin_7 32 PG_11

8 Cin_13 33 SA_12

9 Cin_14 34 SA_49

10 Cin_15 35 PG_7

11 Cin_25 36 Wan_24/4

12 Cin_28 37 Bks_6

13 Cin_36 38 GH_5

14 Cin_57 39 GP_4

15 Cin_58 40 GP_5

16 Cin_60 41 KP_1

17 Cin_66 42 Pam_15

18 Cin_67 43 PG_3

19 Cin_69 44 SA_33

20 Cip_18 45 SA_64

21 Cip_19 46 SA_72

22 Cip_31 47 Sin_2

23 Cip_37 48 Sin_3

24 GP_2 49 Sin_5


(31)

Lampiran 3. Boxplot dari tiap peubah

Lampiran 4. Korelasi Antar Peubah

X1 X2 X3 X4 X5 X6 X7 X2 0.752*

0.000

X3 0.853* 0.947* 0.000 0.000

X4 0.276 0.223 0.240 0.052 0.119 0.093

X5 0.184 0.464* 0.364* 0.101 0.200 0.001 0.009 0.485

X6 0.082 0.342* 0.249 0.011 0.752* 0.573 0.015 0.081 0.940 0.000

X7 -0.065 -0.249 -0.199 0.151 -0.293* -0.178 0.652 0.081 0.165 0.294 0.039 0.215

X8 -0.116 0.044 -0.085 -0.189 0.209 0.185 -0.198 0.423 0.761 0.559 0.189 0.145 0.199 0.168

Cell Contents: Pearson correlation P-Value

X4 X2

X1 12

10

8

6

4

2

0

D

a

t

a

Boxplot of X1, X2, X4

45

40

35

30

25

20

X

3

Boxplot of X3

X6 X5

2.5

2.0

1.5

1.0

0.5

0.0

D

a

t

a

Boxplot of X5, X6

X8 X7

70

60

50

40

30

20

10

D

a

t

a


(32)

Lampiran 5. Hasil Analisis Komponen Utama

Eigenvalue 3.231 1.766 1.064 0.771 0.712 0.227 0.200 0.030

Proportion 0.404 0.221 0.133 0.096 0.089 0.028 0.025 0.004

Cumulative 0.404 0.625 0.758 0.854 0.943 0.971 0.996 1.000

Lampiran 6. Plot Peubah Komponen Pertama dan Kedua

Lampiran 7. Dendogram Metode Pautan Rataan

3 2 1 0 -1 -2 -3 -4 3

2

1

0

-1

-2

-3

-4

KU2

K

U

1

Scatterplot of KU1 vs KU2

23 44 39 38 28 27 35 30 42 46 40 33 32 45 31 48 24 4 34 17 6 25 47 37 26 3 49 16 2 10 9 29 20 22 8 15 14 21 18 12 13 19 11 7 50 5 41 36 43 1

5.50

3.67

1.83

0.00

Obs erv at ions

D

is

t

a

n

c

e

Dendrogram Average Linkage, Euclidean Distance


(33)

Lampiran 8. Dendogram Metode Pautan Lengkap

Lampiran 9. Rataan dan Standar Deviasi dari Metode Pautan Rataan

gerombol x1 x2 x3 x4 x5 x6 x7 x8

1 rataan 11.433 4.852 38.921 0.454 0.768 1.303 39.825 36.258 stdev 0.691 0.308 3.252 0.034 0.108 0.263 12.559 4.965 2 rataan 9.606 3.871 25.688 0.413 0.583 0.959 39.434 38.222 stdev 0.931 0.350 4.488 0.048 0.125 0.245 10.442 5.493 3 rataan 10.305 4.483 32.125 0.383 0.858 1.575 23.113 37.263

stdev 0.386 0.300 2.586 0.025 0.091 0.115 3.781 6.138

4 rataan 10.895 5.220 38.800 0.425 0.825 1.475 17.420 52.060

stdev 0.389 0.057 2.079 0.035 0.092 0.233 4.752 1.414

5 rataan 9.710 5.080 35.940 0.390 1.210 2.460 24.390 42.110

stdev - - - -

6 rataan 10.590 4.140 29.110 0.350 0.650 1.840 56.670 39.830

stdev - - - -

7 rataan 9.200 3.965 24.280 0.470 0.970 1.755 44.500 42.720

stdev 0.453 0.049 0.042 0.014 0.014 0.276 2.362 1.725

28 42 45 31 27 48 24 41 36 7 15 14 21 18 12 13 19 11 50 5 38 35 30 29 20 22 8 46 40 33 32 47 37 26 34 17 6 25 3 4 49 16 2 23 10 9 44 39 43 1

7.88

5.26

2.63

0.00

Obs erv at ions

D

is

t

a

n

c

e

Dendrogram Complete Linkage, Euclidean Distance


(34)

Lampiran 10. Rataan dan Standar Deviasi dari Metode Pautan Lengkap

gerombol x1 x2 x3 x4 x5 x6 x7 x8

1 rataan 10.208 4.245 29.725 0.485 0.898 1.628 46.570 42.095

stdev 1.199 0.381 6.748 0.021 0.084 0.413 2.986 1.336

2 rataan 9.998 4.044 27.680 0.436 0.579 0.893 37.542 37.691

stdev 0.747 0.318 4.030 0.037 0.133 0.223 9.223 5.727

3 rataan 11.685 4.982 40.378 0.437 0.755 1.249 34.255 37.310

stdev 0.356 0.248 2.385 0.027 0.130 0.231 10.183 3.420

4 rataan 10.737 4.637 36.563 0.480 0.773 1.353 52.517 29.277

stdev 1.287 0.258 2.532 0.017 0.040 0.032 12.688 3.698

5 rataan 10.163 4.191 29.849 0.361 0.783 1.520 29.351 39.657

stdev 0.451 0.455 3.713 0.034 0.115 0.242 12.568 5.506

6 rataan 10.895 5.220 38.800 0.425 0.825 1.475 17.420 52.060

stdev 0.389 0.057 2.079 0.035 0.092 0.233 4.752 1.414

7 rataan 9.710 5.080 35.940 0.390 1.210 2.460 24.390 42.110

stdev - - - -

8 rataan 8.691 3.543 21.141 0.386 0.559 1.026 46.977 37.683


(35)

(36)

Lampiran 1. Diagram Alirlir Tahapan Analisis

Data Teh

Analisis Deskriptif

Korelasi Pearson

AKU

Data Skor Komponen

Analisis Gerombol Hirarki

Pseudo-F

Uji Validitas Gerombol

Jumlah Gerombol Optimum


(37)

Lampiran 2. Kode Untuk Masing-masing Klon Teh No.Klon Jenis Klon No.Klon Jenis Klon

1 BD_3 26 Mel_48

2 BD_11 27 Mel_49

3 BD_12 28 Mel_101

4 BD_13 29 Mel_108

5 BD_15 30 PG_4

6 Cin_1 31 PG_5

7 Cin_7 32 PG_11

8 Cin_13 33 SA_12

9 Cin_14 34 SA_49

10 Cin_15 35 PG_7

11 Cin_25 36 Wan_24/4

12 Cin_28 37 Bks_6

13 Cin_36 38 GH_5

14 Cin_57 39 GP_4

15 Cin_58 40 GP_5

16 Cin_60 41 KP_1

17 Cin_66 42 Pam_15

18 Cin_67 43 PG_3

19 Cin_69 44 SA_33

20 Cip_18 45 SA_64

21 Cip_19 46 SA_72

22 Cip_31 47 Sin_2

23 Cip_37 48 Sin_3

24 GP_2 49 Sin_5


(38)

Lampiran 3. Boxplot dari tiap peubah

Lampiran 4. Korelasi Antar Peubah

X1 X2 X3 X4 X5 X6 X7 X2 0.752*

0.000

X3 0.853* 0.947* 0.000 0.000

X4 0.276 0.223 0.240 0.052 0.119 0.093

X5 0.184 0.464* 0.364* 0.101 0.200 0.001 0.009 0.485

X6 0.082 0.342* 0.249 0.011 0.752* 0.573 0.015 0.081 0.940 0.000

X7 -0.065 -0.249 -0.199 0.151 -0.293* -0.178 0.652 0.081 0.165 0.294 0.039 0.215

X8 -0.116 0.044 -0.085 -0.189 0.209 0.185 -0.198 0.423 0.761 0.559 0.189 0.145 0.199 0.168

Cell Contents: Pearson correlation P-Value

X4 X2

X1 12

10

8

6

4

2

0

D

a

t

a

Boxplot of X1, X2, X4

45

40

35

30

25

20

X

3

Boxplot of X3

X6 X5

2.5

2.0

1.5

1.0

0.5

0.0

D

a

t

a

Boxplot of X5, X6

X8 X7

70

60

50

40

30

20

10

D

a

t

a


(39)

Lampiran 5. Hasil Analisis Komponen Utama

Eigenvalue 3.231 1.766 1.064 0.771 0.712 0.227 0.200 0.030

Proportion 0.404 0.221 0.133 0.096 0.089 0.028 0.025 0.004

Cumulative 0.404 0.625 0.758 0.854 0.943 0.971 0.996 1.000

Lampiran 6. Plot Peubah Komponen Pertama dan Kedua

Lampiran 7. Dendogram Metode Pautan Rataan

3 2 1 0 -1 -2 -3 -4 3

2

1

0

-1

-2

-3

-4

KU2

K

U

1

Scatterplot of KU1 vs KU2

23 44 39 38 28 27 35 30 42 46 40 33 32 45 31 48 24 4 34 17 6 25 47 37 26 3 49 16 2 10 9 29 20 22 8 15 14 21 18 12 13 19 11 7 50 5 41 36 43 1

5.50

3.67

1.83

0.00

Obs erv at ions

D

is

t

a

n

c

e

Dendrogram Average Linkage, Euclidean Distance


(40)

Lampiran 8. Dendogram Metode Pautan Lengkap

Lampiran 9. Rataan dan Standar Deviasi dari Metode Pautan Rataan

gerombol x1 x2 x3 x4 x5 x6 x7 x8

1 rataan 11.433 4.852 38.921 0.454 0.768 1.303 39.825 36.258 stdev 0.691 0.308 3.252 0.034 0.108 0.263 12.559 4.965 2 rataan 9.606 3.871 25.688 0.413 0.583 0.959 39.434 38.222 stdev 0.931 0.350 4.488 0.048 0.125 0.245 10.442 5.493 3 rataan 10.305 4.483 32.125 0.383 0.858 1.575 23.113 37.263

stdev 0.386 0.300 2.586 0.025 0.091 0.115 3.781 6.138

4 rataan 10.895 5.220 38.800 0.425 0.825 1.475 17.420 52.060

stdev 0.389 0.057 2.079 0.035 0.092 0.233 4.752 1.414

5 rataan 9.710 5.080 35.940 0.390 1.210 2.460 24.390 42.110

stdev - - - -

6 rataan 10.590 4.140 29.110 0.350 0.650 1.840 56.670 39.830

stdev - - - -

7 rataan 9.200 3.965 24.280 0.470 0.970 1.755 44.500 42.720

stdev 0.453 0.049 0.042 0.014 0.014 0.276 2.362 1.725

28 42 45 31 27 48 24 41 36 7 15 14 21 18 12 13 19 11 50 5 38 35 30 29 20 22 8 46 40 33 32 47 37 26 34 17 6 25 3 4 49 16 2 23 10 9 44 39 43 1

7.88

5.26

2.63

0.00

Obs erv at ions

D

is

t

a

n

c

e

Dendrogram Complete Linkage, Euclidean Distance


(41)

Lampiran 10. Rataan dan Standar Deviasi dari Metode Pautan Lengkap

gerombol x1 x2 x3 x4 x5 x6 x7 x8

1 rataan 10.208 4.245 29.725 0.485 0.898 1.628 46.570 42.095

stdev 1.199 0.381 6.748 0.021 0.084 0.413 2.986 1.336

2 rataan 9.998 4.044 27.680 0.436 0.579 0.893 37.542 37.691

stdev 0.747 0.318 4.030 0.037 0.133 0.223 9.223 5.727

3 rataan 11.685 4.982 40.378 0.437 0.755 1.249 34.255 37.310

stdev 0.356 0.248 2.385 0.027 0.130 0.231 10.183 3.420

4 rataan 10.737 4.637 36.563 0.480 0.773 1.353 52.517 29.277

stdev 1.287 0.258 2.532 0.017 0.040 0.032 12.688 3.698

5 rataan 10.163 4.191 29.849 0.361 0.783 1.520 29.351 39.657

stdev 0.451 0.455 3.713 0.034 0.115 0.242 12.568 5.506

6 rataan 10.895 5.220 38.800 0.425 0.825 1.475 17.420 52.060

stdev 0.389 0.057 2.079 0.035 0.092 0.233 4.752 1.414

7 rataan 9.710 5.080 35.940 0.390 1.210 2.460 24.390 42.110

stdev - - - -

8 rataan 8.691 3.543 21.141 0.386 0.559 1.026 46.977 37.683


(1)

Lampiran 1. Diagram Alirlir Tahapan Analisis

Data Teh

Analisis Deskriptif

Korelasi Pearson

AKU

Data Skor Komponen

Analisis Gerombol Hirarki

Pseudo-F

Uji Validitas Gerombol

Jumlah Gerombol Optimum


(2)

Lampiran 2. Kode Untuk Masing-masing Klon Teh No.Klon Jenis Klon No.Klon Jenis Klon

1 BD_3 26 Mel_48

2 BD_11 27 Mel_49 3 BD_12 28 Mel_101 4 BD_13 29 Mel_108

5 BD_15 30 PG_4

6 Cin_1 31 PG_5

7 Cin_7 32 PG_11

8 Cin_13 33 SA_12 9 Cin_14 34 SA_49 10 Cin_15 35 PG_7 11 Cin_25 36 Wan_24/4 12 Cin_28 37 Bks_6 13 Cin_36 38 GH_5 14 Cin_57 39 GP_4 15 Cin_58 40 GP_5 16 Cin_60 41 KP_1 17 Cin_66 42 Pam_15 18 Cin_67 43 PG_3 19 Cin_69 44 SA_33 20 Cip_18 45 SA_64 21 Cip_19 46 SA_72 22 Cip_31 47 Sin_2 23 Cip_37 48 Sin_3

24 GP_2 49 Sin_5


(3)

Lampiran 3. Boxplot dari tiap peubah

Lampiran 4. Korelasi Antar Peubah

X1 X2 X3 X4 X5 X6 X7 X2 0.752*

0.000

X3 0.853* 0.947* 0.000 0.000

X4 0.276 0.223 0.240 0.052 0.119 0.093

X5 0.184 0.464* 0.364* 0.101 0.200 0.001 0.009 0.485

X6 0.082 0.342* 0.249 0.011 0.752* 0.573 0.015 0.081 0.940 0.000

X7 -0.065 -0.249 -0.199 0.151 -0.293* -0.178 0.652 0.081 0.165 0.294 0.039 0.215

X8 -0.116 0.044 -0.085 -0.189 0.209 0.185 -0.198 0.423 0.761 0.559 0.189 0.145 0.199 0.168

Cell Contents: Pearson correlation P-Value

X4 X2

X1 12

10

8

6

4

2

0

D

a

t

a

Boxplot of X1, X2, X4

45

40

35

30

25

20

X

3

Boxplot of X3

X6 X5

2.5

2.0

1.5

1.0

0.5

0.0

D

a

t

a

Boxplot of X5, X6

X8 X7

70

60

50

40

30

20

10

D

a

t

a


(4)

Lampiran 5. Hasil Analisis Komponen Utama

Eigenvalue 3.231 1.766 1.064 0.771 0.712 0.227 0.200 0.030

Proportion 0.404 0.221 0.133 0.096 0.089 0.028 0.025 0.004

Cumulative 0.404 0.625 0.758 0.854 0.943 0.971 0.996 1.000

Lampiran 6. Plot Peubah Komponen Pertama dan Kedua

Lampiran 7. Dendogram Metode Pautan Rataan

3 2 1 0 -1 -2 -3 -4 3 2 1 0 -1 -2 -3 -4 KU2 K U 1

Scatterplot of KU1 vs KU2

23 44 39 38 28 27 35 30 42 46 40 33 32 45 31 48 24 4 34 17 6 25 47 37 26 3 49 16 2 10 9 29 20 22 8 15 14 21 18 12 13 19 11 7 50 5 41 36 43 1 5.50 3.67 1.83 0.00

Obs erv at ions

D is t a n c e Dendrogram Average Linkage, Euclidean Distance


(5)

Lampiran 8. Dendogram Metode Pautan Lengkap

Lampiran 9. Rataan dan Standar Deviasi dari Metode Pautan Rataan

gerombol x1 x2 x3 x4 x5 x6 x7 x8

1 rataan 11.433 4.852 38.921 0.454 0.768 1.303 39.825 36.258 stdev 0.691 0.308 3.252 0.034 0.108 0.263 12.559 4.965 2 rataan 9.606 3.871 25.688 0.413 0.583 0.959 39.434 38.222 stdev 0.931 0.350 4.488 0.048 0.125 0.245 10.442 5.493 3 rataan 10.305 4.483 32.125 0.383 0.858 1.575 23.113 37.263 stdev 0.386 0.300 2.586 0.025 0.091 0.115 3.781 6.138 4 rataan 10.895 5.220 38.800 0.425 0.825 1.475 17.420 52.060 stdev 0.389 0.057 2.079 0.035 0.092 0.233 4.752 1.414 5 rataan 9.710 5.080 35.940 0.390 1.210 2.460 24.390 42.110

stdev - - - -

6 rataan 10.590 4.140 29.110 0.350 0.650 1.840 56.670 39.830

stdev - - - -

7 rataan 9.200 3.965 24.280 0.470 0.970 1.755 44.500 42.720 stdev 0.453 0.049 0.042 0.014 0.014 0.276 2.362 1.725

28 42 45 31 27 48 24 41 36 7 15 14 21 18 12 13 19 11 50 5 38 35 30 29 20 22 8 46 40 33 32 47 37 26 34 17 6 25 3 4 49 16 2 23 10 9 44 39 43 1 7.88 5.26 2.63 0.00

Obs erv at ions

D is t a n c e Dendrogram Complete Linkage, Euclidean Distance


(6)

Lampiran 10. Rataan dan Standar Deviasi dari Metode Pautan Lengkap

gerombol x1 x2 x3 x4 x5 x6 x7 x8

1 rataan 10.208 4.245 29.725 0.485 0.898 1.628 46.570 42.095 stdev 1.199 0.381 6.748 0.021 0.084 0.413 2.986 1.336 2 rataan 9.998 4.044 27.680 0.436 0.579 0.893 37.542 37.691 stdev 0.747 0.318 4.030 0.037 0.133 0.223 9.223 5.727 3 rataan 11.685 4.982 40.378 0.437 0.755 1.249 34.255 37.310 stdev 0.356 0.248 2.385 0.027 0.130 0.231 10.183 3.420 4 rataan 10.737 4.637 36.563 0.480 0.773 1.353 52.517 29.277 stdev 1.287 0.258 2.532 0.017 0.040 0.032 12.688 3.698 5 rataan 10.163 4.191 29.849 0.361 0.783 1.520 29.351 39.657 stdev 0.451 0.455 3.713 0.034 0.115 0.242 12.568 5.506 6 rataan 10.895 5.220 38.800 0.425 0.825 1.475 17.420 52.060 stdev 0.389 0.057 2.079 0.035 0.092 0.233 4.752 1.414 7 rataan 9.710 5.080 35.940 0.390 1.210 2.460 24.390 42.110

stdev - - - -

8 rataan 8.691 3.543 21.141 0.386 0.559 1.026 46.977 37.683 stdev 0.827 0.104 2.049 0.028 0.114 0.249 10.259 4.976