Analisis Tingkat Kesukaan Konsumen dengan Metode Bayesian Network (Studi Kasus Produk Biskuit)

(1)

(Studi Kasus Produk Biskuit). Dibimbing oleh AJI HAMIM WIGENA dan ANANG KURNIA. Analisis tingkat kesukaan konsumen terhadap suatu produk merupakan salah satu cara yang dilakukan produsen dalam mengevaluasi produk. Analisis ini memberikan penilaian pada berbagai aspek produk. Hasil penilaian ini penting bagi produsen untuk memperbaiki aspek yang harus ditingkatkan agar produknya tetap disukai konsumen. Pada umumnya data tentang tingkat kesukaan berskala ordinal. Salah satu metode yang dapat digunakan untuk menganalisisnya adalah Bayesian Network (BN). Simple-Naïve Bayesian merupakan metode BN yang sering digunakan, tetapi asumsi kebebasan antar-peubah penjelas pada metode ini sering tidak terpenuhi sehingga berkembang berbagai metode alternatif untuk mengatasinya. Beberapa metode alternatif tersebut adalah BN Terboboti dengan algoritma Maximum Spanning Tree, Equivalence Classes, dan Semi-Naïve Bayesian dengan algoritma Backward Sequential Elimination (BSE), Forward Sequential Selection (FSS). Penelitian ini bertujuan untuk menerapkan dan membandingkan metode berdasarkan tingkat akurasi klasifikasi terbesar dalam klasifikasi tingkat kesukaan, serta menganalisis perubahan persentase pada setiap peubah. Hasil penelitian menunjukkan bahwa metode yang memberikan tingkat akurasi terbesar dalam klasifikasi tingkat kesukaan adalah Metode Semi-Naïve Bayesian dengan algoritma BSE sebesar 94%. Struktur BN yang terbentuk merupakan struktur yang sama dengan simple-naïve Bayesian. Tingkat akurasi pada penelitian ini bernilai maksimum saat semua peubah penjelas dihubungkan dengan peubah respon. Aspek yang memiliki kontribusi terbesar pada tingkat kesukaan produk biskuit yang diteliti adalah rasa keju. Kata kunci : analisis tingkat kesukaan, bayesian network, maximum spanning tree, equivalence


(2)

ANALISIS TINGKAT KESUKAAN KONSUMEN

DENGAN METODE

BAYESIAN NETWORK

(Studi Kasus Produk Biskuit)

ASEP KHOERUDIN

DEPARTEMEN STATISTIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR

BOGOR

2011


(3)

(Studi Kasus Produk Biskuit). Dibimbing oleh AJI HAMIM WIGENA dan ANANG KURNIA. Analisis tingkat kesukaan konsumen terhadap suatu produk merupakan salah satu cara yang dilakukan produsen dalam mengevaluasi produk. Analisis ini memberikan penilaian pada berbagai aspek produk. Hasil penilaian ini penting bagi produsen untuk memperbaiki aspek yang harus ditingkatkan agar produknya tetap disukai konsumen. Pada umumnya data tentang tingkat kesukaan berskala ordinal. Salah satu metode yang dapat digunakan untuk menganalisisnya adalah Bayesian Network (BN). Simple-Naïve Bayesian merupakan metode BN yang sering digunakan, tetapi asumsi kebebasan antar-peubah penjelas pada metode ini sering tidak terpenuhi sehingga berkembang berbagai metode alternatif untuk mengatasinya. Beberapa metode alternatif tersebut adalah BN Terboboti dengan algoritma Maximum Spanning Tree, Equivalence Classes, dan Semi-Naïve Bayesian dengan algoritma Backward Sequential Elimination (BSE), Forward Sequential Selection (FSS). Penelitian ini bertujuan untuk menerapkan dan membandingkan metode berdasarkan tingkat akurasi klasifikasi terbesar dalam klasifikasi tingkat kesukaan, serta menganalisis perubahan persentase pada setiap peubah. Hasil penelitian menunjukkan bahwa metode yang memberikan tingkat akurasi terbesar dalam klasifikasi tingkat kesukaan adalah Metode Semi-Naïve Bayesian dengan algoritma BSE sebesar 94%. Struktur BN yang terbentuk merupakan struktur yang sama dengan simple-naïve Bayesian. Tingkat akurasi pada penelitian ini bernilai maksimum saat semua peubah penjelas dihubungkan dengan peubah respon. Aspek yang memiliki kontribusi terbesar pada tingkat kesukaan produk biskuit yang diteliti adalah rasa keju. Kata kunci : analisis tingkat kesukaan, bayesian network, maximum spanning tree, equivalence


(4)

ANALISIS TINGKAT KESUKAAN KONSUMEN

DENGAN METODE

BAYESIAN NETWORK

(Studi Kasus Produk Biskuit)

ASEP KHOERUDIN

Skripsi

Sebagai salah satu syarat untuk memperoleh gelar

Sarjana Statistika pada

Departemen Statistika

DEPARTEMEN STATISTIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR

BOGOR

2011


(5)

NRP : G14070047

Disetujui

Pembimbing I Pembimbing II

Dr. Ir. Aji Hamim Wigena, M.Sc Dr.Anang Kurnia

NIP. 195209281977011001 NIP. 197308241997021001

Diketahui

Ketua Departemen Statistika

Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor

Dr. Ir. Hari Wijayanto, MS NIP. 196504211990021001


(6)

rangka memenuhi tugas akhir yang merupakan salah satu syarat untuk memperoleh gelar Sarjana Statistika di Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor.

Terimakasih penulis ucapkan kepada Bapak Dr.Ir. Aji Hamim Wigena, M.Sc dan Bapak Dr. Anang Kurnia selaku pembimbing yang telah memberikan arahan dan masukan yang membangun kepada penulis dalam meyelesaikan penelitian. Terima kasih juga penulis sampaikan kepada orang tua dan keluarga tercinta atas doa dan dukunganya serta semua pihak yang telah membantu penulis dalam menyelesaikan tulisan ini.

Semoga tulisan ini dapat bermanfaat bagi semua pihak yang membutuhkan.

Bogor, Agustus 2011


(7)

pendidikannya di Sekolah Dasar Negeri (SDN) Ciomas 2 pada tahun 2001. Jenjang pendidikan selanjutnya penulis tempuh di Sekolah Menengah Pertama Negeri (SMPN) 4 Bogor dan lulus tahun 2004. Penulis menamatkan pendidikannya di Sekolah Menengah Atas Negeri (SMAN) 1 Bogor pada tahun 2007 dan pada tahun yang sama penulis diterima sebagai mahasiswa Departemen Statistika, Institut Pertanian Bogor (IPB) melalui Undangan Seleksi Masuk IPB (USMI).

Selama mengikuti perkuliahan, penulis aktif menjadi pengurus Badan Eksekutif Mahasiswa (BEM) Fakultas MIPA sebagai staff Kajian Strategi (KASTRAT) pada periode Kepengurusan 2009-2010 dan menjadi pengurus BEM Fakultas MIPA sebagai ketua Departemen Sosial dan Lingkungan (SOSLING) pada periode Kepengurusan 2010-2011. Pada Tahun 2010, penulis menjadi finalis Pekan Ilmiah Mahaiswa Nasional (PIMNAS) untuk karya ilmiah kelompok Program Kreativitas Mahaiswa bidang Pengabdian Masyarakat (PKM-M) dengan judul

“Peꜜiꜜgkataꜜ Ketepataꜜ Peꜜgaꜛbilaꜜ Kebijakaꜜ Berbasis Statistika melalui Pembekalan Teknik Updating Data yang Efektif di Desa Petir, Dramaga, Bogor”. Penulis melaksanakan praktik lapang pada tanggal 07 Februari sampai 01 April 2011 di Pusat Data dan Sistem Informasi Kementerian Pertanian, Jakarta Selatan.


(8)

DAFTAR GAMBAR ... vii

DAFTAR LAMPIRAN ... vii

PENDAHULUAN Latar Belakang ... 1

Tujuan ... 1

TINJAUAN PUSTAKA Bayesian Network ... 1

Algoritma Naïve Bayes ... 2

Semi-Naïve Bayessian ... 2

Algoritma Backward Sequential Elimination ... 3

Algoritma Forward Sequential Selection ... 3

BN Terboboti ... 3

Algoritma Maximum Spanning Tree ... 3

Algoritma Equivalence Classes ... 4

METODOLOGI Data ... 4

Metode ... 5

HASIL DAN PEMBAHASAN Deskripsi Data ... 5

Klasifikasi dengan BN Terboboti ... 6

Klasifikasi dengan Semi-Naïve Bayesian ... 7

Perbandingan Tingkat Akurasi ... 9

Analisis Perubahan Peubah Penjelas ... 9

Analisis Perubahan Peubah Respon ... 11

Perbandingan Tingkat Akurasi untuk Jumlah Kategori Berbeda ... 12

KESIMPULAN ... 12

DAFTAR PUSTAKA ... 12


(9)

3 Dugaan klasifikasi Semi-Naïve Bayesian algoritma BSE ... 8

4 Dugaan klasifikasi Semi-Naïve Bayesian algoritma FSS ... 8

5 Perbandingan Tingkat Akurasi ... 9

6 Perubahan persentase peubah respon saat persentase kategori suka (4) dan sangat suka (5) pada peubah warna produk, kekuatan aroma, dan semua peubah penjelas ditingkatkan menjadi 100% ... 9

7 Kontribusi setiap peubah penjelas ... 11

8 Perbandingan Tingkat Akurasi untuk jumlah kategori berbeda ... 12

DAFTAR GAMBAR

Halaman 1

Graf berarah dengan

nodeN={P,Q,R} dan edgeE={(P,Q),(P,R)}... 1

2 Struktur BN dengan algoritma naïve bayesian ... 2

3 Sebaran frekuensi tingkat kesukaan peubah respon ... 5

4 Sebaran tingkat kesukaan berdasarkan (a) warna produk; (b) kekuatan aroma; (c) ketebalan produk; (d) kelembutan produk; (e) rasa asin pada produk; (f) kekuatan rasa susu; (g) rasa keju; (h) kelezatan produk; dan (i) kekuatan rasa setelah dirasakan ... 5

5 Struktur BN dengan algoritma Maximum Spanning Tree ... 6

6 Struktur BN dengan algoritma Equivalence Classes ... 7

7 Struktur BN dengan algoritma BSE ... 8

8 Struktur BN dengan algoritma FSS ... 8

9 Perubahan yang terjadi pada peubah respon saat persentase kategori sangat suka (5) pada peubah penjelas ditingkatkan manjadi 100% ... 10

10 Kondisi peubah-peubah penjelas saat kategori sangat suka (5) pada peubah tingkat kesukaan (Y) ditingkatkan menjadi 100%. ... 11

DAFTAR LAMPIRAN

Halaman

1

Nilai Korelasi Spearman Antar Peubah ... 15

2

Proses Pembentukan Struktur BN dengan algoritma Maximum Spanning Tree ... 15

3

Nilai Khi-Kuadrat antar peubah ... 16

4

Proses Pembentukan Struktur BN dengan algoritma Equivalence Classes ... 16

5

Perubahan persentase peubah respon saat persentase setiap kategori pada peubah penjelas ditingkatkan menjadi 100% ... 17

6

Struktur BN dan Tingkat Akurasi untuk 3 kategori Tingkat Kesukaan ... 18


(10)

PENDAHULUAN

Latar belakang

Analisis tingkat kesukaan konsumen terhadap suatu produk merupakan salah satu cara yang dilakukan produsen dalam mengevaluasi produk yang dikeluarkannya. Analisis ini memberikan penilaian pada berbagai aspek produk. Hasil penilaian konsumen ini merupakan hal penting untuk memperbaiki aspek mana yang harus ditingkatkan agar produknya tetap disukai para konsumen. Data yang digunakan umumnya berskala ordinal yang diperoleh melalui survei langsung pada konsumen. Metode yang selama ini banyak digunakan oleh instansi riset pemasaran adalah analisis regresi berganda. Namun demikian dalam penggunaannya sering dihadapkan dengan tidak terpenuhinya asumsi analisis regresi. Salah satu pendekatan yang dapat digunakan untuk menganalisis data berskala ordinal adalah Bayesian Network (BN).

BN merupakan pendekatan yang digunakan untuk mengetahui hubungan antar peubah dalam bentuk jaringan (networks). Metode ini cocok diterapkan pada data yang berskala ordinal. Metode BN yang sering digunakan adalah Simple Naïve Bayesian, akan tetapi metode ini mengasumsikan antar peubah penjelas saling bebas, sedangkan dalam kenyataannya asumsi kebebasan antar-peubah penjelas ini sering tidak terpenuhi sehingga berkembang berbagai metode alternatif untuk mengatasi kondisi ini.

Salah satu metode alternatif yang dapat digunakan adalah Semi Naïve Bayesian. Metode ini dibangun untuk mengurangi pengaruh ketidakbebasan antar peubah penjelas (Zeng & Web 2005). Lesmanawati (2008) menggunakan algoritma Backward Sequential Elimination (BSE) dan Forward Sequential Selection (FSS) dalam penelitiannya untuk mengklasifikasi nilai mutu ujian komprehensif mahasiswa Departemen Statistika IPB.

Metode alternatif yang lainnya adalah BN Terboboti (Weighted Bayesian Network). Metode ini dibangun dengan menggunakan suatu pembobot dalam menyusun struktur BN. Metode alternatif ini pernah digunakan oleh Purwadi (2009) dalam penelitiannya untuk penetapan daerah tertinggal. Algoritma yang digunakan adalah algoritma Maximum Spanning Tree dan Equivalence Classes.

Kedua metode alternatif tersebut digunakan saat kondisi peubah penjelas tidak

saling bebas. Penelitian ini akan membandingkan tingkat keakuratan klasifikasi yang lebih baik antara metode Semi-Naive Bayesian dan BNTerboboti.

Tujuan Tujuan penelitian ini adalah:

1. Menerapkan metode BN dalam analisis tingkat kesukaan konsumen pada suatu produk.

2. Membandingkan metode BN Terboboti (algoritma Maximum Spanning Tree dan Equivalence Classes) dan Semi-Naïve Bayesian (algoritma BSE dan FSS) dalam kemampuan mengklasifikasikan tingkat kesukaan pada kasus produk biskuit. 3. Menganalisis perubahan persentase

peubah respon akibat perubahan persentase peubah penjelas dan sebaliknya.

TINJAUAN PUSTAKA

Bayesian Network

BN merupakan suatu model peluang grafis yang merepresentasikan suatu gugus peubah dan peluang bebasnya (Neapolitan 2004). Model ini didasarkan atas teorema Bayes. Teorema Bayes menyatakan jika S suatu ruang contoh dan {A1,.…, An} merupakan sekatan S dengan syarat P( ≠0, i=1, …, n;

 . Jika B merupakan suatu kejadian pada ruang contoh S dengan syarat P(B)≠0, maka secara matematis kaidah peluang Bayes dapat dituliskan sebagai berikut (Nasoetion & Rambe, 1984):

|

| |

(1)

Menurut Hassan (2007) diacu dalam Purwadi (2009), BN merupakan pasangan dari (G,P) di mana G=(N,E) adalah Directed Acylic Graph (DAG) atau graf berarah, sedangkan P adalah sebaran peluang bersyarat.

Gambar 1Graf berarah dengan nodeN={P,Q,R} dan edgeE={(P,Q),(P,R)}


(11)

Martono (1990) menyebutkan suatu graf G=(N,E) terdiri atas dua gugus objek yaitu N=(n1,n2, n3,…) adalah suatu gugus tak kosong yang unsur-unsurnya disebut simpul (node)dan gugus E=(e1,e2, e3,…) yaꜜg uꜜsur -unsurnya disebut sisi (edge), sedemikian sehingga masing-masing edge ek diidentifikasikan dengan pasangan tidak terurut (ni, nj).

Parents didefinisikan sebagai node yang dijadikan syarat dan child adalah node yang diberikan syarat. Pada Gambar 1 dapat dijelaskan bahwa P merupakan parent dari Q dan R atau dapat dijelaskan bahwa Q dan R merupakan child dari P.

Pembuatan model dalam BN melibatkan dua langkah yaitu:

1. Membuat struktur jaringan

Struktur jaringan dalam BN dibentuk dalam suatu graf. Sebuah graf terdiri dari kumpulan node dan edge. Node merupakan titik simpul dan edge merupakan garis yang menghubungkan titik node tersebut.

2. Mengestimasi nilai peluang setiap node. Algoritma Naïve Bayesian

Naïve Bayes merupakan salah satu algoritma pembangun struktur BN dengan asumsi antar peubah penjelas saling bebas (naive). Algoritma Naïve Bayesian bekerja secara sederhana dalam membangun model BN, yaitu dengan menghubungkan semua peubah penjelas ke peubah respon. Arah hubungan (edge) pada BN semuanya mengarah ke peubah respon karena asumsi naïve menyatakan bahwa peubah penjelas diasumsikan saling bebas. Struktur BN yang dibangun dengan algoritma ini dapat dilihat pada Gambar 2. Node P sebagai peubah respon dan node Q, R, dan S sebagai peubah penjelas.

Gambar 2 Struktur BN dengan algoritma naïve bayesian.

Langkah kerja algoritma Naïve Bayes menurut Frank et al. (1999) dalam membangun struktur BN sebagai berikut:

1. Seluruh peubah dalam keadaan diskret (jika ada peubah kontinu didiskretisasi terlebih dahulu).

2. Menentukan peubah respon.

3. Hubungkan semua peubah penjelas pada peubah respon dengan edge.

4. Semua arah edge peubah penjelas menuju ke peubah respon.

5. Menghitung peluang bersyaratnya. Semi Naïve Bayessian

Metode Semi Naive Bayesian secara garis besar dapat dibagi dalam dua kelompok. Kelompok pertama membangun simple naïve Bayesian dengan menggunakan sekumpulan peubah penjelas baru yang dapat dihasilkan dari proses deleting attributes dan joining attributes.Kelompok ini membangun struktur Bayesian dengan menyeleksi peubah yang memberikan keakuratan yang tinggi. Kelompok kedua membangun simple naive Bayesian dengan membuat struktur garis penghubung secara jelas di antara peubah-peubah penjelas yang menunjukkan hubungan ketidakbebasan (saling mempengaruhi) antar peubah penjelas (Zheng & Webb 2005).

Metode semi naïve Bayesian yang digunakan pada penelitian ini adalah deleting attributes. Zheng & Webb (2005) menjelaskan bahwa ada dua pendekatan yang dapat digunakan dalam deleting attributes, yaitu BSE dan FSS. Baik BSE maupun FSS memiliki tujuan yang sama, yaitu memilih atau menentukan himpunan bagian dari peubah penjelas yang dapat menyebabkan terjadinya peningkatan akurasi terbesar dari simple naive Bayesian.

BSE diawali dengan menggunakan keseluruhan set peubah penjelas, kemudian dilakukan proses eliminasi peubah yang dapat menyebabkan terjadinya peningkatan akurasi terbesar. Sedangkan FSS menggunakan cara yang berlawanan dengan BSE, yaitu diawali dengan gugus himpunan peubah penjelas yang kosong, kemudian dilakukan proses penambahan peubah yang dapat menyebabkan terjadinya peningkatan akurasi paling besar. Baik proses eliminasi maupun penambahan peubah terus dilakukan hingga tidak ada lagi peningkatan akurasi (Langley & Sage 1994; Zeng & Web 2005).

Himpunan bagian dari peubah-peubah yang terpilih diasumsikan saling bebas dan dinotasikan sebagai Attribute = {bg1, . . . , bgn}. sedangkan kategori-kategori pada peubah yang terpilih dinotasikan sebagai {g1,…, gn}. Kaidah klasifikasi pada BSE dan FSS


(12)

(2) dilakukan dengan memilih peluang bersama yang terbesar berdasarkan rumus:

∏ |

dengan:

arg max :.argumen yang memaksimumkan fungsi.

: peubah penjelas ke-j j=g1, ..., gn. gk : kategori ke-k dari peubah penjelas

yang terpilih

: peubah yang menjadi syarat : peluang prior kejadian

| : peluang kejadian b setalah a terjadi. Penjabaran langkah-langkah algoritma BSE dari Zeng & Web (2005) menurut Lesmanawati (2008) adalah sebagai berikut: 1. Diawali dengan proses klasifikasi simple

naive Bayesian dengan menggunakan seluruh peubah penjelas.

( P0 = p adalah banyaknya peubah penjelas awal ; P = P0 ; n = p-1; i = 1).

2. Hitung akurasi dugaan klasifikasi yang dihasilkan, notasikan sebagai C0.

3. Tentukan kombinasi n peubah penjelas yang mungkin terbentuk dari p peubah penjelas yang tersedia dengan cara mengeliminasi sebuah peubah penjelas. 4. Lakukan proses klasifikasi simple naïve

Bayesian untuk setiap kombinasi peubah penjelas yang telah terbentuk pada langkah ketiga serta hitung akurasi dugaan klasifikasinya.

5. Tentukan kombinasi peubah penjelas yang menghasilkan tingkat akurasi dugaan terbesar. Notasikan tingkat akurasi dugaan klasifikasi terbesar tersebut sebagai Ci. 6. Bandingkan Ci dengan C0 :

 Jika Ci ≤ C0, proses eliminasi peubah selesai.

 Jika Ci > C0, kembali ke langkah tiga untuk melanjutkan proses eliminasi peubah dari n peubah penjelas yang diperoleh pada langkah lima dengan menetapkan C0 = Ci ; n= n-1; p = p-1; i = i +1.

7. Proses eliminasi peubah penjelas berhenti jika semua peubah penjelas sudah tereliminasi.

Sedangkan penjabaran langkah-langkah akgoritma FSS dari Zeng & Web (2005) menurut Lesmanawati (2008) adalah sebagai berikut:

1. Diawali dengan set peubah penjelas kosong.

(P0 = 0 adalah banyaknya peubah penjelas mula-mula; n = P0+2; i = 1 ).

2. Tambahkan satu peubah penjelas dan lakukan proses klasifikasi simple naïve Bayesian dengan menggunakan satu peubah penjelas untuk setiap peubah penjelas yang tersedia.

3. Tentukan peubah penjelas yang menghasilkan tingkat akurasi dugaan klasifikasi terbesar. Notasikan tingkat akurasi dugaan terbesar tersebut sebagai C0.

4. Tambahkan kembali satu peubah penjelas sebagai dasar klasifikasi, lalu tentukan kombinasi n peubah penjelas yang mungkin terbentuk dari p peubah penjelas yang tersedia. Kombinasi harus mengandung peubah penjelas yang diperoleh pada langkah tiga.

5. Lakukan kembali proses klasifikasi simple naive Bayesian untuk setiap kombinasi peubah penjelas yang telah terbentuk pada langkah empat serta hitung akurasi dugaan klasifikasinya.

6. Tentukan kombinasi peubah penjelas pada langkah empat yang menghasilkan tingkat akurasi dugaan terbesar. Notasikan tingkat akurasi dugaan terbesar tersebut sebagai Ci.

7. Bandingkan Ci dengan C0 :

 Jika Ci ≤ C0, proses penambahan peubah berhenti/selesai.

 Jika Ci > C0, kembali ke langkah empat untuk melanjutkan proses penambahan peubah dari n peubah penjelas yang diperoleh pada langkah enam dengan menetapkan C0 = Ci ; n = n+1; i = i+1. 8. Proses penambahan peubah penjelas

berhenti jika semua peubah penjelas yang tersedia sudah masuk/sudah ditambahkan.

BN Terboboti

BN Terboboti adalah metode untuk menyususn struktur BN dengan menggunakan suatu nilai pembobot pada setiap edge. Nilai pembobot yang digunakan dapat berupa jarak, korelasi, dan kekuatan hubungan lainnya. Pada penelitian ini digunakan algoritma Maximum Spanning Tree dan Equivalence Classes.

Algoritma Maximum Spanning Tree

Maximum Spanning Tree adalah himpunan bagian dari suatu graf G yang tidak memiliki siklus namun memiliki node yang sama seperti G. Syarat Spanning tree adalah semua


(13)

node terhubungkan dan memiliki bobot (Munir 2003).

Penggunaan algoritma maximum spanning tree untuk analisis tingkat kesukaan adalah mencari bobot paling maksimum dari nilai korelasi. Korelasi yang digunakan adalah korelasi spearman karena datanya merupakan berskala ordinal. Korelasi menggambarkan kedekatan hubungan antara dua peubah sehingga semakin tinggi nilainya maka hubungan antara kedua peubah semakin kuat Terdapat dua jenis algoritma spanning tree, yaitu prim dan kruskal. Dalam penelitian ini digunakan algoritma prim.

Berdasarkan definisi yang dikemukakan Munir (2003), maka penjabaran langkah-langkah algoritma Maximum Spanning Tree dalam membangun BN adalah sebagai berikut:

1. Seluruh peubah dalam keadaan diskret (jika ada peubah kontinu didiskretisasi terlebih dahulu).

2. Mencari korelasi spearman seluruh peubah yang ada dan menggunakan korelasi tersebut sebagai bobot untuk setiap edge. 3. Memilih peubah penjelas yang memiliki

edge dengan bobot terbesar dengan peubah respon lalu menghubungkan kedua peubah tersebut dan menentukan arah edge. 4. Mencari edge dengan bobot terbesar

berikutnya. Edge antara peubah yang sudah terhubungkan pada langkah ke-3 dengan peubah lain yang belum terhubungkan namun bukan merupakan siklus

5. Menghubungkan peubah baru yang didapat pada langkah ke-4 dan menentukan arah edge.

6. Mengulangi langkah ke-4 dan ke-5 hingga seluruh peubah terhubungkan.

7. Menghitung peluang bersyaratnya. Algoritma Equivalence Classes

Jouffe (2008) menyatakan bahwa equivalence classes merupakan salah satu algoritma untuk membangun BN. Algoritma ini digunakan jika tidak diketahui hubungan antar peubah. Algoritma bekerja dengan cara menemukan hubungan berdasarkan pola data seperti spanning tree, sebelum membangun struktur BN equivalence classes terlebih dahulu menyeleksi peubah-peubah yang saling bebas terhadap semua peubah yang lainnya. Uji kebebasan khi-kuadrat digunakan oleh algoritma ini sebagai alat untuk menyeleksi peubah yang saling bebas sekaligus nilai khi-kuadrat sebagai bobot dalam membangun struktur BN.

Langkah-langkah algoritma equivalence classes sesuai definisi Jouffe (2008) dapat dijabarkan sebagai berikut:

1. Seluruh peubah dalam keadaan diskret (jika ada peubah kontinu didiskretisasi terlebih dahulu)

2. Menyeleksi peubah yang saling bebas dengan menggunakan uji khi-kuadrat 3. Mencari nilai uji khi-kuadrat terbesar lalu

menghubungkan peubah tersebut

4. Menentukan arah edge pada peubah yang terhubung

5. Mencari nilai khi-kuadrat terbesar berikutnya (dari peubah yang telah terhubung dengan peubah yang belum terhubung) namun tidak membentuk siklus, lalu menghubungkan peubah tersebut.

6. Menghitung peluang bersyarat.

METODOLOGI

Data

Data yang digunakan dalam penelitian ini adalah data yang didapatkan dari hasil survei suatu instansi riset pemasaran pada tahun 2011. Data ini merupakan data kecenderungan pemilihan suatu produk makanan oleh konsumen, pada penelitian ini kecenderungan pemilihan produk biskuit. Data tersebut terdiri dari sepuluh peubah. Tingkat kesukaan dipilih sebagai peubah respon (Y), dan sebagai peubah penjelas X1- X9 adalah:

X1 : Warna Produk X2 : Kekuatan Aroma X3 : Ketebalan Produk X4 : Kelembutan Produk X5 : Rasa Asin pada Produk X6 : Kekuatan Rasa Susu X7 : Rasa Keju

X8 : Kelezatan Produk

X9 : Kekuatan Rasa setelah dirasakan Masing-masing peubah terdiri dari sembilan kategori sebagai berikut:

1 : sama sekali tidak suka 2 : sangat tidak suka 3 : lumayan tidak suka 4 : agak tidak suka 5 : biasa saja 6 : agak suka 7 : lumayan suka 8 : sangat suka 9 : sangat suka sekali

Perangkat lunak yang digunakan untuk menyusun struktur BN dan mencari peluang bersyarat memiliki keterbatasan kapasitas, sehingga dilakukan pengkategorian ulang untuk semua peubah dengan melakukan


(14)

penggabungan beberapa kategori menjadi kategori yang lebih umum. Kategori yang baru terdiri atas lima kategori yaitu:

1 : sangat tidak suka 2 : tidak suka 3 : biasa saja 4 : suka 5 : sangat suka

Metode

Tahapan yang dilakukan dalam penelitian ini adalah:

1. Membuat deskripsi data untuk melihat gambaran umum masing-masing peubah. 2. Membuat klasifikasi BN Terboboti

menggunakan algoritma Spanning Tree dan Equivalence Classes, kemudian menghitung tingkat akurasi dugaan klasifikasi dengan rumus dibawah ini:

3. Membuat klasifikasi Semi Naïve Bayesian dengan menggunakan algoritma BSE, FSS untuk deleteting attribute, kemudian menghitung tingkat akurasi dugaan klasifikasi dengan rumus seperti pada langkah kedua.

4. Membandingkan tingkat akurasi dugaan klasifikasi Semi Naïve Bayesian, baik yang menggunakan algoritma deleting attribute terhadap tingkat akurasi dugaan klasifikasi BN Terboboti.

5. Menganalisis perubahan peluang peubah respon berdasarkan perubahan peluang yang terjadi pada setiap peubah penjelas dan sebaliknya berdasarkan struktur BN yang terbaik.

Perangkat lunak yang digunakan untuk membuat struktur BN dalam penelitian ini adalah Bayesia Lab 5.0 Evaluation Version (http://www.bayesia.com).

PEMBAHASAN

Deskripsi data

Data yang digunakan merupakan data hasil survei produk biskuit yang dilakukan kepada 200 responden.

Peubah Respon

Peubah respon tingkat kesukaan (Y) merupakan penilaian seseorang terhadap keadaan produk secara keseluruhan. Penilaian ini dilihat dari berbagai aspek. Sebaran data untuk masing-masing kategori tingkat kesukaan dapat dilihat pada Gambar 3.

Gambar 3 Sebaran frekuensi tingkat kesukaan peubah respon.

Jumlah konsumen yang menyatakan tidak suka (kategori 2) sebanyak 3 (1.5%), biasa saja (kategori 3) sebanyak 5 (2.5%), suka (kategori 4) sebanyak 58 (29%), dan sangat suka (kategori 5) sebanyak 134 (67%). Sehingga secara umum dapat dilihat bahwa lebih dari 90% konsumen menyatakan kesukaannya terhadap produk biskuit tersebut.

Gambar 4 Sebaran tingkat kesukaan berdasarkan (a) warna produk; (b) kekuatan aroma; (c) ketebalan produk; (d) kelembutan produk; (e) rasa asin pada produk; (f) kekuatan rasa susu; (g) rasa keju; (h) kelezatan produk; dan (i) kekuatan rasa setelah dirasakan


(15)

Peubah Penjelas

Peubah penjelas yang digunakan merupakan penilaian secara lebih detail dari berbagai aspek yang dijadikan tolak ukur. Pada penelitian ini digunakan sembilan peubah penjelas yaitu: warna produk, kekuatan aroma, ketebalan produk, kelembutan produk, rasa asin pada produk, kekuatan rasa susu, rasa keju, kelezatan produk, dan kekuatan rasa setelah dirasakan. Sebaran tingkat kesukaan setiap peubah penjelas dapat dilihat pada Gambar 4.

Persentase kesukaan konsumen yang menyatakan sangat suka (kategori 5) untuk semua peubah penjelas secara rata-rata berada pada persentase 64% dan konsumen yang menyatakan suka (kategori 4) berada pada persentase rata-rata sebesar 31%. Banyaknya konsumen yang menyatakan biasa saja (kategori 3) secara rata-rata untuk semua peubah sebesar 1.9%, dan banyaknya konsumen yang menyatakan tidak suka (kategori 2) sebesar 3.2%.

Pada peubah penjelas kelembutan produk (X4) tidak terdapat konsumen yang menyatakan tidak suka (kategori 2), sedangkan pada peubah penjelas yang lain masih terdapat konsumen yang menyatakan tidak suka (kategori 1 dan 2). Konsumen sudah menyukai kelembutan produk biskuit dan aspek ini perlu dipertahankan oleh produsen.

Persentase terbesar konsumen yang menyatakan tidak suka (kategori 2) terdapat pada peubah penjelas rasa asin (X5) yaitu sebesar 9.5%. Pada peubah penjelas ini juga terdapat konsumen yang menyatakan sangat tidak suka (kategori 1) yaitu sebesar 1%. Aspek rasa asin pada produk adalah aspek yang pertama harus dievaluasi oleh produsen agar konsumen tetap menyukai produk biskuit tersebut.

Klasifikasi dengan BN Terboboti Algoritma Maximum Spanning Tree

Algoritma Maximum Spanning Tree yang digunakan merupakan algoritma yang didasarkan hubungan causal relationship. Hubungan ini diperlihatkan melalui nilai korelasi spearman. Nilai korelasi antar peubah dapat dilihat pada Lampiran 1. Nilai korelasi ini selanjutnya digunakan sebagai pembobot pada setiap edge.

Langkah pertama adalah mencari edge dari peubah respon yang memiliki bobot terbesar yaitu edge antara peubah respon (Y) dan peubah rasa asin pada produk (X5). Kemudian

mencari edge dengan nilai bobot terbesar selanjutnya dari node-node yang sudah terhubungkan tetapi tidak membentuk siklus. Algoritma ini berhenti saat semua node sudah terhubungkan minimal dengan satu edge. Gambar 5 memperlihatkan struktur BN hasil algoritma Maximum Spanning Tree. Peubah tingkat kesukaan (Y) merupakan child dari peubah kekuatan rasa asin (X5) dan warna produk (X1). Peubah kelezatan produk (X8) menjadi parent bagi peubah rasa asin (X5) yang selanjutnya menjadi child bagi peubah rasa keju (X7) dan peubah kekuatan rasa setelah dirasakan (X9).

Gambar 5 Struktur BN dengan algoritma Maximum Spanning Tree

Struktur BN dengan menggunakan algoritma Maximum Spanning Tree memperlihatkan bahwa selain peubah warna produk (X1) dan rasa asin pada produk (X5), ketujuh peubah yang lain tidak mempengaruhi peubah tingkat kesukaan (Y) secara langsung. Perubahan pada peubah kekuatan aroma (X2) akan mempengaruhi peubah kekuatan rasa susu (X6) terlebih dahulu, selanjutnya perubahan peubah kekuatan rasa susu (X6) akan mempengaruhi peubah kelezatan produk (X8), dan perubahan peubah kelezatan produk ini yang akan mempengaruhi peubah rasa asin (X5) yang secara langsung berpengaruh terhadap peubah tingkat kesukaan (Y). Begitu pula dengan perubahan pada ketebalan produk (X3) dan kelembutan produk (X4). Perubahan pada peubah-peubah ini akan mempengaruhi peubah kekuatan rasa setelah dirasakan (X9), kelezatan produk (X8), kekuatan rasa asin (X5), dan akhirnya akan berpengaruh terhadap tingkat kesukaan (Y).

Tabel 1 memperlihatkan hasil perbandingan klasifikasi aktual dan dugaan tingkat kesukaan dengan menggunakan algoritma Maximum Spanning Tree. Hasil klasifikasi dengan menggunakan algoritma tersebut memiliki tingkat akurasi dugaan klasifikasi sebesar 75.5%.

Hasil klasifikasi yang tidak sesuai antara hasil dugaan dan aktual banyak terdapat pada kategori sangat suka (5) yaitu sebesar 25%. Sedangkan untuk kategori tidak suka (2) dan


(16)

biasa saja (3) tidak ada satu pun hasil dugaan yang diklasifikasi pada kategori ini.

Tabel 1 Dugaan klasifikasi algoritma Maximum Spanning Tree

Aktual Total

2 3 4 5

Du

g

aa

n 2 0 0 0 0 0

3 0 0 0 0 0

4 2 1 20 3 26

5 1 4 38 131 174

Total 3 5 58 134 200

Algoritma Equivalence Classes

Algoritma Equivalence Classes merupakan algoritma yang didasarkan pada tingkat kesamaan (Equivalence) peubah. Peubah yang memiliki kesamaan akan memiliki hubungan yang erat dan tingkat kebebasan yang kecil. Hubungan kesamaan dan kebebasan antar peubah ini ditunjukkan dengan nilai khi-kuadrat yang dapat dilihat pada Lampiran 3. Jika pada uji khi-kuadrat kedua peubah dinyatakan saling bebas, maka kedua peubah tersebut tidak dihubungkan dengan edge. Gambar 6 memperlihatkan struktur BN yang dibangun dengan menggunakan algoritma equivalence classes.

Gambar 6 Struktur BN dengan algoritma Equivalence Classes

Struktur BN dengan menggunakan algoritma equivalence classes memperlihatkan bahwa hanya peubah kelezatan produk (X8) yang berpengaruh langsung terhadap peubah tingkat kesukaan (Y). Selain peubah tersebut, peubah lain memiliki pengaruh tidak langsung terhadap peubah tingkat kesukaan.

Perubahan pada peubah kelembutan produk (X5) akan terlebih dahulu mempengaruhi peubah ketebalan produk (X4). Selanjutnya perubahan pada peubah ini akan berpengaruh terhadap peubah rasa keju (X7) dan perubahan pada peubah ini akan mempengaruhi peubah kelezatan produk (X8) yang secara langsung berpengaruh pada tingkat kesukaan (Y).

Begitu pula dengan perubahan pada peubah warna produk (X1). Perubahan pada peubah ini secara berturut-turut akan berpengaruh terhadap peubah rasa asin pada

produk (X5), kekuatan rasa susu (X6), rasa keju (X7), kelezatan produk (X8), dan akhirnya akan berpengaruh terhadap tingkat kesukaan (Y). Sedangkan perubahan pada peubah kekuatan aroma (X2) dan kekuatan rasa setelah dirasakan (X9) akan terlebih dahulu berpengaruh pada peubah rasa keju (X7) dan kelezatan produk (X8) yang pada akhirnya berpengaruh terhadap peubah tingkat kesukaan (Y).

Hasil klasifikasi nilai dugaan tingkat kesukaan menggunakan struktur BN dengan algoritma Equivalence Classes yang dibandingkan dengan nilai aktual dapat dilihat pada Tabel 2. Hasil klasifikasi dengan menggunakan algoritma tersebut memiliki tingkat akurasi dugaan klasifikasi sebesar 69.5%.

Tabel 2 Dugaan klasifikasi algoritma Equivalence Classes

Aktual Total

2 3 4 5

Du

g

aa

n 2 3 1 0 0 4

3 0 0 0 0 0

4 0 0 2 0 2

5 0 4 56 134 194

Total 3 5 58 134 200

Hasil klasifikasi nilai dugaan tingkat kesukaan yang tidak sesuai dengan aktual untuk kategori sangat suka (5) sebesar 30%. Nilai ini merupakan nilai terbesar ketidak sesuaian antara hasil dugaan dengan aktualnya. Hasil klasifikasi terkecil terdapat pada kategori suka (4) yaitu hanya diduga sebanyak 4 dari 58 pada nilai aktual.

Klasifikasi dengan Semi Naïve Bayesian Algoritma BSE

Penerapan algoritma BSE diawali dengan proses klasifikasi dengan metode simple-naïve Bayesian yaitu menggunakan seluruh peubah penjelas dan menghubungkan semua peubah tersebut dengan peubah tingkat kesukaan (Y) sebagai peubah respon. Tingkat akurasi dugaan klasifikasi yang dihasilkan dengan proses klasifikasi ini sebesar 94%. Nilai akurasi klasifikasi ini selanjutnya digunakan sebagai dasar untuk melakukan eliminasi peubah penjelas.

Tingkat akurasi klasifikasi terbesar hasil proses eliminasi salah satu peubah penjelas yaitu sebesar 93%. Nilai tersebut terjadi saat proses eliminasi untuk peubah penjelas kelembutan produk (X4), rasa keju (X7), dan kekuatan rasa setelah dirasakan (X9). Karena nilai tingkat akurasi klasifikasi hasil proses eliminasi tersebut lebih kecil dari nilai tingkat


(17)

akurasi klasifikasi proses klasifikasi simple-naïve Bayesian (Ci≤ C0), maka proses eliminasi peubah selesai.

Struktur BN yang diperoleh dengan menerapkan algoritma BSE sama dengan struktur BN hasil proses klasifikasi simple-naïve Bayesian yaitu menggunakan seluruh peubah penjelas. Struktur BN dengan menggunakan algoritma BSE dapat dilihat pada Gambar 7.

Gambar 7 Struktur BN dengan algoritma BSE

Tingkat akurasi dugaan klasifikasi hasil Semi Naïve Bayesian dengan penerapan algoritma BSE dapat dilihat pada Tabel 3. Hasil klasifikasi dengan menggunakan algoritma tersebut memiliki tingkat akurasi dugaan klasifikasi sebesar 94%.

Tabel 3 Dugaan klasifikasi Semi Naïve Bayesian dengan algoritma BSE

Aktual Total

2 3 4 5

Du

g

aa

n 2 3 0 0 0 3

3 0 4 0 0 4

4 0 0 48 1 49

5 0 1 10 133 144

Total 3 5 58 134 200

Hasil klasifikasi pada Tabel 3 menunjukkan banyaknya klasifikasi yang tidak sesuai untuk kategori sangat suka (5) sebesar 7.6%, dan untuk kategori suka (4) relatif kecil yaitu sebesar 2%. Sedangkan untuk kategori tidak suka (2) hasil dugaan sama dengan nilai aktual.

Algoritma FSS

Penerapan algoritma FSS pada prinsipnya sama dengan penerapan algoritma BSE yaitu menentukan peubah penjelas yang meningkatkan akurasi klasifikasi. Berlawanan dengan penerapan algoritma BSE yang melakukan eliminasi, algoritma ini diawali dengan gugus himpunan peubah penjelas yang kosong, kemudian dilakukan proses penambahan peubah penjelas yang dapat meningkatkan tingkat akurasi klasifikasi paling besar.

Proses penambahan peubah penjelas dengan menggunakan peubah penjelas rasa asin pada produk (X5) menghasilkan tingkat akurasi klasifikasi sebesar 73%. Nilai ini merupakan nilai ketepatan klasifikasi terbesar di antara kombinasi penambahan peubah penjelas yang lain, sehingga peubah penjelas ini menjadi dasar klasifikasi (C0) untuk proses penambahan peubah penjelas selanjutnya.

Susunan peubah penjelas yang terbentuk dari penerapan algoritma FSS adalah sebagai berikut. Peubah penjelas kekuatan rasa setelah dirasakan (X9) merupakan peubah penjelas yang selanjutnya bergabung dengan peubah respon karena memiliki nilai tingkat akurasi klasifikasi terbesar dibandingkan dengan kombinasi peubah penjelas lain, yaitu sebesar 76.5%. Nilai ini lebih besar dari nilai tingkat ketepatan klasifikasi dasar (C0) = 73.5%. Proses penambahan peubah penjelas secara berturut-turut yaitu: warna produk (X1), kelezatan produk (X8), kekuatan rasa susu (X6), kekuatan aroma (X2), ketebalan produk (X3), dan rasa keju (X7). Proses penambahan peubah penjelas berhenti saat nilai tingkat akurasi klasifikasi hasil penambahan peubah penjelas lebih kecil dari tingkat akurasi klasifikasi dasar (Ci ≤ C0). Peubah penjelas kelembutan produk (X4) tidak dimasukan karena penambahan peubah penjelas ini tidak meningkatkan ketepatan klasifikasi.

Gambar 8 Struktur BN dengan menggunakan algoritma FSS Tabel tingkat ketepatan klasifikasi hasil Semi-Naïve Bayesian dengan penerapan algoritma FSS disajikan pada Tabel 4.

Tabel 4 Dugaan klasifikasi Semi Naïve Bayesian dengan algoritma FSS

Aktual Total

2 3 4 5

Du

g

aa

n 2 3 0 0 0 3

3 0 4 0 0 4

4 0 0 48 3 51

5 0 1 10 131 142

Total 3 5 58 134 200 Tingkat akurasi dugaan klasifikasi akhir yang dihasilkan dengan penerapan algoritma FSS yaitu sebesar 93%. Hasil klasifikasi yang


(18)

tidak sesuai banyak terdapat pada kategori sangat suka (5) yaitu sebesar 8%.

Perbandingan Tingkat Akurasi Dugaan klasifikasi dinyatakan memiliki hasil yang baik jika memiliki tingkat akurasi klasifikasi yang besar. Tingkat akurasi klasifikasi yang dihasilkan dengan metode klasifikasi BN Terboboti dan Semi Naïve Bayesian disajikan pada Tabel 5.

Secara umum metode Semi Naïve Bayesian memiliki tingkat akurasi dugaan klasifikasi yang lebih baik dibandingkan metode BN Terboboti. Penerapan kedua algoritma pada metode Semi Naïve Bayesian memiliki nilai akurasi dugaan klasifikasi lebih dari 90%, sedangkan algoritma BN Terboboti memberikan akurasi dugaan klasifikasinya kurang dari 80%.

Tabel 5 Perbandingan Tingkat Akurasi

Metode Tingkat

Akurasi BN Terboboti

-Maximum Spaning Tree 75.5%

-Equilavence Classes 69.5%

Semi-Naïve Bayesian

-Backward Sequential Elimination 94% -Forward Sequential Selection 93% Tingkat akurasi dugaan klasifikasi yang dihasilkan metode Semi-Naïve Bayesian dengan algoritma BSE memiliki nilai yang sama dengan Simple Naïve Bayesian. Tingkat akurasi dugaan klasifikasi yang dihasilkan dalam penelitian ini bernilai maksimum saat semua peubah penjelas dihubungkan dengan peubah respon.

Analisis Perubahan Peubah Penjelas Dugaan klasifikasi BN dapat digunakan dalam melihat perubahan peluang yang terjadi pada peubah respon ketika peluang peubah penjelas berubah. Hal ini dapat dilakukan dengan cara merubah peluang pada kategori-kategori peubah penjelas dan dilihat sejauh mana perubahan peluang yang terjadi pada peubah respon. Struktur BN yang digunakan adalah struktur yang memiliki tingkat akurasi yang tertinggi yaitu Semi-Naïve Bayesian, dengan algoritma BSE.

Pembahasan selanjutnya akan difokuskan analisis perubahan persentase pada kategori suka (4) dan sangat suka (5), baik pada peubah penjelas maupun peubah respon. Tabel 6 memperlihatkan contoh perubahan yang terjadi pada peubah tingkat kesukaan (Y) saat persentase kategori-kategori pada peubah warna produk (X1), kekuatan aroma (X2), dan semua peubah penjelas ditingkatkan menjadi 100%. Saat kategori suka (4) pada peubah penjelas ditingkatkan menjadi 100% akan berdampak pada peningkatan persentase kategori suka (4) dan penurunan persentase kategori sangat suka (5) pada peubah tingkat kesukaan (Y). Sedangkan saat persentase kategori sangat suka (5) pada peubah penjelas ditingkatkan menjadi 100% akan berdampak pada penurunan persentase kategori suka (4) dan peningkatan persentase sangat suka (5) pada peubah tingkat kesukaan (Y). Perubahan yang terjadi pada peubah respon saat setiap kategori - kategori peubah penjelas ditingkatkan menjadi 100% disajikan dengan lengkap pada Lampiran 5.

Tabel 6 Perubahan persentase peubah respon saat persentase kategori suka (4) dan sangat suka (5) pada peubah warna produk, kekuatan aroma, dan semua peubah penjelas ditingkatkan menjadi 100%.

Tingkat Kesukaan (Y) (%)

Suka (4) Sangat suka (5)

Persentase awal 23.74 38.97

Ditingkatkan menjadi 100%

Warna Produk Suka (4) 27.52ꜛ 32.66

Sangat suka (5) 21.19 43.96ꜛ

Ditingkatkan menjadi 100%

Kekuatan Aroma Suka (4) 24.94ꜛ 33.13

Sangat suka (5) 23.08 42.60ꜛ

Ditingkatkan menjadi 100%

Semua Peubah Penjelas Suka (4) 16.67 83.33ꜛ


(19)

10 Gambar 9. Perubahan yang terjadi pada peubah respon saat persentase kategori sangat suka (5) pada peubah penjelas ditingkatkan menjadi 100%


(20)

Perubahan persentase kategori-kategori peubah tingkat kesukaan (Y) saat kategori sangat suka (5) pada setiap peubah penjelas ditingkatkan menjadi 100% dapat dilihat pada Gambar 9. Pengaruh terhadap kategori tidak suka (2), biasa saja (3), dan suka (4) pada peubah tingkat kesukaan (Y) bernilai negatif, sedangkan pada kategori sangat suka (5) bernilai positif. Artinya jika terjadi perubahan persentase pada kategori sangat suka (5) peubah penjelas, maka akan menurunkan persentase kategori tidak suka (2), biasa saja (3), dan suka (4) pada peubah tingkat kesukaan (Y). Sedangkan perubahan tersebut akan meningkatkan persentase kategori sangat suka (5) pada peubah tingkat kesukaan (Y).

Besarnya kontribusi peubah penjelas terhadap perubahan persentase kategori sangat suka (5) pada tingkat kesukaan (Y) disajikan pada Tabel 7. Nilai tersebut diperoleh dari selisih persentase kategori sangat suka (5) pada peubah respon saat persentase kategori sangat suka (5) dan suka (4) peubah penjelas ditingkatkan menjadi 100%.

Pada Tabel 7 dapat dilihat bahwa peubah penjelas yang memiliki kontribusi paling besar adalah peubah rasa keju (X5) dengan kontribusi sebesar 18.49%, sedangkan peubah rasa asin pada produk (X5) adalah peubah yang memiliki kontribusi terkecil terhadap perubahan persentase kategori sangat suka (5). Peubah kekuatan rasa setelah dirasakan (X9) bernilai negatif, artinya saat kategori suka (4)

ditingkatkan menjadi kategori sangat suka (5) pada peubah ini maka kategori sangat suka (5) pada peubah tingkat kesukaan (Y) akan mengalami penurunan.

Tabel 7 Kontribusi setiap peubah penjelas. Peubah Penjelas Persentase

Kontribusi

Rasa Keju (X7) 18.49%

Kekuatan Rasa Susu (X6) 17.59% Warna dari Produk (X1) 14.72% Kelezatan Produk (X8) 12.94%

Kekuatan Aroma (X2) 12.33%

Kelembutan Produk (X4) 11.85%

Ketebalan Produk (X3) 9.60%

Rasa Asin pada Produk (X5) 3.24% Kekuatan Rasa Setelah

dirasakan (X9) -0.77%

Analisis Perubahan Peubah Respon Perubahan persentase pada peubah respon merupakan akibat dari perubahan persentase pada peubah-peubah penjelas. Analisis perubahan peubah penjelas terhadap respon sudah kita bicarakan pada pembahasan sebelumnya. Dalam analisis perubahan peubah respon akan diteliti kondisi-kondisi peubah penjelas yang dapat menyebabkan tingkat kesukaan berada pada kondisi tertentu. Analisis ini melibatkan semua peubah penjelas yang terhubungkan dengan peubah tingkat kesukaan (Y).

Gambar 10 Kondisi peubah-peubah penjelas saat kategori sangat suka (5) pada peubah tingkat kesukaan (Y) ditingkatkan menjadi 100%.


(21)

Kondisi sangat suka (5) pada peubah tingkat kesukaan (Y) merupakan kondisi yang diharapkan oleh para produsen. Kondisi ini memperlihatkan bahwa konsumen sangat menyukai produk yang ditawarkan oleh para produsen. Untuk melihat bagaimana kondisi peubah-peubah penjelas saat terjadi kondisi sangat suka (5) sebesar 100%, maka kondisi peubah-peubah penjelas dapat dilihat pada Gambar 10.

Persentase kondisi kategori sangat suka (5) pada tingkat kesukaann (Y) mencapai 100% saat peubah-peubah aroma dari produk (X2), ketebalan produk (X3), kelembutan produk (X4), kekuatan rasa susu (X6), rasa keju (X7), dan kelezatan produk (X8) memiliki persentase kategori sangat suka (5) lebih dari 70%. Sedangkan peubah warna produk (X1) memiliki persentase 60%, dan peubah rasa asin pada produk (X5) dan kekuatan rasa setelah dirasakan (X9) memiliki persentase lebih dari 50% untuk kategori yang sama. Perubahan persentase terbesar setelah kategori sangat suka (5) ditingkatkan menjadi 100% terjadi pada peubah kekuatan rasa susu (X6), yaitu sebesar 8.65%. Hal ini menunjukkan bahwa peubah penjelas tersebut cukup sensitif terhadap perubahan pada peubah respon.

Perbandingan Tingkat Akurasi untuk Kategori Berbeda

Pengkategorian ulang tingkat kesukaan yang pada awalnya lima kategori menjadi empat dan tiga kategori memberikan hasil struktur BN dan tingkat akurasi yang berbeda untuk setiap kategori. Perbandingan tingkat akurasi dapat dilihat pada Tabel 8.

Tabel 8 Perbandingan Tingkat Akurasi untuk jumlah kategori berbeda

Metode

Tingkat Akurasi 3 kategori 4 kategori 5 kategori BN Terboboti -Maximum

Spaning Tree 97.0% 75.5% 75.5% -Equilavence

Classes 97.5% 75.0% 69.5%

Semi-Naïve

Bayesian

-BSE 98.5% 94.0% 94.0% -FSS 98.5% 93.0% 93.0%

Pada Tabel 8 dapat dilihat bahwa metode Semi-Naïve Bayesian memiliki tingkat akurasi yang lebih tinggi dibandingkan metode BN Terboboti pada setiap pengkategorian tingkat

kesukaan. Nilai tingkat akurasi terbesar terjadi saat tingkat kesukaan dikategorikan dengan tiga kategori (tidak suka, biasa saja, dan suka). Hal ini dikarenakan jumlah data yang ada pada setiap kategori peubah penjelas lebih banyak, sehingga peubah-peubah penjelas tersebut dapat memberikan informasi lebih banyak terhadap peubah respon.

Struktur BN dan tingkat akurasinya untuk setiap jumlah kategori dapat dilihat pada Lampiran 6 dan 7. Saat tingkat kesukaan hanya dikategorikan menjadi tiga kategori, peubah penjelas yang digunakan sebanyak 8 peubah penjelas. Hal ini karena peubah kelembutan produk (X4) tidak teridentifikasi sebagai data yang ordinal pada perangkat lunak yang digunakan.

KESIMPULAN

Pendekatan BN dalam analisis tingkat kesukaan konsumen pada produk dapat menggambarkan hubungan antar tingkat kesukaan dan berbagai peubah yang mempengaruhinya. Metode semi-naive Bayesian memiliki tingkat akurasi yang lebih baik dibanding metode BN Terboboti. Tingkat akurasi tertinggi diperoleh saat menggunakan algoritma BSE.

Analisis perubahan peubah penjelas menunjukkan bahwa peningkatan persentase kategori sangat suka (5) pada peubah respon dipengaruhi perubahan persentase untuk kategori yang sama pada peubah penjelas. Peubah penjelas yang memiliki kontribusi terbesar terhadap tingkat kesukaan adalah rasa keju.

Kedua metode, BN Terboboti dan Semi naïve Bayesian, menghasilkan tingkat akurasi terbesar untuk tingkat kesukaan dengan tiga kategori (tidak suka, biasa saja, dan suka).

DAFTAR PUSTAKA

Frank E, Trigg L, Holmes G, Witten I.H. 1999. Technical note naïve bayes for regression. Machine Learning: 1-20. Jouffe L. 2008. Data analysis-satisfaction poll.

[terhubung berkala]. http://www.bayesia. com/assets/files/produits/blab/resources/en /BayesiaLab-satisfaction-poll-analysis.pdf [12 Juli 2011]

Langley P, Sage S. 1994. Induction of selective bayesian classifiers. Di dalam: Kaufmann M (Eds.). Proceedings of the Tenth Conference on Uncertainty in Artificial Intelligence. hal 399-406.


(22)

Lesmanawati I. 2008. Pengklasifikasian nilai mutu ujian komprehensif mahasiswa departemen statistika ipb menggunakan semi naïve bayesian classifier [Skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor.

Martono T. 1990. Teori Graf dan Aplikasinya. Bogor: UPT PMI LSI IPB.

Munir R. 2003. Matematika Diskrit. Edisi kedua. Bandung: Informatika.

Nasoetion AH, Rambe A. 1984. Teori Statistika untuk Ilmu-Ilmu Kuantitatif. Ed ke-2. Jakarta: Bhratara Karya Aksara Neapolitan RE. 2004. Learning Bayesian

Network. Northeastern Ilinois University. Chicago: Pearson Prentice Hall.

Purwadi I. 2009. Penerapan bayesian network dalam penetapan daerah tertinggal [Skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor.

Zeng F, Web GI. 2005. A comparative study of semi-naïve bayes method in classification learning. Di dalam: S.J. Simoff, G.J. Williams, J. Galloway and I.Kolyshkina (Eds.). Proceedings of Fourth Australasian Data Mining

Workshop (AusDM05); Sydney:


(23)

(24)

Lampiran 1 Nilai korelasi Spearman antar peubah.

Y X1 X2 X3 X4 X5 X6 X7 X8 X9

Y 0.38 0.28 0.09* 0.03* 0.40 0.36 0.24 0.27 0.25

X1 0.38 0.29 0.19 0.22 0.31 0.21 0.26 0.30 0.29

X2 0.28 0.29 0.22 0.15 0.29 0.47 0.44 0.44 0.30

X3 0.09* 0.19 0.22 0.54 0.24 0.24 0.36 0.33 0.39

X4 0.03* 0.22 0.15 0.54 0.25 0.18 0.32 0.27 0.39

X5 0.40 0.31 0.29 0.24 0.25 0.42 0.39 0.44 0.29

X6 0.36 0.21 0.47 0.24 0.18 0.42 0.58 0.46 0.38

X7 0.24 0.26 0.44 0.36 0.32 0.39 0.58 0.56 0.47

X8 0.27 0.30 0.44 0.33 0.27 0.44 0.46 0.56 0.48

X9 0.25 0.29 0.30 0.39 0.39 0.29 0.38 0.47 0.48 Keterangan : * tidak nyata


(25)

Lampiran 3 Nilai Khi-kuadrat antar peubah

Y X1 X2 X3 X4 X5 X6 X7 X8 X9

Y 35.4 66.9 29.2 0.6* 57.3 66.5 81.6 170.4 133.4 X1 35.4 24.2 10.9* 12.5 38.6 13.9* 18.3 20.6* 22.6 X2 66.9 24.2 33.7 8.3 26.1 94.9 92.6 109.6 54.7 X3 29.2 10.9* 33.7 60.0 18.7* 27.2 56.2 48.3 47.9

X4 0.6* 12.5 8.3 60.0 20.8 6.5* 23.9 18.2 33.8

X5 57.3 38.6 26.1 18.7* 20.8 104.0 79.1 52.7 51.6 X6 66.5 13.9* 94.9 27.2 6.5* 104.0 196.9 141.9 134.0 X7 81.6 18.3 92.6 56.2 23.9 79.1 196.9 190.1 138.8 X8 170.4 20.6* 109.6 48.3 18.2 52.7 141.9 190.1 214.5 X9 133.4 22.6 54.7 47.9 33.8 51.6 134.0 138.8 214.5 Keterangan : * tidak nyata


(26)

Lampiran 5 Perubahan persentase peubah respon saat persentase setiap kategori pada peubah penjelas ditingkatkan menjadi 100%.

Tingkat Kesukaan (Y) (%)

Tidak Suka (2) Biasa saja (3) Suka (4) Sangat suka (5)

Persentase awal 18.49 18.81 23.74 38.97

Ditingkatkan menjadi 100%

W ar n a Pro d u

k Tidak Suka (2) 24.18 24.18 27.44 24.19

Biasa saja (3) 24.62 24.62 26.09 24.66

Suka (4) 19.90 19.92 27.52 32.66

Sangat suka (5) 17.15 17.69 21.19 43.96

Ditingkatkan menjadi 100%

Kek u atan Ar o m

a Tidak Suka (2) 25.00 25.00 25.00 25.00

Biasa saja (3) 24.82 24.82 24.82 25.53

Suka (4) 20.97 20.97 24.94 33.13

Sangat suka (5) 16.91 17.41 23.08 42.60

Ditingkatkan menjadi 100%

Kete b alan Pro d u

k Tidak Suka (2) 24.80 24.80 25.60 24.80

Biasa saja (3) 24.97 24.97 24.97 25.08

Suka (4) 20.97 21.91 23.02 34.10

Sangat suka (5) 17.23 17.29 24.00 41.47

Ditingkatkan menjadi 100%

Kele m -b u atan Pro d u

k Suka (4) 21.90 21.92 23.85 32.32

Sangat suka (5) 17.22 17.66 23.70 41.42

Ditingkatkan menjadi 100%

R asa As in p ad a Pro d u k Sangat Tidak

Suka (1) 24.97 24.97 24.97 25.10

Tidak Suka (2) 22.71 22.72 28.36 26.21

Biasa saja (3) 24.09 24.09 27.59 24.23

Suka (4) 17.89 18.65 23.97 39.50

Sangat suka (5) 17.72 17.81 22.49 41.99

Ditingkatkan menjadi 100%

Kek u atan R asa Su su

Tidak Suka (2) 24.23 24.23 24.50 27.05

Biasa saja (3) 24.98 24.98 24.98 25.06

Suka (4) 20.16 21.06 27.93 30.85

Sangat suka (5) 17.01 17.08 21.55 44.36

Ditingkatkan menjadi 100%

R

asa

Keju

Tidak Suka (2) 25.00 25.00 25.00 25.00

Biasa saja (3) 24.96 24.96 24.96 25.12

Suka (4) 23.11 23.14 24.91 28.84

Sangat suka (5) 16.61 17.05 23.29 43.04

Ditingkatkan menjadi 100%

Kele za tan Pro d u

k Tidak Suka (2) 25.00 25.00 25.00 25.00

Biasa saja (3) 25.00 25.00 25.00 25.00

Suka (4) 22.09 22.11 23.83 31.97

Sangat suka (5) 17.00 17.44 23.66 41.91

Ditingkatkan menjadi 100%

Kek

u

atan

R

asa

Setelah dirasak

an Tidak Suka (2) 24.99 25.04 24.99 24.99

Biasa saja (3) 25.00 25.00 25.00 25.00

Suka (4) 18.39 18.41 23.31 39.89


(27)

Lampiran 6 Struktur BN dan Tingkat Akurasi untuk 3 kategori Tingkat Kesukaan kategori awal kategori baru

1,2,3,4 1

5 2

6,7,8,9 3

BN Terboboti

1. Algoritma Spanning Tree

Struktur BN dengan algoritma Maximum Spanning Tree

Dugaan Klasifikasi algoritma Maximum Spanning Tree

Aktual Total

1 2 3

Du

g

aa

n 1 3 2 1 6

2 0 0 0 0

3 0 3 191 194 Total 3 5 192 200 Tingkat akurasi : 97%

2. Algoritma Equivalence Classes

Struktur BN dengan algoritma Equivalence Classe

Dugaan Klasifikasi algoritma Equivalence Classe

Aktual Total

1 2 3

Du

g

aa

n 1 3 1 0 4

2 0 0 0 0

3 0 4 192 196 Total 3 5 192 200 Tingkat akurasi : 97.5%

Semi-Naïve Bayesian 1. Algoritma BSE

Struktur BN dengan algoritma BSE

Dugaan Klasifikasi algoritma BSE

Aktual Total

1 2 3

Du

g

aa

n 1 3 0 0 3

2 0 2 0 2

3 0 3 192 195

Total 3 5 192 200 Tingkat akurasi : 98.5%

2. Algoritma FSS

Struktur BN dengan algoritma FSS

Dugaan Klasifikasi algoritma FSS

Aktual Total

1 2 3

Du

g

aa

n 1 3 0 0 3

2 0 2 0 2

3 0 3 192 195

Total 3 5 192 200 Tingkat akurasi : 98.5%


(28)

Lampiran 7 Struktur BN dan Tingkat Akurasi untuk 4 kategori Tingkat Kesukaan kategori awal kategori baru

1,2,3,4 1

5 2

6,7 3

8,9 4

BN Terboboti

1. Algoritma Spanning Tree

Struktur BN dengan algoritma Maximum Spanning Tree

Dugaan Klasifikasi algoritma Maximum Spanning Tree

Aktual Tota

l

1 2 3 4

Du

g

aa

n 1 0 0 0 0 0

2 0 0 0 0 0

3 2 1 21 4 28

4 1 4 37 130 172

Total 3 5 58 134 200 Tingkat akurasi : 75.5%

2. Algoritma Equivalence Classes

Struktur BN dengan algoritma Equivalence Classe

Dugaan Klasifikasi algoritma Equivalence Classe

Aktual Tota

l

1 2 3 4

Du

g

aa

n 1 3 1 0 0 4

2 0 0 0 0 0

3 0 1 24 11 36

4 0 3 34 123 160

Total 3 5 58 134 200 Tingkat akurasi : 75%

Semi-Naïve Bayesian 1. Algoritma BSE

Struktur BN dengan algoritma BSE

Dugaan Klasifikasi algoritma BSE

Aktual Tota

l

1 2 3 4

Du

g

aa

n 1 3 0 0 0 3

2 0 4 0 0 4

3 0 0 48 1 49

4 0 1 10 133 144

Total 3 5 58 134 200 Tingkat akurasi : 94%

2.Algoritma FSS

Struktur BN dengan algoritma FSS

Dugaan Klasifikasi algoritma FSS

Aktual Tota

l

1 2 3 4

Du

g

aa

n 1 3 0 0 0 3

2 0 4 0 0 4

3 0 0 48 3 51

4 0 1 10 131 142

Total 3 5 58 134 200 Tingkat akurasi : 93%


(29)

PENDAHULUAN

Latar belakang

Analisis tingkat kesukaan konsumen terhadap suatu produk merupakan salah satu cara yang dilakukan produsen dalam mengevaluasi produk yang dikeluarkannya. Analisis ini memberikan penilaian pada berbagai aspek produk. Hasil penilaian konsumen ini merupakan hal penting untuk memperbaiki aspek mana yang harus ditingkatkan agar produknya tetap disukai para konsumen. Data yang digunakan umumnya berskala ordinal yang diperoleh melalui survei langsung pada konsumen. Metode yang selama ini banyak digunakan oleh instansi riset pemasaran adalah analisis regresi berganda. Namun demikian dalam penggunaannya sering dihadapkan dengan tidak terpenuhinya asumsi analisis regresi. Salah satu pendekatan yang dapat digunakan untuk menganalisis data berskala ordinal adalah Bayesian Network (BN).

BN merupakan pendekatan yang digunakan untuk mengetahui hubungan antar peubah dalam bentuk jaringan (networks). Metode ini cocok diterapkan pada data yang berskala ordinal. Metode BN yang sering digunakan adalah Simple Naïve Bayesian, akan tetapi metode ini mengasumsikan antar peubah penjelas saling bebas, sedangkan dalam kenyataannya asumsi kebebasan antar-peubah penjelas ini sering tidak terpenuhi sehingga berkembang berbagai metode alternatif untuk mengatasi kondisi ini.

Salah satu metode alternatif yang dapat digunakan adalah Semi Naïve Bayesian. Metode ini dibangun untuk mengurangi pengaruh ketidakbebasan antar peubah penjelas (Zeng & Web 2005). Lesmanawati (2008) menggunakan algoritma Backward Sequential Elimination (BSE) dan Forward Sequential Selection (FSS) dalam penelitiannya untuk mengklasifikasi nilai mutu ujian komprehensif mahasiswa Departemen Statistika IPB.

Metode alternatif yang lainnya adalah BN Terboboti (Weighted Bayesian Network). Metode ini dibangun dengan menggunakan suatu pembobot dalam menyusun struktur BN. Metode alternatif ini pernah digunakan oleh Purwadi (2009) dalam penelitiannya untuk penetapan daerah tertinggal. Algoritma yang digunakan adalah algoritma Maximum Spanning Tree dan Equivalence Classes.

Kedua metode alternatif tersebut digunakan saat kondisi peubah penjelas tidak

saling bebas. Penelitian ini akan membandingkan tingkat keakuratan klasifikasi yang lebih baik antara metode Semi-Naive Bayesian dan BNTerboboti.

Tujuan Tujuan penelitian ini adalah:

1. Menerapkan metode BN dalam analisis tingkat kesukaan konsumen pada suatu produk.

2. Membandingkan metode BN Terboboti (algoritma Maximum Spanning Tree dan Equivalence Classes) dan Semi-Naïve Bayesian (algoritma BSE dan FSS) dalam kemampuan mengklasifikasikan tingkat kesukaan pada kasus produk biskuit. 3. Menganalisis perubahan persentase

peubah respon akibat perubahan persentase peubah penjelas dan sebaliknya.

TINJAUAN PUSTAKA

Bayesian Network

BN merupakan suatu model peluang grafis yang merepresentasikan suatu gugus peubah dan peluang bebasnya (Neapolitan 2004). Model ini didasarkan atas teorema Bayes. Teorema Bayes menyatakan jika S suatu ruang contoh dan {A1,.…, An} merupakan sekatan S dengan syarat P( ≠0, i=1, …, n;

 . Jika B merupakan suatu kejadian pada ruang contoh S dengan syarat P(B)≠0, maka secara matematis kaidah peluang Bayes dapat dituliskan sebagai berikut (Nasoetion & Rambe, 1984):

|

| |

(1)

Menurut Hassan (2007) diacu dalam Purwadi (2009), BN merupakan pasangan dari (G,P) di mana G=(N,E) adalah Directed Acylic Graph (DAG) atau graf berarah, sedangkan P adalah sebaran peluang bersyarat.

Gambar 1Graf berarah dengan nodeN={P,Q,R} dan edgeE={(P,Q),(P,R)}


(30)

PENDAHULUAN

Latar belakang

Analisis tingkat kesukaan konsumen terhadap suatu produk merupakan salah satu cara yang dilakukan produsen dalam mengevaluasi produk yang dikeluarkannya. Analisis ini memberikan penilaian pada berbagai aspek produk. Hasil penilaian konsumen ini merupakan hal penting untuk memperbaiki aspek mana yang harus ditingkatkan agar produknya tetap disukai para konsumen. Data yang digunakan umumnya berskala ordinal yang diperoleh melalui survei langsung pada konsumen. Metode yang selama ini banyak digunakan oleh instansi riset pemasaran adalah analisis regresi berganda. Namun demikian dalam penggunaannya sering dihadapkan dengan tidak terpenuhinya asumsi analisis regresi. Salah satu pendekatan yang dapat digunakan untuk menganalisis data berskala ordinal adalah Bayesian Network (BN).

BN merupakan pendekatan yang digunakan untuk mengetahui hubungan antar peubah dalam bentuk jaringan (networks). Metode ini cocok diterapkan pada data yang berskala ordinal. Metode BN yang sering digunakan adalah Simple Naïve Bayesian, akan tetapi metode ini mengasumsikan antar peubah penjelas saling bebas, sedangkan dalam kenyataannya asumsi kebebasan antar-peubah penjelas ini sering tidak terpenuhi sehingga berkembang berbagai metode alternatif untuk mengatasi kondisi ini.

Salah satu metode alternatif yang dapat digunakan adalah Semi Naïve Bayesian. Metode ini dibangun untuk mengurangi pengaruh ketidakbebasan antar peubah penjelas (Zeng & Web 2005). Lesmanawati (2008) menggunakan algoritma Backward Sequential Elimination (BSE) dan Forward Sequential Selection (FSS) dalam penelitiannya untuk mengklasifikasi nilai mutu ujian komprehensif mahasiswa Departemen Statistika IPB.

Metode alternatif yang lainnya adalah BN Terboboti (Weighted Bayesian Network). Metode ini dibangun dengan menggunakan suatu pembobot dalam menyusun struktur BN. Metode alternatif ini pernah digunakan oleh Purwadi (2009) dalam penelitiannya untuk penetapan daerah tertinggal. Algoritma yang digunakan adalah algoritma Maximum Spanning Tree dan Equivalence Classes.

Kedua metode alternatif tersebut digunakan saat kondisi peubah penjelas tidak

saling bebas. Penelitian ini akan membandingkan tingkat keakuratan klasifikasi yang lebih baik antara metode Semi-Naive Bayesian dan BNTerboboti.

Tujuan Tujuan penelitian ini adalah:

1. Menerapkan metode BN dalam analisis tingkat kesukaan konsumen pada suatu produk.

2. Membandingkan metode BN Terboboti (algoritma Maximum Spanning Tree dan Equivalence Classes) dan Semi-Naïve Bayesian (algoritma BSE dan FSS) dalam kemampuan mengklasifikasikan tingkat kesukaan pada kasus produk biskuit. 3. Menganalisis perubahan persentase

peubah respon akibat perubahan persentase peubah penjelas dan sebaliknya.

TINJAUAN PUSTAKA

Bayesian Network

BN merupakan suatu model peluang grafis yang merepresentasikan suatu gugus peubah dan peluang bebasnya (Neapolitan 2004). Model ini didasarkan atas teorema Bayes. Teorema Bayes menyatakan jika S suatu ruang contoh dan {A1,.…, An} merupakan sekatan S dengan syarat P( ≠0, i=1, …, n;

 . Jika B merupakan suatu kejadian pada ruang contoh S dengan syarat P(B)≠0, maka secara matematis kaidah peluang Bayes dapat dituliskan sebagai berikut (Nasoetion & Rambe, 1984):

|

| |

(1)

Menurut Hassan (2007) diacu dalam Purwadi (2009), BN merupakan pasangan dari (G,P) di mana G=(N,E) adalah Directed Acylic Graph (DAG) atau graf berarah, sedangkan P adalah sebaran peluang bersyarat.

Gambar 1Graf berarah dengan nodeN={P,Q,R} dan edgeE={(P,Q),(P,R)}


(31)

Martono (1990) menyebutkan suatu graf G=(N,E) terdiri atas dua gugus objek yaitu N=(n1,n2, n3,…) adalah suatu gugus tak kosong yang unsur-unsurnya disebut simpul (node)dan gugus E=(e1,e2, e3,…) yaꜜg uꜜsur -unsurnya disebut sisi (edge), sedemikian sehingga masing-masing edge ek diidentifikasikan dengan pasangan tidak terurut (ni, nj).

Parents didefinisikan sebagai node yang dijadikan syarat dan child adalah node yang diberikan syarat. Pada Gambar 1 dapat dijelaskan bahwa P merupakan parent dari Q dan R atau dapat dijelaskan bahwa Q dan R merupakan child dari P.

Pembuatan model dalam BN melibatkan dua langkah yaitu:

1. Membuat struktur jaringan

Struktur jaringan dalam BN dibentuk dalam suatu graf. Sebuah graf terdiri dari kumpulan node dan edge. Node merupakan titik simpul dan edge merupakan garis yang menghubungkan titik node tersebut.

2. Mengestimasi nilai peluang setiap node. Algoritma Naïve Bayesian

Naïve Bayes merupakan salah satu algoritma pembangun struktur BN dengan asumsi antar peubah penjelas saling bebas (naive). Algoritma Naïve Bayesian bekerja secara sederhana dalam membangun model BN, yaitu dengan menghubungkan semua peubah penjelas ke peubah respon. Arah hubungan (edge) pada BN semuanya mengarah ke peubah respon karena asumsi naïve menyatakan bahwa peubah penjelas diasumsikan saling bebas. Struktur BN yang dibangun dengan algoritma ini dapat dilihat pada Gambar 2. Node P sebagai peubah respon dan node Q, R, dan S sebagai peubah penjelas.

Gambar 2 Struktur BN dengan algoritma naïve bayesian.

Langkah kerja algoritma Naïve Bayes menurut Frank et al. (1999) dalam membangun struktur BN sebagai berikut:

1. Seluruh peubah dalam keadaan diskret (jika ada peubah kontinu didiskretisasi terlebih dahulu).

2. Menentukan peubah respon.

3. Hubungkan semua peubah penjelas pada peubah respon dengan edge.

4. Semua arah edge peubah penjelas menuju ke peubah respon.

5. Menghitung peluang bersyaratnya. Semi Naïve Bayessian

Metode Semi Naive Bayesian secara garis besar dapat dibagi dalam dua kelompok. Kelompok pertama membangun simple naïve Bayesian dengan menggunakan sekumpulan peubah penjelas baru yang dapat dihasilkan dari proses deleting attributes dan joining attributes.Kelompok ini membangun struktur Bayesian dengan menyeleksi peubah yang memberikan keakuratan yang tinggi. Kelompok kedua membangun simple naive Bayesian dengan membuat struktur garis penghubung secara jelas di antara peubah-peubah penjelas yang menunjukkan hubungan ketidakbebasan (saling mempengaruhi) antar peubah penjelas (Zheng & Webb 2005).

Metode semi naïve Bayesian yang digunakan pada penelitian ini adalah deleting attributes. Zheng & Webb (2005) menjelaskan bahwa ada dua pendekatan yang dapat digunakan dalam deleting attributes, yaitu BSE dan FSS. Baik BSE maupun FSS memiliki tujuan yang sama, yaitu memilih atau menentukan himpunan bagian dari peubah penjelas yang dapat menyebabkan terjadinya peningkatan akurasi terbesar dari simple naive Bayesian.

BSE diawali dengan menggunakan keseluruhan set peubah penjelas, kemudian dilakukan proses eliminasi peubah yang dapat menyebabkan terjadinya peningkatan akurasi terbesar. Sedangkan FSS menggunakan cara yang berlawanan dengan BSE, yaitu diawali dengan gugus himpunan peubah penjelas yang kosong, kemudian dilakukan proses penambahan peubah yang dapat menyebabkan terjadinya peningkatan akurasi paling besar. Baik proses eliminasi maupun penambahan peubah terus dilakukan hingga tidak ada lagi peningkatan akurasi (Langley & Sage 1994; Zeng & Web 2005).

Himpunan bagian dari peubah-peubah yang terpilih diasumsikan saling bebas dan dinotasikan sebagai Attribute = {bg1, . . . , bgn}. sedangkan kategori-kategori pada peubah yang terpilih dinotasikan sebagai {g1,…, gn}. Kaidah klasifikasi pada BSE dan FSS


(32)

(2) dilakukan dengan memilih peluang bersama yang terbesar berdasarkan rumus:

∏ |

dengan:

arg max :.argumen yang memaksimumkan fungsi.

: peubah penjelas ke-j j=g1, ..., gn. gk : kategori ke-k dari peubah penjelas

yang terpilih

: peubah yang menjadi syarat : peluang prior kejadian

| : peluang kejadian b setalah a terjadi. Penjabaran langkah-langkah algoritma BSE dari Zeng & Web (2005) menurut Lesmanawati (2008) adalah sebagai berikut: 1. Diawali dengan proses klasifikasi simple

naive Bayesian dengan menggunakan seluruh peubah penjelas.

( P0 = p adalah banyaknya peubah penjelas awal ; P = P0 ; n = p-1; i = 1).

2. Hitung akurasi dugaan klasifikasi yang dihasilkan, notasikan sebagai C0.

3. Tentukan kombinasi n peubah penjelas yang mungkin terbentuk dari p peubah penjelas yang tersedia dengan cara mengeliminasi sebuah peubah penjelas. 4. Lakukan proses klasifikasi simple naïve

Bayesian untuk setiap kombinasi peubah penjelas yang telah terbentuk pada langkah ketiga serta hitung akurasi dugaan klasifikasinya.

5. Tentukan kombinasi peubah penjelas yang menghasilkan tingkat akurasi dugaan terbesar. Notasikan tingkat akurasi dugaan klasifikasi terbesar tersebut sebagai Ci. 6. Bandingkan Ci dengan C0 :

 Jika Ci ≤ C0, proses eliminasi peubah selesai.

 Jika Ci > C0, kembali ke langkah tiga untuk melanjutkan proses eliminasi peubah dari n peubah penjelas yang diperoleh pada langkah lima dengan menetapkan C0 = Ci ; n= n-1; p = p-1; i = i +1.

7. Proses eliminasi peubah penjelas berhenti jika semua peubah penjelas sudah tereliminasi.

Sedangkan penjabaran langkah-langkah akgoritma FSS dari Zeng & Web (2005) menurut Lesmanawati (2008) adalah sebagai berikut:

1. Diawali dengan set peubah penjelas kosong.

(P0 = 0 adalah banyaknya peubah penjelas mula-mula; n = P0+2; i = 1 ).

2. Tambahkan satu peubah penjelas dan lakukan proses klasifikasi simple naïve Bayesian dengan menggunakan satu peubah penjelas untuk setiap peubah penjelas yang tersedia.

3. Tentukan peubah penjelas yang menghasilkan tingkat akurasi dugaan klasifikasi terbesar. Notasikan tingkat akurasi dugaan terbesar tersebut sebagai C0.

4. Tambahkan kembali satu peubah penjelas sebagai dasar klasifikasi, lalu tentukan kombinasi n peubah penjelas yang mungkin terbentuk dari p peubah penjelas yang tersedia. Kombinasi harus mengandung peubah penjelas yang diperoleh pada langkah tiga.

5. Lakukan kembali proses klasifikasi simple naive Bayesian untuk setiap kombinasi peubah penjelas yang telah terbentuk pada langkah empat serta hitung akurasi dugaan klasifikasinya.

6. Tentukan kombinasi peubah penjelas pada langkah empat yang menghasilkan tingkat akurasi dugaan terbesar. Notasikan tingkat akurasi dugaan terbesar tersebut sebagai Ci.

7. Bandingkan Ci dengan C0 :

 Jika Ci ≤ C0, proses penambahan peubah berhenti/selesai.

 Jika Ci > C0, kembali ke langkah empat untuk melanjutkan proses penambahan peubah dari n peubah penjelas yang diperoleh pada langkah enam dengan menetapkan C0 = Ci ; n = n+1; i = i+1. 8. Proses penambahan peubah penjelas

berhenti jika semua peubah penjelas yang tersedia sudah masuk/sudah ditambahkan.

BN Terboboti

BN Terboboti adalah metode untuk menyususn struktur BN dengan menggunakan suatu nilai pembobot pada setiap edge. Nilai pembobot yang digunakan dapat berupa jarak, korelasi, dan kekuatan hubungan lainnya. Pada penelitian ini digunakan algoritma Maximum Spanning Tree dan Equivalence Classes.

Algoritma Maximum Spanning Tree

Maximum Spanning Tree adalah himpunan bagian dari suatu graf G yang tidak memiliki siklus namun memiliki node yang sama seperti G. Syarat Spanning tree adalah semua


(1)

(2)

Lampiran 1 Nilai korelasi Spearman antar peubah.

Y X1 X2 X3 X4 X5 X6 X7 X8 X9

Y 0.38 0.28 0.09* 0.03* 0.40 0.36 0.24 0.27 0.25 X1 0.38 0.29 0.19 0.22 0.31 0.21 0.26 0.30 0.29 X2 0.28 0.29 0.22 0.15 0.29 0.47 0.44 0.44 0.30 X3 0.09* 0.19 0.22 0.54 0.24 0.24 0.36 0.33 0.39 X4 0.03* 0.22 0.15 0.54 0.25 0.18 0.32 0.27 0.39 X5 0.40 0.31 0.29 0.24 0.25 0.42 0.39 0.44 0.29 X6 0.36 0.21 0.47 0.24 0.18 0.42 0.58 0.46 0.38 X7 0.24 0.26 0.44 0.36 0.32 0.39 0.58 0.56 0.47 X8 0.27 0.30 0.44 0.33 0.27 0.44 0.46 0.56 0.48 X9 0.25 0.29 0.30 0.39 0.39 0.29 0.38 0.47 0.48

Keterangan : * tidak nyata


(3)

Lampiran 3 Nilai Khi-kuadrat antar peubah

Y X1 X2 X3 X4 X5 X6 X7 X8 X9

Y 35.4 66.9 29.2 0.6* 57.3 66.5 81.6 170.4 133.4 X1 35.4 24.2 10.9* 12.5 38.6 13.9* 18.3 20.6* 22.6 X2 66.9 24.2 33.7 8.3 26.1 94.9 92.6 109.6 54.7 X3 29.2 10.9* 33.7 60.0 18.7* 27.2 56.2 48.3 47.9 X4 0.6* 12.5 8.3 60.0 20.8 6.5* 23.9 18.2 33.8 X5 57.3 38.6 26.1 18.7* 20.8 104.0 79.1 52.7 51.6 X6 66.5 13.9* 94.9 27.2 6.5* 104.0 196.9 141.9 134.0 X7 81.6 18.3 92.6 56.2 23.9 79.1 196.9 190.1 138.8 X8 170.4 20.6* 109.6 48.3 18.2 52.7 141.9 190.1 214.5 X9 133.4 22.6 54.7 47.9 33.8 51.6 134.0 138.8 214.5 Keterangan : * tidak nyata


(4)

Lampiran 5 Perubahan persentase peubah respon saat persentase setiap kategori pada peubah penjelas ditingkatkan menjadi 100%.

Tingkat Kesukaan (Y) (%)

Tidak Suka (2) Biasa saja (3) Suka (4) Sangat suka (5)

Persentase awal 18.49 18.81 23.74 38.97

Ditingkatkan menjadi 100%

W ar n a Pro d u

k Tidak Suka (2) 24.18 24.18 27.44 24.19

Biasa saja (3) 24.62 24.62 26.09 24.66

Suka (4) 19.90 19.92 27.52 32.66

Sangat suka (5) 17.15 17.69 21.19 43.96

Ditingkatkan menjadi 100%

Kek u atan Ar o m

a Tidak Suka (2) 25.00 25.00 25.00 25.00

Biasa saja (3) 24.82 24.82 24.82 25.53

Suka (4) 20.97 20.97 24.94 33.13

Sangat suka (5) 16.91 17.41 23.08 42.60

Ditingkatkan menjadi 100%

Kete b alan Pro d u

k Tidak Suka (2) 24.80 24.80 25.60 24.80

Biasa saja (3) 24.97 24.97 24.97 25.08

Suka (4) 20.97 21.91 23.02 34.10

Sangat suka (5) 17.23 17.29 24.00 41.47

Ditingkatkan menjadi 100%

Kele m -b u atan Pro d u

k Suka (4) 21.90 21.92 23.85 32.32

Sangat suka (5) 17.22 17.66 23.70 41.42

Ditingkatkan menjadi 100%

R asa As in p ad a Pro d u k Sangat Tidak

Suka (1) 24.97 24.97 24.97 25.10

Tidak Suka (2) 22.71 22.72 28.36 26.21

Biasa saja (3) 24.09 24.09 27.59 24.23

Suka (4) 17.89 18.65 23.97 39.50

Sangat suka (5) 17.72 17.81 22.49 41.99

Ditingkatkan menjadi 100%

Kek u atan R asa Su su

Tidak Suka (2) 24.23 24.23 24.50 27.05

Biasa saja (3) 24.98 24.98 24.98 25.06

Suka (4) 20.16 21.06 27.93 30.85

Sangat suka (5) 17.01 17.08 21.55 44.36

Ditingkatkan menjadi 100%

R

asa

Keju

Tidak Suka (2) 25.00 25.00 25.00 25.00

Biasa saja (3) 24.96 24.96 24.96 25.12

Suka (4) 23.11 23.14 24.91 28.84

Sangat suka (5) 16.61 17.05 23.29 43.04

Ditingkatkan menjadi 100%

Kele za tan Pro d u

k Tidak Suka (2) 25.00 25.00 25.00 25.00

Biasa saja (3) 25.00 25.00 25.00 25.00

Suka (4) 22.09 22.11 23.83 31.97

Sangat suka (5) 17.00 17.44 23.66 41.91

Ditingkatkan menjadi 100%

Kek

u

atan

R

asa

Setelah dirasak

an Tidak Suka (2) 24.99 25.04 24.99 24.99

Biasa saja (3) 25.00 25.00 25.00 25.00

Suka (4) 18.39 18.41 23.31 39.89


(5)

Lampiran 6 Struktur BN dan Tingkat Akurasi untuk 3 kategori Tingkat Kesukaan kategori awal kategori baru

1,2,3,4 1

5 2

6,7,8,9 3

BN Terboboti

1. Algoritma Spanning Tree

Struktur BN dengan algoritma Maximum Spanning Tree

Dugaan Klasifikasi algoritma Maximum Spanning Tree

Aktual Total

1 2 3

Du

g

aa

n 1 3 2 1 6 2 0 0 0 0 3 0 3 191 194 Total 3 5 192 200 Tingkat akurasi : 97%

2. Algoritma Equivalence Classes

Struktur BN dengan algoritma Equivalence Classe

Dugaan Klasifikasi algoritma Equivalence Classe

Aktual Total

1 2 3

Du

g

aa

n 1 3 1 0 4

2 0 0 0 0 3 0 4 192 196 Total 3 5 192 200 Tingkat akurasi : 97.5%

Semi-Naïve Bayesian

1. Algoritma BSE

Struktur BN dengan algoritma BSE

Dugaan Klasifikasi algoritma BSE

Aktual Total

1 2 3

Du

g

aa

n 1 3 0 0 3

2 0 2 0 2

3 0 3 192 195 Total 3 5 192 200 Tingkat akurasi : 98.5%

2. Algoritma FSS

Dugaan Klasifikasi algoritma FSS

Aktual Total

1 2 3

Du

g

aa

n 1 3 0 0 3

2 0 2 0 2

3 0 3 192 195 Total 3 5 192 200


(6)

Lampiran 7 Struktur BN dan Tingkat Akurasi untuk 4 kategori Tingkat Kesukaan kategori awal kategori baru

1,2,3,4 1

5 2

6,7 3

8,9 4

BN Terboboti

1. Algoritma Spanning Tree

Struktur BN dengan algoritma Maximum Spanning Tree

Dugaan Klasifikasi algoritma Maximum Spanning Tree

Aktual Tota

l

1 2 3 4

Du

g

aa

n 1 0 0 0 0 0

2 0 0 0 0 0

3 2 1 21 4 28

4 1 4 37 130 172 Total 3 5 58 134 200 Tingkat akurasi : 75.5%

2. Algoritma Equivalence Classes

Struktur BN dengan algoritma Equivalence Classe

Dugaan Klasifikasi algoritma Equivalence Classe

Aktual Tota

l

1 2 3 4

Du

g

aa

n 1 3 1 0 0 4

2 0 0 0 0 0

3 0 1 24 11 36 4 0 3 34 123 160 Total 3 5 58 134 200 Tingkat akurasi : 75%

Semi-Naïve Bayesian

1. Algoritma BSE

Struktur BN dengan algoritma BSE

Dugaan Klasifikasi algoritma BSE

Aktual Tota

l

1 2 3 4

Du

g

aa

n 1 3 0 0 0 3

2 0 4 0 0 4

3 0 0 48 1 49

4 0 1 10 133 144 Total 3 5 58 134 200 Tingkat akurasi : 94%

2.Algoritma FSS

Struktur BN dengan algoritma FSS

Dugaan Klasifikasi algoritma FSS

Aktual Tota

l

1 2 3 4

Du

g

aa

n 1 3 0 0 0 3

2 0 4 0 0 4

3 0 0 48 3 51

4 0 1 10 131 142 Total 3 5 58 134 200 Tingkat akurasi : 93%