Preferensi Karakteristik Kopi 3 in 1 Menggunakan Metode Pohon Regresi dan Klasifikasi

PREFER
ERENSI KARAKTERISTIK KOPI 3 IN 1
MENGGUN
NAKAN METODE POHON REGRESI
ESI DAN
KLASIFIKASI

FITRIYANTO

DEPARTEMEN STATISTIKA
FAKULTAS MA
ATEMATIKA DAN ILMU PENGETAHU
UAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2010

RINGKASAN
FITRIYANTO. Preferensi Karakteristik Kopi 3 in 1 Menggunakan Metode Pohon Regresi dan
Klasifikasi. Dibimbing oleh AUNUDDIN dan LA ODE ABDUL RAHMAN.
Saat ini, banyak perusahaan yang berlomba-lomba memproduksi kopi 3 in 1. Hal ini

menimbulkan tantangan bagi salah satu pihak perusahaan kopi 3 in 1, yaitu PT X yang
memproduksi kopi X. Perusahaan ini harus lebih pandai menciptakan produk yang disukai
masyarakat agar produknya laris di pasaran. Untuk mengetahui apakah produk sudah disukai oleh
konsumen perlu dilakukan evaluasi produk. Tahap awal yang dapat dilakukan oleh PT X adalah
eksplorasi data dengan membuat klasifikasi karakteristik kopi X. Analisis yang dapat digunakan
untuk membuat klasifikasi adalah metode pohon regresi dan klasifikasi (classification and
regression trees). Pohon regresi dan klasifikasi adalah salah satu metode eksplorasi data yaitu
berupa teknik pohon keputusan. Pohon keputusan yang digunakan pada penelitian ini adalah
pohon klasifikasi. Penelitian ini menghasilkan pohon klasifikasi optimum dengan peubah penjelas
yang masuk kedalam pohon yaitu kekuatan aroma kopi dan kekuatan rasa susu. Hasil klasifikasi
sebanyak tiga klasifikasi karakteristik kopi X dengan dua klasifikasi memiliki label kelas bahwa
konsumen menyukai produk kopi X dan sisanya memiliki label kelas bahwa konsumen biasa saja
terhadap produk ini.
Kata kunci: pohon klasifikasi, kopi 3 in 1

PPREFERENSI KARAKTERISTIK KOPI 3 IN 1
MENGGUNAKAN METODE POHON REGRESI DAN
KLASIFIKASI

FITRIYANTO


Skripsi sebagai salah satu syarat untuk memperoleh
gelar Sarjana Statistika pada Departemen Statistika

DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2010

Judul :
Nama :
NRP :

Preferensi Karakteristik Kopi 3 in 1 Menggunakan Metode Pohon
Regresi dan Klasifikasi
Fitriyanto
G14061368

Menyetujui:

Pembimbing I,

Pembimbing II,

Prof. Dr. Ir. Aunuddin, M.Sc
NIP.19470615 197106 1 001

La Ode Abdul Rahman, S.Si, M.Si

Mengetahui:
Ketua Departemen Statistika
Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor

Dr. Ir. Hari Wijayanto, M.Si
NIP. 19650421 199002 1 001

Tanggal Lulus:

KATA PENGANTAR

Puji dan syukur penulis panjatkan kehadirat Tuhan Yang Maha Esa atas segala rahmat,
hidayah, kemudahan, dan karunia-Nya sehingga skripsi yang berjudul “Preferensi Karakteristik
Kopi 3 in 1 Menggunakan Metode Pohon Regresi dan Klasifikasi ” ini dapat diselesaikan dengan
baik.
Pada kesempatan ini, penulis mengucapkan terima kasih kepada:
1. Bapak Prof. Dr. Ir. Aunuddin, M.Sc sebagai ketua komisi pembimbing atas kesabarannya
dalam membimbing dan memberi ide, saran serta kritik membangun selama penulisan karya
ilmiah ini.
2. Bapak La Ode Abdul Rahman, S.Si, M.Si selaku dosen pembimbing atas seluruh masukan dan
dukungan yang diberikan sehingga karya ilmiah ini dapat diselesaikan dengan baik.
3. Ibu Pika Silvianti selaku penguji luar atas kesediaannya memberikan saran dan membantu
penulis dalam menyempurnakan karya ilmiah ini.
4. Bapak Kelik Harjono dan M Mufti Mubarak yang telah bersedia membantu penulis untuk
memperoleh data yang digunakan dalam karya ilmiah ini.
5. Ibu Endang, Mba Susan dan suluruh Ibu pengasuh di Yayasan Namira yang telah membantu
membiayai kuliah penulis
6. Ibu dan kakak tersayang atas segala dukungan dan semangat yang tak henti-hentinya
selama ini.
7. Nurhayati atas diskusi dan semangatnya dalam membantu penulis menyelesaikan penulisan ini.
8. Teman-teman STK 43. “Terima kasih atas diskusi dan motivasinya.”

Penulis sangat berharap karya ilmiah ini dapat bermanfaat bagi penulis dan pembaca.
Bogor, Desember 2010

Fitriyanto

RIWAYAT HIDUP
Penulis dilahirkan di Jakarta pada tanggal 18 Mei 1988 sebagai anak bungsu dari
pasangan Bapak Wardaya dan Ibu Sutarni. Penulis mengawali pendidikan dasar pada tahun 1994
di SD Negeri 03 Petang Jakarta dan lulus pada tahun 2000. Penulis melanjutkan sekolah ke SLTP
Negeri 131 Jakarta hingga tahun 2003. Selanjutnya, penulis menamatkan pendidikan menengah
atas di SMA Negeri 49 Jakarta pada tahun 2006 dan pada tahun yang sama penulis diterima di
Perguruan Tinggi Institut Pertanian Bogor melalui jalur SPMB dengan mayor Statistika dan minor
Manajemen Fungsional.
Selama menjadi mahasiswa, Penulis aktif di kelembagaan kemahasiswaan IPB sebagai
anggota Himpunan Keprofesian Gamma Sigma Beta Statistika IPB. Penulis pernah menjadi
asisten dosen untuk mata kuliah rancangan percobaan pada semester enam dan mata kuliah metode
statistika pada semester tujuh. Penulis juga pernah bekerja menjadi staf promosi di bimbingan
belajar dan olah data Statistics Centre periode tahun 2008 sampai 2009.

DAFTAR ISI

Halaman
DAFTAR TABEL .................................................................................................................
viii
DAFTAR GAMBAR ............................................................................................................
viii
DAFTAR LAMPIRAN .........................................................................................................
viii
PENDAHULUAN
Latar Belakang.................................................................................................................
Tujuan..............................................................................................................................

1
1

TINJAUAN PUSTAKA
Pohon Regresi dan Klasifikasi .........................................................................................
Pemilihan Pemilah ...........................................................................................................
Penentuan Simpul Terminal ............................................................................................
Penandaan Label Kelas ....................................................................................................
Penentuan Pohon Optimum .............................................................................................


1
1
2
2
2

DATA DAN METODE
Data .................................................................................................................................
Metode .............................................................................................................................

3
3

HASIL DAN PEMBAHASAN
Deskripsi Peubah Respon ................................................................................................
Analisis Pohon Klasifikasi Menggunakan Metode Pohon Regresi dan Klasifikasi .........

3
4


SIMPULAN DAN SARAN
Simpulan ..........................................................................................................................
Saran ................................................................................................................................

6
6

DAFTAR PUSTAKA ...........................................................................................................

6

LAMPIRAN ..........................................................................................................................

7

DAFTAR TABEL
1
2


Halaman
Statistik Deskriptif Kesukaan Konsumen terhadap Kopi X Secara Keseluruhan ..........
3
Urutan Pohon Klasifikasi ...............................................................................................
4

DAFTAR GAMBAR
1
2
3

Halaman
Struktur Pohon Klasifikasi .............................................................................................
1
Pohon Klasifikasi Optimum ...........................................................................................
4
Pohon Klasifikasi Hasil Pengembangan Satu Tahap dari Pohon Klasifikasi
Optimum ........................................................................................................................
5


DAFTAR LAMPIRAN
1
2
3

Halaman
Karakteristik Peubah ......................................................................................................
8
Nilai Tingkat Salah Pengklasifikasian Pengganti Relatif Validasi Silang
Setiap Pohon ..................................................................................................................
8
Pohon Klasifikasi Hasil Pengembangan Dua Tahap dari Pohon Klasifikasi
Optimum ........................................................................................................................
9

1

PENDAHULUAN
Latar Belakang
Saat ini banyak perusahaan yang

memproduksi kopi 3 in 1 dengan berbagai
merek. Salah satu untuk jenis minuman ini
adalah kopi X. Kopi X merupakan minuman
kopi 3 in 1 susu, yaitu campuran antara kopi,
gula dan susu yang diproduksi oleh PT X.
Banyaknya perusahan yang berlombalomba memproduksi kopi 3 in 1,
mengakibatkan adanya persaingan yang ketat.
Adanya persaingan menimbulkan tantangan
bagi salah satu pihak perusahaan kopi 3 in 1,
yaitu PT X. Pihak perusahaan minuman ini
harus lebih pandai menciptakan produk agar
produknya laris di pasaran.
Pada kenyataannya, sering kali suatu
konsumen menginginkan produk dengan
karakteristik tertentu. Oleh karena itu, PT X
harus menciptakan produk yang disukai
konsumen. Untuk mengetahui apakah produk
sudah disukai oleh konsumen perlu dilakukan
evaluasi produk.
Tahap awal yang dapat dilakukan oleh PT
X adalah eksplorasi data. Eksplorasi data yang
dapat dilakukan berbentuk klasifikasi. Analisis
yang dapat digunakan untuk membuat
klasifikasi adalah metode pohon regresi dan
klasifikasi (classification and regression
trees). Sedangkan untuk tahap selanjutnya
dapat dilakukan dengan metode lain.
Tujuan
Tujuan penelitian ini adalah membuat
klasifikasi karakteristik kopi X yang
disukai menggunakan metode pohon regresi
dan klasifikasi.

TINJAUAN PUSTAKA
Pohon Regresi dan Klasifikasi
Pohon
regresi
dan
klasifikasi
(classification and regression trees) adalah
salah satu metode eksplorasi data yaitu berupa
teknik pohon keputusan. Metode ini
dikembangkan oleh Leo Breiman, Jerome H.
Friedman, Richard A. Olshen dan Charles J.
Stone sekitar tahun 1980. Pohon regresi dan
klasifikasi merupakan pendekatan yang
populer untuk
membangun
klasifikasi
berdasarkan pohon biner (Mulier 1998).
Metode ini akan menghasilkan pohon regresi
jika peubah responnya kontinu dan
menghasilkan pohon klasifikasi jika peubah
responnya kategorik.

Pohon klasifikasi merupakan penyekatan
data secara berulang
(rekursif) dan
menghasilkan sekatan yang biner, karena
selalu membagi kumpulan data menjadi dua
sekatan. Hal ini dapat ditunjukan dalam suatu
gambar struktur pohon (Gambar 1).
Node/
Simpul

A
ya

tidak

cabang

C

B

C

C

Simpul
terminal

Gambar 1 Struktur pohon klasifikasi
Menurut Breiman et al. (1993), pohon
klasifikasi terdiri dari tiga elemen, yaitu:
1. Pemilihan pemilah.
2. Penentuan simpul terminal.
3. Penandaan label kelas.
Misalkan (X, y) merupakan peubah
penjelas dan peubah respon dengan X=(x1, x2,
..., xq)ЄRq tersusun dari q vektor penjelas dan
y={1, 2, ..., j} vektor label yang berkaitan,
sehingga terdapat himpunan data L={(xn, jn),
n=1, 2, ..., N}. T dinamakan pohon klasifikasi
sedangkan ∀t∈T dinamakan simpul pohon.
Elemen minimum dari T dinamakan akar(T).
Jika g,h∈T dan sisi kiri bagian simpul t
(g=l(h)) atau sisi kanan simpul t (g=r(h)),
maka h dinamakan simpul induk (induk(g))
dan g dinamakan simpul anak (anak(h)). Jika
h=induk(g) atau h=induk(induk(g)), g
dinamakan keturunan(h) dan h dinamakan
tertua(g). Tt adalah himpunan bagian dari T
yang memuat t dan seluruh keturunan t.
Pemangkasan cabang Tt dari T dengan cara
menghilangkan seluruh keturunan(t) dari T
yaitu potong seluruh Tt kecuali akar(Tt). Pohon
terpangkas
dinotasikan
dengan
T-Tt
(Kardiana et al. 2006).
Pemilihan Pemilah
Pada tahap ini akan dicari pemilah yang
menurunkan tingkat keheterogenan yang
paling tinggi dari setiap simpul. Breiman et al.
(1993)
menjelaskan
bahwa
impuritas
merupakan ukuran keheterogenan suatu
simpul. Fungsi impuritas yang dapat
digunakan adalah indeks Gini. Bila nilai
impuritas suatu simpul semakin besar maka
semakin heterogen simpul tersebut.

2

Nilai impuritas menggunakan indeks
Gini pada simpul t, i(t), dapat ditulis
sebagai berikut:
= 1−∑

|

dimana p(j|t) adalah peluang unit pengamatan
dalam kelas ke-j berasal dari simpul t yang
dinyatakan sebagai berikut:
|

=





/



/

dengan
adalah peluang awal kelas ke-j,
adalah banyaknya unit pengamatan yang
termasuk dalam kelas ke-j, dan
adalah
banyaknya unit pengamatan yang termasuk
dalam kelas ke-j pada simpul t.
Pemilahan dimulai dari ruang umum
dengan cara memeriksa nilai-nilai dari setiap
peubah penjelas. Misalkan untuk setiap
peubah penjelas xq dimana xq ∈ X, q=(1, 2, ...,
m). Untuk peubah penjelas yang dapat
diurutkan, pemilah peubah penjelas dilakukan
dengan bentuk xq ≤ c lawan xq > c, c adalah
bilangan riil . Jika peubah penjelas xq yang
tidak dapat diurutkan dengan b kategori,
dimana b∈{b1, b2,..., bd}, d adalah banyaknya
kategori peubah penjelas ke-q, maka b
kategori dibagi menjadi dua himpunan saling
lepas (akan terdapat sebanyak 2b-1-1
kemungkinan pemilah)
Misalkan terdapat calon pemilah s yang
memilah t menjadi tL (dengan proporsi PL)
dan menjadi tR (dengan proporsi PR), maka
kebaikan dari s didefinisikan sebagai
penurunan impuritas:


,

=











Pengembangan pohon dilakukan dengan
cara, pada simpul t1, carilah s* yang
memberikan nilai penurunan impuritas
tertinggi yaitu:


∗,

= max
∈!









dengan S adalah gugus yang berisi semua
kemungkinan penyekatan.
Maka
t1 dipilah menjadi
t2 dan
t3
menggunakan s*. Dengan cara yang sama
dilakukan juga pencarian pemilah terbaik
pada t2 dan t3 secara terpisah, dan seterusnya.
Sehingga
didapatkan
penurunan
keheterogenan pohon dengan membelah
simpul t sebagai berikut:

∆" ,

=#



$



dimana
p(t)
adalah peluang amatan
berada pada simpul t yang dapat ditulis
sebagai berikut:
=%

/

Penentuan Simpul Terminal
Suatu simpul t akan menjadi simpul
terminal atau tidak akan dipilah kembali,
apabila adanya batasan minimum jumlah
pengamatan. Umumnya jumlah pengamatan
minimum pada
simpul sebesar 5 dan
terkadang berjumlah 1 (Breiman et al. 1993).
Maka selanjutnya t tidak dipilah lagi tetapi
dijadikan simpul terminal dan hentikan
pembentukan pohon.
Penandaan Label Kelas
Label
kelas dari simpul terminal
ditentukan
berdasarkan
aturan
jumlah
terbanyak, yaitu jika P(j0|t) = max P(j|t),
maka label kelas untuk terminal t adalah j0
(Breiman et al. 1993).
Penentuan Pohon Optimum
Breiman et al. (1993) menjelaskan bahwa
pohon klasifikasi T tidak dibatasi ukurannya.
Pohon klasifikasi terbesar memberikan nilai
salah pengklasifikasian paling kecil sehingga
kita akan selalu cenderung memilih pohon ini
untuk prakiraan. Tetapi, pohon ini cukup
kompleks dalam menggambarkan struktur
data. Sehingga perlu dipilih pohon optimal
yang berukuran
sederhana
tetapi
memberikan tingkat salah pengklasifikasian
pengganti yang kecil.
Salah satu cara penentuan pohon
klasifikasi dengan pemangkasan (pruning).
Pemangkasan
berturut-turut
memangkas
beberapa bagian pohon. Hal ini bertujuan
untuk memperoleh pohon yang berukuran
sederhana. Ukuran pemangkasan yang
digunakan untuk memperoleh ukuran pohon
yang optimum adalah biaya kompleksitas
(cost-complexcity). Persamaan ukuran biaya
kompleksitas adalah:
&' () = & () + '|(+) |
dengan
& (,
adalah
tingkat
salah
pengklasifikasian pada pohon bagian Tk untuk
-, adalah himpunan simpul terminal
k ≥ 1, (
-, | adalah banyaknya simpul
pada Tk, |(

3

terminal pada Tk, dan α adalah parameter
biaya kompleksitas.
Tingkat salah pengklasifikasian penggganti
didapatkan dengan cara amatan induk L yang
berukuran n dibagi secara acak menjadi v
kelompok, yaitu L1, L2, ..., Lv yang sedapat
mungkin berukuran sama. Himpunan data
untuk membentuk pohon ke-v adalah L(v) = L Lv, dimana v = 1, 2, ..., V yang digunakan
untuk membentuk v urutan pohon T(v)(α).
Bila ukuran v besar, maka seharusnya
memiliki tingkat salah pengklasifikasian
yang sama dengan T(α) = T(αk) = Tk. Tingkat
salah
pengklasifikasian pengganti T(α)
sebagai berikut:
&./ ( '

=

1

%0 | )
1,

1

dengan N adalah banyaknya data pada L, c(i|j)
adalah
biaya
salah
pengklasifikasian
responden kelas ke-j diklasifikasikan sebagai
responden kelas ke-i.
adalah banyaknya responden
dimana Ni j
kelas ke-j diklasifikasikan sebagai responden
kelas ke-i.
1

=%
2

1

(2)

(2)
adalah banyaknya responden
dengan
1
kelas ke-j diklasifikasikan sebagai responden
kelas ke-i oleh T(v)(α).
Kemudian gunakan amatan induk L untuk
membentuk urutan {Tk} dengan αk ≤ α < αk+1.
maka tingkat
Definisikan '′, = 4', ',5
salah pengklasifikasian pengganti validasi
silang pada pohon bagian Tk
sebagai
berikut:

&./ ((, ) = &./ ((('′, ))
Hasil proses pemangkasan berupa sederet
pohon klasifikasi Tk dan dengan validasi silang
v-lipatan dapat ditentukan pohon optimum Tk0
sebagai berikut:
&./ ((,6 )

=

min(&./ ((, ))
,

DATA DAN METODE
Data
Data yang digunakan untuk penelitian ini
adalah data CLT (Central Location Test)
untuk produk kopi 3 in 1 di beberapa kota di
Indonesia yang didapat dari Pixel Research
(PT. Global Insight Indonesia). Pengambilan

data dengan
mengumpulkan beberapa
responden pada suatu tempat tertentu dan
memberikan kopi X yang sudah dihidangkan
kemudian responden menjawab pertanyaan
pada lembar pertanyaan. Total responden
sebanyak 415 orang dari tiga kota yaitu
Bandung, Cimahi dan Sukabumi. Produk kopi
yang dicobakan kepada responden merupakan
produk kopi baru yang dilambangkan dengan
produk kopi X. Semua responden merupakan
peminum kopi 3 in 1 dengan merek tertentu.
Peubah respon
merupakan peubah
kategorik yang bernilai 1 sampai 9 dengan
skala ordinal. Responden yang suka dengan
produk kopi X (y=3) terdiri dari skala 7
sampai 9, responden yang biasa saja dengan
produk kopi X (y=2) terdiri dari skala 5
sampai 6, dan responden yang tidak suka
dengan produk kopi X (y=1) terdiri dari skala
1 sampai 4.
Peubah penjelas merupakan peubah
kategorik yang bernilai 1 sampai 5 dengan
skala ordinal. Peubah penjelas yang digunakan
sebanyak sembilan peubah yang mencirikan
karakteristik dari produk kopi 3 in 1 susu.
Sembilan peubah penjelas tersebut adalah
kekutan aroma kopi, warna, tekstur ampas,
kekentalan, kekuatan rasa kopi, kekuatan
aroma susu, kekuatan rasa susu, kepahitan,
dan kemanisan.
Metode
Tahapan-tahapan yang dilakukan dalam
penelitian ini adalah:
1. Melakukan analisis statistika deskriptif
terhadap peubah respon.
2. Melakukan analisis pohon klasifikasi
menggunakan metode pohon regresi dan
klasifikasi.
3. Melakukan intepretasi hasil.
Software yang digunakan untuk analisis adalah
CART ver 4.0 dan Answertree ver 3.0.

HASIL DAN PEMBAHASAN
Deskripsi Peubah Respon
Deskripsi tingkat kesukaan konsumen
terhadap kopi X secara keseluruhan dapat
dikategorikan pada Tabel 1.
Tabel

1

Tidak Suka
Biasa Saja
Suka
Total

Statistik deskriptif kesukaan
konsumen terhadap kopi X
secara keseluruhan
Frekuensi
3
58
354
415

Persentase
0.72
13.98
85.30
100.00

4

Pada Tabel 1 dapat dilihat bahwa terdapat
tiga kategori yaitu konsumen yang tidak suka,
biasa saja dan suka terhadap produk kopi X.
Konsumen yang suka terhadap produk kopi X
sebanyak 354 orang (85.30%), konsumen yang
biasa saja sebanyak 58 orang (13.98%) dan
konsumen yang tidak suka sebanyak 3 orang
(0.72%). Secara deskriptif dapat dikatakan
bahwa sebagian besar konsumen menyukai
kopi X.
Analisis Pohon Klasifikasi Menggunakan
Metode Pohon Regresi dan Klasifikasi
Hasil analisis berupa urutan pohon
klasifikasi. Hasil analisis ini disajikan pada
Tabel 2. Pada Tabel 2 dapat dilihat bahwa
terjadi pemangkasan pohon klasifikasi dari
nomor pohon satu sampai nomor pohon tujuh.
Pohon klasifikasi optimum tercapai pada
nomor pohon tujuh. Jika nomor pohon
semakin besar maka jumlah simpul terminal
semakin kecil namun jika nomor pohon
semakin besar maka nilai parameter
kompleksitas semakin besar.
Tabel 2 Urutan pohon klasifikasi
Nomor Pohon

Jumlah Simpul
Terminal
1
26
2
23
3
19
4
12
5
8
6
5
7**
3
8
1
** pohon klasifikasi optimum

Parameter
Kompleksitas
0
8.24E-04
0.001
0.002
0.003
0.005
0.006
0.024

Pohon klasifikasi optimum diperoleh dari
pemangkasan pohon klasifikasi terbesar yang
menggunakan batasan minimum jumlah
amatan pada simpul induk sebanyak 5
sedangkan simpul anak sebanyak 1. Pohon
klasifikasi optimum disajikan pada Gambar 2.
Proses pemangkasan pohon klasifikasi ini
dilakukan dengan dasar aturan biaya
kompleksitas minimum dan validasi silang 10
lipatan. Pohon klasifikasi ini tercapai pada
parameter kompleksitas bernilai 0.006. Pohon
klasifikasi ini memiliki tiga simpul terminal.
Peubah penjelas yang masuk kedalam
pohon klasifikasi optimum yaitu kekuatan
aroma kopi dan kekuatan rasa susu. Peubah
pertama yang menyekat adalah kekuatan
aroma kopi. Hal ini menyatakan bahwa
peubah ini merupakan peubah yang dominan
dalam pembentukan pohon klasifikasi.
Konsumen sebanyak 415 orang, konsumen
yang merasa kekuatan aroma kopi sangat

kurang kuat atau kurang kuat sebanyak 71
orang mengelompok pada simpul 1 (kiri)
sedangkan konsumen yang merasa kekuatan
aroma kopi pas, kuat atau sangat kuat
sebanyak 344 orang mengelompok pada
simpul 2 (kanan). Simpul 2 merupakan simpul
terminal. Penurunan keheterogenan pohon
pada simpul pertama sebesar 0.0506.
kesukaan kopi X secara keseluruhan
Node 0
Category
%
n
tidak suka
0.72
3
biasa saja 13.98 58
suka
85.30 354
Total
(100.00) 415
Kekuatan Aroma Kopi
Improvement=0.0506

sangat kurang kuat,
kurang
kuatkuat
Node 2
Category
%
n
tidak suka
0.29
1
biasa saja
6.98 24
suka
92.73 319
Total
(82.89) 344

Kekuatan Rasa Susu
Improvement=0.0307

sangat kurang kuat,
kurang
kuatkuat
Node 4
Category
%
tidak suka
0.00
biasa saja 26.67
suka
73.33
Total
(10.84)

n
0
12
33
45

Gambar 2 Pohon klasifikasi optimum
Pada simpul 1, konsumen yang merasa
kekuatan rasa susu sangat kurang kuat atau
kurang kuat sebanyak 26 orang mengelompok
pada simpul 3 (kiri) sedangkan konsumen
yang merasa kekuatan rasa susu pas, kuat atau
sangat kuat sebanyak 45 orang mengelompok
pada simpul 4 (kanan). Simpul 3 dan 4
merupakan simpul terminal. Penurunan
keheterogenan pohon pada simpul 1
sebesar 0.0307.
Hasil pohon klasifikasi optimum yaitu tiga
klasifikasi karakteristik kopi X. Klasifikasi
yang terbentuk sebagai berikut:
1. Kekuatan aroma kopi dan kekuatan rasa
susu kurang. Label kelas pada klasifikasi
ini adalah konsumen biasa saja terhadap
kopi X.
2. Kekuatan aroma kopi kurang namun
kekuatan rasa susu pas atau kuat. Label
kelas pada klasifikasi ini adalah
konsumen suka terhadap kopi X.
3. Kekuatan aroma kopi pas atau kuat. Label
kelas pada klasifikasi ini adalah
konsumen suka terhadap kopi X.

5

mengelompok pada simpul 6 (kanan). Simpul
5 merupakan simpul terminal. Penurunan
keheterogenan pohon pada
simpul 2
sebesar 0.0158.
Pada simpul 6, konsumen yang merasa
kekuatan aroma kopi pas sebanyak 15 orang
mengelompok pada simpul 13 (kiri)
sedangkan konsumen yang merasa kekuatan
aroma kopi kuat atau sangat kuat sebanyak 6
orang mengelompok pada simpul 14 (kanan).
Simpul 13 dan 14 merupakan simpul terminal.
Penurunan keheterogenan pohon pada simpul
6 sebesar 0.0092.
Hasil pengembangan satu tahap dari pohon
klasifikasi optimum yaitu pohon klasifikasi
dengan lima klasifikasi karakteristik kopi X.
Klasifikasi yang terbentuk sebagai berikut:
1. Kekuatan aroma kopi dan kekuatan rasa
susu kurang. Label kelas pada klasifikasi
ini adalah konsumen biasa saja terhadap
kopi X.
2. Kekuatan aroma kopi kurang namun
kekuatan rasa susu pas atau kuat. Label
kelas pada klasifikasi ini adalah
konsumen suka terhadap kopi X.
3. Kekuatan aroma kopi pas atau kuat
namun kekuatan rasa kopi kurang atau
pas. Label kelas pada klasifikasi ini
adalah konsumen suka terhadap kopi X.

Karakteristik kopi X yang disukai
konsumen pada pohon klasifikasi ini yaitu
kopi X pada klasifikasi kedua dan ketiga.
Konsumen yang suka dengan kopi X sebanyak
389 orang, konsumen yang menyukai
karakteristik kopi X pada klasifikasi kedua
sebanyak 45 orang sedangkan pada klasifikasi
ketiga sebanyak 344 orang. Hal ini
menjelaskan
bahwa
sebagian
besar
konsumen menyukai karakteristik kopi pada
klasifikasi ketiga.
Jika pohon optimum dikembangkan satu
tahap lagi maka menghasilkan pohon dengan
pencabangan dari simpul 2. Pohon ini
disajikan pada Gambar 3. Pohon ini tercapai
pada parameter kompleksitas bernilai 0.005.
Pohon ini memiliki tiga peubah penjelas yang
masuk kedalam pohon klasifikasi yaitu
kekuatan aroma kopi, kekuatan rasa susu dan
kekuatan rasa kopi. Pohon ini memiliki jumlah
klasifikasi lebih banyak dibandingkan dengan
pohon klasifikasi optimum yaitu sebanyak
lima buah.
Pada simpul 2, konsumen yang merasa
kekuatan rasa kopi sangat kurang kuat, kurang
kuat atau pas
sebanyak 323 orang
mengelompok pada simpul 5 (kiri) sedangkan
konsumen yang merasa kekuatan rasa kopi
kuat atau sangat kuat sebanyak 21 orang

kesukaan kopi X secara keseluruhan
Node 0
Category
%
tidak suka
0.72
biasa saja 13.98
suka
85.30
Total
(100.00)

n
3
58
354
415

Kekuatan Aroma Kopi
Improvement=0.0506

pas, kuat, sangat kuat

Sangat kurang kuat,
kurang kuat

Node 2
Category
%
n
tidak suka
0.29
1
biasa saja
6.98 24
suka
92.73 319
Total
(82.89) 344

n
2
34
35
71

Kekuatan Rasa Susu
Improvement=0.0307

Sangat kurang kuat,
kurang kuat

Node 4
Category
%
tidak suka
0.00
biasa saja 26.67
suka
73.33
Total
(10.84)

n
0
12
33
45

sangat kurang kuat,
Pas

Kekuatan Aroma Kopi
Improvement=0.0092

pas

Pas

Node 14
Category
%
n
tidak suka 16.67
1
biasa saja 83.33
5
suka
0.00
0
Total
(1.45) 6

Gambar 3 Pohon klasifikasi hasil pengembangan satu tahap dari pohon klasifikasi optimum

6

4.

Kekuatan aroma kopi pas dan kekuatan
rasa kopi pas atau kuat. Label kelas pada
klasifikasi ini adalah konsumen suka
terhadap kopi X.
5. Kekuatan aroma kopi dan kekuatan rasa
kopi kuat. Label kelas pada klasifikasi
ini adalah konsumen biasa saja terhadap
kopi X.
Karakteristik kopi X yang disukai
konsumen pada pohon klasifikasi ini yaitu
kopi X pada klasifikasi kedua, ketiga dan
keempat. Konsumen yang suka dengan kopi X
sebanyak 383 orang, konsumen yang
menyukai karakteristik kopi X pada klasifikasi
kedua sebanyak 45 orang, pada klasifikasi
ketiga sebanyak 323 orang, dan pada
klasifikasi keempat sebanyak 15 orang. Hal ini
menjelaskan
bahwa
sebagian
besar
konsumen menyukai karakteristik kopi pada
klasifikasi ketiga.
Klasifikasi kedua, ketiga dan keempat
memiliki label kelas bahwa konsumen
menyukai produk X sedangkan sisanya
memiliki label kelas bahwa konsumen biasa
saja terhadap kopi X. Konsumen terbanyak
terdapat pada klasifikasi ketiga yaitu sebanyak
323 orang sedangkan kosumen yang paling
sedikit terdapat pada klasifikasi kelima yaitu
sebanyak 6 orang.
Pohon klasifikasi yang akan dipilih
merupakan pohon klasifikasi yang memiliki
nilai RCV terkecil. Jika melihat pohon hasil
pencabangan satu tahap dari pohon klasifikasi
optimum, pohon ini lebih terperinci namun
ada klasifikasi yang jumlah konsumennya
sedikit. Sehingga pohon klasifikasi yang
dipilih yaitu pohon klasifikasi optimum.

SIMPULAN DAN SARAN
Simpulan
Pohon klasifikasi yang terbentuk sebanyak
delapan urutan pohon klasifikasi. Pohon
klasifikasi yang akan dipilih merupakan pohon
klasifikasi yang memiliki nilai RCV terkecil.
Sehingga pohon klasifikasi yang dipilih yaitu
pohon klasifikasi optimum.
Pohon klasifikasi optimum menghasilkan
tiga klasifikasi karakteristik kopi X.
Klasifikasi yang terbentuk sebagai berikut:
1. Kekuatan aroma kopi dan kekuatan rasa
susu kurang. Label kelas pada klasifikasi
ini adalah konsumen biasa saja terhadap
kopi X.
2. Kekuatan aroma kopi kurang namun
kekuatan rasa susu pas atau kuat. Label

kelas pada klasifikasi ini adalah
konsumen suka terhadap kopi X.
3. Kekuatan aroma kopi pas atau kuat. Label
kelas pada klasifikasi ini adalah
konsumen suka terhadap kopi X.
Karakteristik kopi X yang disukai yaitu
kopi X pada klasifikasi kedua dan ketiga.
Saran
Untuk penelusuran peubah penjelas dalam
pendugaan tingkat kesukaan konsumen secara
keseluruhan terhadap kopi 3 in 1, dapat
menggunakan metode analisis yang lain
seperti metode pohon gabungan.

DAFTAR PUSTAKA
Breiman L, JH Friedman, RA Olshen, CJ
Stone. 1993. Classification and Regression
Trees. New York: Chapman and Hall.
Kardiana A, Aunuddin, AH Wigena, H
Wijayanto. 2006.
Metode Klasifikasi
Berstruktur Pohon Biner: Kasus Prakiraan
Sifat Hujan Bulanan di Bogor. Yogyakarta,
17 Juni 2006. Seminar Nasional
Aplikasi Teknologi Informasi (SNATI).
hlm: G21-G25.
Kurniawan T. 2002. Penerapan Metode
Pemangkasan dalam CART (Classification
and Regression Trees): Kasus Pendugaan
Status Gizi Anak di Kecamatan Bogor
Timur
[Skripsi].
Bogor:
Fakultas
Matematika dan Ilmu Pengetahuan Alam,
Institut Pertanian Bogor.
Mulier C. 1998. Learning From Data
Concept, Theory, and Methods. New York:
John Wiley & Sons, Inc.
Sinambela YS. 2008. Penerapan Metode
Pohon Klasifikasi dengan Algoritma
CART pada Data Status Daerah Kabupaten
di Indonesia [Skripsi]. Bogor: Fakultas
Matematika dan Ilmu Pengetahuan Alam,
Institut Pertanian Bogor.
Wulandari SA. 2004. Analisis Tingkat
Keberhasilan
Mahasiswa
S2
IPB
Menggunakan Pendekatan Pohon Regresi
[Skripsi]. Bogor: Fakultas Matematika dan
Ilmu Pengetahuan Alam, Institut Pertanian
Bogor.

7

LAMPIRAN

8

Lampiran 1 Karakteristik peubah
Kode
Y

Peubah
Kesukaan Kopi X Secara Keseluruhan

X1

Kekuatan Aroma Kopi

X2

Warna

X3

Tekstur Ampas

X4

Kekentalan

X5

Kekuatan Rasa Kopi

X6

Kekuatan Aroma Susu

X7

Kekuatan Rasa Susu

X8

Kepahitan

X9

Kemanisan

Keterangan
1: tidak suka
2: biasa saja
3: suka
1: sangat kurang kuat
2: kurang kuat
3: pas
4: kuat
5: sangat kuat
1: terlalu terang
2: terang
3: pas
4: gelap
5: terlalu gelap
1: terlalu halus
2: halus
3: pas
4: kasar
5: terlalu kasar
1: terlalu encer
2: encer
3: pas
4: kental
5: terlalu kental
1: sangat kurang kuat
2: kurang kuat
3: pas
4: kuat
5: sangat kuat
1: sangat kurang kuat
2: kurang kuat
3: pas
4: kuat
5: sangat kuat
1: sangat kurang kuat
2: kurang kuat
3: pas
4: kuat
5: sangat kuat
1: sangat kurang pahit
2: kurang pahit
3: pas
4: pahit
5: terlalu pahit
1: sangat kurang manis
2: kurang manis
3: pas
4: manis
5: terlalu manis

Lampiran 2 Nilai tingkat salah pengklasifikasian pengganti relatif validasi silang setiap pohon
Nomor Pohon
1
2
3
4
5
6
7**
8

Tingkat Salah Pengklasifikasian
Pengganti Relatif Validasi Silang
0.705 +/- 0.094
0.738 +/- 0.095
0.770 +/- 0.095
0.705 +/- 0.089
0.672 +/- 0.085
0.705 +/- 0.077
0.672 +/- 0.065
1.000 +/- .734046E-04

9

Lampiran 2 Pohon klasifikasi hasil pengembangan dua tahap dari pohon klasifikasi optimum
kesukaan kopi X secara keseluruhan
Node 0
Category
%
n
tidak suka
0.72
3
biasa saja 13.98 58
suka
85.30 354
Total
(100.00) 415
Kekuatan Aroma Kopi
Improvement=0.0506

Sangat kurang kuat,
kurang kuat

Node 2
Category
%
n
tidak suka
0.29
1
biasa saja
6.98 24
suka
92.73 319
Total
(82.89) 344

n
2
34
35
71

Kekuatan Rasa Susu
Improvement=0.0307

Sangat kurang kuat,
kurang kuat

Node 4
Category
%
tidak suka
0.00
biasa saja 26.67
suka
73.33
Total
(10.84)

n
0
12
33
45

Sangat kurang kuat,
Pas

Node 5
Category
%
n
tidak suka
0.00
0
biasa saja
4.64 15
suka
95.36 308
Total
(77.83) 323

Node 6
Category
%
n
tidak suka
4.76
1
biasa saja 42.86
9
suka
52.38 11
Total
(5.06) 21

Kepahitan
Improvement=0.0094

Sangat kurang pahit,
kurang pahit
pahit

n
0
10
10
20

Node 10
Category
%
n
tidak suka
0.00
0
biasa saja
8.00
2
suka
92.00 23
Total
(6.02) 25

Kemanisan
Improvement=0.0060

Sangat kurang manis,
Pas

Node 16
Category
%
n
tidak suka
0.00
0
biasa saja 100.00
4
suka
0.00
0
Total
(0.96) 4

Kepahitan
Improvement=0.0043

Sangat kurang pahit

Sangat kurang pahit
Node 28
Category
%
n
tidak suka
0.00
0
biasa saja 28.57
4
suka
71.43 10
Total
(3.37) 14

Kekuatan Aroma Kopi
Improvement=0.0092

pas

Pas

Node 14
Category
%
n
tidak suka 16.67
1
biasa saja 83.33
5
suka
0.00
0
Total
(1.45) 6