Prediksi kecenderungan konsumen dalam memilih jenis kendaraan poda empat berdasarkan spesifikasi kendaraan mengunakan decision tree dengan metode gini

PREDIKSI KECENDERUNGAN KONSUMEN
DALAM MEMILIH JENIS KENDARAAN (RODA EMPAT)
RERDASARKAN SPESIFIKASI KENDARAAN
MENGGUNAKAN Decision Tree DENGAN METODE Gini

Mahbllblll Wathoni

PROGRAM STUD! MATEMA TIKA JURUSAN MIPA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS ISLAM negiセri
SYARIF IDDAYATULLAH
JAKARTA
2006 M /1427 H

PREDIKSI KECENDERUNGAN KONSUMEN
DALAM MEMILIH JENIS KENDARAAN (RODA EMPAT)
BERDASARKAN SPESIFIKASI KEN]JIARAAN
MENGGUNAKAN Decision Tree DENGAN METODE Gini

Oleh:
rvwmuBuL WATHONI


102094026456
"["l
lJ
セi

Skripsi
Stbagai Salah Salu Syaral untuK Memptrolch Gdar
Smjana Sains

Fakultas

sセゥョウ

dan Teknologi

Uniwrsitas Islam Neotri
SvarifHidavatullah
Jakarta
'"

b
'"
.

PROGRAM STUDI MATEMATIKAJURUSAN MIPA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS ISLAM NEGERI
SYARIF HlDAYA1ULLAH
JAKA.RTA
2006 M / 1427 H

Perumpamaan petunjuk dan ilmu
akan ditulis Allah untuk membawanya laksana air hujan
yang sangat lebat menyirami bumi,
diantara tanah (bumi) itu terdapat tanah
yang layak menerima air,
kemudian menumbuhkan pepohonan
dan rerumputan yang banyak.
Ada pula ada tanah yang keras,
sehingga dapat rr.enampung air,

sehingga t'mah semacam ini memberi manfaat kepada manusia.
(H.R. Bukhari dan Muslim dari Abi Musa) Al Fathul Kabir, Jilid
lH,h,133

PREDIKSI KECENDERUNGAN KONSUMEN
DALAM MEMILIH JENIS KENDARAAN (RODA EMPAT)
BERDASARKAN SPESIFIKASI KENDARAAN
MENGGUNAKAN Decision Tree DENGAN METODE Gini
Skripsi
Sebagai Salah Satu Syarat untuk Memperoleh Gelar
Sarjana Sains
Pada Fakultas Sains dan Teknologi
Universitas Islam Negeri SyarifHidayatuIlah Jakmia

Oleh:
Mabbllblll Watboni
102094026467

Menyetujui,


Pembimbing II

Pembimbin I

/2ft

Dr. Agns Salim, M.Si
NIP. 150294451

Taufik Edy Sufan 0, M.SeTech
NIP. 150377 447
Mengetahui,
Kelua Jurusan MIPA

Dr. Agus Salim, M.Si
NIP. 150294451

PROGRAM STUm MATEMATIKA
JURUSAN MIPA FAKULTAS SAINS DAN TEKNOLOGI
UIN SYARIF HIDAYATULLAH JAKARTA


Dengan ini menyatakan bahwa skripsi yang ditulis oleh :
Nama

Mahbubul Wathoni

NIM

102094026467

Program Studi

Matematika

Judul Skripsi

Prediksi Kecenderungan Konsumen Dalam Memilih
Jcnis Kcndaraan (Roda Empai) Bcrdasarkan
Spesifikasi Kendaraan Menggunakan Decision Tree
Dengan Metode Gini.


Dapat diterima sebagai syarat kelulusan untuk memperoleh gelar Sarjana Sains
pada Program Studi Matematika Jurusan MIPA, Fakultas Sains dan Teknologi
UIN Syarif Hidayatu!lah JakaJta.

Jakarta, 19 Novcmber 2006
Menyetujui,
Dosen Pembimbing
Pembimbing 2

セH[Zz

Dr. Agus Salim, M.Si
NIP.. 150294451

Mcngctahui,

Dekan FakultasS,' s dan Teknologi

Ketua Jurusan MIPA


セmB

NIP. 150294451

PENGESAHAN UJIAN

Skripsi yang berjudul "Prediksi Kecenderungan Konsumen Dalam Memilih
Jenis Kendaraan (Roda Empat) Berdasarkan Spes[jikasi Kendaraan Menggunakan
Decision Tree Dengan Metode Gini.". Telah dinji dan dinyatakan lulus dalam
sidang munaqosyah Fakultas Sains dan Teknologi, Universitas Islam Negeri Syarif
Hidayatullah JakaIia, pada had Jum'at 17 November 2006, Skripsi ini telah
diterima scbagai salah satu syarat untuk mempcrolch gclar sarjana strata satu (S I)
pada Program Studi Matematika Jurusan MIPA,

Jakarta, 19 November 2006

Tim Pcnguji,

Penguji 1


Pcnguji 2

Suherman, M.Si

l'fur Inayah, S.Pd, M.Si
NIP. ISO 326 911
Mcngctahui,
DekaIl ウョGゥQセB。エャオォZf

dan Teknologi

h Ja a Putra M.Sis

. NIP. 150 317 965

PERNYATAAN

DENGAN INI SAYA MENYATAKAN BAHWA SKRIPSI INI BENAR-BENAR
HASIL KARYA SENDIRI YANG BELUM PERNAH DIAJUKAN SEBAGAI

SKRIPSI ATAU KARYA ILMIAH PADA PERGURUAN TINGGI ATAU
LEMBAGA MANAPUN.

Jakarta, 19 November 2006


Mahbubul Wathoni
102094026467

ABSTRACT

The world of business has always been full of competitions. The executors think
relentlessly of the way to get survived. Fortunately. in the modem business world,
there is valuable data warehouse that could be utilized to generate new knowledge
to help the executives in arranging their business strategies. The knowledge
generator. which is data mining technology. would be introduced to the readers.
This paper presents the business problems to be solved and th,e foundations of data
mining: the usage, how data mining works. the tasks, and the popular methods
(decision tree. classification.).
The result shows tendency of a consumer to buy heir favorite vehicle in the reality

is not influenced by purchasing level of the costomer, but from its this finding
Support the hypothesis that Indonesian people do prefer brand than of her factors.

Keywords: Data Mining, Decision Tree, Algoritma CART, Product Marketing

ABSTR-\K
MAHBUBUL WATHONI, Prediksi Kecenderungan Konsumen Oalam Memilih
Jenis Kendaraan (Roda Empat) Berdasarkan Spesifikasi Kendaraan Menggunakan
Decision Tree Ocngan Mctodc Gini. (Oi bawah bimbingan TAUFIK EDY
SUTANTO, M.ScTech. dan Dr. AGUS SALIM, M.SL).
Oalam dunia bisnis yang penuh persaingan membuat para pelakunya harus selalu
mcmikirkan stratcgi-stratcgi tcrobosan yang dapat mcnjamin kclangsungan bisnis
mereka. Salah satu aset utama yang dimiliki oleh perusahaan masa kini adalah data
bisnis dalam jumlah yang banyak. Hal ini melahirkan kebutuhan akan adanya
teknologi yang dapat memanfaatkannya untuk membangkitkan "pengetahuanpengetahuan" baru, yang dapat membantu dalam pengaturan strategi bisnis.
Teknologi data mining
hadir sebagai solusi. Skripsi ini akan mengulas
pcrmasalahan bisn;s yang ada dan dasar-dasar desicion tree melalui bahasan
kegunaan, cara kerja dan metodologi-metodologi populer pada teknologi ini
(pohon keputusan, klasifikasi, regresi), Desicion tree yang digunakan adalah

Classification and Regression Trees.
Dari pengolahan Dat.a PT. OTO MULTIARTA yang merupaksn dat"! dari tahun
2004 sampai 2005 dinyatakan bahwa, kencenderungan seorang konsum.;n ulltuk
mcmbcli kcndaraan yang diinginkan tcmyata bukanJah dipcngaruhi olch tingkat
pembelian seorang konsumen (harga). Hal ini mcmpertegas dugaan pandangan di
masyarakr ptang sifat konsumen di Indonesia.

Kata Kunci : Data Mining, Decision Tree, Algoritma CART, Pemasaran Produk

KATA PENGANTAR

Puja dan puji serta syukur saya panjatkan kehadirat Allah SWT. Atas
segala karuniyanya hingga penulis dapat menyelesaikan skripsi ini. Shalawat serta
salam keeintaan hanya tereurahkan kepada junjungan Nabi besar Muhammad
SA W. Semoga kita semua mendltpatkan syafaatnya baik didunia maupun
diakherat kelak. Amin.
Atas izin Allah SWT disertai denga'l usaha yang maksimal penulis dapat
menyclesaikan skrips! ini. Meskipun demik!an, !)cnulis s"dar bahwa rlalam
mengerjakan skripsi ini p $40.000". Hasi! dari tes ini menyebabkan tree terpecah menjadi dua

cabang, clengan tiap cabang mepresentasikan satu dari jawaban yang mungkin.
Dalam kasus in!, jawabannya adalah "ya" dan "tidak", sehingga kita mendapatkan
dua cahang.
Bergantung pada algoritma yang digunakan. Tiap simpul bisa memiliki
dua atau lebih cabang. Misalnya, CAR f akan meng-generate hanya dua cabang
pada tiap simpul. Tree seperti inl disebut binmy tree. Ketika lebih dad dua cabang
diperbolehkan maka disebut sebagai mllltiway tree.
Tiap cabang akan memiliki simpul node yang lain atau dasar tree. yang
disebut leaf Dengan mengikuti decision tree kita bisa memberikan nilai pada
suatu kasus dengan memutuskan cabang mana yang akan diambil, dimulai dari
simpul root dan bergerak ke bawah sampai leaf Dengan menggunakan metode

ini, scorang manager, yang bcrtanggungja\\ab untuk memutuskan apakah scorang
konsumen dapat membeli sebuah kendaraan dengan prediksi memiliki resiko
kredit yang baik atau buruk.
Model decision tree umum digunakan dalam data mining untuk menelaah
data dan menginduksi tree dan aturan yang akan digunakan untuk membuat
prediksi. Sejumlah algoritma yang berbeda bisa digunakan untuk membanguntree
di antaranya adalah CHAID (Chi squared Automatic Interactin Detection), CART

(Classification and Regression Trees), Quest dan CS.O.
Decision tree

ァョ。「ュ・ォセ

melalui pemecahan iteratif dari data ke dalam

grup-gi'UP diskrit, yang tujuannya adalah untuk memaksimalkan 'Jarak" antara
grup pada エゥセー

pemecahan.

Contoh yang kim gunakan pada penelitian ini sederhana. Tree ini mudah
untuk dimclIgcrti dan d;jnielpretasikan. Akan tetapi, tree bisa menjadi sangat
kompleks. Sebagai contoh kompleksi!us suatu tree yang diturunkan dari database
d'cngan

ョ。セオエ イ

atrib:.Jt dan

カ。セゥ 「・A

respon dcngan lusinan kelas input. Tree

sej)crti ini akan sangat sulit untuk dimengerti, meskipun tiap path dari tree
lJiasanya dapat dimengerti. Dalam hat ini decision tree bisa rnenjelaskan
prediksinya, yang merupakan keuntungan penting. Akan tetapi, kejelasan ini bisa
jadi menyesatkan.

2.5 Classification and Regression Trees (CARl)
Clas.I'lication And Regression Tree (CART) adalah metodologi klasitikasi
yang menggunakan data terdahulu untuk membangun decision tree. Kemudian

decision tree tersebut digunakan untuk meng-kelaskan data banJ.

Dalam membangun decision free, Classification And Regressio/l Tree
(CART) menggunakan learning sample yaitu kumpulan dat, terdahulu sebelum
dikelaskan untuk semua observasL
CART merupakan alat decisio/l tree yang baik untuk data mining,
pemodelan prediksi dan pengolahan datI. CART seeara otomatis mencari polapola dan hubungan yang pe:1ting yairu membuka struktur yang tersembunyi
meskipun datI yang digunakan memiliki kompleksitas tinggi. Metodologi CART
dike;)a] sebagai parrisi binary rekursif Binary karena proses pemode!an
melibatkan pe;nba8ia'1 kumpulan datI mer:jadi dua subgroup (atau /lode).
ヲゥウセオォ・r

"arena "roses Giuiar:g untuk setiap penghasilan /lode. Basil model

biasanya dilampilkali sebagai diagram pohon. Diagram pohon ini membagi semua
data menjadi kumpulall dari beberapa subgroup atIu node sehingga perk iraan dari
jawaban mendct-ati nilai aktual dari jawaban da!am setlap node. Kemudian CART
mengatur semua variabel penting sehingga jumlah prediil.1ot' yang mendapatkan
:1:lai tidak nol re!atif ked!.

BABIH
METODOLOGI PENELITIAN

3.1.

Pengolaban Data

3.1.1. Proses Screening Data

Screening data adalah sebuah proses yang dilakukan untuk mengetahui
terdapat nilai yang hilang (missing value), kesalahan ketik, Wilier, penentuan
variabel yang akan digunakan, dan sebagainya. Terkadang dalal11 melakukan proses
screening data, transfarmasi data dilakukan c:ntuk merubah data bemilai numerik,
menjadi kategorik.
Pada pembentukan model, learnjag sample yang digunakan ahn dipisah
menjadi menjadi ciua subgmp (node) secara rekm-sif atau bertingkat hingga mencapai
lerminal node (lcu/) dCllgan rl'enggiJuakan algcritma pemisah tcrtentu[7]. Dalam
peneliti8.n ini algoritma p.emisah yang akan diballas adalah aturan pemisah Gini (Gini
splitTing rule) yang digunakan dalam classtfication tree.
Pertumbuhan Iree dari learning sample akan menghasilkan level suatu tree
yang paling besar atau disebut dengan tinggi tree. Dibandingkan dengan model tree
yang lainnya tree tersebut memiliki jumlah terminal node yang paling banyak. Tree
paling besar seperti ini disebut dengan maksimum tree.
Database saat ini baleh jadi berkembang menjadi sangat besar secara cepat ke
dalam ukuran gigaby1e. Di dalam tumpukan data tersebut mungkin terdapat

informasi-informasi tersel11bunyi yang sangat penting atau menjadi penting pada saat
dibutuhkan. Hal ini sulitnya l11enel11ukan sebuah jarum dalam tUl11pukan jerami?
Dalal11 hal ini dapat kita katakan bahwa semua data belum berarti infonnasi.
Pengolahan sebuah data terlebih dahulu haruslah melalui proses screening
data agar dapat diketahui variabel-variabel mana saja yang memiliki missing value.
[17 J Penggunaan SPSS untuk melakukan screening dab agar data tersebut dapat di
olah kedalam program CART (Classification dan Regression Trees).
Penggunaan SPSSuntuk melakukan screening data agar data tersebut dapat cii
lakukan dalam mcngolah kc dalam program CART (Classification dun Regression
Trees). Dari data tersebut akan diketahui variabel-variabel apa saja yang berpengaruh
terhadap data yang ada, antara lain (tabel 3.2, 3.3, dan 3.4)

I

Tabel 3.1. Contoh data yang akan di screening dengan mengglmakan sofwere SPSS
rnrkmobi!

I bbakar I

sid

Ibpinll jkendara Qセャッォイョ・S

lOIS;

Iー。ョセ

lebarlting! berat ljmesinl

turbo

tv,,/(1

h.lchba

f','.o'd

flont

959

11')
",":1
, , ) .