Peningkatan Kinerja Sistem Peramal Cerdas Perilaku Konsumen Menggunakan Teknik Regresi Kuadratik Chapter III V
28
BAB 3
METODOLOGI PENELITIAN
3.1
Umum
Sistem Peramal Cerdas Perilaku Kosumen adalah sebuah sistem yang bekerja
untuk meramal jenis barang apa yang sebenarnya akan dibeli atau dibutuhkan oleh
konsumen. Sehingga di dalam perancangannya diperlukan suatu metode yang tepat
berdasarkan data yang digunakan untuk mendapatkan hasil peramalan yang lebih
mendekati kondisi yang sebenarnya. Untuk mendapatkan metode yang lebih tepat
sebagai peramal perlu dilakukan analisis terhadap metode yang digunakan. Dalam
penelitian ini, metode yang dianalisis adalah metode regresi kuadratik dengan
tahapan-tahapan sebagai berikut:
1.
Menentukan data yang digunakan pada Sistem Peramal Cerdas Perilaku
Konsumen
2.
Menetapkan parameter pengukuran yang digunakan untuk menganalisis
kedekatan hasil peramalan terhadap nilai referensinya.
3.
Menentukan metode yang digunakan untuk peramalan di dalam penelitian
4.
Menentukan persamaan model peramalan terhadap metode yang digunakan
dengan bantuan Program Matlab.
Universitas Sumatera Utara
29
5.
Menghitung besarnya nilai hasil peramalan dengan menggunakan
persamaan model yang telah ditentukan berdasarkan metode yang
digunakan dengan bantuan Program Excel.
6.
Melakukan pengukuran nilai hasil peramalan dengan menggunakan
parameter pengukuran yang telah ditetapkan
7.
Membandingkan hasil pengukuran nilai peramalan dari metode yang
dipilih terhadap hasil pengukuran nilai peramalan dari metode-metode lain
yang telah diteliti sebelumnya.
Secara keseluruhan, metodologi penelitian yang dilakukan untuk peningkatan
kinerja Sistem Peramal Cerdas Perilaku Konsumen ini dapat dilihat pada Gambar 3.1.
Dari diagram alir pada Gambar 3.1 terlihat bahwa di awal proses penelitian, data yang
diambil dari U.S. Bureau of Labour Statistics (BLS) Consumer Price Index (CPI) [9]
harus dinormalisasi terlebih dahulu agar data yang akan diolah tidak terlalu menyebar
namun tidak mengurangi bobotnya terhadap data yang lainnya. Dimana data sampel
masukan yang dipilih adalah berupa data indeks best customer dan biggest customer
untuk masing-masing jenis demografi dari beberapa sub kategori produk telepon.
Proses selanjutnya adalah dengan memodelkan data masukkan tersebut ke dalam
bentuk model regresi kuadratik sehingga diperoleh model persamaan peramal untuk
perilaku konsumen. Persamaan model tersebut kemudian digunakan untuk
mendapatkan data output peramalan terhadap masing-masing data masukan berupa
indeks best customer dan biggest customer untuk setiap jenis demografi dari beberapa
sub kategori produk telepon.
Universitas Sumatera Utara
30
Gambar 3.1. Diagram alir metode penelitian
Universitas Sumatera Utara
31
Untuk mengukur tingkat keakuratan hasil peramalan, digunakanlah data indeks
average spending untuk setiap jenis demografi dari beberapa sub kategori produk
telepon sebagai pembanding terhadap data hasil peramalan tersebut. Parameter ukur
yang digunakan untuk melihat tingkat keakuratan hasil peramalan tersebut adalah
MSE (Mean of Square Error) dan R2 (Rsquare). Selanjutnya, untuk melihat tingkat
keberhasilan penelitian ini, peneliti membandingkan nilai MSE dan R2 yang diperoleh
pada penelitian ini yang menggunakan metode regresi kuadratik terhadap hasil MSE
dan R2 atas penggunaan metode lain yang pernah dilakukan oleh peneliti sebelumnya.
3.2
Metode Pengumpulan Data
Pada penelitian ini, data yang digunakan adalah data survei pasar yang sudah
diperoleh dari U.S. Bureau of Labour Statistics (BLS). Data survei pasar adalah satuan
konsumen yang dikategorikan dalam berbagai demografi berdasarkan pembelanjaan
konsumen atas berbagai produk [9].
3.3
Pemilihan Parameter Pengukuran
Di dalam pelaksanaan penelitian ini, peneliti mengamati nilai kedekatan hasil
peramalan dengan nilai referensi dari hasil penggunaan metode quadratic regression
(regresi kuadratik) dengan menggunakan bantuan Program Excel.
Nilai kedekatan hasil peramalan dengan nilai referensi dari penggunaan metode
quadratic regression (regresi kuadratik) yang akan digunakan sebagai pemroses
tahap awal pada Sistem Peramal Cerdas Perilaku Konsumen diukur dengan
Universitas Sumatera Utara
32
menggunakan parameter pengukuran MSE (Mean of Square Error) dan R2 (Rsquare).
MSE mengukur rata-rata pangkat dua dari kesalahan. Kesalahan adalah suatu nilai
yang diperoleh dari perbedaan nilai referensi dengan nilai yang diramal. Persamaan
MSE adalah seperti yang terlihat pada Persamaan (3.1).
∑(y − y
MSE =
predict
)2
(3.1)
n
Dimana y adalah nilai referensi, ypredict adalah nilai peramalan dan n adalah jumlah
data.
Di dalam regresi, R2 adalah suatu variabel statistikal yang mengukur bagaimana
garis regresi memperkirakan data point yang riil. Nilai R2 = 1 menunjukkan garis
regresi sangat sesuai dengan data [8]. Rumus untuk menghitung R2 ditunjukkan pada
Persamaan (3.2).
∑(y − y )
=1−
n∑y −(∑y)
(n −1)*
2
2
R
predict
2
n(n −1)
2
(3.2)
Dimana y adalah nilai referensi, ypredict adalah nilai peramalan dan n adalah jumlah
data.
3.4 Penggunaan Metode Regresi Kuadratik
Metode regresi kuadratik adalah merupaka metode yang dianalisis pada
penelitian ini. Metode ini digunakan sebagai unit pemrosesan tahap awal pada Sistem
Peramal Cerdas Perilaku Konsumen yang menggantikan metode fuzzy logic yang
Universitas Sumatera Utara
33
digunakan pada Sistem Peramal Cerdas Perilaku Konsumen yang sebelumnya. Sistem
Peramal Cerdas Perilaku Konsumen yang diusulkan dapat dilihat pada Gambar 3.2.
Dengan penggunaan metode ini diharapkan dapat meningkatkan kinerja Sistem
Peramal Cerdas Perilaku Konsumen yang sebelumnya.
Sebagaimana pada Gambar 3.2, Sistem Peramal Cerdas Perilaku Konsumen
yang diusulkan menggunakan dua tahap pemrosesan, yaitu: pada pemrosesan awal
menggunakan metode regresi kuadratik dan pada pemrosesan tahap berikutnya
menggunakan Ordinal Structure Fuzzy Model (OSFM).
Gambar 3.2. Diagram blok Sistem Peramal Cerdas Perilaku Konsumen
yang diusulkan
Masukan untuk Sistem Peramal Cerdas Perilaku Konsumen berupa data
variabel best customer dan biggest customer berdasarkan masing-masing jenis
Universitas Sumatera Utara
34
demografi yang dipilih. Keluaran dari tingkat pemrosesan awal adalah berupa data
indeks dari sub produk yang paling disukai oleh konsumen.
Pada tahap pemrosesan berikutnya, data keluaran dari masing-masing jenis
demografi dari unti pemroses tahap awal dijadikan sebagai masukan untuk unit
Ordinal Structure Fuzzy Model (OSFM). Keluaran dari tahap pemrosesan ini yang
juga merupakan hasil akhir dari Sistem Peramal Cerdas Perilaku Konsumen adalah
berupa perioritas produk atau produk yang paling tepat untuk memenuhi kebutuhan
konsumen sesuai dengan demografinya.
Universitas Sumatera Utara
35
BAB 4
HASIL PEMBAHASAN DAN ANALISA DATA
4.1
Penentuan Persamaan Peramal Perilaku Konsumen
Pada tesis ini, penulis mengambil contoh data kategori produk telepon yang
bersumber dari U.S. Bureau of Labour Statistics (BLS) Consumer Price Index (CPI)
[9] sebagaimana pada Lampiran-1 untuk proses simulasi peramalan. Data tersebut
memiliki 4 tipe sub kategori produk, yaitu : cellular phone service (tipe-1), phone
cards (tipe-2), residential telephone service and pay phones (tipe-3) dan telephones,
answering machines, and accessories (tipe-4) untuk 6 jenis demografi. Dimana untuk
jenis demografi umur (age) memiliki 7 variasi, pendapatan (income) memiliki 7
variasi, tipe keluarga (type of household) memiliki 8 variasi, ras (race) memiliki 4
variasi, daerah tempat tinggal (region) memiliki 4 variasi dan latar belakang
pendidikan (education) memiliki 7 variasi. Sehingga total variasi data untuk masingmasing data best customer dan biggest customer berjumlah 148 variasi data yang
terdiri dari 28 variasi data untuk jenis demografi umur (age), 28 variasi data untuk
jenis demografi pendapatan (income), 32 variasi data untuk jenis demografi tipe
keluarga (type of household), 16 variasi data untuk jenis demografi ras (race), 16
variasi data untuk jenis demografi daerah tempat tinggal (region), 28 variasi data
untuk jenis demografi latar belakang pendidikan (education).
Universitas Sumatera Utara
36
Data kemudian dinormalisasi untuk kebutuhan pengolahan sehingga diperoleh
tabel data kategori produk telepon seperti pada Lampiran-2. Dari data pada
Lampiran-2 diperoleh data best customer (x1), biggest customer (x2) dan average
spending (Y) seperti pada Tabel 4.1 yang kemudian digunakan untuk penentuan
persamaan peramalan pada tesis ini.
Tabel 4.1 Data demografi umur (age) untuk kategori produk telepon
n
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
Product
id
267
268
269
270
267
268
269
270
267
268
269
270
267
268
269
270
267
268
269
270
267
268
269
270
267
268
269
270
Data
type
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
Data
type
id
1
1
1
1
2
2
2
2
3
3
3
3
4
4
4
4
5
5
5
5
6
6
6
6
7
7
7
7
Average
spending
value
Best
customer
value
Biggest
customer
value
(y)
(x1)
(x2)
0.4621
0.1198
0.3374
0.1054
0.5544
0.1194
0.6258
0.1059
0.5411
0.1226
0.7521
0.1202
0.5689
0.1106
0.7691
0.1533
0.4444
0.1068
0.7608
0.1267
0.3002
0.1055
0.6847
0.1079
0.1769
0.0998
0.5793
0.1088
0.28407
0.37611
0.14956
0.14484
0.34307
0.36903
0.26755
0.14956
0.33363
0.40914
0.31711
0.27227
0.35251
0.25575
0.32419
0.56018
0.27227
0.20855
0.32183
0.32891
0.18258
0.18968
0.29115
0.16608
0.10472
0.11888
0.24867
0.17316
0.16379
0.19418
0.12025
0.11924
0.29646
0.31569
0.24278
0.15873
0.33899
0.40582
0.32378
0.28429
0.35013
0.26608
0.32684
0.53342
0.23063
0.19013
0.26203
0.26709
0.14253
0.14557
0.18709
0.13544
0.11114
0.11722
0.1719
0.14051
Universitas Sumatera Utara
37
Dimana:
1.
Product id adalah sub produk pada kategori produk, seperti: 267 adalah
cellular phone service, 268 adalah phone card, 269 adalah residential
telephone service and pay phones dan 270 adalah telephones, answering
machines, and accessories.
2.
Data type adalah variasi demografi, seperti:
1=age, 2=income,
3=household type, 4=race, 5=region dan 6=education.
3.
Data type id adalah variasi masing-masing, seperti:
variasi demografi
umur (age) adalah 1=Under age 25, 2=Age 25-34, 3=Age 35-44, 4=Age 4554, 5= Age 55-64, 6=Age 65-74 dan 7=Age 75 and older.
Dengan menggunakan Persamaan (2.20) dari data pada Tabel 4.1 maka diperoleh
persamaan seperti pada Persamaan (4.1).
(a) 28a0 + 7.5150a1 + 6.5418a2 + 2.0151a3 + 2.3033a4 + 1.8145a5= 9.1707
(b) 7.5150a0 + 2.3033a1 + 2.0151a2 + 0.6953a3 + 0.7875a4 + 0.6311a5 = 2.6409
(c)
6.5418 a0 + 2.0151 a1 + 1.8145 a2 + 0.6311 a3 + 0.6953 a 4 + 0.5842 a5 = 2.2988
(d ) 2.0151a0 + 0.6953a1 + 0.6311a2 + 0.2421a3 + 0.2644a4 + 0.2255a5 = 0.7135
(e) 2.3033a0 + 0.7875a1 + 0.6953a2 + 0.2644a3 + 0.2960a4 + 0.2421a5 = 0.8122
( f ) 1.8145a0 + 0.6311a1 + 0.5842a2 + 0.2255a3 + 0.2421a4 + 0.2126a5 = 0.6437
(4.1)
Dengan menggunakan metode eliminasi Gauss, maka diperoleh penyelesaian dari
Persamaan (4.1) adalah a0 = -0.4850, a1 = 11.1391, a2 = -6.0605, a3 = 21.4419,
a4 = -7.3597 dan a5= -0.8287. Dengan cara yang sama dan menggunakan bantuan
Program Matlab, maka diperoleh koefisien persamaan model untuk 6 jenis demografi
seperti pada Tabel 4.2.
Universitas Sumatera Utara
38
Tabel 4.2 Nilai koefisien persamaan model untuk 6 jenis demografi
Coefficient
Age
a0
a1
a2
a3
a4
a5
1
-0.4850
11.1391
-6.0605
21.4419
-27.3597
-0.8287
Income
2
-0.6914
3.0451
3.9370
6.2920
-5.0842
-12.1861
Demographic types
House
Race
Hold
3
4
-0.5199 -0.1380
3.7616 3.9940
1.4851 -1.7327
-4.5737 1.0704
-2.2225 -4.5169
-0.0421 1.3122
Region
Education
5
-0.0575
24.5700
-20.2870
2.6771
-36.9597
25.7092
6
-1.4177
9.9187
1.0837
-7.1401
-11.0716
1.8590
Dengan mensubstitusikan data pada Tabel 4.2 ke dalam Persamaan (2.16) maka
diperoleh persamaan peramal untuk 6 jenis demografi yang kemudian digunakan
untuk unit permosesan awal pada Sistem Peramal Cerdas Perilaku Konsumen seperti
pada Persamaan (4.2).
y1 = −0.4850 + 11.1391x1 − 6.0605 x2 + 21.4419 x1 x2 − 27.3597) x1 − 0.8287 x2
2
y2 = −0.6914 + 3.0451x1 + 3.9370x2 + 6.2920x1x2 − 5.0842x − 12.1861x2
2
1
2
2
y 3 = − 0 .5199 + 3 .7616 x1 + 1 .4851 x 2 − 4 .5737 x1 x 2 − 2 .2225 x1 − 0 .0421 x 2
2
2
2
2
y4 = −0.1380 + 3.9940 x1 − 1.7327 x2 + 1.0704 x1 x2 − 4.5169 x1 + 1.3122 x2
y 5 = − 0 .0575 + 24 . 5700 x1 − 20 .2870 x 2 + 2 .6771 x1 x 2 − 36 .9597 x1 + 25 .7092 x 2
2
y6 = −1.4177 + 9.9187 x1 + 1.0837 x2 − 7.1401x1 x2 − 11.0716 x1 + 1.8590 x2
2
(4.2)
2
2
Dimana y1 adalah persamaan peramal untuk jenis demografi umur (age), y2 adalah
persamaan peramal untuk jenis demografi penghasilan (income), y3 adalah persamaan
peramal untuk jenis demografi tipe keluarga (type of house hold), y4 adalah
persamaan peramal untuk jenis demografi ras (race), y5 adalah persamaan peramal
untuk jenis demografi daerah tempat tinggal (region) dan y6 adalah persamaan
peramal untuk jenis demografi latar belakang pendidikan (education).
Universitas Sumatera Utara
39
4.2 Eksperimen dan Hasil
Eksperimen ini dikembangkan berdasarkan data survei pasar dari U.S. Bureau
of Labour Statistics (BLS)[9]. Data survei pasar adalah unit atau set konsumen yang
terkelompokkan dalam variasi demografi yang berdasarkan pembelanjaannya pada
suatu produk. Pada eksperimen ini dianalisa data survei pasar dari U.S. Bureau of
Labour Statistics (BLS)[9], khususnya data jenis demografi umur (age) yang tertera
pada Tabel 4.1.
Berdasarkan data yang diberikan dari Tabel 4.1, diperoleh kurva korelasi data
average spending (Y) terhadap quadratic regression trendline average spending (Y)
seperti pada Gambar 4.1.
Berdasarkan Gambar 4.1 terlihat adanya korelasi secara kuadratik antara data
average spending (Yo) terhadap quadratic regression trendline average spending (Y).
Oleh karena itu pada eksperimen ini peneliti menggunakan metode regresi kuadratik
yang merupakan bagian dari multiple regression untuk mendapatkan ketepatan dalam
peramalan perilaku konsumen.
Gambar 4.1 Korelasi data average spending (Yo) terhadap quadratic
regression trendline average spending (Y)
Universitas Sumatera Utara
40
4.2.1 Simulasi Eksperimen
Untuk menentukan metode yang lebih mendekati ketepatan dalam meramal
tipe produk yang paling disukai untuk dibeli oleh konsumen berdasarkan latar
belakang demografinya, langkah awal yang harus diketahui adalah korelasi diantara
data input dan output referensi seperti pada Gambar 4.1.
Di dalam unit pemrosesan awal pada Sistem Peramal Cerdas Perilaku
Konsumen seperti pada Gambar 3.2, data best customer dan biggest customer
digunakan sebagai data input dan average spending digunakan sebagai data output
referensi. Data average spending digunakan sebagai data output referensi karena data
average spending dapat digunakan untuk menentukan potensi pasar dari produk atau
pelayanan di suatu area. Proses berikutnya adalah menghitung nilai output sebagai
suatu hasil peramalan untuk metode yang digunakan, dalam hal ini adalah metode
regresi kuadratik. Dan proses yang terakhir adalah menghitung selisih yang terjadi
antara data output referensi dengan data output hasil peramalan dengan
menggunakan parameter pengukuran MSE ( Mean of Square Error) dan R2 (RSquare).
Data output peramalan yang memiliki nilai MSE terkecil dan R2 terbesar dijadikan
sebagai masukan untuk unit pemrosesan berikutnya dalam meramal perilaku
konsumen sebagaimana pada Gambar 3.2.
Universitas Sumatera Utara
41
4.2.2 Hasil dan Diskusi
Dengan mensubstitusikan data best customer (x1) dan biggest customer (x2)
kategori produk telepon untuk masing-masing jenis demografi pada Persamaan (4.2)
diperoleh hasil peramalan seperti pada Tabel 4.3.
Tabel 4.3 Output hasil peramalan dengan metode regresi kuadratik untuk jenis
demografi umur (age) pada kategori produk telepon
No
Product
id
Data
type
Data
type
id
Norm
average
spending
(Yo)
Norm best
customer
(X1)
Norm
biggest
customer
(X2)
Category
id
Y predict
quadratic
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
267
268
269
270
267
268
269
270
267
268
269
270
267
268
269
270
267
268
269
270
267
268
269
270
267
268
269
270
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
2
2
2
2
3
3
3
3
4
4
4
4
5
5
5
5
6
6
6
6
7
7
7
7
0.46211057
0.11996835
0.33742459
0.10542973
0.55443576
0.11941448
0.62582336
0.10604292
0.54114331
0.12258926
0.75208189
0.12024528
0.56899416
0.11058253
0.76912274
0.15333795
0.44436752
0.10701216
0.76080506
0.12674315
0.30023737
0.10547918
0.68471961
0.10792207
0.17686678
0.09899989
0.57930966
0.10883197
0.28407079
0.37610619
0.14955752
0.14483776
0.34306785
0.36902655
0.26755162
0.14955752
0.33362832
0.40914454
0.31710914
0.27227139
0.35250737
0.25575221
0.32418879
0.56017699
0.27227139
0.20855457
0.32182891
0.32890855
0.18259587
0.18967552
0.29115044
0.16607669
0.10471976
0.11887906
0.24867257
0.17315634
0.16379747
0.19417722
0.12025316
0.11924051
0.29645569
0.31569619
0.24278481
0.15873418
0.33898734
0.40582278
0.32379747
0.28430379
0.35012658
0.26607595
0.32683544
0.53341772
0.23063291
0.19012658
0.26202532
0.26708861
0.14253165
0.14556962
0.18708861
0.13544304
0.11113924
0.11721519
0.17189873
0.14050633
17
17
17
17
17
17
17
17
17
17
17
17
17
17
17
17
17
17
17
17
17
17
17
17
17
17
17
17
0.4542
0.1922
0.2138
0.1903
0.4276
0.4019
0.4093
0.0951
0.4613
0.4567
0.4484
0.3894
0.4647
0.3622
0.4533
0.1079
0.4243
0.3161
0.4294
0.4248
0.3142
0.3358
0.4439
0.2566
-0.0528
0.0296
0.4434
0.2773
Dimana:
1.
Product id adalah sub produk pada kategori produk, seperti : 267 adalah
cellular phone service, 268 adalah phone card, 269 adalah residential
Universitas Sumatera Utara
42
telephone service and pay phones dan 270 adalah telephones, answering
machines, and accessories.
2.
Data type adalah variasi demografi, seperti : 1=age, 2=income, 3= type of
household, 4=race, 5=region dan 6=education.
3.
Data type id adalah variasi masing-masing, seperti:
variasi demografi
umur (age) adalah 1=Under age 25, 2=Age 25-34, 3=Age 35-44, 4=Age 4554, 5= Age 55-64, 6=Age 65-74 dan 7=Age 75 and older.
4.
Category id adalah kategori produk, dimana 17 adalah kategori produk
telepon.
5.
Ypredict
quadratic
adalah data output hasil peramalan dengan metode regresi
kuadratik.
Dimana output hasil peramalan untuk masing-masing jenis demografi pada kategori
produk telepon dapat dilihat pada Lampiran-3.
Untuk melihat kurva hasil peramalan menggunakan metode regresi kuadratik
berdasarkan Tabel 4.3 dapat dilihat pada Gambar 4.2.
Sedangkan untuk melihat perbandingan hasil peramalan (Ypredict quadratic) dengan
output referensi yang dalam penelitian ini adalah average spending (Yo) berdasarkan
Tabel 4.3 dapat dilihat pada Gambar 4.3.
Universitas Sumatera Utara
43
Gambar 4.2 Kurva hasil peramalan dengan metode regresi kuadratik
Gambar 4.3 Perbandingan data output referensi dengan data output hasil
peramalan menggunakan metode regresi kuadratik untuk jenis
demografi (1): umur (age) kategori produk telepon
Universitas Sumatera Utara
44
Untuk menghitung nilai parameter pengukuran seperti MSE dan R2 dari data
kategori produk telepon pada masing-masing jenis demografi, dilakukan dengan
mensubstitusikan data output referensi (Yo) dan output hasil peramalan yang
menggunakan metode regresi kuadratik (Ypredict quadratic) sebagaimana pada Lampiran-3
ke dalam Persamaan (3.1) dan Persamaan (3.2) sehingga diperoleh data seperti pada
Tabel 4.4. Hasil perhitungan selengkapnya dapat dilihat pada Lampiran-4.
Nilai MSE dan R2 hasil peramalan dengan metode regresi kuadratik pada Tabel
4.4
jika dibandingkan
dengan nilai MSE dan R2 dengan metode-metode yang
digunakan oleh peneliti sebelumnya, seperti: fuzzy logic [2], regresi linier dan
kuadratik murni [1] sebagaimana pada Tabel 4.5 dan Gambar 4.3 terlihat bahwa nilai
MSE dan R2 hasil peramalan dengan menggunakan metode regresi kuadratik memiliki
nilai MSE terkecil dan R2 terbesar.
Tabel 4.4 Nilai MSE dan R2 untuk masing-masing jenis demografi pada
kategori produk telepon dengan metode regresi kuadratik
No
Jenis Demografi
Regresi Kuadratik
MSE
R2
1
2
Age
Income
0.03964
0.06067
0.34200
0.24590
3
Type of House Hold
0.05012
0.36916
4
Race
0.04293
0.28389
5
6
Region
Educational background
0.04032
0.05336
0.30194
0.18981
Universitas Sumatera Utara
45
Hal ini mengindikasikan bahwa peramalan dengan menggunakan metode
regresi kuadratik lebih mendekati nilai output referensi dibandingkan dengan
menggunakan metode-metode yang digunakan oleh peneliti sebelumnya.
Tabel 4.5 Perbandingan nilai MSE dan R2 untuk penggunaan metode regresi
linier, regresi kuadratik, regresi murni kuadratik dan fuzzy logic
No
Demographic
types
Linear
MSE
R2
Regression
Quadratic
MSE
R2
Purequadratic
MSE
R2
Fuzzy
Logic
MSE
1
Age
0.05620
0.06719
0.03964
0.34200
0.04047
0.32831
0.07447
2
Income
0.07510
0.06656
0.06067
0.24590
0.06113
0.24021
0.09593
3
Type HH
0.06863
0.13615
0.05012
0.36916
0.05404
0.31980
0.09290
4
Race
0.05743
0.04192
0.04293
0.28389
0.04338
0.27640
0.13761
5
Region
0.05749
0.00463
0.04032
0.30194
0.04032
0.30192
0.07834
6
Education
Average
0.06544
0.06338
0.00634
0.05380
0.05336
0.04784
0.18981
0.28878
0.05368
0.04884
0.18488
0.27525
0.08027
0.09325
Gambar 4.3 Perbandingan antara data referensi dengan data hasil peramalan
menggunakan metode regresi kuadratik, regresi linier, regresi
kuadratik murni dan fuzzy logic
Universitas Sumatera Utara
46
BAB 5
PENUTUP
5.1 Kesimpulan
Dari hasil eksperimen ini maka dapat disimpulkan bahwa:
1.
Nilai MSE dan R2 yang diperoleh dengan menggunakan metode regresi
kuadratik untuk masing-masing jenis demografi adalah: untuk jenis
demografi (1) umur (age) diperoleh MSE = 0.03964 dan R2 = 0.34200,
untuk jenis demografi (2) penghasilan (income) diperoleh MSE = 0.06067
dan R2 = 0.24590, untuk jenis demografi (3) tipe keluarga (type of
household) diperoleh MSE = 0.05012 dan R2 = 0.36916, untuk jenis
demografi (4) ras (race) diperoleh MSE = 0.04293 dan R2 = 0.28389,
untuk jenis demografi (5) daerah tempat tinggal (region) diperoleh MSE =
0.04032 dan R2 = 0.30194 dan untuk jenis demografi (6) latar belakang
pendidikan (education) diperoleh MSE = 0.05336 dan R2 = 0.18981.
2.
Hasil peramalan menggunakan metode regresi kuadratik memiliki nilai
MSE terkecil dan R2 terbesar jika dibandingkan dengan nilai MSE dan R2
dari hasil peramalan dengan menggunakan metode fuzzy logic, regresi
linier dan regresi kuadratik murni.
Universitas Sumatera Utara
47
3.
Peramalan perilaku konsumen dengan menggunakan metode regresi
kuadratik lebih mendekati nilai output referensi dibandingkan dengan
menggunakan metode-metode yang digunakan oleh peneliti sebelumnya,
seperti: fuzzy logic, regresi linier dan regresi kuadratik murni.
5.2 Saran
Dari hasil penelitian ini, penulis menyarankan perlunya dilanjutkan penelitian
ini dengan melakukan pengukuran kinerja pada output Sistem Peramal Cerdas
Perilaku Konsumen, khususnya untuk penggunaan metode regresi kuadratik dan
regresi kuadratik murni.
Universitas Sumatera Utara
BAB 3
METODOLOGI PENELITIAN
3.1
Umum
Sistem Peramal Cerdas Perilaku Kosumen adalah sebuah sistem yang bekerja
untuk meramal jenis barang apa yang sebenarnya akan dibeli atau dibutuhkan oleh
konsumen. Sehingga di dalam perancangannya diperlukan suatu metode yang tepat
berdasarkan data yang digunakan untuk mendapatkan hasil peramalan yang lebih
mendekati kondisi yang sebenarnya. Untuk mendapatkan metode yang lebih tepat
sebagai peramal perlu dilakukan analisis terhadap metode yang digunakan. Dalam
penelitian ini, metode yang dianalisis adalah metode regresi kuadratik dengan
tahapan-tahapan sebagai berikut:
1.
Menentukan data yang digunakan pada Sistem Peramal Cerdas Perilaku
Konsumen
2.
Menetapkan parameter pengukuran yang digunakan untuk menganalisis
kedekatan hasil peramalan terhadap nilai referensinya.
3.
Menentukan metode yang digunakan untuk peramalan di dalam penelitian
4.
Menentukan persamaan model peramalan terhadap metode yang digunakan
dengan bantuan Program Matlab.
Universitas Sumatera Utara
29
5.
Menghitung besarnya nilai hasil peramalan dengan menggunakan
persamaan model yang telah ditentukan berdasarkan metode yang
digunakan dengan bantuan Program Excel.
6.
Melakukan pengukuran nilai hasil peramalan dengan menggunakan
parameter pengukuran yang telah ditetapkan
7.
Membandingkan hasil pengukuran nilai peramalan dari metode yang
dipilih terhadap hasil pengukuran nilai peramalan dari metode-metode lain
yang telah diteliti sebelumnya.
Secara keseluruhan, metodologi penelitian yang dilakukan untuk peningkatan
kinerja Sistem Peramal Cerdas Perilaku Konsumen ini dapat dilihat pada Gambar 3.1.
Dari diagram alir pada Gambar 3.1 terlihat bahwa di awal proses penelitian, data yang
diambil dari U.S. Bureau of Labour Statistics (BLS) Consumer Price Index (CPI) [9]
harus dinormalisasi terlebih dahulu agar data yang akan diolah tidak terlalu menyebar
namun tidak mengurangi bobotnya terhadap data yang lainnya. Dimana data sampel
masukan yang dipilih adalah berupa data indeks best customer dan biggest customer
untuk masing-masing jenis demografi dari beberapa sub kategori produk telepon.
Proses selanjutnya adalah dengan memodelkan data masukkan tersebut ke dalam
bentuk model regresi kuadratik sehingga diperoleh model persamaan peramal untuk
perilaku konsumen. Persamaan model tersebut kemudian digunakan untuk
mendapatkan data output peramalan terhadap masing-masing data masukan berupa
indeks best customer dan biggest customer untuk setiap jenis demografi dari beberapa
sub kategori produk telepon.
Universitas Sumatera Utara
30
Gambar 3.1. Diagram alir metode penelitian
Universitas Sumatera Utara
31
Untuk mengukur tingkat keakuratan hasil peramalan, digunakanlah data indeks
average spending untuk setiap jenis demografi dari beberapa sub kategori produk
telepon sebagai pembanding terhadap data hasil peramalan tersebut. Parameter ukur
yang digunakan untuk melihat tingkat keakuratan hasil peramalan tersebut adalah
MSE (Mean of Square Error) dan R2 (Rsquare). Selanjutnya, untuk melihat tingkat
keberhasilan penelitian ini, peneliti membandingkan nilai MSE dan R2 yang diperoleh
pada penelitian ini yang menggunakan metode regresi kuadratik terhadap hasil MSE
dan R2 atas penggunaan metode lain yang pernah dilakukan oleh peneliti sebelumnya.
3.2
Metode Pengumpulan Data
Pada penelitian ini, data yang digunakan adalah data survei pasar yang sudah
diperoleh dari U.S. Bureau of Labour Statistics (BLS). Data survei pasar adalah satuan
konsumen yang dikategorikan dalam berbagai demografi berdasarkan pembelanjaan
konsumen atas berbagai produk [9].
3.3
Pemilihan Parameter Pengukuran
Di dalam pelaksanaan penelitian ini, peneliti mengamati nilai kedekatan hasil
peramalan dengan nilai referensi dari hasil penggunaan metode quadratic regression
(regresi kuadratik) dengan menggunakan bantuan Program Excel.
Nilai kedekatan hasil peramalan dengan nilai referensi dari penggunaan metode
quadratic regression (regresi kuadratik) yang akan digunakan sebagai pemroses
tahap awal pada Sistem Peramal Cerdas Perilaku Konsumen diukur dengan
Universitas Sumatera Utara
32
menggunakan parameter pengukuran MSE (Mean of Square Error) dan R2 (Rsquare).
MSE mengukur rata-rata pangkat dua dari kesalahan. Kesalahan adalah suatu nilai
yang diperoleh dari perbedaan nilai referensi dengan nilai yang diramal. Persamaan
MSE adalah seperti yang terlihat pada Persamaan (3.1).
∑(y − y
MSE =
predict
)2
(3.1)
n
Dimana y adalah nilai referensi, ypredict adalah nilai peramalan dan n adalah jumlah
data.
Di dalam regresi, R2 adalah suatu variabel statistikal yang mengukur bagaimana
garis regresi memperkirakan data point yang riil. Nilai R2 = 1 menunjukkan garis
regresi sangat sesuai dengan data [8]. Rumus untuk menghitung R2 ditunjukkan pada
Persamaan (3.2).
∑(y − y )
=1−
n∑y −(∑y)
(n −1)*
2
2
R
predict
2
n(n −1)
2
(3.2)
Dimana y adalah nilai referensi, ypredict adalah nilai peramalan dan n adalah jumlah
data.
3.4 Penggunaan Metode Regresi Kuadratik
Metode regresi kuadratik adalah merupaka metode yang dianalisis pada
penelitian ini. Metode ini digunakan sebagai unit pemrosesan tahap awal pada Sistem
Peramal Cerdas Perilaku Konsumen yang menggantikan metode fuzzy logic yang
Universitas Sumatera Utara
33
digunakan pada Sistem Peramal Cerdas Perilaku Konsumen yang sebelumnya. Sistem
Peramal Cerdas Perilaku Konsumen yang diusulkan dapat dilihat pada Gambar 3.2.
Dengan penggunaan metode ini diharapkan dapat meningkatkan kinerja Sistem
Peramal Cerdas Perilaku Konsumen yang sebelumnya.
Sebagaimana pada Gambar 3.2, Sistem Peramal Cerdas Perilaku Konsumen
yang diusulkan menggunakan dua tahap pemrosesan, yaitu: pada pemrosesan awal
menggunakan metode regresi kuadratik dan pada pemrosesan tahap berikutnya
menggunakan Ordinal Structure Fuzzy Model (OSFM).
Gambar 3.2. Diagram blok Sistem Peramal Cerdas Perilaku Konsumen
yang diusulkan
Masukan untuk Sistem Peramal Cerdas Perilaku Konsumen berupa data
variabel best customer dan biggest customer berdasarkan masing-masing jenis
Universitas Sumatera Utara
34
demografi yang dipilih. Keluaran dari tingkat pemrosesan awal adalah berupa data
indeks dari sub produk yang paling disukai oleh konsumen.
Pada tahap pemrosesan berikutnya, data keluaran dari masing-masing jenis
demografi dari unti pemroses tahap awal dijadikan sebagai masukan untuk unit
Ordinal Structure Fuzzy Model (OSFM). Keluaran dari tahap pemrosesan ini yang
juga merupakan hasil akhir dari Sistem Peramal Cerdas Perilaku Konsumen adalah
berupa perioritas produk atau produk yang paling tepat untuk memenuhi kebutuhan
konsumen sesuai dengan demografinya.
Universitas Sumatera Utara
35
BAB 4
HASIL PEMBAHASAN DAN ANALISA DATA
4.1
Penentuan Persamaan Peramal Perilaku Konsumen
Pada tesis ini, penulis mengambil contoh data kategori produk telepon yang
bersumber dari U.S. Bureau of Labour Statistics (BLS) Consumer Price Index (CPI)
[9] sebagaimana pada Lampiran-1 untuk proses simulasi peramalan. Data tersebut
memiliki 4 tipe sub kategori produk, yaitu : cellular phone service (tipe-1), phone
cards (tipe-2), residential telephone service and pay phones (tipe-3) dan telephones,
answering machines, and accessories (tipe-4) untuk 6 jenis demografi. Dimana untuk
jenis demografi umur (age) memiliki 7 variasi, pendapatan (income) memiliki 7
variasi, tipe keluarga (type of household) memiliki 8 variasi, ras (race) memiliki 4
variasi, daerah tempat tinggal (region) memiliki 4 variasi dan latar belakang
pendidikan (education) memiliki 7 variasi. Sehingga total variasi data untuk masingmasing data best customer dan biggest customer berjumlah 148 variasi data yang
terdiri dari 28 variasi data untuk jenis demografi umur (age), 28 variasi data untuk
jenis demografi pendapatan (income), 32 variasi data untuk jenis demografi tipe
keluarga (type of household), 16 variasi data untuk jenis demografi ras (race), 16
variasi data untuk jenis demografi daerah tempat tinggal (region), 28 variasi data
untuk jenis demografi latar belakang pendidikan (education).
Universitas Sumatera Utara
36
Data kemudian dinormalisasi untuk kebutuhan pengolahan sehingga diperoleh
tabel data kategori produk telepon seperti pada Lampiran-2. Dari data pada
Lampiran-2 diperoleh data best customer (x1), biggest customer (x2) dan average
spending (Y) seperti pada Tabel 4.1 yang kemudian digunakan untuk penentuan
persamaan peramalan pada tesis ini.
Tabel 4.1 Data demografi umur (age) untuk kategori produk telepon
n
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
Product
id
267
268
269
270
267
268
269
270
267
268
269
270
267
268
269
270
267
268
269
270
267
268
269
270
267
268
269
270
Data
type
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
Data
type
id
1
1
1
1
2
2
2
2
3
3
3
3
4
4
4
4
5
5
5
5
6
6
6
6
7
7
7
7
Average
spending
value
Best
customer
value
Biggest
customer
value
(y)
(x1)
(x2)
0.4621
0.1198
0.3374
0.1054
0.5544
0.1194
0.6258
0.1059
0.5411
0.1226
0.7521
0.1202
0.5689
0.1106
0.7691
0.1533
0.4444
0.1068
0.7608
0.1267
0.3002
0.1055
0.6847
0.1079
0.1769
0.0998
0.5793
0.1088
0.28407
0.37611
0.14956
0.14484
0.34307
0.36903
0.26755
0.14956
0.33363
0.40914
0.31711
0.27227
0.35251
0.25575
0.32419
0.56018
0.27227
0.20855
0.32183
0.32891
0.18258
0.18968
0.29115
0.16608
0.10472
0.11888
0.24867
0.17316
0.16379
0.19418
0.12025
0.11924
0.29646
0.31569
0.24278
0.15873
0.33899
0.40582
0.32378
0.28429
0.35013
0.26608
0.32684
0.53342
0.23063
0.19013
0.26203
0.26709
0.14253
0.14557
0.18709
0.13544
0.11114
0.11722
0.1719
0.14051
Universitas Sumatera Utara
37
Dimana:
1.
Product id adalah sub produk pada kategori produk, seperti: 267 adalah
cellular phone service, 268 adalah phone card, 269 adalah residential
telephone service and pay phones dan 270 adalah telephones, answering
machines, and accessories.
2.
Data type adalah variasi demografi, seperti:
1=age, 2=income,
3=household type, 4=race, 5=region dan 6=education.
3.
Data type id adalah variasi masing-masing, seperti:
variasi demografi
umur (age) adalah 1=Under age 25, 2=Age 25-34, 3=Age 35-44, 4=Age 4554, 5= Age 55-64, 6=Age 65-74 dan 7=Age 75 and older.
Dengan menggunakan Persamaan (2.20) dari data pada Tabel 4.1 maka diperoleh
persamaan seperti pada Persamaan (4.1).
(a) 28a0 + 7.5150a1 + 6.5418a2 + 2.0151a3 + 2.3033a4 + 1.8145a5= 9.1707
(b) 7.5150a0 + 2.3033a1 + 2.0151a2 + 0.6953a3 + 0.7875a4 + 0.6311a5 = 2.6409
(c)
6.5418 a0 + 2.0151 a1 + 1.8145 a2 + 0.6311 a3 + 0.6953 a 4 + 0.5842 a5 = 2.2988
(d ) 2.0151a0 + 0.6953a1 + 0.6311a2 + 0.2421a3 + 0.2644a4 + 0.2255a5 = 0.7135
(e) 2.3033a0 + 0.7875a1 + 0.6953a2 + 0.2644a3 + 0.2960a4 + 0.2421a5 = 0.8122
( f ) 1.8145a0 + 0.6311a1 + 0.5842a2 + 0.2255a3 + 0.2421a4 + 0.2126a5 = 0.6437
(4.1)
Dengan menggunakan metode eliminasi Gauss, maka diperoleh penyelesaian dari
Persamaan (4.1) adalah a0 = -0.4850, a1 = 11.1391, a2 = -6.0605, a3 = 21.4419,
a4 = -7.3597 dan a5= -0.8287. Dengan cara yang sama dan menggunakan bantuan
Program Matlab, maka diperoleh koefisien persamaan model untuk 6 jenis demografi
seperti pada Tabel 4.2.
Universitas Sumatera Utara
38
Tabel 4.2 Nilai koefisien persamaan model untuk 6 jenis demografi
Coefficient
Age
a0
a1
a2
a3
a4
a5
1
-0.4850
11.1391
-6.0605
21.4419
-27.3597
-0.8287
Income
2
-0.6914
3.0451
3.9370
6.2920
-5.0842
-12.1861
Demographic types
House
Race
Hold
3
4
-0.5199 -0.1380
3.7616 3.9940
1.4851 -1.7327
-4.5737 1.0704
-2.2225 -4.5169
-0.0421 1.3122
Region
Education
5
-0.0575
24.5700
-20.2870
2.6771
-36.9597
25.7092
6
-1.4177
9.9187
1.0837
-7.1401
-11.0716
1.8590
Dengan mensubstitusikan data pada Tabel 4.2 ke dalam Persamaan (2.16) maka
diperoleh persamaan peramal untuk 6 jenis demografi yang kemudian digunakan
untuk unit permosesan awal pada Sistem Peramal Cerdas Perilaku Konsumen seperti
pada Persamaan (4.2).
y1 = −0.4850 + 11.1391x1 − 6.0605 x2 + 21.4419 x1 x2 − 27.3597) x1 − 0.8287 x2
2
y2 = −0.6914 + 3.0451x1 + 3.9370x2 + 6.2920x1x2 − 5.0842x − 12.1861x2
2
1
2
2
y 3 = − 0 .5199 + 3 .7616 x1 + 1 .4851 x 2 − 4 .5737 x1 x 2 − 2 .2225 x1 − 0 .0421 x 2
2
2
2
2
y4 = −0.1380 + 3.9940 x1 − 1.7327 x2 + 1.0704 x1 x2 − 4.5169 x1 + 1.3122 x2
y 5 = − 0 .0575 + 24 . 5700 x1 − 20 .2870 x 2 + 2 .6771 x1 x 2 − 36 .9597 x1 + 25 .7092 x 2
2
y6 = −1.4177 + 9.9187 x1 + 1.0837 x2 − 7.1401x1 x2 − 11.0716 x1 + 1.8590 x2
2
(4.2)
2
2
Dimana y1 adalah persamaan peramal untuk jenis demografi umur (age), y2 adalah
persamaan peramal untuk jenis demografi penghasilan (income), y3 adalah persamaan
peramal untuk jenis demografi tipe keluarga (type of house hold), y4 adalah
persamaan peramal untuk jenis demografi ras (race), y5 adalah persamaan peramal
untuk jenis demografi daerah tempat tinggal (region) dan y6 adalah persamaan
peramal untuk jenis demografi latar belakang pendidikan (education).
Universitas Sumatera Utara
39
4.2 Eksperimen dan Hasil
Eksperimen ini dikembangkan berdasarkan data survei pasar dari U.S. Bureau
of Labour Statistics (BLS)[9]. Data survei pasar adalah unit atau set konsumen yang
terkelompokkan dalam variasi demografi yang berdasarkan pembelanjaannya pada
suatu produk. Pada eksperimen ini dianalisa data survei pasar dari U.S. Bureau of
Labour Statistics (BLS)[9], khususnya data jenis demografi umur (age) yang tertera
pada Tabel 4.1.
Berdasarkan data yang diberikan dari Tabel 4.1, diperoleh kurva korelasi data
average spending (Y) terhadap quadratic regression trendline average spending (Y)
seperti pada Gambar 4.1.
Berdasarkan Gambar 4.1 terlihat adanya korelasi secara kuadratik antara data
average spending (Yo) terhadap quadratic regression trendline average spending (Y).
Oleh karena itu pada eksperimen ini peneliti menggunakan metode regresi kuadratik
yang merupakan bagian dari multiple regression untuk mendapatkan ketepatan dalam
peramalan perilaku konsumen.
Gambar 4.1 Korelasi data average spending (Yo) terhadap quadratic
regression trendline average spending (Y)
Universitas Sumatera Utara
40
4.2.1 Simulasi Eksperimen
Untuk menentukan metode yang lebih mendekati ketepatan dalam meramal
tipe produk yang paling disukai untuk dibeli oleh konsumen berdasarkan latar
belakang demografinya, langkah awal yang harus diketahui adalah korelasi diantara
data input dan output referensi seperti pada Gambar 4.1.
Di dalam unit pemrosesan awal pada Sistem Peramal Cerdas Perilaku
Konsumen seperti pada Gambar 3.2, data best customer dan biggest customer
digunakan sebagai data input dan average spending digunakan sebagai data output
referensi. Data average spending digunakan sebagai data output referensi karena data
average spending dapat digunakan untuk menentukan potensi pasar dari produk atau
pelayanan di suatu area. Proses berikutnya adalah menghitung nilai output sebagai
suatu hasil peramalan untuk metode yang digunakan, dalam hal ini adalah metode
regresi kuadratik. Dan proses yang terakhir adalah menghitung selisih yang terjadi
antara data output referensi dengan data output hasil peramalan dengan
menggunakan parameter pengukuran MSE ( Mean of Square Error) dan R2 (RSquare).
Data output peramalan yang memiliki nilai MSE terkecil dan R2 terbesar dijadikan
sebagai masukan untuk unit pemrosesan berikutnya dalam meramal perilaku
konsumen sebagaimana pada Gambar 3.2.
Universitas Sumatera Utara
41
4.2.2 Hasil dan Diskusi
Dengan mensubstitusikan data best customer (x1) dan biggest customer (x2)
kategori produk telepon untuk masing-masing jenis demografi pada Persamaan (4.2)
diperoleh hasil peramalan seperti pada Tabel 4.3.
Tabel 4.3 Output hasil peramalan dengan metode regresi kuadratik untuk jenis
demografi umur (age) pada kategori produk telepon
No
Product
id
Data
type
Data
type
id
Norm
average
spending
(Yo)
Norm best
customer
(X1)
Norm
biggest
customer
(X2)
Category
id
Y predict
quadratic
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
267
268
269
270
267
268
269
270
267
268
269
270
267
268
269
270
267
268
269
270
267
268
269
270
267
268
269
270
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
2
2
2
2
3
3
3
3
4
4
4
4
5
5
5
5
6
6
6
6
7
7
7
7
0.46211057
0.11996835
0.33742459
0.10542973
0.55443576
0.11941448
0.62582336
0.10604292
0.54114331
0.12258926
0.75208189
0.12024528
0.56899416
0.11058253
0.76912274
0.15333795
0.44436752
0.10701216
0.76080506
0.12674315
0.30023737
0.10547918
0.68471961
0.10792207
0.17686678
0.09899989
0.57930966
0.10883197
0.28407079
0.37610619
0.14955752
0.14483776
0.34306785
0.36902655
0.26755162
0.14955752
0.33362832
0.40914454
0.31710914
0.27227139
0.35250737
0.25575221
0.32418879
0.56017699
0.27227139
0.20855457
0.32182891
0.32890855
0.18259587
0.18967552
0.29115044
0.16607669
0.10471976
0.11887906
0.24867257
0.17315634
0.16379747
0.19417722
0.12025316
0.11924051
0.29645569
0.31569619
0.24278481
0.15873418
0.33898734
0.40582278
0.32379747
0.28430379
0.35012658
0.26607595
0.32683544
0.53341772
0.23063291
0.19012658
0.26202532
0.26708861
0.14253165
0.14556962
0.18708861
0.13544304
0.11113924
0.11721519
0.17189873
0.14050633
17
17
17
17
17
17
17
17
17
17
17
17
17
17
17
17
17
17
17
17
17
17
17
17
17
17
17
17
0.4542
0.1922
0.2138
0.1903
0.4276
0.4019
0.4093
0.0951
0.4613
0.4567
0.4484
0.3894
0.4647
0.3622
0.4533
0.1079
0.4243
0.3161
0.4294
0.4248
0.3142
0.3358
0.4439
0.2566
-0.0528
0.0296
0.4434
0.2773
Dimana:
1.
Product id adalah sub produk pada kategori produk, seperti : 267 adalah
cellular phone service, 268 adalah phone card, 269 adalah residential
Universitas Sumatera Utara
42
telephone service and pay phones dan 270 adalah telephones, answering
machines, and accessories.
2.
Data type adalah variasi demografi, seperti : 1=age, 2=income, 3= type of
household, 4=race, 5=region dan 6=education.
3.
Data type id adalah variasi masing-masing, seperti:
variasi demografi
umur (age) adalah 1=Under age 25, 2=Age 25-34, 3=Age 35-44, 4=Age 4554, 5= Age 55-64, 6=Age 65-74 dan 7=Age 75 and older.
4.
Category id adalah kategori produk, dimana 17 adalah kategori produk
telepon.
5.
Ypredict
quadratic
adalah data output hasil peramalan dengan metode regresi
kuadratik.
Dimana output hasil peramalan untuk masing-masing jenis demografi pada kategori
produk telepon dapat dilihat pada Lampiran-3.
Untuk melihat kurva hasil peramalan menggunakan metode regresi kuadratik
berdasarkan Tabel 4.3 dapat dilihat pada Gambar 4.2.
Sedangkan untuk melihat perbandingan hasil peramalan (Ypredict quadratic) dengan
output referensi yang dalam penelitian ini adalah average spending (Yo) berdasarkan
Tabel 4.3 dapat dilihat pada Gambar 4.3.
Universitas Sumatera Utara
43
Gambar 4.2 Kurva hasil peramalan dengan metode regresi kuadratik
Gambar 4.3 Perbandingan data output referensi dengan data output hasil
peramalan menggunakan metode regresi kuadratik untuk jenis
demografi (1): umur (age) kategori produk telepon
Universitas Sumatera Utara
44
Untuk menghitung nilai parameter pengukuran seperti MSE dan R2 dari data
kategori produk telepon pada masing-masing jenis demografi, dilakukan dengan
mensubstitusikan data output referensi (Yo) dan output hasil peramalan yang
menggunakan metode regresi kuadratik (Ypredict quadratic) sebagaimana pada Lampiran-3
ke dalam Persamaan (3.1) dan Persamaan (3.2) sehingga diperoleh data seperti pada
Tabel 4.4. Hasil perhitungan selengkapnya dapat dilihat pada Lampiran-4.
Nilai MSE dan R2 hasil peramalan dengan metode regresi kuadratik pada Tabel
4.4
jika dibandingkan
dengan nilai MSE dan R2 dengan metode-metode yang
digunakan oleh peneliti sebelumnya, seperti: fuzzy logic [2], regresi linier dan
kuadratik murni [1] sebagaimana pada Tabel 4.5 dan Gambar 4.3 terlihat bahwa nilai
MSE dan R2 hasil peramalan dengan menggunakan metode regresi kuadratik memiliki
nilai MSE terkecil dan R2 terbesar.
Tabel 4.4 Nilai MSE dan R2 untuk masing-masing jenis demografi pada
kategori produk telepon dengan metode regresi kuadratik
No
Jenis Demografi
Regresi Kuadratik
MSE
R2
1
2
Age
Income
0.03964
0.06067
0.34200
0.24590
3
Type of House Hold
0.05012
0.36916
4
Race
0.04293
0.28389
5
6
Region
Educational background
0.04032
0.05336
0.30194
0.18981
Universitas Sumatera Utara
45
Hal ini mengindikasikan bahwa peramalan dengan menggunakan metode
regresi kuadratik lebih mendekati nilai output referensi dibandingkan dengan
menggunakan metode-metode yang digunakan oleh peneliti sebelumnya.
Tabel 4.5 Perbandingan nilai MSE dan R2 untuk penggunaan metode regresi
linier, regresi kuadratik, regresi murni kuadratik dan fuzzy logic
No
Demographic
types
Linear
MSE
R2
Regression
Quadratic
MSE
R2
Purequadratic
MSE
R2
Fuzzy
Logic
MSE
1
Age
0.05620
0.06719
0.03964
0.34200
0.04047
0.32831
0.07447
2
Income
0.07510
0.06656
0.06067
0.24590
0.06113
0.24021
0.09593
3
Type HH
0.06863
0.13615
0.05012
0.36916
0.05404
0.31980
0.09290
4
Race
0.05743
0.04192
0.04293
0.28389
0.04338
0.27640
0.13761
5
Region
0.05749
0.00463
0.04032
0.30194
0.04032
0.30192
0.07834
6
Education
Average
0.06544
0.06338
0.00634
0.05380
0.05336
0.04784
0.18981
0.28878
0.05368
0.04884
0.18488
0.27525
0.08027
0.09325
Gambar 4.3 Perbandingan antara data referensi dengan data hasil peramalan
menggunakan metode regresi kuadratik, regresi linier, regresi
kuadratik murni dan fuzzy logic
Universitas Sumatera Utara
46
BAB 5
PENUTUP
5.1 Kesimpulan
Dari hasil eksperimen ini maka dapat disimpulkan bahwa:
1.
Nilai MSE dan R2 yang diperoleh dengan menggunakan metode regresi
kuadratik untuk masing-masing jenis demografi adalah: untuk jenis
demografi (1) umur (age) diperoleh MSE = 0.03964 dan R2 = 0.34200,
untuk jenis demografi (2) penghasilan (income) diperoleh MSE = 0.06067
dan R2 = 0.24590, untuk jenis demografi (3) tipe keluarga (type of
household) diperoleh MSE = 0.05012 dan R2 = 0.36916, untuk jenis
demografi (4) ras (race) diperoleh MSE = 0.04293 dan R2 = 0.28389,
untuk jenis demografi (5) daerah tempat tinggal (region) diperoleh MSE =
0.04032 dan R2 = 0.30194 dan untuk jenis demografi (6) latar belakang
pendidikan (education) diperoleh MSE = 0.05336 dan R2 = 0.18981.
2.
Hasil peramalan menggunakan metode regresi kuadratik memiliki nilai
MSE terkecil dan R2 terbesar jika dibandingkan dengan nilai MSE dan R2
dari hasil peramalan dengan menggunakan metode fuzzy logic, regresi
linier dan regresi kuadratik murni.
Universitas Sumatera Utara
47
3.
Peramalan perilaku konsumen dengan menggunakan metode regresi
kuadratik lebih mendekati nilai output referensi dibandingkan dengan
menggunakan metode-metode yang digunakan oleh peneliti sebelumnya,
seperti: fuzzy logic, regresi linier dan regresi kuadratik murni.
5.2 Saran
Dari hasil penelitian ini, penulis menyarankan perlunya dilanjutkan penelitian
ini dengan melakukan pengukuran kinerja pada output Sistem Peramal Cerdas
Perilaku Konsumen, khususnya untuk penggunaan metode regresi kuadratik dan
regresi kuadratik murni.
Universitas Sumatera Utara