Klasifikasi Data Mining id. docx

BAB I
PENDAHULUAN

1.1 Deskripsi Permasalahan
Setiap perusahaan, apakah perusahaan itu perusahaan perdagangan ataupun
perusahaan pabrik serta perusahaan jasa selalu mengadakan persediaan. Tanpa
adanya persediaan, para pengusaha akan dihadapkan pada resiko bahwa
perusahaannya pada suatu waktu tidak dapat memenuhi keinginan pelanggan yang
memerlukan atau meminta barang/jasa. Persediaan diadakan apabila keuntungan
yang diharapkan dari persediaan tersebut hendaknya lebih besar daripada biayabiaya yang ditimbulkannya. Sebelum dijelaskan tentang pengertian persediaan,
perlu dijelaskan juga bahwa istilah persediaan sama dengan istilah inventory.
Persediaan merupakan bagian utama dari modal kerja, sebab dilihat dari
jumlahnya biasanya persediaan inilah unsur kerja yang paling besar. Hal ini dapat
dipahami karena persediaan merupakan faktor penting dalam menentukan
kelancaran operasi perusahaan. Tanpa ada persediaan yang memadai kemungkinan
perusahaan tidak bisa mendapatkan keuntungan yang diinginkan sebab proses
produksi terganggu. Jadi persediaan merupakan sejumlah barang yang disediakan
untuk memenuhi permintaan dari pelanggan. Dalam perusahaan perdagangan pada
dasarnya hanya ada satu golongan inventory (persediaan), yang mempunyai sifat
perputaran yang sama yaitu yang disebut “Merchandise Inventory” (persediaan
barang dagangan). Persediaan ini merupakan persediaan barang yang selalu dalam

perputaran, yang selalu dibeli dan dijual, yang tidak mengalami proses lebih lanjut
didalam perusahaan tersebut yang mengakibatkan perubahan bentuk dari barang
yang bersangkutan. (www.transformasi.net)
Persediaan merupakan bagian utama dalam perusahaan khususnya perusahaan
dagang dan seringkali merupakan perkiraan yang nilainya cukup besar dan
melibatkan modal kerja yang besar. Tanpa adanya persediaan barang dagangan,
perusahaan akan menghadapi resiko dimana pada suatu waktu tidak dapat

memenuhi keinginan dari para pelanggannya. Tentu saja kenyataan ini dapat
berakibat buruk bagi perusahaan, karena secara tidak langsung perusahaan
menjadi kehilangan kesempatan untuk memperoleh keuntungan yang seharusnya
didapatkan. Dalam hal ini yang meliputi barang-barang milik perusahaan dengan
maksud untuk dijual dalam suatu periode waktu tertentu atau persediaan barangbarang yang masih dalam pengerjaan atau proses produksi, ataupun persediaan
bahan baku yang menunggu penggunaannya dalam suatu proses produksi Oleh
karena

itu

persediaan

sebaiknya

dapat

dikelola

dengan

baik.

(www.pengusahamuslim.com)
Salah satu yang cukup penting berkaitan dengan persediaan adalah masalah
biaya yang berkaitan dengan persediaan. Hal ini penting untuk diperhatikan
karena akan berpengaruh lansung kepada nilai persediaan dan harga jual ke
konsumen nantinya. Bukan tidak mungkin karena salah dalam mengelolah akan
berakibat harga jual akan meningkat. Untuk itu perlu diketahui dulu biaya-biaya
yang berkaitan dengan persediaan. Sedangkan biaya-biaya yang berkaitan dengan
persediaan dapat dikelompokkan kedalam klasifikasi biaya antara lain pengelolaan
sediaan, kekurangan sediaan, dan pemesanan dan penerimaan sediaan. Dari ketiga
klasifikasi ini akan mengakibatkan tiga jenis baya sediaan, yaitu biaya

pengelolaan (pemeliharaan), biaya pesan, dan total biaya sediaan. (Kasmir, 2010)
Dalam penelitian ini ada 5 faktor yang mempengaruhi dalam peningkatan total
inventory cost PT. ART yaitu persediaan awal, kuantitas pesan, leadtime,
frekuensi, pemesanan, dan safety stock. Dengan pendekatan data mining yaitu
menggunakan metode decision tree dan naive bayes akan dibuatkan model
prediksi dimana model tersebut berfungsi sebagai prediksi dari status inventory
cost. Decision tree digunakan untuk membagi kumpulan data yang besar menjadi
himpunan-himpunan data yang lebih kecil dan naive bayes sendiri digunakan
untuk menentukan probabilitas terjadinya peristiwa dimasa depan berdasarkan
data yang telah ada sebelumnya.
Terdapat beberapa penelitian terdahulu yang serupa dimana meneliti dengan
menggunakan klasifikasi data mining metode decision tree dan naive bayes.
Penelitian pertama yaitu dari Wawan Yunanto, Mochamad Hariadi, dan Mauridhi

Hery Purnomo yang memiliki judul “Pemetaan Kecelakaan Lalu Lintas Berbasis
Klasifikasi Naive Bayes dengan Parameter Infrastruktur Jalan” perbedaan antara
penelitian kami dengan penelitian ini yaitu pada penelitian ini hanya menggunakan
naive bayes saja dan diterapkan untuk memetakan kecelakaan lalu lintas. Tujuan
dari penelitian tersebut yaitu untuk memetakan kecelakaan lalu lintas yang terjadi
dengan parameter infrastruktur di jalan itu sendir sedangkan hasil dari penelitian

tersebut yaitu prediksi dengan Naive Bayes menunjukan bahwa tingkat akurasi ratarata berkisar antara 29.3653% sampai dengan 78.0415%, ini menunjukan bahwa
tidak semua infrastruktur jalan bisa digunakan sebagai parameter sebuah kecelakaan
terjadi karena masih ada hasil prediksi yang berada di bawah 50%. Namun ini
bukan merupakan hasil final yang langsung diimplementasikan. Prediksi kecelakaan
lalu lintas ini masih merupakan penelitian yang sedang berjalan dan belum
sepenuhnya selesai. Selain infrastruktur jalan, masih ada hal lain yang menjadi
target, antara lain dari sisi kendaraan yang mengalami kecelakaan, manusia yang
mengemudikan kendaraan tersebut, dan cuaca dimana kecelakaan itu terjadi.
Penelitian lebih lanjut sangat diperlukan untuk melihat seberapa besar korelasi
antara target-target tersebut dengan kecelakaan lalu lintas.
Penelitian kedua yaitu datang dari mahasiswa Universitas Islam Indonesia
Ahmad Fathan Hidayatullah, Alan Dwi Prasetyo, dan Dantik Puspita Sari dengan
penelitiannya yang berjudul “Analisis Kualitas Data dan Klasifikasi Data Pasien
Kanker” perbedaan dengan penelitian kami adalah penerapan dari penggunaan
decision tree dan native bayes dimana pada penelitian ini diterapkan untuk kualitas
data dan klasifikasi data pasien kanker. Hasil dari penelitian ini yaitu telah
menyelesaikan masalah missing value data pasien kanker dengan replace missing
value. Replace missing value mengganti nilai yang hilang pada suatu atribut dengan
nilai rata-rata suatu atribut. Untuk menentukan kemiripan data pasien, digunakan
metode Levenshtein string metric. Metode Levenshtein string metric melakukan

pengecekan setiap karakter string pada setiap atribut data pasien. Berdasarkan dua
metode yang diuji coba, disimpulkan bahwa Decision Tree menghasilkan performa
yang sedikit lebih baik dari Naive Bayes dalam menentukan klasifikasi. Metode
Decision tree menghasilkan akurasi sebesar 99.9988 % sedangkan metode Naive

Bayes menghasilkan akurasi 99.9799 %. Berdasarkan uji coba yang telah dilakukan,
diperoleh bahwa Decision Tree J48 memberikan hasil akurasi sedikit lebih baik dari
Naive Bayes dengan selisih akurasi 0,0189%. Namun demikian, secara umum
metode Decision Tree dan Naive Bayes sama-sama memiliki akurasi yang baik
dalam melakukan klasifikasi kemiripan data pasien.
1.2 Rumusan Masalah
Rumusan masalah pada penelitian ini adalah:
1. Bagaimanakah hasil rule yang terbentuk dari analisis klasifikasi pada
peningkatan total inventory cost menggunakan algoritma Decision Tree dan
Naïve Bayes?
2. Bagaimana perbandingan hasil prediksi menggunakan algoritma Decision Tree
dan Naïve Bayes?
1.3 Tujuan Penelitian
Tujuan penelitian pada penelitian ini adalah:
1. Untuk mengetahui hasil rule yang terbentuk dari analisis klasifikasi pada

peningkatan total inventory cost menggunakan algoritma Decision Tree dan
Naïve Bayes.
2. Untuk mengetahui perbandingan hasil prediksi menggunakan algoritma
Decision Tree dan Naïve Bayes.

BAB II
TINJAUAN PUSTAKA

2.1 Kajian Deduktif
2.1.1 Klasifikasi
Klasifikasi menurut Bertalya (2009) adalah suatu proses untuk menyatakan suatu
objek ke salah satu kategori yang sudah didefinisikan sebelumnya. Proses
pembelajaran fungsi target (model klasifikasi) yang memetakan setiap sekumpulan
atribut x (input) ke salah satu klas y yang didefinisikan sebelumnya. Inputnya
adalah sekumpulan record (training set) dari setiap record tersebut terdiri atas
sekumpulan atribut, salah satu atribut adalah klas. Mencari model utk atribut klas
sebagai fungsi dari nilai-nilai untuk atribut yang lain. Model klasifikasi digunakan
untuk:
1. Pemodelan deskriptif sebagai perangkat penggambaran untuk membedakan
objek-objek dari klas berbeda.

2. Pemodelan prediktif digunakan untuk memprediksi label klas untuk record yang
tidak diketahui atau tidak dikenal.
Klasifikasi dalam data mining bekerja pada data historis atau data sejarah. Data
historis disebut data latihan atau training data. Histori data digunakan sebagai cara
mendapatkan pengetahuan dan disebut data pengalaman. Secara sederhana ada 3
proses pemecahan masalah klasifikasi diantaranya:
1. Data historis atau data pengalaman
2. Data historis akan diproses menggunakan algoritma klasifikasi
3. Klassifikasi menghasilkan pengetahuan yang dipresentasikan dalam bentuk
diagram pohon keputusan”decission tree”.
Tahapan dari klasifikasi dalam data mining terdiri dari:
1.

Pembangunan model, dalam tahapan ini dibuat sebuah model untuk
menyelesaikan masalah klasifikasi class atau attribut dalam data, model ini
dibangun berdasarkan training set-sebuah contoh data dari permasalahan yang

dihadapi, training set ini sudah mempunyai informasi yang lengkap baik
attribut maupun classnya.
2.

Penerapan model, pada tahapan ini model yang sudah dibangun sebelumnya
digunakan untuk menentukan attribut / class dari sebuah data baru yang
attribut / class-nya belum diketahui sebelumnya.

3.

Evaluasi, pada tahapan ini hasil dari penerapan model pada tahapan
sebelumnya dievaluasi menggunakan parameter terukur untuk menentukan
apakah model tersebut dapat diterima.

2.1.2 Decision Tree
Decision Tree adalah sebuah struktur pohon, dimana setiap node pohon
merepresentasikan atribut yang telah diuji, setiap cabang merupakan suatu
pembagian hasil uji, dan node daun (leaf) merepresentasikan kelompok kelas
tertentu. Level node teratas dari sebuah Decision Tree adalah node akar (root) yang
biasanya berupa atribut yang paling memiliki pengaruh terbesar pada suatu kelas
tertentu. Pada umumnya Decision Tree melakukan strategi pencarian secara topdown untuk solusinya. Pada proses mengklasifikasi data yang tidak diketahui, nilai
atribut akan diuji dengan cara melacak jalur dari node akar (root) sampai node akhir
(daun) dan kemudian akan diprediksi kelas yang dimiliki oleh suatu data baru

tertentu. Secara singkat bahwa Decision Tree merupakan salah satu metode
klasifikasi pada Text Mining. Klasifikasi adalah proses menemukan kumpulan pola
atau fungsi-fungsi yang mendeskripsikan dan memisahkan kelas data satu dengan
lainnya, untuk dapat digunakan untuk memprediksi data yang belum memiliki kelas
data tertentu (Jianwei Han, 2001).
Jika suatu set data mempunyai beberapa pengamatan dengan missing value
yaitu record dengan beberapa nilai variabel tidak ada, Jika jumlah pengamatan
terbatas maka atribut dengan missing value dapat diganti dengan nilai rata-rata dari
variabel yang bersangkutan. (Santosa, 2007)
Untuk melakukan pemisahan obyek (split) dilakukan tes terhadap atribut dengan
mengukur tingkat ketidakmurnian pada sebuah simpul (node). Pada algoritma C.45
menggunakan rasio perolehan (gain ratio). Sebelum menghitung rasio perolehan,

perlu menghitung dulu nilai informasi dalam satuan bits dari suatu kumpulan objek.
Cara menghitungnya dilakukan dengan menggunakan konsep entropy.

Gambar 2.1 Rumus Entropy
Kemudian menghitung perolehan informasi dari output data atau variabel
dependent y yang dikelompokkan berdasarkan atribut A, dinotasikan dengan gain
(y,A). Perolehan informasi, gain (y,A), dari atribut A relative terhadap output data y

adalah:

Gambar 2.2 Rumus Information Gain
nilai (A) adalah semua nilai yang mungkin dari atribut A, dan yc adalah subset dari
y dimana A mempunyai nilai c. Term pertama dalam persamaan diatas adalah
entropy total y dan term kedua adalah entropy sesudah dilakukan pemisahan data
berdasarkan atribut A.
2.1.3 Naïve Bayes
Teorema Bayes dikemukakan oleh seorang pendeta presbyterian Inggris pada tahun
1763 yang bernama Thomas Bayes. Teorema Bayes digunakan untuk menghitung
probabilitas terjadinya suatu peristiwa berdasarkan pengaruh yang didapat dari hasil
observasi. Algoritma bayes mempelajari kejadian-kejadian dari rekaman database
dengan cara memperhitungkan korelasi antara variabel yang dianalisa dengan
variabel-variabel lainnya. Hasilnya adalah kita dapat memprediksi sesuatu,
misalnya apakah seseorang berasal dari golongan tertentu berdasarkan variabelvariabel yang melekat padanya. Selain itu, naive bayes dapat juga menganalisa
variabel-variabel yang paling mempengaruhinya dalam bentuk peluang. (Olson
Delen, 2008)
Keuntungan metode Naive Bayes :
1. Menangani kuantitatif dan data diskrit

2. Kokoh untuk titik noise yang diisolasi, misalkan titik yang dirata – ratakan
ketika mengestimasi peluang bersyarat data.
3. Hanya memerlukan sejumlah kecil data pelatihan untuk mengestimasi parameter
(rata-rata dan variansi dari variabel) yang dibutuhkan untuk klasifikasi.
4. Menangani nilai yang hilang dengan mengabaikan instansi selama perhitungan
estimasi peluang.
5. Cepat dan efisiensi ruang.
6. Kokoh terhadap atribut yang tidak relevan.
Kekurangan Naive Bayesian :
1. Tidak berlaku jika probabilitas kondisionalnya adalah nol, apabila nol maka
probabilitas prediksi akan bernilai nol juga.
2. Mengasumsikan variabel bebas.
2.2 Kajian Induktif
Terdapat beberapa penelitian terdahulu yang serupa dimana meneliti dengan
menggunakan klasifikasi data mining metode decision tree dan naive bayes.
Penelitian pertama yaitu dari Wawan Yunanto, Mochamad Hariadi, dan Mauridhi
Hery Purnomo yang memiliki judul “Pemetaan Kecelakaan Lalu Lintas Berbasis
Klasifikasi Naive Bayes dengan Parameter Infrastruktur Jalan” perbedaan antara
penelitian kami dengan penelitian ini yaitu pada penelitian ini hanya menggunakan
naive bayes saja dan diterapkan untuk memetakan kecelakaan lalu lintas. Tujuan
dari penelitian tersebut yaitu untuk memetakan kecelakaan lalu lintas yang terjadi
dengan parameter infrastruktur di jalan itu sendir sedangkan hasil dari penelitian
tersebut yaitu prediksi dengan Naive Bayes menunjukan bahwa tingkat akurasi ratarata berkisar antara 29.3653% sampai dengan 78.0415%, ini menunjukan bahwa
tidak semua infrastruktur jalan bisa digunakan sebagai parameter sebuah kecelakaan
terjadi karena masih ada hasil prediksi yang berada di bawah 50%. Namun ini
bukan merupakan hasil final yang langsung diimplementasikan. Prediksi kecelakaan
lalu lintas ini masih merupakan penelitian yang sedang berjalan dan belum
sepenuhnya selesai. Selain infrastruktur jalan, masih ada hal lain yang menjadi
target, antara lain dari sisi kendaraan yang mengalami kecelakaan, manusia yang

mengemudikan kendaraan tersebut, dan cuaca dimana kecelakaan itu terjadi.
Penelitian lebih lanjut sangat diperlukan untuk melihat seberapa besar korelasi
antara target-target tersebut dengan kecelakaan lalu lintas.
Penelitian kedua yaitu datang dari mahasiswa Universitas Islam Indonesia
Ahmad Fathan Hidayatullah, Alan Dwi Prasetyo, dan Dantik Puspita Sari dengan
penelitiannya yang berjudul “Analisis Kualitas Data dan Klasifikasi Data Pasien
Kanker” perbedaan dengan penelitian kami adalah penerapan dari penggunaan
decision tree dan native bayes dimana pada penelitian ini diterapkan untuk kualitas
data dan klasifikasi data pasien kanker. Hasil dari penelitian ini yaitu telah
menyelesaikan masalah missing value data pasien kanker dengan replace missing
value. Replace missing value mengganti nilai yang hilang pada suatu atribut dengan
nilai rata-rata suatu atribut. Untuk menentukan kemiripan data pasien, digunakan
metode Levenshtein string metric. Metode Levenshtein string metric melakukan
pengecekan setiap karakter string pada setiap atribut data pasien. Berdasarkan dua
metode yang diuji coba, disimpulkan bahwa Decision Tree menghasilkan performa
yang sedikit lebih baik dari Naive Bayes dalam menentukan klasifikasi. Metode
Decision tree menghasilkan akurasi sebesar 99.9988 % sedangkan metode Naive
Bayes menghasilkan akurasi 99.9799 %. Berdasarkan uji coba yang telah dilakukan,
diperoleh bahwa Decision Tree J48 memberikan hasil akurasi sedikit lebih baik dari
Naive Bayes dengan selisih akurasi 0,0189%. Namun demikian, secara umum
metode Decision Tree dan Naive Bayes sama-sama memiliki akurasi yang baik
dalam melakukan klasifikasi kemiripan data pasien.

BAB III
METODE PENELITIAN

3.1 Objek Penelitian
Pada penelitian ini tempat yang dijadikan objek penelitian yaitu sebuah perusahaan
yang bernama PT. ART
3.2 Metode Pengumpulan Data
Metode pengumpulan data yang digunakan dalam penelitian ini adalah penelitian
observasi kemudian hasil dari data yang telah didapatkan asisten pembimbing
memberikannya kepada praktikan.
3.3 Jenis Data
Pada penelitian ini jenis data yang digunakan ada dua macam yaitu data primer dan
data sekunder. Dimana dalam data primer didapatkan dari data yang telah diberikan
oleh asisten pembimbing. Serta pada data sekunder yaitu data yang didapatkan
secara tidak langsung dari objek penelitian melainkan mencari data dari sumber lain
yang dapat mendukung penelitian ini dan juga digunakan sebagai referensi.

3.4 Alur Penelitian

Mulai

Transformasi data

Menentukan
training set & test
set

Pengolahan data
dengan decision tree
& naive bayes

Output rule

Analisis Hasil

Selesai

Gambar 3.1 Diagram Alur Penelitian

Penjelasan dari diagram alir diatas adalah sebagai berikut:
1. Memulai penelitian dengan

melakukan transformasi data sehingga akan

didapatkan data yang sudah dikurangi tingkat komplektisitasnya yang
kemudian akan memudahkan proses pengolahan karena ukuran data yang
diproses sudah menjadi lebih kecil.
2. Melakukan pemilihan training set dan test set yaitu dari 100 data yang ada 1-50
dijadikan sebagai training set sedangkan sisanya 51-100 dijadikan sebagai test
set.
3. Setelah itu dilanjutkan untuk pengolahan data dimana yang pertama melakukan
pengolahan algoritma decision tree secara manual dengan menggunakan
software Ms. Excel dan kemudian secara otomatis untuk decision tree dan
naive bayes dengan bantuan software Rapid Miner.
4. Hasil dari pengolahan data yang sudah dilakukan akan ditentukan rule yang
terbentuk untuk memberikan suatu keputusan dari kedua algoritma.
5. Terakhir melakukan analisis terhadap hasil akhir yang didapatkan dari kedua
perhitungan yaitu secara manual dan otomatis sehingga dapat ditarik sebuah
kesimpulan dan rekomendasi yang sesuai.

BAB IV
HASIL DAN PEMBAHASAN

4.1 Prepocessing Data
4.1.1 Data Historis
Berdasarkan studi kasus yang diberikan menyangkut prediksi status Inventory cost
pada PT. ART apakah terjadi peningkatan atau tidak berdasarkan 5 faktor utama
seperti persediaan awal, kuantitas pesan, leadtime, frekuensi pemesanan dan
safety stock diketahui data hsitoris seperti pada tabel berikut
Tabel 4. 1 Data Historis

Kode
bahan
baku
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

Persediaan Kuantitas
awal
1236
2127
1246
2075
2377
2131
2563
1747
2588
2915
2300
2764
1918
1368
1835
1382
1293
2040
1773
2006

pesan
8629
11618
11074
9472
11791
9779
10005
8779
11045
8251
10540
11328
11530
8457
11676
8369
10271
9729
11838
8219

Leadtim

Frekuensi

Safety

Peningkatan

e

pemesanan

stock

total Inventory

1289
1949
1715
2860
1631
2564
2920
2462
2521
1926
1387
1734
2183
1343
1003
1227
1877
1011
2333
2890

cost
Tidak
Ya
Tidak
Tidak
Tidak
Ya
Tidak
Ya
Tidak
Ya
Tidak
Ya
Tidak
Ya
Tidak
Ya
Ya
Tidak
Tidak
Ya

5
8
15
15
9
5
7
12
11
13
13
11
12
7
8
13
8
13
12
14

16
14
7
20
7
10
16
12
16
10
12
10
4
22
10
18
17
16
10
22

Kode
bahan
baku
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55

Persediaan Kuantitas
awal
2116
1721
2973
1058
1516
2704
1779
2480
1554
2770
2413
2425
1445
1637
2890
1904
2570
1874
2683
2150
1862
1568
1313
1501
2501
1924
2734
2140
2234
1227
1581
1476
1538
1749
2931

pesan
11710
11234
10616
11772
11780
11883
9364
9788
9076
8328
8597
9035
11755
9750
10646
9276
10782
10207
8471
9351
10083
8514
10641
11225
9770
8817
11411
11770
11314
9187
8699
9056
11970
10668
8607

Leadtim

Frekuensi

Safety

Peningkatan

e

pemesanan

stock

total Inventory

1124
1946
2522
2088
2779
2658
2192
2939
2915
2814
1325
1776
2897
1802
1633
1522
1957
2622
1628
1540
1864
1533
1983
2343
1214
1752
1803
2180
2352
1406
2146
1382
1066
2602
2453

cost
Ya
Tidak
Ya
Tidak
Ya
Tidak
Tidak
Tidak
Tidak
Ya
Ya
Ya
Ya
Ya
Tidak
Ya
Ya
Ya
Tidak
Ya
Tidak
Ya
Tidak
Tidak
Tidak
Tidak
Ya
Tidak
Tidak
Tidak
Ya
Ya
Tidak
Ya
Tidak

13
8
14
15
15
8
8
12
7
9
6
8
10
5
6
5
12
7
9
12
10
5
13
15
8
15
15
15
13
11
15
9
6
12
7

6
5
20
13
20
5
6
16
5
16
11
9
16
9
13
11
20
16
5
10
15
17
7
14
16
15
16
16
11
15
17
6
16
5
6

Kode
bahan
baku
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90

Persediaan Kuantitas
awal
2795
1151
1214
2594
1734
2922
2128
2564
1194
1633
1231
2370
1157
2600
2998
2734
2812
1009
2569
2000
2143
2928
2582
1886
1221
2526
1803
2331
2753
2808
2591
1308
2850
1564
1866

pesan
8424
11756
11013
8689
8315
10255
10547
9632
8366
11040
9073
10325
8010
9552
11122
10176
9893
10187
11076
9709
10482
11804
8116
11891
10254
9721
9476
8323
9840
8673
9968
8165
11852
11080
11683

Leadtim

Frekuensi

Safety

Peningkatan

e

pemesanan

stock

total Inventory

1557
2165
2562
2702
1824
2716
1641
2506
2952
1145
2409
2662
2001
1928
2787
2491
2645
2484
1790
1370
1944
1706
1757
1102
1297
1735
2188
1901
1816
2556
2188
1455
2044
2383
2331

cost
Tidak
Ya
Tidak
Tidak
Tidak
Tidak
Ya
Ya
Ya
Tidak
Tidak
Ya
Tidak
Tidak
Ya
Tidak
Ya
Ya
Ya
Tidak
Tidak
Ya
Tidak
Tidak
Ya
Ya
Tidak
Tidak
Tidak
Ya
Tidak
Ya
Ya
Ya
Ya

10
15
9
12
8
11
8
15
12
6
14
13
5
14
6
15
13
11
6
10
5
8
13
13
5
10
14
14
14
13
10
15
13
5
8

22
4
8
9
11
12
4
6
20
16
10
14
15
6
12
13
13
7
13
16
16
15
5
9
15
15
13
7
13
20
16
7
9
20
8

Kode

Persediaan Kuantitas

bahan

awal

baku
91
92
93
94
95
96
97
98
99
100

1064
2467
1370
1775
1864
2816
1737
1087
2477
2772

pesan
9530
10703
10462
8105
8956
11630
11569
9278
9790
11168

Leadtim

Frekuensi

Safety

Peningkatan

e

pemesanan

stock

total Inventory

2699
1794
2924
2905
1910
2219
2379
2421
2150
2393

cost
Tidak
Tidak
Ya
Tidak
Tidak
Ya
Tidak
Tidak
Ya
Ya

7
6
10
12
5
5
7
12
12
12

12
17
10
7
16
16
12
16
11
22

4.1.2 Transformasi Data
Untuk memproses data menjadi training set maka diperlukan transformasi data
berdasarkan aturan transformasi yang diberikan pada studi kasus seperti pada tabel
berikut
Tabel 4. 2 Aturan Trasnformasi

Aturan Transformasi

Kategori

Range

Persediaan Awal

Sedikit
Sedang
Banyak
Sedikit
Sedang
Banyak
Cepat
Sedang
Lama
Jarang
Kadang-kadang
Sering
Sedikit
Sedang

< 1500
1500 - 2500
> 2500
10500
12
< 10
10 - 15
> 15
< 1500
1500 - 2500

Kuantitas Pesan

Leadtime

Frekuensi Pemesanan

Safety stock

Banyak

> 2500

Dari aturan yang telah diberikan maka didapatkan transformasi data seperti pada
tabel berikut
Tabel 4. 3 Data Transformasi

Kode
bahan
baku
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29

Persediaan Kuantitas
awal
Sedikit
Sedang
Sedikit
Sedang
Sedang
Sedang
Banyak
Sedang
Banyak
Banyak
Sedang
Banyak
Sedang
Sedikit
Sedang
Sedikit
Sedikit
Sedang
Sedang
Sedang
Sedang
Sedang
Banyak
Sedikit
Sedang
Banyak
Sedang
Sedang
Sedang

pesan
Sedikit
Banyak
Banyak
Sedang
Banyak
Sedang
Sedang
Sedikit
Banyak
Sedikit
Banyak
Banyak
Banyak
Sedikit
Banyak
Sedikit
Sedang
Sedang
Banyak
Sedikit
Banyak
Banyak
Banyak
Banyak
Banyak
Banyak
Sedang
Sedang
Sedang

Leadtim

Frekuensi

Safety

Peningkatan

e

pemesanan

stock

total Inventory

Sedikit
Sedang
Sedang
Banyak
Sedang
Banyak
Banyak
Sedang
Banyak
Sedang
Sedikit
Sedang
Sedang
Sedikit
Sedikit
Sedikit
Sedang
Sedikit
Sedang
Banyak
Sedikit
Sedang
Banyak
Sedang
Banyak
Banyak
Sedang
Banyak
Banyak

cost
Tidak
Ya
Tidak
Tidak
Tidak
Ya
Tidak
Ya
Tidak
Ya
Tidak
Ya
Tidak
Ya
Tidak
Ya
Ya
Tidak
Tidak
Ya
Ya
Tidak
Ya
Tidak
Ya
Tidak
Tidak
Tidak
Tidak

Cepat
Sedang
Lama
Lama
Sedang
Cepat
Cepat
Sedang
Sedang
Lama
Lama
Sedang
Sedang
Cepat
Sedang
Lama
Sedang
Lama
Sedang
Lama
Lama
Sedang
Lama
Lama
Lama
Sedang
Sedang
Sedang
Cepat

Sering
Kadang-kadang
Jarang
Sering
Jarang
Kadang-kadang
Sering
Kadang-kadang
Sering
Kadang-kadang
Kadang-kadang
Kadang-kadang
Jarang
Sering
Kadang-kadang
Sering
Sering
Sering
Kadang-kadang
Sering
Jarang
Jarang
Sering
Kadang-kadang
Sering
Jarang
Jarang
Sering
Jarang

30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67

Banyak
Sedang
Sedang
Sedikit
Sedang
Banyak
Sedang
Banyak
Sedang
Banyak
Sedang
Sedang
Sedang
Sedikit
Sedang
Banyak
Sedang
Banyak
Sedang
Sedang
Sedikit
Sedang
Sedikit
Sedang
Sedang
Banyak
Banyak
Sedikit
Sedikit
Banyak
Sedang
Banyak
Sedang
Banyak
Sedikit
Sedang
Sedikit
Sedang

Sedikit
Sedikit
Sedang
Banyak
Sedang
Banyak
Sedang
Banyak
Sedang
Sedikit
Sedang
Sedang
Sedikit
Banyak
Banyak
Sedang
Sedikit
Banyak
Banyak
Banyak
Sedang
Sedikit
Sedang
Banyak
Banyak
Sedikit
Sedikit
Banyak
Banyak
Sedikit
Sedikit
Sedang
Banyak
Sedang
Sedikit
Banyak
Sedang
Sedang

Sedang
Cepat
Sedang
Sedang
Cepat
Cepat
Cepat
Sedang
Cepat
Sedang
Sedang
Sedang
Cepat
Lama
Lama
Sedang
Lama
Lama
Lama
Lama
Sedang
Lama
Sedang
Cepat
Sedang
Cepat
Sedang
Lama
Sedang
Sedang
Sedang
Sedang
Sedang
Lama
Sedang
Cepat
Lama
Lama

Sering
Kadang-kadang
Jarang
Sering
Jarang
Kadang-kadang
Kadang-kadang
Sering
Sering
Jarang
Kadang-kadang
Kadang-kadang
Sering
Jarang
Kadang-kadang
Sering
Kadang-kadang
Sering
Sering
Kadang-kadang
Kadang-kadang
Sering
Jarang
Sering
Jarang
Jarang
Sering
Jarang
Jarang
Jarang
Kadang-kadang
Kadang-kadang
Jarang
Jarang
Sering
Sering
Kadang-kadang
Kadang-kadang

Banyak
Sedikit
Sedang
Banyak
Sedang
Sedang
Sedang
Sedang
Banyak
Sedang
Sedang
Sedang
Sedang
Sedang
Sedang
Sedikit
Sedang
Sedang
Sedang
Sedang
Sedikit
Sedang
Sedikit
Sedikit
Banyak
Sedang
Sedang
Sedang
Banyak
Banyak
Sedang
Banyak
Sedang
Banyak
Banyak
Sedikit
Sedang
Banyak

Ya
Ya
Ya
Ya
Ya
Tidak
Ya
Ya
Ya
Tidak
Ya
Tidak
Ya
Tidak
Tidak
Tidak
Tidak
Ya
Tidak
Tidak
Tidak
Ya
Ya
Tidak
Ya
Tidak
Tidak
Ya
Tidak
Tidak
Tidak
Tidak
Ya
Ya
Ya
Tidak
Tidak
Ya

68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100

Sedikit
Banyak
Banyak
Banyak
Banyak
Sedikit
Banyak
Sedang
Sedang
Banyak
Banyak
Sedang
Sedikit
Banyak
Sedang
Sedang
Banyak
Banyak
Banyak
Sedikit
Banyak
Sedang
Sedang
Sedikit
Sedang
Sedikit
Sedang
Sedang
Banyak
Sedang
Sedikit
Sedang
Banyak

Sedikit
Sedang
Banyak
Sedang
Sedang
Sedang
Banyak
Sedang
Sedang
Banyak
Sedikit
Banyak
Sedang
Sedang
Sedang
Sedikit
Sedang
Sedikit
Sedang
Sedikit
Banyak
Banyak
Banyak
Sedang
Banyak
Sedang
Sedikit
Sedikit
Banyak
Banyak
Sedang
Sedang
Banyak

Cepat
Lama
Cepat
Lama
Lama
Sedang
Cepat
Sedang
Cepat
Sedang
Lama
Lama
Cepat
Sedang
Lama
Lama
Lama
Lama
Sedang
Lama
Lama
Cepat
Sedang
Cepat
Cepat
Sedang
Sedang
Cepat
Cepat
Cepat
Sedang
Sedang
Sedang

4.2 If-Then Rule dari Hasil Klasifikasi
4.2.1 Decision tree
4.2.1.1 Microsoft Excel

Kadang-kadang
Jarang
Kadang-kadang
Kadang-kadang
Kadang-kadang
Jarang
Kadang-kadang
Sering
Sering
Kadang-kadang
Jarang
Jarang
Kadang-kadang
Kadang-kadang
Kadang-kadang
Jarang
Kadang-kadang
Sering
Sering
Jarang
Jarang
Sering
Jarang
Kadang-kadang
Sering
Kadang-kadang
Jarang
Sering
Sering
Kadang-kadang
Sering
Kadang-kadang
Sering

Sedang
Sedang
Banyak
Sedang
Banyak
Sedang
Sedang
Sedikit
Sedang
Sedang
Sedang
Sedikit
Sedikit
Sedang
Sedang
Sedang
Sedang
Banyak
Sedang
Sedikit
Sedang
Sedang
Sedang
Banyak
Sedang
Banyak
Banyak
Sedang
Sedang
Sedang
Sedang
Sedang
Sedang

Tidak
Tidak
Ya
Tidak
Ya
Ya
Ya
Tidak
Tidak
Ya
Tidak
Tidak
Ya
Ya
Tidak
Tidak
Tidak
Ya
Tidak
Ya
Ya
Ya
Ya
Tidak
Tidak
Ya
Tidak
Tidak
Ya
Tidak
Tidak
Ya
Ya

Dari hasil pengolahan data training-set menggunakan Microsoft Excel maka
didapatkan hasil perhitungan information gain, rule, pohon keputusan, dan
akurasi prediksi seperti pada output output berikut

Perhitungan Root Node
Tabel 4. 4 Perhitungan Atribut Persediaan Awal untuk Roor Node

Persedia
an awal

Record
Status

Sedikit
Sedang
Banyak

Jumlah

Nilai

dalam

Q

Entropy

Instance
Tidak
Iya
Tidak
Iya
Tidak
Iya

Total

5
4
16
13
6
6
50

9
29
12

Informa
si

Informati
on gain

Q

0.9910

1
Q

76
0.9922

0.99390

0.9953784

0.0014700

2
Q

67

8341

39

98

1

3

Tabel 4. 5 Perhitungan Atribut Kuantitas Pesan untuk Root Node

Kuantitas
pesan
Sedikit
Sedang
Banyak

Record
Status

Jumlah

dalam

Q

Nilai

Informati

Informasi

on gain

0.93113

0.9953784

0.0642461

2338

39

01

Entropy

Instance
Tidak
Iya
Tidak
Iya
Tidak
Iya

3
8
9
7
15
8

11
16
23

Q

0.8453

1
Q

51
0.9886

2
Q

99
0.93211

3

2

Total

50

Tabel 4. 6 Perhitungan Atribut Leadtime untuk Root Node

Record
Leadtime

Status

Jumlah

dalam

Q

Nilai

Informatio

Informasi

n gain

0.969816

0.9953784

0.02556202

41

39

9

Entropy

Instance
Tidak
Iya
Tidak
Iya
Tidak
Iya

Cepat
Sedang
Lama

4
7
13
9
10
7
50

Total

11
22
17

Q

0.945

1
Q

66
0.976

2
Q

021
0.977

3

418

Tabel 4. 7 Perhitungan Atribut Frekuensi Pesan untuk Root Node

Record

Frekuensi

Status

pemesanan

Jumlah

dalam

Q

Nilai

Informati

Informasi

on gain

0.9398743

0.9953784

0.055504

69

39

07

Entropy

Instance
Tidak
Iya
Tidak
Iya
Tidak
Iya

Jarang
Kadangkadang
Sering

9
3
10
8
8
12
50

Total

12
18
20

Q

0.811

1
Q

278
0.991

2
Q

076
0.970

3

951

Tabel 4. 8 Perhitungan Atribut Safety stock untuk Root Node

Safety
stock
Sedikit
Sedang

Record
Status

Jumlah

dalam

Q

Nilai

Informati

Informasi

on gain

0.9882603

0.9953784

0.0071181

29

39

1

Entropy

Instance
Tidak
Iya
Tidak
Iya

6
4
15
12

10
27

Q

0.970

1
Q

951
0.991

2

076

Tidak
Iya

Banyak

6
7
50

Total

13

Q

0.995

3

727

Dari hasil perhitungan root node diatas diketahui bahwa atribut kuantitas pesan
mempunyai nilai information gain yang paling besar dengan nilai sebesar
0.064246101 sehingga atribut kuantitas pesan menjadi root node dari pohon
keputusan yang terbentuk.
Perhitungan Internal Node 1
Tabel 4. 9 Perhitungan Atribut Persediaan Awal untuk Internal Node 1
Record

Persediaan

Status

awal

Jumlah

dalam

Q

Instance
Tidak
Iya
Tidak
Iya
Tidak
Iya

Sedikit
Sedang
Banyak

1
1
6
6
2
0
16

Total

Q

2

1
Q

12

2
Q

2

3

Entr

Nilai

Information

opy

Informasi

gain

1
1

0.875

0.98869940

0.11369940

8

8

0

Tabel 4. 10 Perhitungan Atribut Leadtime untuk Internal Node 1
Record
Leadtime

Status

Jumlah

dalam

Q

Nilai

Informatio

Informasi

n gain

0.8215779

0.9886994

0.16712146

39

08

9

Entropy

Instance
Cepat
Sedang
Lama
Total

Tidak
Iya
Tidak
Iya
Tidak
Iya

2
4
5
3
2
0
16

6
8
2

Q 0.918
1
296
Q 0.954
2
Q
3

434
0

Tabel 4. 11 Perhitungan Atribut Frekuensi Pemesanan untuk Internal Node 1

Frekuensi
pemesanan
Jarang
Kadangkadang
Sering

Record
Status

Jumlah

dalam

Q

Entropy

Instance
Tidak
Iya
Tidak
Iya
Tidak
Iya

Total

2
2
2
3
5
2
16

4

Q1

1

5

Q2

0.970951

7

Q3

0.863121

0.93103731

Nilai

Information

Informasi

gain

0.988699408

0.05766209
9

Tabel 4. 12 Perhitungan Atribut Safety stock untuk Internal Node 1

Record
Safety stock

Status

Jumlah

dalam

Q

Entropy

Instance
Sedikit
Sedang
Banyak
Total

Tidak
Iya
Tidak
Iya
Tidak
Iya

3
0
2
5
4
2
16

3

Q1

0

7

Q2

0.863121

6

Q3

0.918296

0.721976187

Nilai

Information

Informasi

gain

0.988699408

0.266723222

Dari hasil perhitungan internal node 1 diatas diketahui bahwa atribut safety stock
mempunyai nilai information gain yang paling besar yaitu dengan nilai sebesar
0.266723222 sehingga safety stock menjadi internal node pertama dari pohon
keputusan yang terbentuk.
Perhitungan Internal Node 2

Tabel 4. 13 Perhitungan Atribut Persediaan Awal untuk Internal Node 2

Persedia

Status

Jumlah

Record

Q

Entropy

an awal

dalam

Sedikit

Tidak
Iya

0
0

Instance
0

Q

0

Sedang

Tidak
Iya

3
2

5

1
Q

0.970

Tidak
Iya

1
0

1

2
Q

951
0

Banyak
Total

Nilai

Informati

Inform

on gain

0.8091

asi
0.9182958

0.1091703

25495

34

39

3

6
Tabel 4. 14 Perhitungan Atribut Leadtime untuk Internal Node 2

Leadtime

Status

Jumlah

Record

Q

Entropy

dalam
Instance
4

Cepat

Tidak
Iya

2
2

Sedang

Tidak
Iya

1
0

1

1
Q 0

Lama

Tidak
Iya

1
0

1

2
Q 0

Total

Q 1 0.66666666

Nilai

Information

Informasi

gain

0.91829583

0.25162916

4

7

7

3

6

Tabel 4. 15 Perhitungan Atribut Frekuensi Pemesanan untuk Internal Node 2

Frekuensi
pemesanan
Jarang
Kadangkadang
Sering
Total

Record
Status

Jumlah

dalam

Q

Entropy

Instance
Tidak
Iya
Tidak
Iya
Tidak
Iya

1
0
0
1
3
1
6

1

Q1

0

1

Q2

0

4

Q3

0.811278

Nilai

Information

Informasi

gain

0.540852083 0.918295834

0.377443751

Dari hasil perhitungan internal node 2 diatas diketahui bahwa atribut frekuensi
pemesanan mempunyai nilai information gain yang paling besar yaitu dengan nilai
sebesar 0.377443751sehingga frekuensi pemesanan menjadi internal node kedua
dari pohon keputusan yang terbentuk.
Perhitungan Internal Node 3
Tabel 4. 16 Perhitungan Atribut Persediaan Awal untuk Internal Node 3

Persediaan
awal

Record
Status

Jumlah

dalam

Q

Entropy

Instance

Sedikit
Sedang
Banyak

Tidak
Iya
Tidak
Iya
Tidak
Iya

Total

0
0
2
1
1
0
4

0

Q1

0

3

Q2

0.918296

1

Q3

0

Nilai

Information

Informasi

gain

0.688721876 0.811278124

0.122556249

Tabel 4. 17 Perhitungan Atribut Leadtime untuk Internal Node 3

Leadtime
Cepat
Sedang
Lama
Total

Status

Jumlah

Tidak
Iya
Tidak
Iya
Tidak
Iya

1
1
1
0
1
0
4

Record
dalam
Instance

Q

2

Q1

1

1

Q2

0

1

Q3

0

Entropy

Nilai
Informasi

Information
gain

0.5

0.811278124

0.311278124

Dari hasil perhitungan internal node 3 diatas diketahui bahwa atribut leadtime
mempunyai nilai information gain yang paling besar yaitu dengan nilai sebesar
0.311278124 sehingga leadtime menjadi internal node ketiga dari pohon keputusan
yang terbentuk.

Perhitungan Leaf Node
Tabel 4. 18 Perhitungan Atribut Persediaan Awal untuk Internal Node 3

Persediaan
awal
Sedikit
Sedang
Banyak
Total

Record
Status

Jumlah

dalam

Q

Entropy

Instance
Tidak
Iya
Tidak
Iya
Tidak
Iya

0
0
0
1
1
0
2

0

Q1

0

1

Q2

0

1

Q3

0

Nilai

Information

Informasi

gain

1

1

0

Setelah tahap perhitungan untuk menentukan root node, internal node, dan leaf
node selesai dilakukan maka akan didapatkan rule rule yang nantinya akan menjadi
panduan kita dalam membuat pohon keputusan dari data yang diolah. Hasil rule
yang didapat adalah sebagai berikut
Hasil Rule yang Terbentuk
1. R1= if(kuantitas pesan="Sedikit","Iya"
Dari rule ini diketahui bahwa jika kuantitas pesan sedikit maka status
inventory cost akan meningkat.
2. R2= if(kuantitas pesan="Banyak","Tidak"
Dari rule ini diketahui bahwa jika kuantitas pesan banyak maka status
inventory cost tidak meningkat.
3. R3= if((kuantitas pesan="Sedang")*(Safety stock="Sedikit"),"Tidak"
Dari rule ini diketahui bahwa jika kuantitas pesan sedang dan safety stock
sedikit maka status inventory cost tidak meningkat.
4. R4= if((kuantitas pesan="Sedang")*(Safety stock="Sedang"),"Iya"

Dari rule ini diketahui bahwa jika kuantitas pesan sedang dan safety stock
sedang maka status inventory cost akan meningkat.
5. R5= if((kuantitas

pesan="Sedang")*(safety

stock="Banyak")*(Frekuensi

pemesanan="Jarang"),"Tidak"
Dari rule ini diketahui bahwa jika kuantitas pesan sedang, safety stock
banyak, dan frekuensi pemesanan jarang maka status inventory cost tidak
meningkat.
6. R6= if((kuantitas

pesan="Sedang"*(Safety

stock="Banyak")*(Frekuensi

pemesanan="Kadang-kadang"),"Iya"
Dari rule ini diketahui bahwa jika kuantitas pesan sedang, safety stock
banyak, dan frekuensi pemesanan kadang-kadang maka status inventory
cost akan meningkat.
7. R7= if((kuantitas

pesan="Sedang")*(safety

stock="Banyak")*(frekuensi

pemesanan="Sering")*(Lead time="Sedang"),"Tidak"
Dari rule ini diketahui bahwa jika kuantitas pesan sedang, safety stock
banyak, frekuensi pemesanan sering, dan leadtime sedang maka status
inventory cost tidak meningkat.
8. R8= if((kuantitas

pesan="Sedang")(*safety

stock="Banyak")*(frekuensi

pemesanan="Sering")*(Lead time="Lama"),"Tidak"
Dari rule ini diketahui bahwa jika kuantitas pesan sedang, safety stock
banyak, frekuensi pemesanan sering, dan leadtime lama

maka status

inventory cost tidak meningkat.
9. R9= if((kuantitas

pesan="Sedang")*(safety

stock="Banyak")*(frekuensi

pemesanan="Sering")*(Leadtime="Cepat")*(Persediaanawal="Sedikit"),"Tidak"

Dari rule ini diketahui bahwa jika kuantitas pesan sedang, safety stock
banyak, frekuensi pemesanan sering, leadtime cepat dan persediaan awal
sedikit maka status inventory cost tidak meningkat.
10. R10= if((kuantitas

pesan="Sedang")*(safety

stock="Banyak")*(frekuensi

pemesanan="Sering")*(Lead time="Cepat")*(Persediaan awal="Sedang"),"Iya"
Dari rule ini diketahui bahwa jika kuantitas pesan sedang, safety stock
banyak, frekuensi pemesanan sering, leadtime cepat dan persediaan awal
sedang maka status inventory cost akan meningkat.
11. R11= if((kuantitas

pesan="Sedang")*(safety

stock="Banyak")*(frekuensi

pemesanan="Sering")*(Leadtime="Cepat")*(Persediaanawal="Banyak"),"Tidak"
Dari rule ini diketahui bahwa jika kuantitas pesan sedang, safety stock
banyak, frekuensi pemesanan sering, leadtime cepat dan persediaan awal
banyak maka status inventory cost tidak meningkat.
Pohon Keputusan

Kuantitas
Kuantitas
pesan
pesan

Sikit
Sikit
(Iya)
(Iya)

Sedang
Sedang

Banyak
Banyak
(Tidak)
(Tidak)

Safety
stock sikit
Safety stock
sikit
(Tidak)
(Tidak)

Safety stock
stock sedang
Safety
sedang
(Iya)
(Iya)

Safety
Safety stock
stock
banyak
banyak

Frekuensi
Frekuensi
pemesanan jarang
pemesanan
jarang
(Tidak)
(Tidak)

Frekuensi
Frekuensi
pemesanan KadangKadangpemesanan
kadang
kadang
(Iya)
(Iya)

Frekuensi
Frekuensi
pemesanan
pemesanan
sering
sering

Lead
Lead time
time
cepat
cepat

Lead time
sedang
Lead
time sedang
(Tidak)
(Tidak)

Persediaan
Persediaan awal
awal
sedang
sedang
(Iya)
(Iya)

Persediaan
Persediaan awal
awal
banyak
banyak
(Tidak)
(Tidak)

Persediaan awal
Persediaan
awal
seikit
seikit
(Tidak)
(Tidak)

Lead
Lead time
time lama
lama
(Tidak)
(Tidak)

Gambar 4. 1 Pohon Keputusan yang Terbentuk

Pada gambar diatas kita dapat mengetahui susunan pohon keputusan yang terbentuk
berdasarkan hasil rule yang didapat. Pada pohon keputusan, atribut yang menjadi root
nodenya adalah kuantitas pesan, sedangkan yang menjadi internal nodenya yaitu safety
stock, frekuensi pemesanan dan leadtime. Penjelasan pengambilan keputusan yang dapat
dijelaskan dari pohon keputusan tersebut adalah sebagai berikut
1. Jika kuantitas pesan sedikit maka status inventory cost akan meningkat.
2. Jika kuantitas pesan banyak maka status inventory cost tidak meningkat.
3. Jika kuantitas pesan sedang dan safety stock sedikit maka status inventory cost tidak
meningkat
4. Jika kuantitas pesan sedang dan safety stock sedang maka status inventory cost akan
meningkat

5. Jika kuantitas pesan sedang, safety stock banyak, dan frekuensi pemesanan jarang
maka status inventory cost tidak meningkat
6. Jika kuantitas pesan sedang, safety stock banyak, dan frekuensi pemesanan kadangkadang maka status inventory cost akan meningkat
7. Jika kuantitas pesan sedang, safety stock banyak, frekuensi pemesanan sering, dan
leadtime sedang maka status inventory cost tidak meningkat
8. Jika kuantitas pesan sedang, safety stock banyak, frekuensi pemesanan sering, dan
leadtime lama maka status inventory cost tidak meningkat
9. Jika kuantitas pesan sedang, safety stock banyak, frekuensi pemesanan sering,
leadtime cepat dan persediaan awal sedikit maka status inventory cost tidak meningkat
10. Jika kuantitas pesan sedang, safety stock banyak, frekuensi pemesanan sering,
leadtime cepat dan persediaan awal sedang maka status inventory cost akan meningkat
11. Jika kuantitas pesan sedang, safety stock banyak, frekuensi pemesanan sering,
leadtime cepat dan persediaan awal banyak maka status inventory cost

tidak

meningkat

Perhitungan Akurasi
Tabel 4. 19 Perhitungan Akurasi Algoritma Decision tree Menggunakan Microsoft Excel

Kode

Persedi Kuantitas

Leadtime

Safety

Peningka

pemesanan

stock

tan total

bahan

aan

baku

awal

Inventor

Sedang
Sedikit
Sedang

y cost
Ya
Ya
Tidak

51
52
53

pesan

Frekuensi

Sedikit
Sedang
Banyak

Lama
Sedang
Cepat

Sering
Jarang
Sering

Sedang
Sedikit
Sedikit

Keputusan

Iya
Tidak
Tidak

Kode

Persedi Kuantitas

Leadtime

Safety

Peningka

pemesanan

stock

tan total

Keputusan

bahan

aan

baku

awal

Inventor

54
55
56
57
58
59
60

Sedang
Banyak
Banyak
Sedikit
Sedikit
Banyak
Sedang

Banyak
Sedikit
Sedikit
Banyak
Banyak
Sedikit
Sedikit

Sedang
Cepat
Sedang
Lama
Sedang
Sedang
Sedang

Jarang
Jarang
Sering
Jarang
Jarang
Jarang
Kadang-

Banyak
Sedang
Sedang
Sedang
Banyak
Banyak
Sedang

y cost
Ya
Tidak
Tidak
Ya
Tidak
Tidak
Tidak

Tidak
Iya
Iya
Tidak
Tidak
Iya
Iya

61

Banyak

Sedang

Sedang

kadang
Kadang-

Banyak

Tidak

Iya

Sedang
Lama
Sedang
Cepat
Lama

kadang
Jarang
Jarang
Sering
Sering
Kadang-

Sedang
Banyak
Banyak
Sedikit
Sedang

Ya
Ya
Ya
Tidak
Tidak

Tidak
Tidak
Iya
Tidak
Iya

Lama

kadang
Kadang-

Banyak

Ya

Iya

Sedang

Tidak

Iya

62
63
64
65
66
67

Sedang
Banyak
Sedikit
Sedang
Sedikit
Sedang

pesan

Frekuensi

Banyak
Sedang
Sedikit
Banyak
Sedang
Sedang

68

Sedikit

Sedikit

Cepat

kadang
Kadang-

69
70

Banyak
Banyak

Sedang
Banyak

Lama
Cepat

kadang
Jarang
Kadang-

Sedang
Banyak

Tidak
Ya

Iya
Tidak

Lama

kadang
Kadang-

Sedang

Tidak

Iya

Banyak

Ya

Iya

71

Banyak

Sedang

72

Banyak

Sedang

Lama

kadang
Kadang-

73
74

Sedikit
Banyak

Sedang
Banyak

Sedang
Cepat

kadang
Jarang
Kadang-

Sedang
Sedang

Ya
Ya

Iya
Tidak

Sedang
Cepat

kadang
Sering
Sering

Sedikit
Sedang

Tidak
Tidak

Tidak
Iya

75
76

Sedang
Sedang

Sedang
Sedang

Kode

Persedi Kuantitas

Leadtime

Safety

Peningka

pemesanan

stock

tan total

Keputusan

bahan

aan

baku

awal

Inventor

77

Banyak

Banyak

Sedang

Kadang-

Sedang

y cost
Ya

Tidak

78
79
80

Banyak
Sedang
Sedikit

Sedikit
Banyak
Sedang

Lama
Lama
Cepat

kadang
Jarang
Jarang
Kadang-

Sedang
Sedikit
Sedikit

Tidak
Tidak
Ya

Iya
Tidak
Tidak

81

Banyak

Sedang

Sedang

kadang
Kadang-

Sedang

Ya

Iya

Lama

kadang
Kadang-

Sedang

Tidak

Iya

Sedang
Sedang

Tidak
Tidak

Iya
Iya

82

Sedang

pesan

Frekuensi

Sedang

83
84

Sedang
Banyak

Sedikit
Sedang

Lama
Lama

kadang
Jarang
Kadang-

85
86
87
88
89
90
91

Banyak
Banyak
Sedikit
Banyak
Sedang
Sedang
Sedikit

Sedikit
Sedang
Sedikit
Banyak
Banyak
Banyak
Sedang

Lama
Sedang
Lama
Lama
Cepat
Sedang
Cepat

kadang
Sering
Sering
Jarang
Jarang
Sering
Jarang
Kadang-

Banyak
Sedang
Sedikit
Sedang
Sedang
Sedang
Banyak

Ya
Tidak
Ya
Ya
Ya
Ya
Tidak

Iya
Iya
Iya
Tidak
Tidak
Tidak
Iya

Sedang
Banyak

Tidak
Ya

Tidak
Iya

92
93

Sedang
Sedikit

Banyak
Sedang

Cepat
Sedang

kadang
Sering
Kadang-

94
95
96
97

Sedang
Sedang
Banyak
Sedang

Sedikit
Sedikit
Banyak
Banyak

Sedang
Cepat
Cepat
Cepat

kadang
Jarang
Sering
Sering
Kadang-

Banyak
Sedang
Sedang
Sedang

Tidak
Tidak
Ya
Tidak

Iya
Iya
Tidak
Tidak

98
99

Sedikit
Sedang

Sedang
Sedang

Sedang
Sedang

kadang
Sering
Kadang-

Sedang
Sedang

Tidak
Ya

Iya
Iya

100

Banyak

Banyak

Sedang

kadang
Sering

Sedang

Ya

Tidak

Tabel 4. 20 Perhitungan Akurasi dan Eror

Eror

0.66

66%

Akuras

0.34

34%

i
Berdasarkan hasil perhitungan akurasi menggunakan data test-set dari dari
transformasi yang terbentuk sebelumnya, didapatkan nilai akurasi sebesar 34% dan
nilai eror sebesar 66% sehingga nilai akurasi < nilai eror yang berarti data yang
digunakan untuk memprediksi training-set tidak akurat dan tidak dapat digunakan
untuk meprediksi ada atau tidaknya peningkatan yang terjadi pada inventory cost
PT. ART.
4.2.1.2

Rapid Miner
Dari hasil pengolahan data training-set menggunakan Rapid Miner maka
didapatkan pohon keputusan dan akurasi prediksi seperti pada output output
berikut

Gambar 4. 2 Pengolahan Data Decision tree Menggunakan Rapid Miner

Gambar 4. 3 Output Decision tree Pada Rapid Miner

Pada output diatas diketahui hasil struktur dari decision tree yang didapat cukup berbeda dengan hasil yang didapat lewat
perhitungan manual. Pada output menggunakan Rapid Miner ini struktur decision tree terlihat lebih kompleks dan lebih rumit
jika dibandingkan dengan hasil yang didapat dari rule perhitungan manual. Namun dikarenakan akurasi yang didapat
menggunakan Rapid Miner berbeda sedikit atau hampir sama dengan akurasi yang didapat dari perhitungan manual maka
kami memutuskan untuk tetap mencantumkan output decision tree ini.

Gambar 4. 4 Output Akurasi Algoritma Tree decision dengan Rapid Miner

Pada output di atas diketahui nilai akurasi algorima tree decision dengan
menggunakan Software Rapid Miner pada data test-set sebesar 40%. Hasil
akurasi ini sedikit berbeda dengan hasil akurasi algoritma tree decision
menggunakan Microsoft Excel yang hanya sebesar 34%. Pada output diatas
diketahui prediksi “Ya” akan terjadi peningkatan inventory cost dan benar ada
11 data. Sedangkan prediksi “Ya” akan terjadi peningkatan inventory cost dan
ternyata salah ada 17 data. Pada prediksi berikutnya untuk “Tidak” pada
peningkatan inventory cost dan ternyata salah ada 13 data. Sedangkan pada
prediksi “Tidak” pada peningkatan inventory cost dan ternyata benar ada 9
data.
4.2.2 Naïve Bayes
Berdasarkan hasil pengolahan data menggunakan bantuan software Rapid Miner
untuk perhitungan algoritma Naïve Bayes didapatkan hasil rule dan tingkat
akurasi seperti pada output berikut

Gambar 4. 5 Pengolahan Data Menggunakan Algoritma Naïve Bayes

Gambar 4. 6 Output Import Data

Berdasarkan hasil output diatas dapat diketahui bahwa:
1. Atribut Presediaan awal dengan parameter “Sedikit” akan muncul keputusan
“Tidak” dengan probablitias sebesar 0.185 sedangkan untuk keputusan “Ya”
memiliki nilai probabilitas 0.174
2. Atribut Presediaan awal dengan parameter “Sedang” akan muncul keputusan
“Tidak” dengan probablitias sebesar 0.592 sedangkan untuk keputusan “Ya”
memiliki nilai probabilitas 0.564
3. Atribut Presediaan awal dengan parameter “Banyak” akan muncul keputusan
“Tidak” dengan probablitias sebesar 0.592 sedangkan untuk keputusan “Ya”
memiliki nilai probabilitas 0.564
4. Atribut Kuantitas pesan dengan parameter “Sedikit” akan muncul keputusan
“Tidak” dengan probablitias sebesar 0.112 sedangkan untuk keputusan “Ya”
memiliki nilai probabilitas 0.347
5. Atribut Kuantitas pesan dengan parameter “Banyak” akan muncul keputusan
“Tidak” dengan probablitias sebesar 0.555 sedangkan untuk keputusan “Ya”
memiliki nilai probabilitas 0.347
6. Atribut Kuantitas pesan dengan parameter “Sedang” akan muncul keputusan
“Tidak” dengan probablitias sebesar 0.333 sedangkan untuk keputusan “Ya”
memiliki nilai probabilitas 0.304
7. Atribut Leadtime dengan parameter “Cepat” akan muncul keputusan “Tidak”
dengan probablitias sebesar 0.148 sedangkan untuk keputusan “Ya” memiliki
nilai probabilitas 0.304
8. Atribut Leadtime dengan parameter “Sedang” akan muncul keputusan
“Tidak” dengan probablitias sebesar 0.481 sedangkan untuk keputusan “Ya”
memiliki nilai probabilitas 0.391
9. Atribut Leadtime dengan parameter “Lama” akan muncul keputusan “Tidak”
dengan probablitias sebesar 0.370 sedangkan untuk keputusan “Ya” memiliki
nilai probabilitas 0.304
10. Atribut Frekuensi pemesanan dengan parameter “Sering” akan muncul
keputusan “Tidak” dengan probablitias sebesar 0.296 sedangkan untuk
keputusan “Ya” memiliki nilai probabilitas 0.521

11.

Atribut Frekuensi pemesanan dengan parameter “Kadang-kadang” akan
muncul keputusan “Tidak” dengan probablitias sebesar 0.370 sedangkan
untuk keputusan “Ya” memiliki nilai probabilitas 0.347

12.

Atribut Frekuensi pemesanan dengan parameter “Jarang” akan muncul
keputusan “Tidak” dengan probablitias sebesar 0.333 sedangkan untuk
keputusan “Ya” memiliki nilai probabilitas 0.131

13. Atribut Safety stock dengan parameter “Sedikit” akan muncul keputusan
“Tidak” dengan probablitias sebesar 0.222 sedangkan untuk keputusan “Ya”
memiliki nilai probabilitas 0.174
14. Atribut Safety stock dengan parameter “Sedang” akan muncul keputusan
“Tidak” dengan probablitias sebesar 0.555 sedangkan untuk keputusan “Ya”
memiliki nilai probabilitas 0.521
15. Atribut Safety stock dengan parameter “Banyak” akan muncul keputusan
“Tidak” dengan probablitias sebesar 0.222 sedangkan untuk keputusan “Ya”
memiliki nilai probabilitas 0.304

Gambar 4. 7 Output Akurasi Algoritma Naïve Bayes dengan Rapid Miner

Pada output di atas diketahui nilai akurasi algorima Naïve Bayes dengan
menggunakan Software Rapid Miner pada data test-set sebesar 42%. Pada
output diatas diketahui prediksi “Ya” akan terjadi peningkatan inventory cost
dan benar ada 8 data. Sedangkan prediksi “Ya” akan terjadi peningkatan
inventory cost dan ternyata salah ada 13 data. Pada prediksi berikutnya untuk
“Tidak” pada

peningkatan inventory cost dan ternyata salah ada 16 data.

Sedangkan pada prediksi “Tidak” pada peningkatan inventory cost dan ternyata
benar ada 13 data.

4.3 Analisa If-Then Rule
Dari hasil pengolahan data yang dilakukan baik secara manual (Microsoft Excel)
ataupun menggunakan bantuan Software Rapid Miner untuk algoritma Tree
decision dan Naïve Bayes didapatkan perbedaan hasil dari kedua cara yang
digunakan khususnya pada tree decision saat menggunakan Microsoft Excel dan
saat menggunakan Software Rapid Miner. Untuk pengolahan data perhitungan
algoritma tree decision menggunakan Microsoft Excel didapatkan hasil rule sebagai
berikut
1. Jika kuantitas pesan sedikit maka status inventory cost akan meningkat.
Pada hal ini berarti jika kuantitas pesan PT. ART sedikit maka otomatis frekuensi
pemesanan untuk barangnya akan meningkat sehingga akan meningkatkan biaya
setiap kali menyimpan barang (dalam jumlah sedikit). Berbeda jika PT . ART
melakukan pemesanan barang dengan kuantittas besar, maka otomatis frekuensi
pesannya akan rendah dan hanya sesekali sa

Klasifikasi Data Mining id. docx

Dokumen yang terkait

Pembangunan Data Warehouse dan Reporting Tools Pada Puskesmas Kema

Aplikasi Data Mining Menggunakan Metode Decision Tree Untuk Pemantauan Distribusi Penjualan Sepeda Motor Di PD. Wijaya Abadi Bandung

Membangun Aplikasi Pengadaan Data Barang di Badan Perencanaan Pembangunan Daerah (BAPPEDA) Kota Bandung berbasis web

Pembangunan Data Mart Pada PLTGU Cilegon

Sistem Informasi Pengolahan Data Pinjaman Pada Koperasi Serba Usaha Bersama di Ciroyom Provinsi Jawa Barat

Penerapan Data Mining Untuk Memprediksi Fluktuasi Harga Saham Menggunakan Metode Classification Dengan Teknik Decision Tree

Perancangan Dan Implementasi Algoritma Kompresi Lempel-ZIV-Welch Pada Weblog Berbasis PHP Dan Basis Data Mysql

Sistem Informasi Pengolahan Data Pertanian di Badan Pelaksana Penyuluhan Pertanian Perikanan dan Kehutanan BP4K Kabupaten Sukabumi

Aplikasi databae arsip kepegawaian pada kantor Pengoalha Data Elektronik Kota Bandung Jalan Wastukencana No.2 Bandung

Implementasi Term Frequency Inverse Document Frequency TF IDF dan Vector Space Model Untuk Klasifikasi Berita Bahasa Indonesia

Dukungan

Links

Klasifikasi Data Mining id. docx

Dokumen yang terkait

Pembangunan Data Warehouse dan Reporting Tools Pada Puskesmas Kema

Aplikasi Data Mining Menggunakan Metode Decision Tree Untuk Pemantauan Distribusi Penjualan Sepeda Motor Di PD. Wijaya Abadi Bandung

Membangun Aplikasi Pengadaan Data Barang di Badan Perencanaan Pembangunan Daerah (BAPPEDA) Kota Bandung berbasis web

Pembangunan Data Mart Pada PLTGU Cilegon

Sistem Informasi Pengolahan Data Pinjaman Pada Koperasi Serba Usaha Bersama di Ciroyom Provinsi Jawa Barat

Penerapan Data Mining Untuk Memprediksi Fluktuasi Harga Saham Menggunakan Metode Classification Dengan Teknik Decision Tree

Perancangan Dan Implementasi Algoritma Kompresi Lempel-ZIV-Welch Pada Weblog Berbasis PHP Dan Basis Data Mysql

Sistem Informasi Pengolahan Data Pertanian di Badan Pelaksana Penyuluhan Pertanian Perikanan dan Kehutanan BP4K Kabupaten Sukabumi

Aplikasi databae arsip kepegawaian pada kantor Pengoalha Data Elektronik Kota Bandung Jalan Wastukencana No.2 Bandung

Implementasi Term Frequency Inverse Document Frequency TF IDF dan Vector Space Model Untuk Klasifikasi Berita Bahasa Indonesia

Dokumen yang Anda mencari sudah siap untuk unduhkan