Multidimensional Association Rule untuk Melihat Pola Keterkaitan Aspek Gangguan pada VSAT IP
MULTIDIMENSIONAL ASSOCIATION RULE UNTUK MELIHAT
POLA KETERKAITAN ASPEK GANGGUAN
PADA VSAT IP
TANTI NOPIANTI
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2014
PERNYATAAN MENGENAI SKRIPSI DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa skripsi berjudul Multidimensional
Association Rule untuk Melihat Pola Keterkaitan Aspek Gangguan pada VSAT IP
adalah benar karya saya dengan arahan dari komisi pembimbing dan belum
diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber
informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak
diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam
Daftar Pustaka di bagian akhir skripsi ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut
Pertanian Bogor.
Bogor, Juni 2014
Tanti Nopianti
NIM G64086033
ABSTRAK
TANTI NOPIANTI. Multidimensional Association Rule untuk Melihat Pola
Keterkaitan Aspek Gangguan pada VSAT IP. Dibimbing oleh ANNISA.
Penelitian ini bertujuan untuk menentukan pola keterkaitan dari gangguan
pada divisi VSAT IP (Very Small Aperture Terminal Internet Protocol) dengan
menggunakan metode aturan asosiasi multidimensi. Penelitian ini menggunakan
kombinasi dari minimum support 40%, 30% dan 20% dan minimum confidence
50%, 60% dan 80%. Hasilnya menunjukkan bahwa aturan menarik dibentuk oleh
kejadian item 'USO' (Universal Service Obligation) bersama-sama dengan
dimensi 'area' dengan item 'Area-3' yang dihasilkan oleh aturan USOArea-3
dengan support 40% dan confidence 99.6%. Support tertinggi dari seluruh data
dibentuk oleh dimensi ‘area’ dengan item ‘Area-3’ dengan nilai support 55.62%.
Hal ini berarti lebih dari setengah data gangguan, terjadi di ‘Area-3’ yaitu wilayah
Provinsi Kalimantan Timur, Sumatera Utara, Bali, Bengkulu, Jambi, Sumatera
Barat, Riau, Kepulauan Riau, Bangka Belitung, Kalimantan Selatan, Kalimantan
Tengah dan Kalimantan Barat. Area-3 adalah area yang perlu diperhatikan dalam
perbaikan. Pertimbangan hasil aturan asosiasi dapat digunakan dengan mencari
pola keterkaitan dari masing-masing dimensi pada data gangguan komunikasi.
Kata kunci: Aturan asosiasi, Multidimensional Association Rule.
ABSTRACT
TANTI NOPIANTI. Multidimensional Association Rule to Discover Interference
Relationship Patterns on VSAT IP. Supervised by ANNISA.
This study aimed to give some considerations of interference on VSAT IP
(Very Small Aperture Terminal Internet Protocol) by using multidimensional
association rule. This study used the combinations of minimum support of 40%,
30% and 20% and minimum confidence of 50%, 60% and 80%. The result
showed that the highest value was established by the occurence of itemset 'USO'
(Universal Service Obligation) together with the dimension of ‘area’ with the
itemset ‘Area-3’ which was produced by rule USOArea-3 with the minimum
support of 40% and the confidence of 99.6%. The highest support of the whole
data was established by dimension of ‘area’ with the itemset ‘Area-3’ by the
support value of 55.62%. This means that on half of the data, interference
occurred in Area-3, comprising East Kalimantan, North Sumatera, Bali,
Bengkulu, Jambi, West Sumatera, Riau, Riau Archipelago, Bangka Belitung,
South Kalimantan, Central Kalimantan and West Kalimantan. Hence, Area-3 is
the area that needs to be considered in maintenance. Considerations of the
association result can be used to find relationship patterns from each dimension on
communications interference data.
Keywords: Association Rule, Multidimensional Association Rule.
MULTIDIMENSIONAL ASSOCIATION RULE UNTUK MELIHAT
POLA KETERKAITAN ASPEK GANGGUAN
PADA VSAT IP
TANTI NOPIANTI
Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Komputer
pada
Departemen Ilmu Komputer
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2014
Judul Skripsi : Multidimensional Association Rule untuk
Keterkaitan Aspek Gangguan pada VSAT IP
Nama
: Tanti Nopianti
NIM
: G64086033
Disetujui oleh
Annisa, S.Kom., M.Kom.
Pembimbing
Diketahui oleh
Dr Ir Agus Buono, MSi MKom
Ketua Departemen
Tanggal Lulus:
Melihat
Pola
PRAKATA
Puji dan syukur penulis panjatkan kepada Allah subhanahu wata’ala atas
segala curahan rahmat dan karunia-Nya sehingga penelitian ini berhasil
diselesaikan. Shalawat dan salam semoga senantiasa tercurah kepada Nabi
Muhammad shalallahu ‘alaihi wassalam, keluarganya, para sahabat, serta para
pengikutnya. Karya tulis ini merupakan salah satu syarat memperoleh gelar
Sarjana Komputer di Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu
Pengetahuan Alam. Judul dari karya ilmiah ini adalah Multidimensional
Association Rule untuk Melihat Pola Keterkaitan Aspek Gangguan pada VSAT
IP.
Penyelesaian penelitian ini tidak terlepas dari dukungan dan bantuan
berbagai pihak. Oleh karena itu, penulis ingin mengucapkan terima kasih sebesarbesarnya kepada:
1
Kedua orang tua tercinta Koesbiyanto dan Ibunda Suwarsih, adik Widya
Kusuma Rini, dan segenap keluarga besar penulis atas do’a, dukungan,
semangat, kasih sayang, dan perhatian yang tidak pernah berhenti diberikan
selama ini.
2
Ibu Annisa, S.Kom., M.Kom. selaku pembimbing, Ibu Dr. Imas Sitanggang,
S. Si., M. Kom. dan Bapak Hari Agung Adrianto, S.Kom., M.Kom. selaku
dosen penguji, atas waktu, ilmu, kesabaran, nasihat, dan masukan yang
diberikan.
3
Teman-teman penulis di Ekstensi Ilmu Komputer Angkatan 3, teman satu
bimbingan, serta teman-teman lain yang tidak dapat penulis sebutkan satu
per satu atas bantuan, motivasi, kebersamaan, serta semangat kepada
penulis.
4
Departemen Ilmu Komputer, Bapak/Ibu Dosen dan Tenaga Kependidikan
yang telah begitu banyak membantu baik selama pelaksanaan penelitian ini
maupun sebelumnya.
Kepada semua pihak lainnya yang telah memberikan kontribusi yang besar
selama pengerjaan penelitian ini yang tidak dapat disebutkan satu-persatu, penulis
ucapkan terima kasih banyak. Semoga karya ilmiah ini bermanfaat.
Bogor, Juni 2014
Tanti Nopianti
DAFTAR ISI
PRAKATA
vi
DAFTAR ISI
vii
DAFTAR TABEL
ix
DAFTAR LAMPIRAN
ix
PENDAHULUAN
1
Latar Belakang
1
Perumusan Masalah
1
Tujuan Penelitian
1
Manfaat Penelitian
2
Ruang Lingkup Penelitian
2
TINJAUAN PUSTAKA
2
Association Rule
2
Multidimensional Association Rule
3
Algoritme Apriori
4
Very Small Aperture Terminal (VSAT)
5
Preventive Maintenance (PM) dan Corrective Maintenance (CM)
6
Signal Quality Factor (SQF)
6
Cross Polarization Interference (CPI)
6
METODE
6
Identifikasi Masalah
6
Pengumpulan Data
7
Praproses
9
Pembangkitan Frequent Predicate Sets
9
Pembangkitan Association Rules
9
Analisis Rules
10
Lingkungan Pengembangan
10
HASIL DAN PEMBAHASAN
10
Seleksi Data
10
Pembersihan Data
10
Transformasi Data
11
Data Mining
SIMPULAN DAN SARAN
13
16
Simpulan
16
Saran
16
DAFTAR PUSTAKA
16
RIWAYAT HIDUP
31
DAFTAR TABEL
1
Contoh dimensi dalam aturan asosiasi 1 dimensi
3
2
Contoh dimensi dalam aturan asosiasi multidimensi
4
3
Data asli yang digunakan untuk awal praproses
8
4
Kategori untuk dimensi CPI
11
5
Kategori untuk dimensi SQF
11
6
Pengelompokan cakupan beberapa wilayah menjadi area
12
7
Pengelompokan beberapa pelanggan menjadi 1 kategori pelanggan
12
8
Large 1-itemset dengan minimum support 40%, 30% dan 20%.
13
9
Large 2-itemset dengan minimum support 40%, 30% dan 20%.
13
Empat aturan asosiasi dengan confidence tertinggi untuk minimum
support 20%.
14
Aturan asosiasi dengan minimum confidence di atas 50% dengan
hasil PM dan CM
15
10
11
DAFTAR LAMPIRAN
Sampel data awal sebelum dilakukan pemilihan field yang akan di
mining
17
Sampel data yang telah dilakukan pemilihan field yang akan di
mining
17
3
Large itemset dengan minimum support 40%, 30% dan 20%
18
4
Tabel hasil aturan asosiasi dengan minimum support 20% dan
minimum confidence 50%
21
Tampilan awal masukan minimum support dan minimum confidence
pada sistem.
27
Contoh keluaran ketika diberi masukan minimum support 40% dan
minimum confidence 80%
27
7
Fungsi untuk membuat kombinasi item dalam array
28
8
Fungsi untuk membuat L1
29
9
Fungsi untuk membuat L2
29
Fungsi untuk membuat L3 sampai L7
30
1
2
5
6
10
11
1
PENDAHULUAN
Latar Belakang
Dalam kesehariannya Operation Maintenance di Metrasat, sebuah instansi
dalam bidang telekomunikasi, mencatat dan menangani banyak gangguan
komunikasi, salah satunya di bagian VSAT IP (Very Small Aperture Terminal
Internet Protocol). Gangguan yang terjadi dalam setiap harinya datang dari
pelanggan yang beragam. Pihak helpdesk mencatat dan melakukan penanganan
pertama atas gangguan yang terjadi, kemudian engineer masing-masing kelompok
pelanggan akan menangani lebih lanjut pada tingkatan parameter gangguan
tertentu. Pencatatan gangguan, setiap harinya dilakukan oleh helpdesk ke dalam
sebuah sistem, begitu pula pencatatan berbagai lokasi yang telah dilakukan
kunjungan oleh teknisi untuk pengecekan perangkat.
Dalam catatan gangguan terekam lokasi gangguan, area gangguan serta
parameter yang diperlukan. Cara sederhana yang sudah dilakukan oleh perusahaan
untuk menganalisis data gangguan tersebut dengan menghitung banyaknya
gangguan dalam setiap triwulan dalam area tertentu. Hasil pengolahan aspekaspek gangguan tersebut tidak dapat memberikan kesimpulan yang dibutuhkan
seperti seberapa besar keterkaitan antar aspek-aspek gangguan. Kebijakan dalam
penanganan gangguan, masih ditempuh berdasarkan informasi singkat berupa
laporan yang didukung intuisi yang dapat mempengaruhi segala keputusan dan
strategi yang akan diambil oleh manajer. Oleh sebab itu, diperlukan adanya sistem
pendukung yang menerapkan konsep multidimensional berdasarkan data
gangguan yang telah tercatat sebelumnya agar dapat diketahui keterhubungan
antar aspek gangguan untuk bahan pengambilan keputusan.
Metode yang akan digunakan untuk melihat keterkaitan antar aspek
gangguan diharapkan dalam bentuk aturan yang mudah dipahami oleh manajer.
Salah satu metode yang sesuai adalah model Multidimensional Association Rule.
Perumusan Masalah
Berdasarkan latar belakang yang disajikan di atas dapat diambil suatu
rumusan masalah yaitu:
1
Bagaimana menentukan aturan asosiasi multidimensi dengan menggunakan
algoritme Apriori untuk mencari keterkaitan antar aspek gangguan pada
VSAT IP.
2
Bagaimana menghasilkan pola keterkaitan antar komponen gangguan
komunikasi data sebagai bahan pengambilan keputusan dengan
menggunakan algoritme Apriori.
Tujuan Penelitian
Penelitian ini bertujuan mengimplementasikan model multidimensional
association rule dengan menggunakan algoritme Apriori untuk mengetahui
keterkaitan antar aspek gangguan komunikasi data pada VSAT IP.
2
Manfaat Penelitian
Manfaat dari penelitian ini ialah menghasilkan pola keterkaitan antarkomponen dalam hasil pencegahan penanganan gangguan maupun perbaikan
dalam penanganan gangguan komunikasi data. Hasil dari pola keterkaitan tersebut
dapat digunakan sebagai bahan pengambilan keputusan.
Ruang Lingkup Penelitian
Data yang digunakan untuk melihat pola keterkaitan antar dimensi adalah
data gangguan komunikasi data sejak bulan Mei 2011 hingga September 2012.
Data tersebut berisi area lokasi gangguan, kriteria gangguan, serta waktu
terjadinya gangguan.
TINJAUAN PUSTAKA
Association Rule
Association rule mining adalah salah satu teknik data mining dan
merupakan bentuk paling umum dari penentuan pola dalam unsupervised learning
system (Kantardzic 2003). Ukuran kemenarikan yang dapat digunakan dalam
association rule mining adalah (Han dan Kamber 2006):
a
Support, suatu ukuran yang menunjukkan seberapa besar tingkat dominasi
suatu item atau itemset dari keseluruhan transaksi. Support diperoleh dengan
menggunakan persamaan:
support(A ⇒ B)
b
= P(A
=
(
B)………….(1)
)
dengan:
support(A ⇒ B)
: support item A dan B
(
)
: jumlah kemunculan item A bersamaan dengan item B
N
: jumlah seluruh transaksi
Confidence, suatu ukuran yang menunjukkan hubungan antara 2 item secara
kondisional. Confidence diperoleh dengan menggunakan persamaan:
confidence(A ⇒ B)= P(B|A)……...……(2)
=
support(
)
support( )
dengan:
confidence(A ⇒ B) : confidence item A dan B
support(A B)
: support item A dan B
support(A)
: support item A
3
Beberapa model association rule yang selama ini telah digunakan yaitu
(Han dan Kamber 2006):
a
Single level association rule. Contoh: buys(X, “computer”) ⇒ buys(X, “HP
printer”
Dalam single level association rule, jika aturan dalam sebuah set himpunan
yang diberikan tidak berdasarkan atribut pada level yang berbeda, maka
atribut tersebut berisi aturan asosiasi single-level.
b
Multilevel association rule. Contoh: buys(X, “laptop computer”) ⇒ buys(X,
“HP printer”)
Perbedaan dengan poin sebelumnya, bahwa dalam multilevel association
rule menunjuk kepada aturan pada level yang berbeda yakni computer
berada pada tingkatan di atas laptop computer.
c
Interdimensional association rule. Contoh: age(X, “20...29”) ⋀
occupation(X, “student”) ⇒ buys(X, “laptop”)
Aturan tersebut mengandung 3 predikat (age, occupation, dan buys).
Interdimensional association rule adalah aturan dalam multidimensional
association rule dengan tanpa perulangan predikat.
d
Hybrid-dimensional association rule. Contoh: age(X, “20...29”) ⋀ buys(X,
“laptop”) ⇒ buys(X, “HP printer”)
Ada 2 macam model untuk multidimensional association rule, yang
membedakan dari keduanya adalah pada interdimensional association rule tidak
diperbolehkan adanya pengulangan predikat/dimensi yang sama pada sebuah rule,
sementara hybrid-dimensional association rule memperbolehkan terjadinya
pengulangan predikat sebuah rule (Han dan Kamber 2006).
Multidimensional Association Rule
Sebuah association rule yang terdiri atas 2 atau lebih dimensi atau predikat
dapat disebut multidimensional association rule. Dalam multidimensional
association rule, setiap atribut berperilaku sebagai sebuah dimensi. Setiap
predikat yang berbeda pada sebuah rule adalah sebuah dimensi yang berbeda pula.
Contoh dimensi dalam aturan asosiasi satu dimensi dapat dilihat pada Tabel 1.
Tabel 1 Contoh dimensi dalam aturan asosiasi 1 dimensi
Dimensions
Id/Row Itemsets
buy
1
Item1, Item2
buy
2
Item3
buy
3
Item2, Item5
Pada aturan 1 dimensi, pencarian fokus pada frequent itemset untuk
mengetahui seberapa banyak kemunculan item dalam keseluruhan baris. Contoh
dimensi dalam aturan asosiasi multidimensi dapat dilihat pada Tabel 2.
4
Tabel 2 Contoh dimensi dalam aturan asosiasi multidimensi
Dimensi/Predicates Rows
age, buy
1, 2
income
3
buy, occupation
2, 5
Pada aturan multidimensi, pencarian fokus pada frequent predicate set.
Pencarian tersebut untuk mengetahui seberapa banyak kemunculan item dalam
dimensi tersebut dalam keseluruhan data.
Algoritme Apriori
Algoritme apriori menghitung frequent itemsets dalam basis data melalui
beberapa iterasi. Iterasi i menghitung semua frequent i-itemsets (itemsets dengan
element i). Tiap iterasi memiliki 2 langkah: candidate generation dan candidate
counting and selection.
Pada fase pertama dalam iterasi pertama, set yang dibangkitkan dari
candidate itemset mengandung semua 1-itemsets (dalam hal ini semua item dalam
dataset). Pada fase candidate counting, algoritme akan menghitung support dan
mencari lagi candidate itemset dalam keseluruhan basis data. Kemudian pada
akhirnya, hanya 1-itemsets dengan minimum support tertentu yang memenuhi
threshold yang dipilih sebagai 1-frequent item.
Berdasarkan pengetahuan tentang infrequent itemsets yang diperoleh dari
iterasi sebelumnya, algoritme Apriori mereduksi set dari candidates itemsets
dengan pruning (menggunakan Apriori) candidate itemsets yang tidak frequent.
Pruning dilakukan berdasarkan observasi bahwa jika sebuah itemset adalah
frequent maka semua subsetnya adalah frequent sehingga sebelum memasuki step
perhitungan kandidat, algoritme ini tidak melihat candidate itemsets yang
memiliki subset yang tidak frequent. Proses iterasi Apriori akan berhenti ketika
tidak ada lagi kandidat i-itemsets yang dapat disilangkan.
Berikut adalah algoritme Apriori yang digunakan untuk mencari frequent
itemsets dengan menggunakan iterasi (Han dan Kamber 2006).
(1) L1 = find_frequent_1-itemsets (D);
(2) for (k=2; Lk-1 ≠ Ø; k++) {
(3)
Ck = apriori_gen (Lk-1);
D { //scan D for counts
(4)
for each transaction t
(5)
Ct = subset(Ck,t); //get the subsets of t that are
candidates
(6)
for each candidate c
Ct
(7)
c.count++;
(8)
}
(9)
Lk = {c
Ck | c.count
min_sup}
(10) }
(11) return L = kLk;
5
Procedure apriori_gen(Lk-1:frequent (k-1) –itemsets)
Lk-1
(1) for each itemset l1
(2) for each itemset l2
Lk-1
(3)
if(l1[1] = l2[1])
(l1[2] = l2[2])
…
(l1[k-2] =
(l1[k-1] < l2[k-1]) then {
l2[k-2])
(4)
c = l1 x l2; // join step: generate candidates
(5)
if has_infrequent_subset(c, Lk-1) then
(6)
delete c; //prune step: remove unfruitful
candidate
(7)
else add c to Ck;
(8)
}
(9) return Ck;
procedure has_infrequent_subset(c: candidate k-itemset;
Lk-1: frequent(k-1)-itemsets); //use prior knowledge
(1) for each(k-1)-subset s of c
(2) if s
Lk-1 then
(3)
return TRUE;
(4) return FALSE;
a
b
c
d
e
f
g
h
Beberapa istilah yang digunakan dalam algoritme Apriori antara lain:
Support untuk aturan asosiasi adalah perbandingan banyaknya kejadian pada
basis data ketika sekumpulan item A dan sekumpulan item B terdapat pada
sebuah transaksi. Definisi dari support, yaitu sebagai berikut:
Probabilitas atribut atau kumpulan atribut A dan B yang terjadi secara
bersamaan.
Confidence adalah kuatnya hubungan antar item dalam aturan asosiasi.
Minimum support adalah parameter yang digunakan sebagai batasan
frekuensi kejadian atau support count yang harus dipenuhi suatu kelompok
data untuk dapat dijadikan aturan
Minimum confidence adalah parameter yang digunakan untuk
mendefinisikan minimum nilai kepercayaan yang harus dipenuhi.
Itemset: Kelompok item.
Support count adalah frekuensi kejadian untuk sebuah kelompok item dari
keseluruhan transaksi.
Candidate itemsets adalah itemset yang akan dihitung support countnya.
Large itemset adalah itemset yang sudah melewati batas minimum support
yang telah diberikan.
Very Small Aperture Terminal (VSAT)
Very Small Aperture Terminal (VSAT) digambarkan dengan terminalterminal penerima/pengirim sinyal berupa stasiun bumi satelit kecil berdiameter
antara 0.9 sampai dengan 3.8 meter yang digunakan untuk melakukan
6
pengiriman/penerimaan data, gambar maupun suara via satelit. Satelit berfungsi
sebagai penerus sinyal untuk dikirimkan ke titik lainnya di atas bumi.
Teknologi VSAT pertama kali dikenal di Amerika Serikat pada awal tahun
1980-an. VSAT masuk pertama kali ke Indonesia tahun 1989 seiring dengan
bermunculannya bank-bank swasta yang sangat membutuhkan sistem komunikasi
online seperti Automated Teller Machine (ATM) (Satkomindo 2008).
Preventive Maintenance (PM) dan Corrective Maintenance (CM)
Preventive Maintenance (PM) dapat diartikan sebagai suatu bentuk
penanganan pencegahan gangguan komunikasi. PM dilakukan untuk perawatan
dan perbaikan oleh teknisi dalam menangani perangkat dan fasilitas yang ada di
lokasi dalam hal memuaskan kondisi pengoperasian dengan cara inspeksi, deteksi
dan koreksi galat sebelum terjadi yang lebih mayor. Maintenance termasuk ke
dalamnya adalah testing, pengukuran, dan pengecekan perangkat. Corrective
Maintenance (CM) dapat diartikan sebagai bentuk tindakan perbaikan karena
adanya gangguan di suatu lokasi (Hughes 2006).
Signal Quality Factor (SQF)
Signal Quality Factor (SQF) adalah sebuah ukuran dalam penerimaan
kekuatan sinyal yang diterima. Ukurannya berkisar antara 0 point sampai 99 point.
SQF merupakan ukuran kualitas, dan tidak mempengaruhi kecepatan jaringan
ataupun bandwidth. SQF dapat dipengaruhi oleh cuaca yang sedang terjadi di
lokasi, misalnya ketika hujan, nilai SQF yang didapatkan berkisar pada nilai di
bawah 60 point. Jika cuaca sangat mendung, ukuran kualitas sinyal berada di nilai
minimum 61 point. Ketika cuaca cerah maka nilai ukuran kualitas sinyal yang
mungkin didapatkan antara nilai 75 point ke atas. Dengan melakukan pointing
yang baik, maka akan didapatkan SQF yang baik pula dan SQF akan dikatakan
sangat baik jika nilainya lebih dari dan sama dengan 85 point (Hughes 2006).
Cross Polarization Interference (CPI)
Cross Polarization Interference (CPI) adalah sebuah pengaturan sudut arah
rambat transmisi ke satelit. Pengukuran CPI bertujuan untuk tes pengiriman data
atau transmit data dan juga untuk memaksimalkan gelombang, apakah sudah
mencapai hasil yang ditetapkan seperti nilai CPI minimal yaitu 30dB (Hughes
2006).
METODE
Identifikasi Masalah
Pelanggan yang menggunakan modem HX50 sebanyak 4000 titik pelanggan
yang tersebar di seluruh wilayah di Indonesia. Banyaknya jenis kategori
pelanggan dan wilayah/lokasi dengan kondisi cuaca tidak menentu dan faktor
eksternal di lokasi dapat mempengaruhi adanya gangguan komunikasi data.
7
Salah satu solusi dalam penanganan permasalahan pada gangguan
komunikasi data tersebut adalah dengan membuat suatu aplikasi yang dapat
menghasilkan aturan untuk mempermudah analisis terhadap atribut-atribut yang
berkaitan dengan penentuan preventive maintenance atau corrective maintenance.
Pelaksanaan penelitian ini meliputi beberapa tahapan proses yang
digambarkan melalui suatu metode penelitian pada Gambar 1.
Mulai
Identifikasi
Masalah
Pengumpulan
Data
Praproses
Algoritme Apriori
Pembangkitan
Frequent Predicate
Sets
Pembangkitan Aturan
Asosiasi
Analisis Aturan
Asosiasi
Selesai
Gambar 1 Tahapan proses pada metode penelitian
Pengumpulan Data
Data yang digunakan pada penelitian ini adalah data pengecekan CPI dan
hasil SQF dari bulan Mei 2011 sampai September 2012 untuk pelanggan yang
menggunakan modem HX50, pada ruang lingkup pelanggan, provinsi, CPI dan
SQF. Terdapat 2249 record gangguan dari sekitar 4000 titik pelanggan. Pelanggan
yang memiliki nilai SQF di bawah 75 dan CPI di bawah nilai 30 sudah termasuk
ke dalam data gangguan, dan segera dilakukan PM agar nilai SQF dan CPI normal
kembali.
Pengumpulan data dilakukan dengan melakukan transmit dengan
memasukkan serial number modem yang digunakan di lokasi tersebut dan di atur
dengan frekuensi yang sama pada spektrum, lalu nilai CPI yang tertera pada layar
spektrum dilihat. Pengecekan SQF dan CPI terhadap titik pelanggan hanya bisa
8
dilakukan ketika titik pelanggan tersebut dalam keadaan menyala atau indikator
pada monitoring system terdeteksi warna hijau. Karena ketika keadaan modem
tidak menyala, tidak ada transmit ataupun receive pada link tersebut sehingga
tidak dapat dilakukan pengukuran. Contoh data asli yang telah dikumpulkan dapat
dilihat pada Tabel 3.
Tabel 3 Data asli yang digunakan untuk awal praproses
No
Lokasi
Provinsi
Pelanggan
SQF CPI
Tanggal
Transmit
1
BPR
Karanggeneng
Jatim
BPR
64
13
12/14/2011 PM
2
ATM BRI
Pamela VI
Yogyakarta
DIY
BRI
91
32
12/14/2011 PM
3
KPC Muara
Teweh
Kalteng
POSINDO
15
28
12/4/2011
PM
4
USO
Kec.Pagar
Merbau Deli
Serdang
Sumut
USO
92
34
12/3/2011
PM
5
…
…
…
…
…
…
…
*PM: Preventive Maintenance
PM /
CM*
CM: Corrective Maintenance
Dalam Tabel 3, dapat dilihat ada 7 kolom data yang digunakan. Data
tersebut perlu diolah terlebih dahulu dengan melakukan transformasi data,
sehingga kolom-kolom dalam data asli nantinya akan berubah sesuai dengan
transformasi yang dilakukan. Kolom data dalam tabel akan menjadi dimensi
dalam data mining.
Data asli kemudian ditransformasi menjadi beberapa dimensi, yakni,
dimensi area (transformasi dari kolom provinsi), kategori pelanggan (transformasi
dari kolom pelanggan), CPI, SQF, waktu, tahun, dan kategori PM/CM. Dimensi
area yang bertransformasi dari kolom provinsi mengelompokkan lokasi tersebut
berada pada wilayah yang banyak mengalami gangguan atau tidak. Dimensi
kategori pelanggan mengelompokkan pelanggan berdasarkan kategori agar
sebaran data tidak terlalu luas. Nilai dimensi CPI dan SQF menunjukkan apakah
pelanggan tersebut ada pada kondisi lingkungan dengan penerimaan sinyal yang
baik. Dimensi waktu dan tahun menunjukkan kapan terjadinyagangguan, sehingga
waktu sebaran gangguan yang terjadi per tahun dapat diketahui. Setelah itu,
dimensi-dimensi yang telah disebutkan tadi akan menentukan dalam hal
pengambilan keputusan bahwa apakah lokasi-lokasi dalam area tertentu dengan
nilai SQF dan CPI tertentu, akan dilakukan maintenance dengan kategori PM atau
CM dengan tingkat kepercayaan di atas minimum confidence dan minimum
support yang telah ditentukan.
9
Praproses
Pada tahap praproses dilakukan proses pengolahan data perusahaan ke
dalam format yang siap di mining. Dalam tahapan ini dilakukan penggabungan
data dalam berbagai dimensi, seperti data pelanggan, data wilayah, data SQF dan
CPI. Selain itu, ditentukan pula dimensi-dimensi yang dipilih dan akan digunakan
untuk diproses. Keluaran dari praproses ini akan dilanjutkan ke Generate
Frequent Predicate Sets.
Pembangkitan Frequent Predicate Sets
Pada tahapan ini dilakukan proses pencarian item yang sering muncul secara
bersamaan dan dalam tahapan ini telah ditentukan nilai minimum support yang
dijadikan ukuran. Pencarian frequent itemsets/frequent predicate sets dilakukan
dengan menggunakan algoritme Apriori dengan iterasi berdasarkan pembentukan
kandidat.
Penerapan algoritme Apriori pada masing-masing kandidat digunakan untuk
diterapkan pada data pengecekan CPI dan SQF, seperti berikut:
1
Menentukan field yang akan dikorelasikan
2
Menentukan data value
3
Menentukan minimum support dan minimum confidence
4
Membentuk kombinasi berdasarkan field terpilih dengan data value yang
ditentukan.
5
Memberikan syarat jika support ≤ minimum support, maka itemset yang
tidak memenuhi akan dipangkas.
6
Membangkitkan rules dari tiap korelasi yang memenuhi minimum support
yang ditentukan.
Pembangkitan Association Rules
Pada tahap ini dilakukan proses pembentukan atau pencarian aturan asosiasi
dengan masukan hasil dari frequent itemsets dan minimum confidence yang akan
menghasilkan aturan asosiasi. Ketika frequent itemsets telah didapatkan, maka
akan dibentuk aturan asosiasi kuat yang memenuhi minimum support dan
minimum confidence.
Aturan asosiasi dapat dibentuk dengan algoritme seperti berikut:
1
Dalam setiap frequent itemset l, bangkitkan semua subset yang tidak kosong
dari l.
2
Dalam setiap subset s yang tidak kosong dari l, dihasilkan aturan “s => (lsupport ount (l)
s)” jika support
confidence.
ount (s)
min_conf, min_conf adalah nilai batas minimum dari
10
Analisis Rules
Aturan yang dihasilkan kemudian dianalisis untuk dijadikan bahan
pertimbangan dalam penentuan maintenance melalui keterkaitan variabel-variabel
yang telah di-mining.
Lingkungan Pengembangan
a
b
Lingkungan pengembangan sistem adalah sebagai berikut:
Perangkat lunak: sistem operasi Windows 8, PHP, MySQL, XAMPP,
Browser, Microsoft Office Excel 2010.
Perangkat keras: prosesor Intel® Core™ i3 CPU 2.20GHz, memori 4GB,
harddisk 500 GB.
HASIL DAN PEMBAHASAN
Penelitian dilakukan dengan mengacu pada metodologi yang telah
disebutkan pada bab sebelumnya, yaitu meliputi tahapan seleksi data,
pembersihan data dan transformasi data.
Seleksi Data
Tahap pertama adalah melakukan seleksi data terhadap data yang akan
digunakan dalam proses data mining. Data yang digunakan pada penelitian ini
adalah data pengecekan gangguan dari bulan Mei 2011 sampai September 2012
sebanyak 2249 record data, mencakup area, kategori pelanggan, CPI, SQF, waktu,
tahun, dan kategori PM/CM. Data tersebut didapatkan dari helpdesk maintenance
dalam format Excel.
Dari keseluruhan gangguan yang terjadi, hanya dipilih gangguan dengan
lokasi-lokasi yang menggunakan modem jenis HX50 saja. Penentuan akhir dari
setiap gangguan yang terjadi adalah pada kolom kategori, yakni apakah akan
dilakukan Preventive Maintenance (PM) atau Corrective Maintenance (CM).
Pembersihan Data
Data dalam format Microsoft Excel diubah formatnya menjadi DBMS
MySQL untuk memudahkan dalam pengolahan data. Data tersebut dibersihkan
dari beberapa hal berikut:
Data yang tidak lengkap. Contohnya, masukan kota yang tidak disertai
dengan provinsi harus dilengkapi untuk memenuhi kolom area.
Kesalahan pengetikan. Contohnya, terdapat karakter lebih atau kurang pada
penulisan kategori pelanggan
Kesalahan masukan. Contohnya, masukan isian tanggal pada kolom
pelanggan.
Data yang terjadi karena kesalahan pengetikan atau kesalahan masukan akan
dihapuskan, karena tidak mungkin dilakukan penggantian dengan random data.
11
Transformasi Data
Pada tahap ini dilakukan pengkodean data numerik ke kategorik untuk
beberapa dimensi data. Data yang dikonversi adalah pada dimensi CPI, SQF,
Waktu, dan Tahun. Data pada dimensi CPI yang tersebar antara nilai 1-99,
dikonversi menjadi kategorik (Tabel 4).
Tabel 4 Kategori untuk dimensi CPI
Nilai Bawah
Nilai Atas
Deskripsi
1
19
Kriteria 1
20
24
Kriteria 2
25
29
Kriteria 3
29
99
Normal
Pengelompokkan pada dimensi CPI ditentukan berdasarkan analisis
manajer. Kriteria 1, Kriteria 2, Kriteria 3 dan Normal digunakan untuk
memudahkan penentuan PM dan CM. Nilai pada Kriteria 1 adalah yang terburuk,
dengan nilai CPI antara 1-19, maka titik pelanggan yang memiliki CPI pada
Kriteria 1 akan diprioritaskan lebih utama daripada Kriteria 2 dan Kriteria 3 untuk
dilakukan maintenance.
Data pada dimensi SQF yang tersebar antara nilai 0-99 dikodekan menjadi
kategorik yang dapat dilihat pada Tabel 5.
Tabel 5 Kategori untuk dimensi SQF
Nilai Bawah
Nilai Atas
Deskripsi
0
30
wrong polarity
31
60
very bad
61
74
bad
75
84
good
85
99
very good
Pada dimensi waktu, rentang antara bulan Januari hingga Desember dibagi
menjadi Triwulan I, Triwulan II, Triwulan III dan Triwulan IV. Perlakuan yang
sama dilakukan untuk dimensi Tahun dibagi menjadi tahun 2011 dan tahun 2012.
Untuk wilayah (kota atau provinsi) dipersempit cakupannya menjadi beberapa
area seperti pada Tabel 6.
12
Tabel 6 Pengelompokan cakupan beberapa wilayah menjadi area
Area
Wilayah
Area-1
Jakarta, Bogor, Depok, Tangerang,
Bekasi, Jabar, Banten, Jateng, Jatim,
Yogyakarta
Area-2
Lampung, Sumsel, Bali, Bengkulu,
Jambi, Sumbar, Riau, Kepri, Babel,
Batam, Kalsel, Kalteng, Kalbar
Area-3
Kaltim, Sumut, NAD, Sulbar, Sultra,
Sulsel, NTB, NTT, Sulut, Sulteng,
Gorontalo
Area-4
Maluku
Area-5
Papua
Pengelompokkan area menjadi 5 kategori diambil berdasarkan data internal
di Divisi Metrasat. Wilayah tersebut sudah ditentukan berdasarkan persebaran
keseluruhan pelanggan yang ada di Divisi Metrasat. Dalam penelitian ini,
pelanggan dikategorikan berdasarkan penyebarannya seperti pada Tabel 7.
Tabel 7 Pengelompokan beberapa pelanggan menjadi 1 kategori pelanggan
Kategori Pelanggan
Pelanggan
Dephan
TNI, Emiliter, Dephan
Kantor Pos
Posindo
Kepolisian
Polda
Kesehatan
Depkes, Askes, Admedika
Oil & Gas
Pertagas, Pertamina, Medco, Petrosea,
PT.Metco Pertamina
Pemerintahan
Adminduk, Deptan, Kejari, PLN,
Dispenduk, Depag, Bulog, Pajak, BKD,
Pemkab Tuban, Pegadaian, Pemkab,
Pemprov DKI
Perbankan
BRI Unit, BNI, BTN, BCA Syariah,
BPR, BPD Papua, Bank Nisp, BPD
Sulteng, BPR Sultra, BII, ATM Niaga,
Bank Jatim, BRI, CIMB Niaga, Bank
Panin, BNI ATM, BRI Teras, BPD, BRI
ATM, BCA, Bank Muamalat
Perkebunan
PT. MSL, PT.Inalum
Telekomunikasi
Gerai Halo
USO
USO, USO_Trial, Koperasi Nasari,
KSU Mekar Jaya, Koperasi Nasari
Tumpang Raya, USO PLIK
13
Data Mining
Data terdiri atas 7 dimensi (Area, Pelanggan, SQF, CPI, Waktu, Tahun dan
Kategori PM/CM) yang digunakan untuk proses mining. Beberapa dimensi pada
data, sudah dibuat dengan tipe kategorik. Tabel data asli dan data yang sudah
ditransformasi dapat dilihat pada Lampiran 1 dan Lampiran 2. Tahapan asosiasi
dibagi menjadi 2 tahap, yaitu mencari frequent itemset dan pembentukan aturan
asosiasi.
1
Frequent Itemset
Minimum support yang digunakan dalam penelitian ini adalah 40%, 30%
dan 20%. Hal ini digunakan untuk melihat seberapa sering kemunculan itemset
dalam data dan dihitung rasio antara kemunculannya dengan total jumlah record
data. Keseluruhan pembentukan large itemset untuk minimum support 40%, 30%
dan 20% dapat dilihat pada Lampiran 3.
1.1
Large 1-itemset
Pada iterasi 1-itemset, support yang memenuhi minimum support 40%, 30%
dan 20% dapat dilihat pada Tabel 8. Berdasarkan tabel tersebut, dapat dilihat
bahwa dari keseluruhan data, gangguan terbanyak terjadi pada Area-3 di Triwulan
2 dan di Tahun 2011.
Tabel 8 Large 1-itemset dengan minimum support 40%, 30% dan 20%.
1.2
Dimensi
Rows
Support
Persen
Support
Area
tahun
periode
pm_cm
pm_cm
kat_pelanggan
tahun
Area-3
Tahun 2011
Triwulan 2
PM
CM
USO
Tahun 2012
1251
1245
1200
1192
1057
1006
1004
55.62%
55.36%
53.36%
53 %
47 %
44.73%
44.64%
Large 2-itemset
Pada iterasi 2-itemset untuk minimum support 40%, 30% dan 20%,
dihasilkan 2 kombinasi yang dapat dilihat pada Tabel 9.
Tabel 9 Large 2-itemset dengan minimum support 40%, 30% dan 20%.
Dimensi
Rows
Support
Persen
Support
area,
kat_pelanggan
Area-3,USO
1002
44.55%
periode, tahun
Triwulan
2,Tahun 2011
907
40.33%
14
Berdasarkan hasil pada Tabel 9, kemunculan item Area-3 dalam dimensi
area bersamaan dengan kemunculan item USO dalam dimensi kategori pelanggan
mencapai support tertinggi untuk iterasi kedua. Hal ini mengindikasikan bahwa
untuk kategori pelanggan USO banyak terjadi gangguan di Area-3.
2
Pembentukan Aturan Asosiasi
2.1 Pembentukan Large Itemset dengan Minimum Support 40%, 30% dan
20%
Aturan asosiasi untuk minimum support 20% dan minimum confidence 50%
diberikan pada Lampiran 4. Akan tetapi, aturan asosiasi yang dipilih hanya aturan
asosiasi dengan confidence yang tinggi dan support yang baik pula, maka diambil
contoh untuk 4 aturan teratas dari confidence yang tertinggi (Tabel 10).
Tabel 10 Empat aturan asosiasi dengan confidence tertinggi untuk minimum
support 20%.
Dimensi
Rules
Confidence (%)
area,kat_pelanggan
USO Area-3
99.6
area, kat_pelanggan
Area-3 USO
80.1
pm_cm, tahun
CM Tahun 2011
78.33
pm_cm, tahun
Tahun 2012 PM
77.19
Confidence tertinggi dibentuk oleh aturan kemunculan dimensi area karena
kemunculan dimensi kategori pelanggan. Confidence aturan ini cukup besar yaitu
99.6%. Dari aturan tersebut dapat dikatakan bahwa untuk melihat seberapa sering
sebuah kategori pelanggan muncul di sebuah area, cukup dengan melihat kategori
pelanggan USO, karena mayoritas gangguan di Area-3, terjadi karena gangguan
pada kategori pelanggan USO.
2.2 Aturan asosiasi dengan Minimum Confidence > 50% dengan hasil PM
dan CM
Aturan asosiasi dengan minimum confidence di atas 50% yang
menghasilkan aturan yang mengandung item PM dan CM dapat dilihat pada Tabel
11. Berdasarkan aturan 1 pada Tabel 11 yaitu Area-3,Tahun 2012 PM, dapat
dinyatakan bahwa item Area-3 dalam dimensi area muncul bersamaan dengan
item Tahun 2012 dalam dimensi tahun yang menghasilkan PM. Dalam aturan 1
tersebut menghasilkan confidence tertinggi dengan nilai 83.79%. Serta
kemunculan item Area-3 dalam dimensi area bersamaan dengan kemunculan item
Triwulan 2 dalam dimensi periode, dan Tahun 2011 dalam dimensi tahun yang
menghasilkan CM dengan aturan Area-3,Triwulan 2,Tahun 2011 CM,
mencapai confidence tertinggi dengan nilai 77.91%. Hal ini mengindikasikan
bahwa pada Tahun 2012, PM banyak terjadi untuk Area-3 dengan tingkat
keyakinan sebesar 83.79%. Lalu pada Triwulan 2 di Tahun 2011, CM banyak
terjadi juga di Area-3.
15
Tabel 11 Aturan asosiasi dengan minimum confidence di atas 50% dengan hasil
PM dan CM
Dimensi
area, pm_cm,tahun
area, periode,
pm_cm, tahun
periode, pm_cm,
tahun
area, pm_cm, tahun
pm_cm, tahun
area, periode,
pm_cm
periode, pm_cm
area, kat_pelanggan,
pm_cm
kat_pelanggan,
pm_cm
area, pm_cm
Rules
Area-3,Tahun
2012 PM
Area3,Triwulan
2,Tahun 2011
CM
Triwulan
2,Tahun 2011
CM
Area-3,Tahun
2011 CM
Tahun 2011
CM
Area3,Triwulan 2
CM
Triwulan 2
CM
Area-3,USO
PM
Confidence (%)
83.79
77.91
73.87
69.49
66.51
64.33
63.42
58.28
USO PM
58.25
Area-3 PM
53.64
Tampilan awal sistem untuk menghasilkan aturan asosiasi pada gangguan
VSAT IP dapat dilihat dalam Lampiran 5. Pada halaman tersebut, terdapat
masukan mengenai threshold minimum support dan minimum confidence yang
telah ditentukan. Proses pembangkitan frequent predicate sets selanjutnya dapat
dilihat dalam Lampiran 6. Pada halaman tersebut dapat dilihat list itemset dengan
minimum support yang telah ditentukan serta aturan-aturan asosiasi yang telah
terbentuk berdasarkan minimum confidence yang telah ditentukan serta list itemset
yang telah melalui proses pruning. Dalam aturan asosiasi, item dalam itemset
dikombinasikan satu sama lain untuk dilakukan proses pruning dengan memenuhi
threshold nilai minimum support menggunakan fungsi kombinasi yang dapat
dilihat dalam Lampiran 7. Setelah proses pruning dilalui, maka proses selanjutnya
adalah pembentukan aturan asosiasi berdasarkan list itemset yang memenuhi
minimum support. Fungsi pembentukan Large Itemset-1 dapat dilihat pada
Lampiran 8, pembentukan Large Itemset-2 dapat dilihat pada Lampiran 9 dan
pembentukan Large Itemset-n dapat dilihat pada Lampiran 10.
16
SIMPULAN DAN SARAN
Simpulan
Setelah percobaan dengan minimum support 40%, 30% dan 20% serta
minimum confidence 50%, 60% dan 80% dilakukan, ditemukan support tertinggi
(55.62%) terdapat pada dimensi ‘area’ dengan itemset ‘Area-3’. Berarti lebih dari
setengah gangguan terjadi wilayah Provinsi Kalimantan Timur, Sumatera Utara,
Bali, Bengkulu, Jambi, Sumatera Barat, Riau, Kepulauan Riau, Bangka Belitung,
Kalimantan Selatan, Kalimantan Tengah dan Kalimantan Barat.
Nilai confidence tertinggi sebesar 99.6% didapatkan pada minimum support
40%, yang dihasilkan oleh aturan USO Area-3 . Hal ini dapat bermakna bahwa
banyak terjadi gangguan pada Area-3 pada kategori pelanggan USO.
Aturan Area-3,Tahun 2012 PM (support 40% dan confidence 83.79%),
menjelaskan bahwa kondisi PM (Preventive Maintenance) banyak terjadi pada
Tahun 2012 di Area-3. Disisi lain, kondisi CM (Corrective Maintenance) banyak
ditemukan pada Triwulan 2 di Tahun 2011 di Area-3 sebagaimana diperlihatkan
oleh aturan Area-3,Triwulan 2,Tahun 2011 CM (confidence 77.91%).
Dengan banyaknya CM pada tahun 2011, dan menurunnya confidence untuk
CM di Area-3 di tahun 2012, maka dalam hal ini, penentu kebijakan telah dapat
mengambil kesimpulan bahwa Area-3 adalah area yang perlu diperhatikan dalam
PM dan CM, dan pelanggan USO adalah pelanggan yang paling sering mengalami
gangguan. Penelitian ini sudah dapat menghasilkan aturan asosiasi berdasarkan
metode aturan asosiasi multidimensional.
Saran
Untuk penelitian selanjutnya dapat dikombinasikan aturan asosiasi
multidimensional dengan multilevel untuk mendapatkan pola asosiasi yang lebih
menarik.
DAFTAR PUSTAKA
Abadi B. 2007. Model Rule: Multilevel and Multidimension Association Rule
untuk Analisa Market Basket pada PT. Maha Agung [skripsi]. Surabaya
(ID): Universitas Kristen Petra Surabaya.
Han J, Kamber M. 2006. Data Mining: Concepts and Techniques, Ed ke-2. San
Fransisco (US): Morgan Kaufmann.
Hughes. 2006. Hughes HX50 Broadband Terminal. Washington (US): Hughes.
Kantardzic M. 2003. Data Mining: Concepts, Models, Methods and Algorithms.
New Jersey (US): Wiley.
Satkomindo. 2008. Pengertian Jaringan VSAT. [Internet]. [diunduh pada 2012 Jan
28]. Tersedia pada: http://www.satkomindo.com/indo/vsat.html.
17
Lampiran 1 Sampel data awal sebelum dilakukan pemilihan field yang akan di
mining
No
Lokasi
Prov
Pelanggan
SQF
CPI
Tanggal
Transmit
PM
/
CM
1
BPR
Karanggeneng
JATIM
BPR
64
13
12/14/2011
PM
2
ATM BRI
Pamela VI
Yogyakarta
DIY
BRI
91
32
12/14/2011
PM
3
KPC Muara
Teweh
KALTENG
POSINDO 15
28
12/4/2011
PM
4
USO
Kec.Pagar
Merbau Deli
Serdang
SUMUT
USO
92
34
12/3/2011
PM
5
…
…
…
…
…
…
…
Lampiran 2 Sampel data yang telah dilakukan pemilihan field yang akan di
mining
No
Area
Kategori
Pelanggan
SQF
CPI
Waktu
Tahun
PM /
CM
1
Area1
PERBAN
KAN
Bad
Kriteria
1
Triwulan
4
2011
PM
2
Area1
PERBAN
KAN
Very Good
Normal
Triwulan
4
2011
PM
3
Area2
KANTOR
POS
Wrong
Polarization
Kriteria
3
Triwulan
4
2011
PM
4
Area3
USO
Very Good
Normal
Triwulan
4
2011
PM
5
…
…
…
…
…
…
…
18
Lampiran 3 Large itemset dengan minimum support 40%, 30% dan 20%
Itemset Dimensi/Fields
1
1
1
1
1
1
1
1
area
tahun
periode
pm_cm
pm_cm
kat_pelanggan
tahun
kat_sqf
Rows
Persentase
Support Support
(%)
Minimum
Support
Area-3
1251
55.62
40%, 30%,
20%
Tahun 2011
1245
55.36
40%, 30%,
20%
Triwulan 2
1200
53.36
40%, 30%,
20%
PM
1192
53
40%, 30%,
20%
CM
1057
47
40%, 30%,
20%
USO
1006
44.73
40%, 30%,
20%
Tahun 2012
1004
44.64
40%, 30%,
20%
Very Good
940
41.8
40%, 30%,
20%
1
kat_cpi
Normal
786
34.95
30%, 20%
1
kat_sqf
Good
737
32.77
30%, 20%
1
kat_cpi
Kriteria 3
677
30.1
30%, 20%
1
kat_pelanggan
KANTOR POS
674
29.97
20%
1
area
Area-1
584
25.97
20%
1
periode
Triwulan 3
573
25.48
20%
2
area,
kat_pelanggan
Area-3, USO
1002
44.55
40%, 30%,
20%
periode, tahun
Triwulan 2,
Tahun 2011
907
40.33
40%, 30%,
20%
pm_cm, tahun
CM, Tahun
2011
828
36.82
30%, 20%
pm_cm, tahun
PM, Tahun
2012
775
34.46
30%, 20%
area, periode
Area-3,
Triwulan 2
771
34.28
30%, 20%
Triwulan 2, CM
761
33.84
30%, 20%
2
2
2
2
2
periode,
pm_cm
19
Lanjutan
Itemset Dimensi/Fields
Rows
Persentase
Support Support
(%)
Minimum
Support
area, tahun
Area-3, Tahun
2011
708
31.48
30%, 20%
area, pm_cm
Area-3, PM
671
29.84
20%
kat_sqf, tahun
Very Good,
Tahun 2011
638
28.37
20%
2
kat_pelanggan,
periode
USO, Triwulan
2
616
27.39
20%
2
kat_pelanggan,
pm_cm
USO, PM
586
26.06
20%
2
area, pm_cm
Area-3, CM
580
25.79
20%
area, kat_sqf
Area-3, Very
Good
571
25.39
20%
kat_sqf,
periode
Very Good,
Triwulan 2
549
24.41
20%
area, tahun
Area-3, Tahun
2012
543
24.14
20%
2
kat_pelanggan,
tahun
USO, Tahun
2011
541
24.06
20%
2
kat_sqf,
pm_cm
Very Good, CM
517
22.99
20%
2
kat_pelanggan,
kat_sqf
USO, Very
Good
501
22.28
20%
2
kat_cpi,
pm_cm
Normal, PM
470
20.9
20%
2
kat_pelanggan,
tahun
USO, Tahun
2012
465
20.68
20%
2
area, kat_cpi
Area-3, Normal
457
20.32
20%
2
kat_sqf,
periode
Good, Triwulan
2
451
20.05
20%
periode,
pm_cm, tahun
Triwulan 2,
CM, Tahun
2011
670
29.79
20%
Area-3, USO,
Triwulan 2
614
27.3
20%
2
2
2
2
2
2
3
3
area,
kat_pelanggan,
periode
20
Lanjutan
Itemset Dimensi/Fields
3
3
area,
kat_pelanggan,
pm_cm
area, periode,
tahun
Rows
Persentase
Support Support
(%)
Minimum
Support
Area-3, USO,
PM
584
25.97
20%
Area-3,
Triwulan 2,
Tahun 2011
584
25.97
20%
3
area,
kat_pelanggan,
tahun
Area-3, USO,
Tahun 2011
537
23.88
20%
3
area,
kat_pelanggan,
kat_sqf
Area-3, USO,
Very Good
500
22.23
20%
3
area, periode,
pm_cm
Area-3,
Triwulan 2, CM
496
22.05
20%
3
area, pm_cm,
tahun
Area-3, CM,
Tahun 2011
492
21.88
20%
kat_sqf,
pm_cm, tahun
Very Good,
CM, Tahun
2011
469
20.85
20%
3
area,
kat_pelanggan,
tahun
Area-3, USO,
Tahun 2012
465
20.68
20%
3
kat_pelanggan,
periode, tahun
USO, Triwulan
2, Tahun 2011
459
20.41
20%
3
area, pm_cm,
tahun
Area-3, PM,
Tahun 2012
455
20.23
20%
4
area,
kat_pelanggan,
periode, tahun
Area-3, USO,
Triwulan 2,
Tahun 2011
457
20.32
20%
area, periode,
pm_cm, tahun
Area-3,
Triwulan 2,
CM, Tahun
2011
455
20.23
20%
3
4
21
Lampiran 4 Tabel hasil aturan asosiasi dengan minimum support 20% dan
minimum confidence 50%
Confidence
(%)
Itemset
Dimensi / Fields
Rules
Area-3, USO,
Tahun 2012
area, kat_pelanggan,
tahun
USO, Tahun
2012 Area-3
100
Area-3, USO,
Very Good
area, kat_pelanggan,
kat_sqf
USO, Very
Good Area-3
99.8
Area-3, USO,
Triwulan 2
area, kat_pelanggan,
periode
USO, Triwulan
2 Area-3
99.68
Area-3, USO,
PM
area, kat_pelanggan,
pm_cm
USO, PM
Area-3
99.66
Area-3, USO
area, kat_pelanggan
USO Area-3
99.6
Area-3, USO,
Triwulan 2,
Tahun 2011
area, kat_pelanggan,
periode, tahun
USO, Triwulan
2, Tahun 2011
Area-3
99.56
Area-3, USO,
Tahun 2011
area, kat_pelanggan,
tahun
USO, Tahun
2011 Area-3
99.26
Area-3,
Triwulan 2, CM,
Tahun 2011
area, periode, pm_cm,
tahun
Area-3, CM,
Tahun 2011
Triwulan 2
92.48
Area-3,
Triwulan 2, CM,
Tahun 2011
area, periode, pm_cm,
tahun
Area-3,
Triwulan 2, CM
Tahun 2011
91.73
Very Good, CM,
Tahun 2011
kat_sqf, pm_cm, tahun
Very Good, CM
Tahun 2011
90.72
Triwulan 2, CM,
Tahun 2011
periode, pm_cm, tahun
Triwulan 2, CM
Tahun 2011
88.04
Area-3, USO,
Very Good
area, kat_pelanggan,
kat_sqf
Area-3, Very
Good USO
87.57
Area-3, USO,
PM
area, kat_pelanggan,
pm_cm
Area-3, PM
USO
87.03
Area-3, USO,
Tahun 2012
area, kat_pelanggan,
tahun
Area-3, Tahun
2012 USO
85.64
Area-3,
Triwulan 2, CM
area, periode, pm_cm
Area-3, CM
Triwulan 2
85.52
Area-3, USO,
Triwulan 2,
Tahun 2011
area, kat_pelanggan,
periode, tahun
Area-3, USO,
Tahun 2011
Triwulan 2
85.1
22
Lanjutan
Confidence
(%)
Itemset
Dimensi / Fields
Rules
USO, Triwulan
2, Tahun 2011
kat_pelanggan, periode,
tahun
USO, Tahun
2011
Triwulan 2
84.84
Area-3, CM,
Tahun 2011
area, pm_cm, tahun
Area-3, CM
Tahun 2011
84.83
Area-3, USO,
Triwulan 2,
Tahun 2011
area, kat_pelanggan,
periode, tahun
USO, Tahun
2011 Area-3,
Triwulan 2
84.47
Area-3, PM,
Tahun 2012
area, pm_cm, tahun
Area-3, Tahun
2012 PM
83.79
Area-3,
Triwulan 2,
Tahun 2011
area, periode, tahun
Area-3, Tahun
2011
Triwulan 2
82.49
Triwulan 2, CM,
Tahun 2011
periode, pm_cm, tahun
CM, Tahun
2011
Triwulan 2
80.92
Area-3, USO
area, kat_pelanggan
Area-3 USO
80.1
Area-3, USO,
Triwulan 2
area, kat_pelanggan,
periode
Area-3,
Triwulan 2
USO
79.64
Area-3,
Triwulan 2, CM,
Tahun 2011
area, periode, pm_cm,
tahun
Area-3, CM
Triwulan 2,
Tahun 2011
78.45
CM, Tahun 2011
pm_cm, tahun
CM Tahun
2011
78.33
Area-3, USO,
Triwulan 2,
Tahun 2011
area, kat_pelanggan,
periode, tahun
Area-3,
Triwulan 2,
Tahun 2011
USO
78.25
Area-3,
Triwulan 2, CM,
Tahun 2011
area, periode, pm_cm,
tahun
Area-3,
Triwulan 2,
Tahun 2011
CM
77.91
PM, Tahun 2012
pm_cm, tahun
Tahun 2012
PM
77.19
Area-3, USO,
Tahun 2011
area, kat_pelanggan,
tahun
Area-3, Tahun
2011 USO
75.85
23
Lanjutan
Confidence
(%)
Itemset
Dimensi / Fields
Rules
Area-3,
Triwulan 2,
Tahun 2011
area, periode, tahun
Area-3,
Triwulan 2
Tahun 2011
75.75
Triwulan 2,
Tahun 2011
periode, tahun
Triwulan 2
Tahun 2011
75.58
USO, Triwulan
2, Tahun 2011
kat_pelanggan, periode,
tahun
USO, Triwulan
2 Tahun
2011
74.51
Area-3, USO,
Triwulan 2,
Tahun 2011
area, kat_pelanggan,
periode, tahun
Area-3, USO,
Triwulan 2
Tahun 2011
74.43
Area-3, USO,
Triwulan 2,
Tahun 2011
area, kat_pelanggan,
periode, tahun
USO, Triwulan
2 Area-3,
Tahun 2011
74.19
Triwulan 2, CM,
Tahun 2011
periode, pm_cm, tahun
Triwulan 2,
Tahun 2011
CM
73.87
Very Good, CM,
Tahun 2011
kat_sqf, pm_cm, tahun
Very Good,
Tahun 2011
CM
73.51
Triwulan 2,
Tahun 2011
periode, tahun
Tahun 2011
Triwulan 2
72.85
Triwulan 2, CM
periode, pm_cm
CM Triwulan
2
72
Area-3, CM,
Tahun 2011
area, pm_cm, tahun
Area-3, Tahun
2011 CM
69.49
Area-3,
Triwulan 2, CM,
Tahun 2011
area, periode, pm_cm,
tahun
Triwulan 2, CM,
Tahun 2011
Area-3
67.91
Very Good,
Tahun 2011
kat_sqf, tahun
Very Good
Tahun 2011
67.87
Area-3, PM,
Tahun 2012
area, pm_cm, tahun
Area-3, PM
Tahun 2012
67.81
CM, Tahun 2011
pm_cm, tahun
Tahun 2011
CM
66.51
Area-3,
Triwulan 2, CM
area, periode, pm_cm
Triwulan 2, CM
Area-3
65.18
24
Lanjutan
Itemset
Dimensi / Fields
Rules
Confidence
(%)
PM, Tahun 2012
pm_cm, tahun
PM Tahun
2012
65.02
Area-3, USO,
Triwulan 2,
Tahun 2011
area, kat_pelanggan,
periode, tahun
Area-3, Tahun
2011 USO,
Triwulan 2
64.55
Area-3,
Triwulan 2,
Tahun 2011
area, periode, tahun
Triwulan 2,
Tahun 2011
Area-3
64.39
Area-3,
Triwulan 2, CM
area, periode, pm_cm
Area-3,
Triwulan 2
CM
64.33
Area-3,
Triwulan 2, CM,
Tahun 2011
area, periode, pm_cm,
tahun
Area-3, Tahun
2011
Triwulan 2, CM
64.27
Area-3,
Triwulan 2
area, periode
Triwulan 2
Area-3
64.25
Triwulan 2, CM
periode, pm_cm
Triwulan 2
CM
63.42
Triwulan 2, CM,
Tahun 2011
periode, pm_cm, tahun
CM Triwulan
2, Tahun 2011
63.39
Area-3,
Triwulan 2
area, periode
Area-3
Triwulan 2
61.63
Area-3, USO,
Triwulan 2
area, kat_pelanggan,
periode
Area-3, USO
Triwulan 2
61.28
USO, Triwulan
2
kat_pelanggan, periode
USO
Triwulan 2
61.23
Good, Triwulan
2
kat_sqf, periode
Good
Triwulan 2
61.19
Area-3, USO,
Triwulan 2
area, kat_pelanggan,
periode
USO Area-3,
Triwulan 2
61.03
Area-3, Very
Good
area, kat_sqf
Very Good
Area-3
60.74
Normal, PM
kat_cpi, pm_cm
Normal PM
59.8
Area-3,
Triwulan 2, CM,
Tahun 2011
area, periode, pm_cm,
tahun
Triwulan 2, CM
Area-3,
Tahun 2011
59.79
25
Lanjutan
Confidence
(%)
Itemset
Dimensi / Fields
Rules
Area-3, CM,
Tahun 2011
area, pm_cm, tahun
CM, Tahun
2011 Area-3
59.42
Area-3, USO,
Triwulan 2,
Tahun 2011
area, kat_pelanggan,
periode, tahun
Area-3,
Triwulan 2
USO, Tahun
2011
59.27
Area-3,
Triwulan 2, CM,
Tahun 2011
area, periode, pm_cm,
tahun
Area-3,
Triwulan 2
CM, Tahun
2011
59.01
Area-3, PM,
Tahun 2012
area, pm_cm, tahun
PM, Tahun 2012
Area-3
58.71
Very Good,
Triwulan 2
kat_sqf, periode
Very Good
Triwulan 2
58.4
Area-3, USO,
PM
area, kat_pelanggan,
pm_cm
Area-3, USO
PM
58.28
USO, PM
kat_pelanggan, pm_cm
USO PM
58.25
Area-3, Normal
area, kat_cpi
Normal
Area-3
58.14
Area-3, USO,
PM
area, kat_pelanggan,
pm_cm
USO Area-3,
PM
58.05
Area-3
POLA KETERKAITAN ASPEK GANGGUAN
PADA VSAT IP
TANTI NOPIANTI
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2014
PERNYATAAN MENGENAI SKRIPSI DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa skripsi berjudul Multidimensional
Association Rule untuk Melihat Pola Keterkaitan Aspek Gangguan pada VSAT IP
adalah benar karya saya dengan arahan dari komisi pembimbing dan belum
diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber
informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak
diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam
Daftar Pustaka di bagian akhir skripsi ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut
Pertanian Bogor.
Bogor, Juni 2014
Tanti Nopianti
NIM G64086033
ABSTRAK
TANTI NOPIANTI. Multidimensional Association Rule untuk Melihat Pola
Keterkaitan Aspek Gangguan pada VSAT IP. Dibimbing oleh ANNISA.
Penelitian ini bertujuan untuk menentukan pola keterkaitan dari gangguan
pada divisi VSAT IP (Very Small Aperture Terminal Internet Protocol) dengan
menggunakan metode aturan asosiasi multidimensi. Penelitian ini menggunakan
kombinasi dari minimum support 40%, 30% dan 20% dan minimum confidence
50%, 60% dan 80%. Hasilnya menunjukkan bahwa aturan menarik dibentuk oleh
kejadian item 'USO' (Universal Service Obligation) bersama-sama dengan
dimensi 'area' dengan item 'Area-3' yang dihasilkan oleh aturan USOArea-3
dengan support 40% dan confidence 99.6%. Support tertinggi dari seluruh data
dibentuk oleh dimensi ‘area’ dengan item ‘Area-3’ dengan nilai support 55.62%.
Hal ini berarti lebih dari setengah data gangguan, terjadi di ‘Area-3’ yaitu wilayah
Provinsi Kalimantan Timur, Sumatera Utara, Bali, Bengkulu, Jambi, Sumatera
Barat, Riau, Kepulauan Riau, Bangka Belitung, Kalimantan Selatan, Kalimantan
Tengah dan Kalimantan Barat. Area-3 adalah area yang perlu diperhatikan dalam
perbaikan. Pertimbangan hasil aturan asosiasi dapat digunakan dengan mencari
pola keterkaitan dari masing-masing dimensi pada data gangguan komunikasi.
Kata kunci: Aturan asosiasi, Multidimensional Association Rule.
ABSTRACT
TANTI NOPIANTI. Multidimensional Association Rule to Discover Interference
Relationship Patterns on VSAT IP. Supervised by ANNISA.
This study aimed to give some considerations of interference on VSAT IP
(Very Small Aperture Terminal Internet Protocol) by using multidimensional
association rule. This study used the combinations of minimum support of 40%,
30% and 20% and minimum confidence of 50%, 60% and 80%. The result
showed that the highest value was established by the occurence of itemset 'USO'
(Universal Service Obligation) together with the dimension of ‘area’ with the
itemset ‘Area-3’ which was produced by rule USOArea-3 with the minimum
support of 40% and the confidence of 99.6%. The highest support of the whole
data was established by dimension of ‘area’ with the itemset ‘Area-3’ by the
support value of 55.62%. This means that on half of the data, interference
occurred in Area-3, comprising East Kalimantan, North Sumatera, Bali,
Bengkulu, Jambi, West Sumatera, Riau, Riau Archipelago, Bangka Belitung,
South Kalimantan, Central Kalimantan and West Kalimantan. Hence, Area-3 is
the area that needs to be considered in maintenance. Considerations of the
association result can be used to find relationship patterns from each dimension on
communications interference data.
Keywords: Association Rule, Multidimensional Association Rule.
MULTIDIMENSIONAL ASSOCIATION RULE UNTUK MELIHAT
POLA KETERKAITAN ASPEK GANGGUAN
PADA VSAT IP
TANTI NOPIANTI
Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Komputer
pada
Departemen Ilmu Komputer
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2014
Judul Skripsi : Multidimensional Association Rule untuk
Keterkaitan Aspek Gangguan pada VSAT IP
Nama
: Tanti Nopianti
NIM
: G64086033
Disetujui oleh
Annisa, S.Kom., M.Kom.
Pembimbing
Diketahui oleh
Dr Ir Agus Buono, MSi MKom
Ketua Departemen
Tanggal Lulus:
Melihat
Pola
PRAKATA
Puji dan syukur penulis panjatkan kepada Allah subhanahu wata’ala atas
segala curahan rahmat dan karunia-Nya sehingga penelitian ini berhasil
diselesaikan. Shalawat dan salam semoga senantiasa tercurah kepada Nabi
Muhammad shalallahu ‘alaihi wassalam, keluarganya, para sahabat, serta para
pengikutnya. Karya tulis ini merupakan salah satu syarat memperoleh gelar
Sarjana Komputer di Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu
Pengetahuan Alam. Judul dari karya ilmiah ini adalah Multidimensional
Association Rule untuk Melihat Pola Keterkaitan Aspek Gangguan pada VSAT
IP.
Penyelesaian penelitian ini tidak terlepas dari dukungan dan bantuan
berbagai pihak. Oleh karena itu, penulis ingin mengucapkan terima kasih sebesarbesarnya kepada:
1
Kedua orang tua tercinta Koesbiyanto dan Ibunda Suwarsih, adik Widya
Kusuma Rini, dan segenap keluarga besar penulis atas do’a, dukungan,
semangat, kasih sayang, dan perhatian yang tidak pernah berhenti diberikan
selama ini.
2
Ibu Annisa, S.Kom., M.Kom. selaku pembimbing, Ibu Dr. Imas Sitanggang,
S. Si., M. Kom. dan Bapak Hari Agung Adrianto, S.Kom., M.Kom. selaku
dosen penguji, atas waktu, ilmu, kesabaran, nasihat, dan masukan yang
diberikan.
3
Teman-teman penulis di Ekstensi Ilmu Komputer Angkatan 3, teman satu
bimbingan, serta teman-teman lain yang tidak dapat penulis sebutkan satu
per satu atas bantuan, motivasi, kebersamaan, serta semangat kepada
penulis.
4
Departemen Ilmu Komputer, Bapak/Ibu Dosen dan Tenaga Kependidikan
yang telah begitu banyak membantu baik selama pelaksanaan penelitian ini
maupun sebelumnya.
Kepada semua pihak lainnya yang telah memberikan kontribusi yang besar
selama pengerjaan penelitian ini yang tidak dapat disebutkan satu-persatu, penulis
ucapkan terima kasih banyak. Semoga karya ilmiah ini bermanfaat.
Bogor, Juni 2014
Tanti Nopianti
DAFTAR ISI
PRAKATA
vi
DAFTAR ISI
vii
DAFTAR TABEL
ix
DAFTAR LAMPIRAN
ix
PENDAHULUAN
1
Latar Belakang
1
Perumusan Masalah
1
Tujuan Penelitian
1
Manfaat Penelitian
2
Ruang Lingkup Penelitian
2
TINJAUAN PUSTAKA
2
Association Rule
2
Multidimensional Association Rule
3
Algoritme Apriori
4
Very Small Aperture Terminal (VSAT)
5
Preventive Maintenance (PM) dan Corrective Maintenance (CM)
6
Signal Quality Factor (SQF)
6
Cross Polarization Interference (CPI)
6
METODE
6
Identifikasi Masalah
6
Pengumpulan Data
7
Praproses
9
Pembangkitan Frequent Predicate Sets
9
Pembangkitan Association Rules
9
Analisis Rules
10
Lingkungan Pengembangan
10
HASIL DAN PEMBAHASAN
10
Seleksi Data
10
Pembersihan Data
10
Transformasi Data
11
Data Mining
SIMPULAN DAN SARAN
13
16
Simpulan
16
Saran
16
DAFTAR PUSTAKA
16
RIWAYAT HIDUP
31
DAFTAR TABEL
1
Contoh dimensi dalam aturan asosiasi 1 dimensi
3
2
Contoh dimensi dalam aturan asosiasi multidimensi
4
3
Data asli yang digunakan untuk awal praproses
8
4
Kategori untuk dimensi CPI
11
5
Kategori untuk dimensi SQF
11
6
Pengelompokan cakupan beberapa wilayah menjadi area
12
7
Pengelompokan beberapa pelanggan menjadi 1 kategori pelanggan
12
8
Large 1-itemset dengan minimum support 40%, 30% dan 20%.
13
9
Large 2-itemset dengan minimum support 40%, 30% dan 20%.
13
Empat aturan asosiasi dengan confidence tertinggi untuk minimum
support 20%.
14
Aturan asosiasi dengan minimum confidence di atas 50% dengan
hasil PM dan CM
15
10
11
DAFTAR LAMPIRAN
Sampel data awal sebelum dilakukan pemilihan field yang akan di
mining
17
Sampel data yang telah dilakukan pemilihan field yang akan di
mining
17
3
Large itemset dengan minimum support 40%, 30% dan 20%
18
4
Tabel hasil aturan asosiasi dengan minimum support 20% dan
minimum confidence 50%
21
Tampilan awal masukan minimum support dan minimum confidence
pada sistem.
27
Contoh keluaran ketika diberi masukan minimum support 40% dan
minimum confidence 80%
27
7
Fungsi untuk membuat kombinasi item dalam array
28
8
Fungsi untuk membuat L1
29
9
Fungsi untuk membuat L2
29
Fungsi untuk membuat L3 sampai L7
30
1
2
5
6
10
11
1
PENDAHULUAN
Latar Belakang
Dalam kesehariannya Operation Maintenance di Metrasat, sebuah instansi
dalam bidang telekomunikasi, mencatat dan menangani banyak gangguan
komunikasi, salah satunya di bagian VSAT IP (Very Small Aperture Terminal
Internet Protocol). Gangguan yang terjadi dalam setiap harinya datang dari
pelanggan yang beragam. Pihak helpdesk mencatat dan melakukan penanganan
pertama atas gangguan yang terjadi, kemudian engineer masing-masing kelompok
pelanggan akan menangani lebih lanjut pada tingkatan parameter gangguan
tertentu. Pencatatan gangguan, setiap harinya dilakukan oleh helpdesk ke dalam
sebuah sistem, begitu pula pencatatan berbagai lokasi yang telah dilakukan
kunjungan oleh teknisi untuk pengecekan perangkat.
Dalam catatan gangguan terekam lokasi gangguan, area gangguan serta
parameter yang diperlukan. Cara sederhana yang sudah dilakukan oleh perusahaan
untuk menganalisis data gangguan tersebut dengan menghitung banyaknya
gangguan dalam setiap triwulan dalam area tertentu. Hasil pengolahan aspekaspek gangguan tersebut tidak dapat memberikan kesimpulan yang dibutuhkan
seperti seberapa besar keterkaitan antar aspek-aspek gangguan. Kebijakan dalam
penanganan gangguan, masih ditempuh berdasarkan informasi singkat berupa
laporan yang didukung intuisi yang dapat mempengaruhi segala keputusan dan
strategi yang akan diambil oleh manajer. Oleh sebab itu, diperlukan adanya sistem
pendukung yang menerapkan konsep multidimensional berdasarkan data
gangguan yang telah tercatat sebelumnya agar dapat diketahui keterhubungan
antar aspek gangguan untuk bahan pengambilan keputusan.
Metode yang akan digunakan untuk melihat keterkaitan antar aspek
gangguan diharapkan dalam bentuk aturan yang mudah dipahami oleh manajer.
Salah satu metode yang sesuai adalah model Multidimensional Association Rule.
Perumusan Masalah
Berdasarkan latar belakang yang disajikan di atas dapat diambil suatu
rumusan masalah yaitu:
1
Bagaimana menentukan aturan asosiasi multidimensi dengan menggunakan
algoritme Apriori untuk mencari keterkaitan antar aspek gangguan pada
VSAT IP.
2
Bagaimana menghasilkan pola keterkaitan antar komponen gangguan
komunikasi data sebagai bahan pengambilan keputusan dengan
menggunakan algoritme Apriori.
Tujuan Penelitian
Penelitian ini bertujuan mengimplementasikan model multidimensional
association rule dengan menggunakan algoritme Apriori untuk mengetahui
keterkaitan antar aspek gangguan komunikasi data pada VSAT IP.
2
Manfaat Penelitian
Manfaat dari penelitian ini ialah menghasilkan pola keterkaitan antarkomponen dalam hasil pencegahan penanganan gangguan maupun perbaikan
dalam penanganan gangguan komunikasi data. Hasil dari pola keterkaitan tersebut
dapat digunakan sebagai bahan pengambilan keputusan.
Ruang Lingkup Penelitian
Data yang digunakan untuk melihat pola keterkaitan antar dimensi adalah
data gangguan komunikasi data sejak bulan Mei 2011 hingga September 2012.
Data tersebut berisi area lokasi gangguan, kriteria gangguan, serta waktu
terjadinya gangguan.
TINJAUAN PUSTAKA
Association Rule
Association rule mining adalah salah satu teknik data mining dan
merupakan bentuk paling umum dari penentuan pola dalam unsupervised learning
system (Kantardzic 2003). Ukuran kemenarikan yang dapat digunakan dalam
association rule mining adalah (Han dan Kamber 2006):
a
Support, suatu ukuran yang menunjukkan seberapa besar tingkat dominasi
suatu item atau itemset dari keseluruhan transaksi. Support diperoleh dengan
menggunakan persamaan:
support(A ⇒ B)
b
= P(A
=
(
B)………….(1)
)
dengan:
support(A ⇒ B)
: support item A dan B
(
)
: jumlah kemunculan item A bersamaan dengan item B
N
: jumlah seluruh transaksi
Confidence, suatu ukuran yang menunjukkan hubungan antara 2 item secara
kondisional. Confidence diperoleh dengan menggunakan persamaan:
confidence(A ⇒ B)= P(B|A)……...……(2)
=
support(
)
support( )
dengan:
confidence(A ⇒ B) : confidence item A dan B
support(A B)
: support item A dan B
support(A)
: support item A
3
Beberapa model association rule yang selama ini telah digunakan yaitu
(Han dan Kamber 2006):
a
Single level association rule. Contoh: buys(X, “computer”) ⇒ buys(X, “HP
printer”
Dalam single level association rule, jika aturan dalam sebuah set himpunan
yang diberikan tidak berdasarkan atribut pada level yang berbeda, maka
atribut tersebut berisi aturan asosiasi single-level.
b
Multilevel association rule. Contoh: buys(X, “laptop computer”) ⇒ buys(X,
“HP printer”)
Perbedaan dengan poin sebelumnya, bahwa dalam multilevel association
rule menunjuk kepada aturan pada level yang berbeda yakni computer
berada pada tingkatan di atas laptop computer.
c
Interdimensional association rule. Contoh: age(X, “20...29”) ⋀
occupation(X, “student”) ⇒ buys(X, “laptop”)
Aturan tersebut mengandung 3 predikat (age, occupation, dan buys).
Interdimensional association rule adalah aturan dalam multidimensional
association rule dengan tanpa perulangan predikat.
d
Hybrid-dimensional association rule. Contoh: age(X, “20...29”) ⋀ buys(X,
“laptop”) ⇒ buys(X, “HP printer”)
Ada 2 macam model untuk multidimensional association rule, yang
membedakan dari keduanya adalah pada interdimensional association rule tidak
diperbolehkan adanya pengulangan predikat/dimensi yang sama pada sebuah rule,
sementara hybrid-dimensional association rule memperbolehkan terjadinya
pengulangan predikat sebuah rule (Han dan Kamber 2006).
Multidimensional Association Rule
Sebuah association rule yang terdiri atas 2 atau lebih dimensi atau predikat
dapat disebut multidimensional association rule. Dalam multidimensional
association rule, setiap atribut berperilaku sebagai sebuah dimensi. Setiap
predikat yang berbeda pada sebuah rule adalah sebuah dimensi yang berbeda pula.
Contoh dimensi dalam aturan asosiasi satu dimensi dapat dilihat pada Tabel 1.
Tabel 1 Contoh dimensi dalam aturan asosiasi 1 dimensi
Dimensions
Id/Row Itemsets
buy
1
Item1, Item2
buy
2
Item3
buy
3
Item2, Item5
Pada aturan 1 dimensi, pencarian fokus pada frequent itemset untuk
mengetahui seberapa banyak kemunculan item dalam keseluruhan baris. Contoh
dimensi dalam aturan asosiasi multidimensi dapat dilihat pada Tabel 2.
4
Tabel 2 Contoh dimensi dalam aturan asosiasi multidimensi
Dimensi/Predicates Rows
age, buy
1, 2
income
3
buy, occupation
2, 5
Pada aturan multidimensi, pencarian fokus pada frequent predicate set.
Pencarian tersebut untuk mengetahui seberapa banyak kemunculan item dalam
dimensi tersebut dalam keseluruhan data.
Algoritme Apriori
Algoritme apriori menghitung frequent itemsets dalam basis data melalui
beberapa iterasi. Iterasi i menghitung semua frequent i-itemsets (itemsets dengan
element i). Tiap iterasi memiliki 2 langkah: candidate generation dan candidate
counting and selection.
Pada fase pertama dalam iterasi pertama, set yang dibangkitkan dari
candidate itemset mengandung semua 1-itemsets (dalam hal ini semua item dalam
dataset). Pada fase candidate counting, algoritme akan menghitung support dan
mencari lagi candidate itemset dalam keseluruhan basis data. Kemudian pada
akhirnya, hanya 1-itemsets dengan minimum support tertentu yang memenuhi
threshold yang dipilih sebagai 1-frequent item.
Berdasarkan pengetahuan tentang infrequent itemsets yang diperoleh dari
iterasi sebelumnya, algoritme Apriori mereduksi set dari candidates itemsets
dengan pruning (menggunakan Apriori) candidate itemsets yang tidak frequent.
Pruning dilakukan berdasarkan observasi bahwa jika sebuah itemset adalah
frequent maka semua subsetnya adalah frequent sehingga sebelum memasuki step
perhitungan kandidat, algoritme ini tidak melihat candidate itemsets yang
memiliki subset yang tidak frequent. Proses iterasi Apriori akan berhenti ketika
tidak ada lagi kandidat i-itemsets yang dapat disilangkan.
Berikut adalah algoritme Apriori yang digunakan untuk mencari frequent
itemsets dengan menggunakan iterasi (Han dan Kamber 2006).
(1) L1 = find_frequent_1-itemsets (D);
(2) for (k=2; Lk-1 ≠ Ø; k++) {
(3)
Ck = apriori_gen (Lk-1);
D { //scan D for counts
(4)
for each transaction t
(5)
Ct = subset(Ck,t); //get the subsets of t that are
candidates
(6)
for each candidate c
Ct
(7)
c.count++;
(8)
}
(9)
Lk = {c
Ck | c.count
min_sup}
(10) }
(11) return L = kLk;
5
Procedure apriori_gen(Lk-1:frequent (k-1) –itemsets)
Lk-1
(1) for each itemset l1
(2) for each itemset l2
Lk-1
(3)
if(l1[1] = l2[1])
(l1[2] = l2[2])
…
(l1[k-2] =
(l1[k-1] < l2[k-1]) then {
l2[k-2])
(4)
c = l1 x l2; // join step: generate candidates
(5)
if has_infrequent_subset(c, Lk-1) then
(6)
delete c; //prune step: remove unfruitful
candidate
(7)
else add c to Ck;
(8)
}
(9) return Ck;
procedure has_infrequent_subset(c: candidate k-itemset;
Lk-1: frequent(k-1)-itemsets); //use prior knowledge
(1) for each(k-1)-subset s of c
(2) if s
Lk-1 then
(3)
return TRUE;
(4) return FALSE;
a
b
c
d
e
f
g
h
Beberapa istilah yang digunakan dalam algoritme Apriori antara lain:
Support untuk aturan asosiasi adalah perbandingan banyaknya kejadian pada
basis data ketika sekumpulan item A dan sekumpulan item B terdapat pada
sebuah transaksi. Definisi dari support, yaitu sebagai berikut:
Probabilitas atribut atau kumpulan atribut A dan B yang terjadi secara
bersamaan.
Confidence adalah kuatnya hubungan antar item dalam aturan asosiasi.
Minimum support adalah parameter yang digunakan sebagai batasan
frekuensi kejadian atau support count yang harus dipenuhi suatu kelompok
data untuk dapat dijadikan aturan
Minimum confidence adalah parameter yang digunakan untuk
mendefinisikan minimum nilai kepercayaan yang harus dipenuhi.
Itemset: Kelompok item.
Support count adalah frekuensi kejadian untuk sebuah kelompok item dari
keseluruhan transaksi.
Candidate itemsets adalah itemset yang akan dihitung support countnya.
Large itemset adalah itemset yang sudah melewati batas minimum support
yang telah diberikan.
Very Small Aperture Terminal (VSAT)
Very Small Aperture Terminal (VSAT) digambarkan dengan terminalterminal penerima/pengirim sinyal berupa stasiun bumi satelit kecil berdiameter
antara 0.9 sampai dengan 3.8 meter yang digunakan untuk melakukan
6
pengiriman/penerimaan data, gambar maupun suara via satelit. Satelit berfungsi
sebagai penerus sinyal untuk dikirimkan ke titik lainnya di atas bumi.
Teknologi VSAT pertama kali dikenal di Amerika Serikat pada awal tahun
1980-an. VSAT masuk pertama kali ke Indonesia tahun 1989 seiring dengan
bermunculannya bank-bank swasta yang sangat membutuhkan sistem komunikasi
online seperti Automated Teller Machine (ATM) (Satkomindo 2008).
Preventive Maintenance (PM) dan Corrective Maintenance (CM)
Preventive Maintenance (PM) dapat diartikan sebagai suatu bentuk
penanganan pencegahan gangguan komunikasi. PM dilakukan untuk perawatan
dan perbaikan oleh teknisi dalam menangani perangkat dan fasilitas yang ada di
lokasi dalam hal memuaskan kondisi pengoperasian dengan cara inspeksi, deteksi
dan koreksi galat sebelum terjadi yang lebih mayor. Maintenance termasuk ke
dalamnya adalah testing, pengukuran, dan pengecekan perangkat. Corrective
Maintenance (CM) dapat diartikan sebagai bentuk tindakan perbaikan karena
adanya gangguan di suatu lokasi (Hughes 2006).
Signal Quality Factor (SQF)
Signal Quality Factor (SQF) adalah sebuah ukuran dalam penerimaan
kekuatan sinyal yang diterima. Ukurannya berkisar antara 0 point sampai 99 point.
SQF merupakan ukuran kualitas, dan tidak mempengaruhi kecepatan jaringan
ataupun bandwidth. SQF dapat dipengaruhi oleh cuaca yang sedang terjadi di
lokasi, misalnya ketika hujan, nilai SQF yang didapatkan berkisar pada nilai di
bawah 60 point. Jika cuaca sangat mendung, ukuran kualitas sinyal berada di nilai
minimum 61 point. Ketika cuaca cerah maka nilai ukuran kualitas sinyal yang
mungkin didapatkan antara nilai 75 point ke atas. Dengan melakukan pointing
yang baik, maka akan didapatkan SQF yang baik pula dan SQF akan dikatakan
sangat baik jika nilainya lebih dari dan sama dengan 85 point (Hughes 2006).
Cross Polarization Interference (CPI)
Cross Polarization Interference (CPI) adalah sebuah pengaturan sudut arah
rambat transmisi ke satelit. Pengukuran CPI bertujuan untuk tes pengiriman data
atau transmit data dan juga untuk memaksimalkan gelombang, apakah sudah
mencapai hasil yang ditetapkan seperti nilai CPI minimal yaitu 30dB (Hughes
2006).
METODE
Identifikasi Masalah
Pelanggan yang menggunakan modem HX50 sebanyak 4000 titik pelanggan
yang tersebar di seluruh wilayah di Indonesia. Banyaknya jenis kategori
pelanggan dan wilayah/lokasi dengan kondisi cuaca tidak menentu dan faktor
eksternal di lokasi dapat mempengaruhi adanya gangguan komunikasi data.
7
Salah satu solusi dalam penanganan permasalahan pada gangguan
komunikasi data tersebut adalah dengan membuat suatu aplikasi yang dapat
menghasilkan aturan untuk mempermudah analisis terhadap atribut-atribut yang
berkaitan dengan penentuan preventive maintenance atau corrective maintenance.
Pelaksanaan penelitian ini meliputi beberapa tahapan proses yang
digambarkan melalui suatu metode penelitian pada Gambar 1.
Mulai
Identifikasi
Masalah
Pengumpulan
Data
Praproses
Algoritme Apriori
Pembangkitan
Frequent Predicate
Sets
Pembangkitan Aturan
Asosiasi
Analisis Aturan
Asosiasi
Selesai
Gambar 1 Tahapan proses pada metode penelitian
Pengumpulan Data
Data yang digunakan pada penelitian ini adalah data pengecekan CPI dan
hasil SQF dari bulan Mei 2011 sampai September 2012 untuk pelanggan yang
menggunakan modem HX50, pada ruang lingkup pelanggan, provinsi, CPI dan
SQF. Terdapat 2249 record gangguan dari sekitar 4000 titik pelanggan. Pelanggan
yang memiliki nilai SQF di bawah 75 dan CPI di bawah nilai 30 sudah termasuk
ke dalam data gangguan, dan segera dilakukan PM agar nilai SQF dan CPI normal
kembali.
Pengumpulan data dilakukan dengan melakukan transmit dengan
memasukkan serial number modem yang digunakan di lokasi tersebut dan di atur
dengan frekuensi yang sama pada spektrum, lalu nilai CPI yang tertera pada layar
spektrum dilihat. Pengecekan SQF dan CPI terhadap titik pelanggan hanya bisa
8
dilakukan ketika titik pelanggan tersebut dalam keadaan menyala atau indikator
pada monitoring system terdeteksi warna hijau. Karena ketika keadaan modem
tidak menyala, tidak ada transmit ataupun receive pada link tersebut sehingga
tidak dapat dilakukan pengukuran. Contoh data asli yang telah dikumpulkan dapat
dilihat pada Tabel 3.
Tabel 3 Data asli yang digunakan untuk awal praproses
No
Lokasi
Provinsi
Pelanggan
SQF CPI
Tanggal
Transmit
1
BPR
Karanggeneng
Jatim
BPR
64
13
12/14/2011 PM
2
ATM BRI
Pamela VI
Yogyakarta
DIY
BRI
91
32
12/14/2011 PM
3
KPC Muara
Teweh
Kalteng
POSINDO
15
28
12/4/2011
PM
4
USO
Kec.Pagar
Merbau Deli
Serdang
Sumut
USO
92
34
12/3/2011
PM
5
…
…
…
…
…
…
…
*PM: Preventive Maintenance
PM /
CM*
CM: Corrective Maintenance
Dalam Tabel 3, dapat dilihat ada 7 kolom data yang digunakan. Data
tersebut perlu diolah terlebih dahulu dengan melakukan transformasi data,
sehingga kolom-kolom dalam data asli nantinya akan berubah sesuai dengan
transformasi yang dilakukan. Kolom data dalam tabel akan menjadi dimensi
dalam data mining.
Data asli kemudian ditransformasi menjadi beberapa dimensi, yakni,
dimensi area (transformasi dari kolom provinsi), kategori pelanggan (transformasi
dari kolom pelanggan), CPI, SQF, waktu, tahun, dan kategori PM/CM. Dimensi
area yang bertransformasi dari kolom provinsi mengelompokkan lokasi tersebut
berada pada wilayah yang banyak mengalami gangguan atau tidak. Dimensi
kategori pelanggan mengelompokkan pelanggan berdasarkan kategori agar
sebaran data tidak terlalu luas. Nilai dimensi CPI dan SQF menunjukkan apakah
pelanggan tersebut ada pada kondisi lingkungan dengan penerimaan sinyal yang
baik. Dimensi waktu dan tahun menunjukkan kapan terjadinyagangguan, sehingga
waktu sebaran gangguan yang terjadi per tahun dapat diketahui. Setelah itu,
dimensi-dimensi yang telah disebutkan tadi akan menentukan dalam hal
pengambilan keputusan bahwa apakah lokasi-lokasi dalam area tertentu dengan
nilai SQF dan CPI tertentu, akan dilakukan maintenance dengan kategori PM atau
CM dengan tingkat kepercayaan di atas minimum confidence dan minimum
support yang telah ditentukan.
9
Praproses
Pada tahap praproses dilakukan proses pengolahan data perusahaan ke
dalam format yang siap di mining. Dalam tahapan ini dilakukan penggabungan
data dalam berbagai dimensi, seperti data pelanggan, data wilayah, data SQF dan
CPI. Selain itu, ditentukan pula dimensi-dimensi yang dipilih dan akan digunakan
untuk diproses. Keluaran dari praproses ini akan dilanjutkan ke Generate
Frequent Predicate Sets.
Pembangkitan Frequent Predicate Sets
Pada tahapan ini dilakukan proses pencarian item yang sering muncul secara
bersamaan dan dalam tahapan ini telah ditentukan nilai minimum support yang
dijadikan ukuran. Pencarian frequent itemsets/frequent predicate sets dilakukan
dengan menggunakan algoritme Apriori dengan iterasi berdasarkan pembentukan
kandidat.
Penerapan algoritme Apriori pada masing-masing kandidat digunakan untuk
diterapkan pada data pengecekan CPI dan SQF, seperti berikut:
1
Menentukan field yang akan dikorelasikan
2
Menentukan data value
3
Menentukan minimum support dan minimum confidence
4
Membentuk kombinasi berdasarkan field terpilih dengan data value yang
ditentukan.
5
Memberikan syarat jika support ≤ minimum support, maka itemset yang
tidak memenuhi akan dipangkas.
6
Membangkitkan rules dari tiap korelasi yang memenuhi minimum support
yang ditentukan.
Pembangkitan Association Rules
Pada tahap ini dilakukan proses pembentukan atau pencarian aturan asosiasi
dengan masukan hasil dari frequent itemsets dan minimum confidence yang akan
menghasilkan aturan asosiasi. Ketika frequent itemsets telah didapatkan, maka
akan dibentuk aturan asosiasi kuat yang memenuhi minimum support dan
minimum confidence.
Aturan asosiasi dapat dibentuk dengan algoritme seperti berikut:
1
Dalam setiap frequent itemset l, bangkitkan semua subset yang tidak kosong
dari l.
2
Dalam setiap subset s yang tidak kosong dari l, dihasilkan aturan “s => (lsupport ount (l)
s)” jika support
confidence.
ount (s)
min_conf, min_conf adalah nilai batas minimum dari
10
Analisis Rules
Aturan yang dihasilkan kemudian dianalisis untuk dijadikan bahan
pertimbangan dalam penentuan maintenance melalui keterkaitan variabel-variabel
yang telah di-mining.
Lingkungan Pengembangan
a
b
Lingkungan pengembangan sistem adalah sebagai berikut:
Perangkat lunak: sistem operasi Windows 8, PHP, MySQL, XAMPP,
Browser, Microsoft Office Excel 2010.
Perangkat keras: prosesor Intel® Core™ i3 CPU 2.20GHz, memori 4GB,
harddisk 500 GB.
HASIL DAN PEMBAHASAN
Penelitian dilakukan dengan mengacu pada metodologi yang telah
disebutkan pada bab sebelumnya, yaitu meliputi tahapan seleksi data,
pembersihan data dan transformasi data.
Seleksi Data
Tahap pertama adalah melakukan seleksi data terhadap data yang akan
digunakan dalam proses data mining. Data yang digunakan pada penelitian ini
adalah data pengecekan gangguan dari bulan Mei 2011 sampai September 2012
sebanyak 2249 record data, mencakup area, kategori pelanggan, CPI, SQF, waktu,
tahun, dan kategori PM/CM. Data tersebut didapatkan dari helpdesk maintenance
dalam format Excel.
Dari keseluruhan gangguan yang terjadi, hanya dipilih gangguan dengan
lokasi-lokasi yang menggunakan modem jenis HX50 saja. Penentuan akhir dari
setiap gangguan yang terjadi adalah pada kolom kategori, yakni apakah akan
dilakukan Preventive Maintenance (PM) atau Corrective Maintenance (CM).
Pembersihan Data
Data dalam format Microsoft Excel diubah formatnya menjadi DBMS
MySQL untuk memudahkan dalam pengolahan data. Data tersebut dibersihkan
dari beberapa hal berikut:
Data yang tidak lengkap. Contohnya, masukan kota yang tidak disertai
dengan provinsi harus dilengkapi untuk memenuhi kolom area.
Kesalahan pengetikan. Contohnya, terdapat karakter lebih atau kurang pada
penulisan kategori pelanggan
Kesalahan masukan. Contohnya, masukan isian tanggal pada kolom
pelanggan.
Data yang terjadi karena kesalahan pengetikan atau kesalahan masukan akan
dihapuskan, karena tidak mungkin dilakukan penggantian dengan random data.
11
Transformasi Data
Pada tahap ini dilakukan pengkodean data numerik ke kategorik untuk
beberapa dimensi data. Data yang dikonversi adalah pada dimensi CPI, SQF,
Waktu, dan Tahun. Data pada dimensi CPI yang tersebar antara nilai 1-99,
dikonversi menjadi kategorik (Tabel 4).
Tabel 4 Kategori untuk dimensi CPI
Nilai Bawah
Nilai Atas
Deskripsi
1
19
Kriteria 1
20
24
Kriteria 2
25
29
Kriteria 3
29
99
Normal
Pengelompokkan pada dimensi CPI ditentukan berdasarkan analisis
manajer. Kriteria 1, Kriteria 2, Kriteria 3 dan Normal digunakan untuk
memudahkan penentuan PM dan CM. Nilai pada Kriteria 1 adalah yang terburuk,
dengan nilai CPI antara 1-19, maka titik pelanggan yang memiliki CPI pada
Kriteria 1 akan diprioritaskan lebih utama daripada Kriteria 2 dan Kriteria 3 untuk
dilakukan maintenance.
Data pada dimensi SQF yang tersebar antara nilai 0-99 dikodekan menjadi
kategorik yang dapat dilihat pada Tabel 5.
Tabel 5 Kategori untuk dimensi SQF
Nilai Bawah
Nilai Atas
Deskripsi
0
30
wrong polarity
31
60
very bad
61
74
bad
75
84
good
85
99
very good
Pada dimensi waktu, rentang antara bulan Januari hingga Desember dibagi
menjadi Triwulan I, Triwulan II, Triwulan III dan Triwulan IV. Perlakuan yang
sama dilakukan untuk dimensi Tahun dibagi menjadi tahun 2011 dan tahun 2012.
Untuk wilayah (kota atau provinsi) dipersempit cakupannya menjadi beberapa
area seperti pada Tabel 6.
12
Tabel 6 Pengelompokan cakupan beberapa wilayah menjadi area
Area
Wilayah
Area-1
Jakarta, Bogor, Depok, Tangerang,
Bekasi, Jabar, Banten, Jateng, Jatim,
Yogyakarta
Area-2
Lampung, Sumsel, Bali, Bengkulu,
Jambi, Sumbar, Riau, Kepri, Babel,
Batam, Kalsel, Kalteng, Kalbar
Area-3
Kaltim, Sumut, NAD, Sulbar, Sultra,
Sulsel, NTB, NTT, Sulut, Sulteng,
Gorontalo
Area-4
Maluku
Area-5
Papua
Pengelompokkan area menjadi 5 kategori diambil berdasarkan data internal
di Divisi Metrasat. Wilayah tersebut sudah ditentukan berdasarkan persebaran
keseluruhan pelanggan yang ada di Divisi Metrasat. Dalam penelitian ini,
pelanggan dikategorikan berdasarkan penyebarannya seperti pada Tabel 7.
Tabel 7 Pengelompokan beberapa pelanggan menjadi 1 kategori pelanggan
Kategori Pelanggan
Pelanggan
Dephan
TNI, Emiliter, Dephan
Kantor Pos
Posindo
Kepolisian
Polda
Kesehatan
Depkes, Askes, Admedika
Oil & Gas
Pertagas, Pertamina, Medco, Petrosea,
PT.Metco Pertamina
Pemerintahan
Adminduk, Deptan, Kejari, PLN,
Dispenduk, Depag, Bulog, Pajak, BKD,
Pemkab Tuban, Pegadaian, Pemkab,
Pemprov DKI
Perbankan
BRI Unit, BNI, BTN, BCA Syariah,
BPR, BPD Papua, Bank Nisp, BPD
Sulteng, BPR Sultra, BII, ATM Niaga,
Bank Jatim, BRI, CIMB Niaga, Bank
Panin, BNI ATM, BRI Teras, BPD, BRI
ATM, BCA, Bank Muamalat
Perkebunan
PT. MSL, PT.Inalum
Telekomunikasi
Gerai Halo
USO
USO, USO_Trial, Koperasi Nasari,
KSU Mekar Jaya, Koperasi Nasari
Tumpang Raya, USO PLIK
13
Data Mining
Data terdiri atas 7 dimensi (Area, Pelanggan, SQF, CPI, Waktu, Tahun dan
Kategori PM/CM) yang digunakan untuk proses mining. Beberapa dimensi pada
data, sudah dibuat dengan tipe kategorik. Tabel data asli dan data yang sudah
ditransformasi dapat dilihat pada Lampiran 1 dan Lampiran 2. Tahapan asosiasi
dibagi menjadi 2 tahap, yaitu mencari frequent itemset dan pembentukan aturan
asosiasi.
1
Frequent Itemset
Minimum support yang digunakan dalam penelitian ini adalah 40%, 30%
dan 20%. Hal ini digunakan untuk melihat seberapa sering kemunculan itemset
dalam data dan dihitung rasio antara kemunculannya dengan total jumlah record
data. Keseluruhan pembentukan large itemset untuk minimum support 40%, 30%
dan 20% dapat dilihat pada Lampiran 3.
1.1
Large 1-itemset
Pada iterasi 1-itemset, support yang memenuhi minimum support 40%, 30%
dan 20% dapat dilihat pada Tabel 8. Berdasarkan tabel tersebut, dapat dilihat
bahwa dari keseluruhan data, gangguan terbanyak terjadi pada Area-3 di Triwulan
2 dan di Tahun 2011.
Tabel 8 Large 1-itemset dengan minimum support 40%, 30% dan 20%.
1.2
Dimensi
Rows
Support
Persen
Support
Area
tahun
periode
pm_cm
pm_cm
kat_pelanggan
tahun
Area-3
Tahun 2011
Triwulan 2
PM
CM
USO
Tahun 2012
1251
1245
1200
1192
1057
1006
1004
55.62%
55.36%
53.36%
53 %
47 %
44.73%
44.64%
Large 2-itemset
Pada iterasi 2-itemset untuk minimum support 40%, 30% dan 20%,
dihasilkan 2 kombinasi yang dapat dilihat pada Tabel 9.
Tabel 9 Large 2-itemset dengan minimum support 40%, 30% dan 20%.
Dimensi
Rows
Support
Persen
Support
area,
kat_pelanggan
Area-3,USO
1002
44.55%
periode, tahun
Triwulan
2,Tahun 2011
907
40.33%
14
Berdasarkan hasil pada Tabel 9, kemunculan item Area-3 dalam dimensi
area bersamaan dengan kemunculan item USO dalam dimensi kategori pelanggan
mencapai support tertinggi untuk iterasi kedua. Hal ini mengindikasikan bahwa
untuk kategori pelanggan USO banyak terjadi gangguan di Area-3.
2
Pembentukan Aturan Asosiasi
2.1 Pembentukan Large Itemset dengan Minimum Support 40%, 30% dan
20%
Aturan asosiasi untuk minimum support 20% dan minimum confidence 50%
diberikan pada Lampiran 4. Akan tetapi, aturan asosiasi yang dipilih hanya aturan
asosiasi dengan confidence yang tinggi dan support yang baik pula, maka diambil
contoh untuk 4 aturan teratas dari confidence yang tertinggi (Tabel 10).
Tabel 10 Empat aturan asosiasi dengan confidence tertinggi untuk minimum
support 20%.
Dimensi
Rules
Confidence (%)
area,kat_pelanggan
USO Area-3
99.6
area, kat_pelanggan
Area-3 USO
80.1
pm_cm, tahun
CM Tahun 2011
78.33
pm_cm, tahun
Tahun 2012 PM
77.19
Confidence tertinggi dibentuk oleh aturan kemunculan dimensi area karena
kemunculan dimensi kategori pelanggan. Confidence aturan ini cukup besar yaitu
99.6%. Dari aturan tersebut dapat dikatakan bahwa untuk melihat seberapa sering
sebuah kategori pelanggan muncul di sebuah area, cukup dengan melihat kategori
pelanggan USO, karena mayoritas gangguan di Area-3, terjadi karena gangguan
pada kategori pelanggan USO.
2.2 Aturan asosiasi dengan Minimum Confidence > 50% dengan hasil PM
dan CM
Aturan asosiasi dengan minimum confidence di atas 50% yang
menghasilkan aturan yang mengandung item PM dan CM dapat dilihat pada Tabel
11. Berdasarkan aturan 1 pada Tabel 11 yaitu Area-3,Tahun 2012 PM, dapat
dinyatakan bahwa item Area-3 dalam dimensi area muncul bersamaan dengan
item Tahun 2012 dalam dimensi tahun yang menghasilkan PM. Dalam aturan 1
tersebut menghasilkan confidence tertinggi dengan nilai 83.79%. Serta
kemunculan item Area-3 dalam dimensi area bersamaan dengan kemunculan item
Triwulan 2 dalam dimensi periode, dan Tahun 2011 dalam dimensi tahun yang
menghasilkan CM dengan aturan Area-3,Triwulan 2,Tahun 2011 CM,
mencapai confidence tertinggi dengan nilai 77.91%. Hal ini mengindikasikan
bahwa pada Tahun 2012, PM banyak terjadi untuk Area-3 dengan tingkat
keyakinan sebesar 83.79%. Lalu pada Triwulan 2 di Tahun 2011, CM banyak
terjadi juga di Area-3.
15
Tabel 11 Aturan asosiasi dengan minimum confidence di atas 50% dengan hasil
PM dan CM
Dimensi
area, pm_cm,tahun
area, periode,
pm_cm, tahun
periode, pm_cm,
tahun
area, pm_cm, tahun
pm_cm, tahun
area, periode,
pm_cm
periode, pm_cm
area, kat_pelanggan,
pm_cm
kat_pelanggan,
pm_cm
area, pm_cm
Rules
Area-3,Tahun
2012 PM
Area3,Triwulan
2,Tahun 2011
CM
Triwulan
2,Tahun 2011
CM
Area-3,Tahun
2011 CM
Tahun 2011
CM
Area3,Triwulan 2
CM
Triwulan 2
CM
Area-3,USO
PM
Confidence (%)
83.79
77.91
73.87
69.49
66.51
64.33
63.42
58.28
USO PM
58.25
Area-3 PM
53.64
Tampilan awal sistem untuk menghasilkan aturan asosiasi pada gangguan
VSAT IP dapat dilihat dalam Lampiran 5. Pada halaman tersebut, terdapat
masukan mengenai threshold minimum support dan minimum confidence yang
telah ditentukan. Proses pembangkitan frequent predicate sets selanjutnya dapat
dilihat dalam Lampiran 6. Pada halaman tersebut dapat dilihat list itemset dengan
minimum support yang telah ditentukan serta aturan-aturan asosiasi yang telah
terbentuk berdasarkan minimum confidence yang telah ditentukan serta list itemset
yang telah melalui proses pruning. Dalam aturan asosiasi, item dalam itemset
dikombinasikan satu sama lain untuk dilakukan proses pruning dengan memenuhi
threshold nilai minimum support menggunakan fungsi kombinasi yang dapat
dilihat dalam Lampiran 7. Setelah proses pruning dilalui, maka proses selanjutnya
adalah pembentukan aturan asosiasi berdasarkan list itemset yang memenuhi
minimum support. Fungsi pembentukan Large Itemset-1 dapat dilihat pada
Lampiran 8, pembentukan Large Itemset-2 dapat dilihat pada Lampiran 9 dan
pembentukan Large Itemset-n dapat dilihat pada Lampiran 10.
16
SIMPULAN DAN SARAN
Simpulan
Setelah percobaan dengan minimum support 40%, 30% dan 20% serta
minimum confidence 50%, 60% dan 80% dilakukan, ditemukan support tertinggi
(55.62%) terdapat pada dimensi ‘area’ dengan itemset ‘Area-3’. Berarti lebih dari
setengah gangguan terjadi wilayah Provinsi Kalimantan Timur, Sumatera Utara,
Bali, Bengkulu, Jambi, Sumatera Barat, Riau, Kepulauan Riau, Bangka Belitung,
Kalimantan Selatan, Kalimantan Tengah dan Kalimantan Barat.
Nilai confidence tertinggi sebesar 99.6% didapatkan pada minimum support
40%, yang dihasilkan oleh aturan USO Area-3 . Hal ini dapat bermakna bahwa
banyak terjadi gangguan pada Area-3 pada kategori pelanggan USO.
Aturan Area-3,Tahun 2012 PM (support 40% dan confidence 83.79%),
menjelaskan bahwa kondisi PM (Preventive Maintenance) banyak terjadi pada
Tahun 2012 di Area-3. Disisi lain, kondisi CM (Corrective Maintenance) banyak
ditemukan pada Triwulan 2 di Tahun 2011 di Area-3 sebagaimana diperlihatkan
oleh aturan Area-3,Triwulan 2,Tahun 2011 CM (confidence 77.91%).
Dengan banyaknya CM pada tahun 2011, dan menurunnya confidence untuk
CM di Area-3 di tahun 2012, maka dalam hal ini, penentu kebijakan telah dapat
mengambil kesimpulan bahwa Area-3 adalah area yang perlu diperhatikan dalam
PM dan CM, dan pelanggan USO adalah pelanggan yang paling sering mengalami
gangguan. Penelitian ini sudah dapat menghasilkan aturan asosiasi berdasarkan
metode aturan asosiasi multidimensional.
Saran
Untuk penelitian selanjutnya dapat dikombinasikan aturan asosiasi
multidimensional dengan multilevel untuk mendapatkan pola asosiasi yang lebih
menarik.
DAFTAR PUSTAKA
Abadi B. 2007. Model Rule: Multilevel and Multidimension Association Rule
untuk Analisa Market Basket pada PT. Maha Agung [skripsi]. Surabaya
(ID): Universitas Kristen Petra Surabaya.
Han J, Kamber M. 2006. Data Mining: Concepts and Techniques, Ed ke-2. San
Fransisco (US): Morgan Kaufmann.
Hughes. 2006. Hughes HX50 Broadband Terminal. Washington (US): Hughes.
Kantardzic M. 2003. Data Mining: Concepts, Models, Methods and Algorithms.
New Jersey (US): Wiley.
Satkomindo. 2008. Pengertian Jaringan VSAT. [Internet]. [diunduh pada 2012 Jan
28]. Tersedia pada: http://www.satkomindo.com/indo/vsat.html.
17
Lampiran 1 Sampel data awal sebelum dilakukan pemilihan field yang akan di
mining
No
Lokasi
Prov
Pelanggan
SQF
CPI
Tanggal
Transmit
PM
/
CM
1
BPR
Karanggeneng
JATIM
BPR
64
13
12/14/2011
PM
2
ATM BRI
Pamela VI
Yogyakarta
DIY
BRI
91
32
12/14/2011
PM
3
KPC Muara
Teweh
KALTENG
POSINDO 15
28
12/4/2011
PM
4
USO
Kec.Pagar
Merbau Deli
Serdang
SUMUT
USO
92
34
12/3/2011
PM
5
…
…
…
…
…
…
…
Lampiran 2 Sampel data yang telah dilakukan pemilihan field yang akan di
mining
No
Area
Kategori
Pelanggan
SQF
CPI
Waktu
Tahun
PM /
CM
1
Area1
PERBAN
KAN
Bad
Kriteria
1
Triwulan
4
2011
PM
2
Area1
PERBAN
KAN
Very Good
Normal
Triwulan
4
2011
PM
3
Area2
KANTOR
POS
Wrong
Polarization
Kriteria
3
Triwulan
4
2011
PM
4
Area3
USO
Very Good
Normal
Triwulan
4
2011
PM
5
…
…
…
…
…
…
…
18
Lampiran 3 Large itemset dengan minimum support 40%, 30% dan 20%
Itemset Dimensi/Fields
1
1
1
1
1
1
1
1
area
tahun
periode
pm_cm
pm_cm
kat_pelanggan
tahun
kat_sqf
Rows
Persentase
Support Support
(%)
Minimum
Support
Area-3
1251
55.62
40%, 30%,
20%
Tahun 2011
1245
55.36
40%, 30%,
20%
Triwulan 2
1200
53.36
40%, 30%,
20%
PM
1192
53
40%, 30%,
20%
CM
1057
47
40%, 30%,
20%
USO
1006
44.73
40%, 30%,
20%
Tahun 2012
1004
44.64
40%, 30%,
20%
Very Good
940
41.8
40%, 30%,
20%
1
kat_cpi
Normal
786
34.95
30%, 20%
1
kat_sqf
Good
737
32.77
30%, 20%
1
kat_cpi
Kriteria 3
677
30.1
30%, 20%
1
kat_pelanggan
KANTOR POS
674
29.97
20%
1
area
Area-1
584
25.97
20%
1
periode
Triwulan 3
573
25.48
20%
2
area,
kat_pelanggan
Area-3, USO
1002
44.55
40%, 30%,
20%
periode, tahun
Triwulan 2,
Tahun 2011
907
40.33
40%, 30%,
20%
pm_cm, tahun
CM, Tahun
2011
828
36.82
30%, 20%
pm_cm, tahun
PM, Tahun
2012
775
34.46
30%, 20%
area, periode
Area-3,
Triwulan 2
771
34.28
30%, 20%
Triwulan 2, CM
761
33.84
30%, 20%
2
2
2
2
2
periode,
pm_cm
19
Lanjutan
Itemset Dimensi/Fields
Rows
Persentase
Support Support
(%)
Minimum
Support
area, tahun
Area-3, Tahun
2011
708
31.48
30%, 20%
area, pm_cm
Area-3, PM
671
29.84
20%
kat_sqf, tahun
Very Good,
Tahun 2011
638
28.37
20%
2
kat_pelanggan,
periode
USO, Triwulan
2
616
27.39
20%
2
kat_pelanggan,
pm_cm
USO, PM
586
26.06
20%
2
area, pm_cm
Area-3, CM
580
25.79
20%
area, kat_sqf
Area-3, Very
Good
571
25.39
20%
kat_sqf,
periode
Very Good,
Triwulan 2
549
24.41
20%
area, tahun
Area-3, Tahun
2012
543
24.14
20%
2
kat_pelanggan,
tahun
USO, Tahun
2011
541
24.06
20%
2
kat_sqf,
pm_cm
Very Good, CM
517
22.99
20%
2
kat_pelanggan,
kat_sqf
USO, Very
Good
501
22.28
20%
2
kat_cpi,
pm_cm
Normal, PM
470
20.9
20%
2
kat_pelanggan,
tahun
USO, Tahun
2012
465
20.68
20%
2
area, kat_cpi
Area-3, Normal
457
20.32
20%
2
kat_sqf,
periode
Good, Triwulan
2
451
20.05
20%
periode,
pm_cm, tahun
Triwulan 2,
CM, Tahun
2011
670
29.79
20%
Area-3, USO,
Triwulan 2
614
27.3
20%
2
2
2
2
2
2
3
3
area,
kat_pelanggan,
periode
20
Lanjutan
Itemset Dimensi/Fields
3
3
area,
kat_pelanggan,
pm_cm
area, periode,
tahun
Rows
Persentase
Support Support
(%)
Minimum
Support
Area-3, USO,
PM
584
25.97
20%
Area-3,
Triwulan 2,
Tahun 2011
584
25.97
20%
3
area,
kat_pelanggan,
tahun
Area-3, USO,
Tahun 2011
537
23.88
20%
3
area,
kat_pelanggan,
kat_sqf
Area-3, USO,
Very Good
500
22.23
20%
3
area, periode,
pm_cm
Area-3,
Triwulan 2, CM
496
22.05
20%
3
area, pm_cm,
tahun
Area-3, CM,
Tahun 2011
492
21.88
20%
kat_sqf,
pm_cm, tahun
Very Good,
CM, Tahun
2011
469
20.85
20%
3
area,
kat_pelanggan,
tahun
Area-3, USO,
Tahun 2012
465
20.68
20%
3
kat_pelanggan,
periode, tahun
USO, Triwulan
2, Tahun 2011
459
20.41
20%
3
area, pm_cm,
tahun
Area-3, PM,
Tahun 2012
455
20.23
20%
4
area,
kat_pelanggan,
periode, tahun
Area-3, USO,
Triwulan 2,
Tahun 2011
457
20.32
20%
area, periode,
pm_cm, tahun
Area-3,
Triwulan 2,
CM, Tahun
2011
455
20.23
20%
3
4
21
Lampiran 4 Tabel hasil aturan asosiasi dengan minimum support 20% dan
minimum confidence 50%
Confidence
(%)
Itemset
Dimensi / Fields
Rules
Area-3, USO,
Tahun 2012
area, kat_pelanggan,
tahun
USO, Tahun
2012 Area-3
100
Area-3, USO,
Very Good
area, kat_pelanggan,
kat_sqf
USO, Very
Good Area-3
99.8
Area-3, USO,
Triwulan 2
area, kat_pelanggan,
periode
USO, Triwulan
2 Area-3
99.68
Area-3, USO,
PM
area, kat_pelanggan,
pm_cm
USO, PM
Area-3
99.66
Area-3, USO
area, kat_pelanggan
USO Area-3
99.6
Area-3, USO,
Triwulan 2,
Tahun 2011
area, kat_pelanggan,
periode, tahun
USO, Triwulan
2, Tahun 2011
Area-3
99.56
Area-3, USO,
Tahun 2011
area, kat_pelanggan,
tahun
USO, Tahun
2011 Area-3
99.26
Area-3,
Triwulan 2, CM,
Tahun 2011
area, periode, pm_cm,
tahun
Area-3, CM,
Tahun 2011
Triwulan 2
92.48
Area-3,
Triwulan 2, CM,
Tahun 2011
area, periode, pm_cm,
tahun
Area-3,
Triwulan 2, CM
Tahun 2011
91.73
Very Good, CM,
Tahun 2011
kat_sqf, pm_cm, tahun
Very Good, CM
Tahun 2011
90.72
Triwulan 2, CM,
Tahun 2011
periode, pm_cm, tahun
Triwulan 2, CM
Tahun 2011
88.04
Area-3, USO,
Very Good
area, kat_pelanggan,
kat_sqf
Area-3, Very
Good USO
87.57
Area-3, USO,
PM
area, kat_pelanggan,
pm_cm
Area-3, PM
USO
87.03
Area-3, USO,
Tahun 2012
area, kat_pelanggan,
tahun
Area-3, Tahun
2012 USO
85.64
Area-3,
Triwulan 2, CM
area, periode, pm_cm
Area-3, CM
Triwulan 2
85.52
Area-3, USO,
Triwulan 2,
Tahun 2011
area, kat_pelanggan,
periode, tahun
Area-3, USO,
Tahun 2011
Triwulan 2
85.1
22
Lanjutan
Confidence
(%)
Itemset
Dimensi / Fields
Rules
USO, Triwulan
2, Tahun 2011
kat_pelanggan, periode,
tahun
USO, Tahun
2011
Triwulan 2
84.84
Area-3, CM,
Tahun 2011
area, pm_cm, tahun
Area-3, CM
Tahun 2011
84.83
Area-3, USO,
Triwulan 2,
Tahun 2011
area, kat_pelanggan,
periode, tahun
USO, Tahun
2011 Area-3,
Triwulan 2
84.47
Area-3, PM,
Tahun 2012
area, pm_cm, tahun
Area-3, Tahun
2012 PM
83.79
Area-3,
Triwulan 2,
Tahun 2011
area, periode, tahun
Area-3, Tahun
2011
Triwulan 2
82.49
Triwulan 2, CM,
Tahun 2011
periode, pm_cm, tahun
CM, Tahun
2011
Triwulan 2
80.92
Area-3, USO
area, kat_pelanggan
Area-3 USO
80.1
Area-3, USO,
Triwulan 2
area, kat_pelanggan,
periode
Area-3,
Triwulan 2
USO
79.64
Area-3,
Triwulan 2, CM,
Tahun 2011
area, periode, pm_cm,
tahun
Area-3, CM
Triwulan 2,
Tahun 2011
78.45
CM, Tahun 2011
pm_cm, tahun
CM Tahun
2011
78.33
Area-3, USO,
Triwulan 2,
Tahun 2011
area, kat_pelanggan,
periode, tahun
Area-3,
Triwulan 2,
Tahun 2011
USO
78.25
Area-3,
Triwulan 2, CM,
Tahun 2011
area, periode, pm_cm,
tahun
Area-3,
Triwulan 2,
Tahun 2011
CM
77.91
PM, Tahun 2012
pm_cm, tahun
Tahun 2012
PM
77.19
Area-3, USO,
Tahun 2011
area, kat_pelanggan,
tahun
Area-3, Tahun
2011 USO
75.85
23
Lanjutan
Confidence
(%)
Itemset
Dimensi / Fields
Rules
Area-3,
Triwulan 2,
Tahun 2011
area, periode, tahun
Area-3,
Triwulan 2
Tahun 2011
75.75
Triwulan 2,
Tahun 2011
periode, tahun
Triwulan 2
Tahun 2011
75.58
USO, Triwulan
2, Tahun 2011
kat_pelanggan, periode,
tahun
USO, Triwulan
2 Tahun
2011
74.51
Area-3, USO,
Triwulan 2,
Tahun 2011
area, kat_pelanggan,
periode, tahun
Area-3, USO,
Triwulan 2
Tahun 2011
74.43
Area-3, USO,
Triwulan 2,
Tahun 2011
area, kat_pelanggan,
periode, tahun
USO, Triwulan
2 Area-3,
Tahun 2011
74.19
Triwulan 2, CM,
Tahun 2011
periode, pm_cm, tahun
Triwulan 2,
Tahun 2011
CM
73.87
Very Good, CM,
Tahun 2011
kat_sqf, pm_cm, tahun
Very Good,
Tahun 2011
CM
73.51
Triwulan 2,
Tahun 2011
periode, tahun
Tahun 2011
Triwulan 2
72.85
Triwulan 2, CM
periode, pm_cm
CM Triwulan
2
72
Area-3, CM,
Tahun 2011
area, pm_cm, tahun
Area-3, Tahun
2011 CM
69.49
Area-3,
Triwulan 2, CM,
Tahun 2011
area, periode, pm_cm,
tahun
Triwulan 2, CM,
Tahun 2011
Area-3
67.91
Very Good,
Tahun 2011
kat_sqf, tahun
Very Good
Tahun 2011
67.87
Area-3, PM,
Tahun 2012
area, pm_cm, tahun
Area-3, PM
Tahun 2012
67.81
CM, Tahun 2011
pm_cm, tahun
Tahun 2011
CM
66.51
Area-3,
Triwulan 2, CM
area, periode, pm_cm
Triwulan 2, CM
Area-3
65.18
24
Lanjutan
Itemset
Dimensi / Fields
Rules
Confidence
(%)
PM, Tahun 2012
pm_cm, tahun
PM Tahun
2012
65.02
Area-3, USO,
Triwulan 2,
Tahun 2011
area, kat_pelanggan,
periode, tahun
Area-3, Tahun
2011 USO,
Triwulan 2
64.55
Area-3,
Triwulan 2,
Tahun 2011
area, periode, tahun
Triwulan 2,
Tahun 2011
Area-3
64.39
Area-3,
Triwulan 2, CM
area, periode, pm_cm
Area-3,
Triwulan 2
CM
64.33
Area-3,
Triwulan 2, CM,
Tahun 2011
area, periode, pm_cm,
tahun
Area-3, Tahun
2011
Triwulan 2, CM
64.27
Area-3,
Triwulan 2
area, periode
Triwulan 2
Area-3
64.25
Triwulan 2, CM
periode, pm_cm
Triwulan 2
CM
63.42
Triwulan 2, CM,
Tahun 2011
periode, pm_cm, tahun
CM Triwulan
2, Tahun 2011
63.39
Area-3,
Triwulan 2
area, periode
Area-3
Triwulan 2
61.63
Area-3, USO,
Triwulan 2
area, kat_pelanggan,
periode
Area-3, USO
Triwulan 2
61.28
USO, Triwulan
2
kat_pelanggan, periode
USO
Triwulan 2
61.23
Good, Triwulan
2
kat_sqf, periode
Good
Triwulan 2
61.19
Area-3, USO,
Triwulan 2
area, kat_pelanggan,
periode
USO Area-3,
Triwulan 2
61.03
Area-3, Very
Good
area, kat_sqf
Very Good
Area-3
60.74
Normal, PM
kat_cpi, pm_cm
Normal PM
59.8
Area-3,
Triwulan 2, CM,
Tahun 2011
area, periode, pm_cm,
tahun
Triwulan 2, CM
Area-3,
Tahun 2011
59.79
25
Lanjutan
Confidence
(%)
Itemset
Dimensi / Fields
Rules
Area-3, CM,
Tahun 2011
area, pm_cm, tahun
CM, Tahun
2011 Area-3
59.42
Area-3, USO,
Triwulan 2,
Tahun 2011
area, kat_pelanggan,
periode, tahun
Area-3,
Triwulan 2
USO, Tahun
2011
59.27
Area-3,
Triwulan 2, CM,
Tahun 2011
area, periode, pm_cm,
tahun
Area-3,
Triwulan 2
CM, Tahun
2011
59.01
Area-3, PM,
Tahun 2012
area, pm_cm, tahun
PM, Tahun 2012
Area-3
58.71
Very Good,
Triwulan 2
kat_sqf, periode
Very Good
Triwulan 2
58.4
Area-3, USO,
PM
area, kat_pelanggan,
pm_cm
Area-3, USO
PM
58.28
USO, PM
kat_pelanggan, pm_cm
USO PM
58.25
Area-3, Normal
area, kat_cpi
Normal
Area-3
58.14
Area-3, USO,
PM
area, kat_pelanggan,
pm_cm
USO Area-3,
PM
58.05
Area-3