III. 2. Perancangan Sistem Secara Umum
III.2 .1. Input
System yang akan dibuat dapat menerima masukan data input dari pengguna sistem berupa data bebas bertipe excel file atau data dalam tabel yang
terdapat dalam basis data yang sudah diolah atau dipreproses sebelumnya. Dalam tugas akhir ini ukuran data yang digunakan adalah ukuran data bebas karena
aplikasi yang akan dibuat bersifat universal, jadi tidak ada batasan ukuran data data hanya format data yang harus disesuaikan dengan sistem agar data bisa
diproses oleh sistem. Selain membutuhkan input berupa data excel dan data dalam basis data,
sistem juga membutuhkan inputan atau masukan lain dari pengguna diantaranya: 1. minimum support threshold sistem
Minimum support threshold sistem digunakan untuk mencari 1-large itemset pada proses transaction clustering. Setiap item dalam transaksi yang memiliki support
= minimum support threshold sistem digolongkan menjadi large item yang digabungkan menjadi 1-large itemset.
2. Minimum Support minsup Minimum Support merupakan batas support yang digunakan untuk mencari 2-
large itemset pada proses transaction clustering. Minimum Support ditentukan oleh pengguna sistem dan digunakan untuk membatasi perluasan itemset yang
berasal dari penggabungan dua item berbeda pada large itemset sebelumnya. Minimum Support dalam proses transaction clustering disebut user difine support
threshold.
3. Maximum Support maxsup Maximum Support merupakan batas support tertinggi yang harus dimiliki oleh
item agar bisa masuk dalam large itemset pada proses pencarian rule dari setiap klaster menggunakan apriori inverse. Item yang memiliki nilai support di atas
maxsup akan dihapus dari kandidat item pembentuk aturan asosiasi langka. 4. Maximum Confidence maxconf
Maximum confidence digunakan untuk membatasi jumlah aturan yang muncul dalam klaster. Hanya aturan yang memiliki nilai confidence = maxconf yang
ditentukan sebagai aturan langka.
III.2 .2. Proses
Sistem pendeteksi aturan langka berjalan dengan beberapa tahapan proses. Pengguna dapat memasukkan data dalam format .xls atau data langsung dari
dalam basis data yang akan dideteksi aturan langkanya. Sistem kemudian akan melakukan pendeteksian transaksi yang bersifat langka pada data yang dimasukan
ke dalam sistem. Pada proses pendeteksian, sistem akan melakukan partisi setiap transaksi ke dalam beberapa klaster untuk mempermudah dalam melakukan
penambangan aturan asosiasi langka, setelah itu dilakukan perhitungan menggunakan persamaan fungsi fitness untuk menemukan titik stabil atau
optimum yang harus dicapai kluster agar bisa stabil. Jika klaster belum mencapai titik stabil maka akan melakukan iterasi sampai klaster bisa mencapai titik
optimum. Setelah klaster mencapai titik optimum maka tahap selanjutnya yang dilakukan oleh sistem adalah menerapkan algoritma apriori inverse ke dalam
setiap klaster sehingga setiap klaster menghasilkan aturan atau pola sendiri -
sendiri. Penentuan aturan langka yang dihasilkan dilakukan pada proses penerapan algoritma apriori inverse ke dalam setiap klaster. Proses-proses
tersebut dapat terlihat seperti pada gambar 3.1 berikut ini.
Data basis data Proses Clustering
Iterasi i=1
Apriori invers Menentukan
MinAbsSupport
Proses pembentukan
aturan asosiasi langka
Data tipe .xls
Penentuan itemset kunci
Perhitungan fitness function untuk
menentukan nilai optimum saat ini
tidak Alokasi transaksi
berdasar simmilarity
Cek nilai optimum iterasi
i sama dengan i-1 ?
Iterasi i ++
ya Rare Rules
Set nilai optimum =
end start
a b
Gambar 3.2. Proses Umum Sistem Deteksi Aturan Langka. a Proses Apriori inverse untuk
deteksi rare rules. b Clustering untuk pengelompokan transaksi.
Dari gambar 3.2 di atas maka dapat dijelaskan bahwa proses pendeteksian aturan asosiasi langka dalam basis data dilakukan dengan 2 langkah yaitu
pembentukan transaction clustering dan penerapan apriori inverse untuk
menentukan aturan asosiasi langka. Berikut adalah penjelasan secara detail dari setiap prosesnya:
III.2. 2.1. Transaction Clustering
Langkah-langkah untuk membentuk clustering dapat dijelaskan sebagai berikut :
1. Langkah awal adalah dengan menentukan nilai kunci yang akan dijadikan titik pusat centroid dari klaster yang akan dibentuk lihat persamaan 2.6,
2.7, 2.8, 2.9. 2. Kelompokan transaksi atau himpunan item yang memiliki karakteristik yang
sama dengan titik pusat centroid awal. Pengelompokan ini menggunakan rumus similarity lihat persamaan 2.10.
3. Periksa titik keseimbangan yang didapat dari kluster yang terbentuk apakah sudah optimum atau belum. Nilai optimum untuk titik keseimbangan kluster
berasal dari perhitungan fungsi fitness lihat persamaan 2.11. Jika titik keseimbangan belum tercapai maka lakukan iterasi ke dua dan seterusnya
untuk menghasilkan nilai titik kluster optimum. Hasil dari proses transaction clustering adalah kumpulan transaksi yang
berisi himpunan large item yang terpartisi menjadi beberapa klaster, di mana setiap klaster memiliki aturan langka sendiri-sendiri yang siap diolah dan
ditambang. Algoritma dari masing – masing tahap dalam transaction clustering
menurut Koh Pears 2010 adalah seperti di bawah ini:
1. Seed Generation Phase
2. Allocation phase
Flow chart dari algoritma transaction clustering yang merupakan gabungan algoritma dari dua tahap dalam transaction clustering dapat dilihat pada
gambar 3.3.
Data.xls Iterasi i=1, k=1,
minsup threshold sistem
Data basis data
Cari kandidat 1- large itemset
Cek support kandidat=minsup
threshold system k++
iya Cari kandidate k-
large itemset Hitung nilai relative
support, chi square setiap kandidat
Cek setiap kandidat apakah memenuhi persyaratan
Iya
end Tidak
Simpan anggota k- large itemset terakhir
yang dihasikan dan jadikan sebagai
centroid awal klaster tidak
Hitung nilai similarity transaksi terhadap centroid
klaster yang terbentuk, menggunakan persamaan
Set nilai optimum =0
Hitung nilai optimum klaster saat ini menggunakan
persamaan Cek apakah nilai optimum
klaster iterasi i nilai optimumklaster iterasi i-1
Iya Iterasi i++
Cari kandidat 1-large item dengan cara mencari item
dalam setiap klaster yang memiliki suppport = minsup
threshold sistem
Simpan setiap klaster dan
anggotanya dari iterasi yang
terakhir tidak
start
Gambar 3.3 Algoritma Transaction Clustring.
III.2. 2.2. Penerapan Algoritma Apriori Inverse
Langkah-langkah penerapan algoritma apriori inverse dapat dijelaskan sebagai berikut:
1. Setelah data dikenai proses transaction clustering data akan terpecah menjadi beberapa kelompok atau klaster dan akan memiliki aturan yang berbeda untuk
setiap klasternya. 2. Agar aturan asosiasi langka dapat diperoleh maka terapkan algoritma apriori
inverse kedalam setiap klasternya. Algoritma ini menggunakan probabilitas of chance collision yang digunakan untuk mengetahui atribut yang muncul
hanya karena kebetulan bukan karena sesuatu yang langka lihat persamaan 2.4.
3. Penerapan apriori inverse ke dalam klaster bisa dilakukan dengan menggunakan minimum absolute support yang di dalamnya terdapat
persamaan probabilitas of chance collision Pcc lihat persamaan 2.5. Bila jumlah support himpunan item mencapai nilai minimum absolute
support maka himpunan item tersebut masuk dalam proses pembentukan aturan asosiasi langka, sebaliknya bila jumlah support dari himpunan item
kurang dari minimum absolute support, maka himpunan item tersebut akan dipangkas dari pembentukan aturan asosiasi langka. Aturan inilah yang
nantinya menjadi aturan langka dalam kumpulan data yang tersimpan dalam basis data dalam bentuk file excel. Algoritma apriori inverse yang diambil
dari jurnal Koh Pears, 2010 adalah seperti dibawah ini:
Proses penentuan aturan asosiasi langka dapat dilihat pada gambar 3.4 berikut ini:
Cluster .xls
Cari kandidat item k-large itemset
k=1, maximum support
Cek support item maximum support
iya k++
Cari k-large itemset dengan menghitung pcc dan minabssup
masing-masing pasangan item kandidat 2-large itemset dengan
menggunakan persamaan dan
Start
Cek apakah ada kandidat item memiliki
support minabsup maxsup ?
tidak end
Iya tidak
Hitung nilai confidence large itemset yang
memenuhi syarat dengan persamaan
Aturan asosiasi langka
Gambar 3.4. Proses Penentuan Rare Association Rules menggunakan algoritma Apriori
Inverse.
III.2 .3. Output
Sistem yang akan dibuat ini merupakan sistem untuk menghasilkan aturan asosiasi langka yang nantinya akan digunakan sebagai acuan dalam melakukan
pendeteksian dini pristiwa-pristiwa langka dalam basis data. Berikut adalah keluaran yang akan dihasilkan oleh sistem yang diberi nama Sistem Deteksi
Aturan Asosiasi Langka : 1. Jumlah data row dan jumlah data coloumn
Sistem akan menampilkan jumlah baris dari data excel yang dipilih oleh pengguna serta jumlah kolomnya. Hal ini untuk memastikan bahwa semua data terbaca oleh
sistem tanpa terkecuali.
2. Minimum support threshold system Sistem akan menampilkan atribut ini sebagai output untuk memastikan kepada
pengguna bahwa pengaturan tentang minimum support threshold system benar sesuai dengan keinginan dari pengguna.
3. Maximum confidence, minimum support dan maximum support Sistem menampilkan output maximum confidence, minimum support dan
maximum support untuk memastikan kepada pengguna bahwa masukan konfigurasi penambangan data sudah sesuai dengan nilai yang di masukan oleh
pengguna. 4. Jumlah klaster
Jumlah klaster dijadikan keluaran program untuk memberitahukan kepada pengguna mengenai jumlah akhir klaster yang terbentuk dari proses penambangan
data. 5. Aturan langka rare rules yang ditemukan oleh sistem dalam setiap klaster
Tujuan utama dibuatnya sistem ini adalah untuk mencari aturan asosiasi langka. Oleh karena itu maka dalam sistem disediakan hasil keluaran berupa aturan-aturan
langka yang ditemukan oleh sistem dengan menggunakan algoritma APIC Apriori Inverse with Clustering.
III. 3. Perancangan Sistem