2. Perancangan Sistem Secara Umum

III. 2. Perancangan Sistem Secara Umum

III.2 .1. Input System yang akan dibuat dapat menerima masukan data input dari pengguna sistem berupa data bebas bertipe excel file atau data dalam tabel yang terdapat dalam basis data yang sudah diolah atau dipreproses sebelumnya. Dalam tugas akhir ini ukuran data yang digunakan adalah ukuran data bebas karena aplikasi yang akan dibuat bersifat universal, jadi tidak ada batasan ukuran data data hanya format data yang harus disesuaikan dengan sistem agar data bisa diproses oleh sistem. Selain membutuhkan input berupa data excel dan data dalam basis data, sistem juga membutuhkan inputan atau masukan lain dari pengguna diantaranya: 1. minimum support threshold sistem Minimum support threshold sistem digunakan untuk mencari 1-large itemset pada proses transaction clustering. Setiap item dalam transaksi yang memiliki support = minimum support threshold sistem digolongkan menjadi large item yang digabungkan menjadi 1-large itemset. 2. Minimum Support minsup Minimum Support merupakan batas support yang digunakan untuk mencari 2- large itemset pada proses transaction clustering. Minimum Support ditentukan oleh pengguna sistem dan digunakan untuk membatasi perluasan itemset yang berasal dari penggabungan dua item berbeda pada large itemset sebelumnya. Minimum Support dalam proses transaction clustering disebut user difine support threshold. 3. Maximum Support maxsup Maximum Support merupakan batas support tertinggi yang harus dimiliki oleh item agar bisa masuk dalam large itemset pada proses pencarian rule dari setiap klaster menggunakan apriori inverse. Item yang memiliki nilai support di atas maxsup akan dihapus dari kandidat item pembentuk aturan asosiasi langka. 4. Maximum Confidence maxconf Maximum confidence digunakan untuk membatasi jumlah aturan yang muncul dalam klaster. Hanya aturan yang memiliki nilai confidence = maxconf yang ditentukan sebagai aturan langka. III.2 .2. Proses Sistem pendeteksi aturan langka berjalan dengan beberapa tahapan proses. Pengguna dapat memasukkan data dalam format .xls atau data langsung dari dalam basis data yang akan dideteksi aturan langkanya. Sistem kemudian akan melakukan pendeteksian transaksi yang bersifat langka pada data yang dimasukan ke dalam sistem. Pada proses pendeteksian, sistem akan melakukan partisi setiap transaksi ke dalam beberapa klaster untuk mempermudah dalam melakukan penambangan aturan asosiasi langka, setelah itu dilakukan perhitungan menggunakan persamaan fungsi fitness untuk menemukan titik stabil atau optimum yang harus dicapai kluster agar bisa stabil. Jika klaster belum mencapai titik stabil maka akan melakukan iterasi sampai klaster bisa mencapai titik optimum. Setelah klaster mencapai titik optimum maka tahap selanjutnya yang dilakukan oleh sistem adalah menerapkan algoritma apriori inverse ke dalam setiap klaster sehingga setiap klaster menghasilkan aturan atau pola sendiri - sendiri. Penentuan aturan langka yang dihasilkan dilakukan pada proses penerapan algoritma apriori inverse ke dalam setiap klaster. Proses-proses tersebut dapat terlihat seperti pada gambar 3.1 berikut ini. Data basis data Proses Clustering Iterasi i=1 Apriori invers Menentukan MinAbsSupport Proses pembentukan aturan asosiasi langka Data tipe .xls Penentuan itemset kunci Perhitungan fitness function untuk menentukan nilai optimum saat ini tidak Alokasi transaksi berdasar simmilarity Cek nilai optimum iterasi i sama dengan i-1 ? Iterasi i ++ ya Rare Rules Set nilai optimum = end start a b Gambar 3.2. Proses Umum Sistem Deteksi Aturan Langka. a Proses Apriori inverse untuk deteksi rare rules. b Clustering untuk pengelompokan transaksi. Dari gambar 3.2 di atas maka dapat dijelaskan bahwa proses pendeteksian aturan asosiasi langka dalam basis data dilakukan dengan 2 langkah yaitu pembentukan transaction clustering dan penerapan apriori inverse untuk menentukan aturan asosiasi langka. Berikut adalah penjelasan secara detail dari setiap prosesnya: III.2. 2.1. Transaction Clustering Langkah-langkah untuk membentuk clustering dapat dijelaskan sebagai berikut : 1. Langkah awal adalah dengan menentukan nilai kunci yang akan dijadikan titik pusat centroid dari klaster yang akan dibentuk lihat persamaan 2.6, 2.7, 2.8, 2.9. 2. Kelompokan transaksi atau himpunan item yang memiliki karakteristik yang sama dengan titik pusat centroid awal. Pengelompokan ini menggunakan rumus similarity lihat persamaan 2.10. 3. Periksa titik keseimbangan yang didapat dari kluster yang terbentuk apakah sudah optimum atau belum. Nilai optimum untuk titik keseimbangan kluster berasal dari perhitungan fungsi fitness lihat persamaan 2.11. Jika titik keseimbangan belum tercapai maka lakukan iterasi ke dua dan seterusnya untuk menghasilkan nilai titik kluster optimum. Hasil dari proses transaction clustering adalah kumpulan transaksi yang berisi himpunan large item yang terpartisi menjadi beberapa klaster, di mana setiap klaster memiliki aturan langka sendiri-sendiri yang siap diolah dan ditambang. Algoritma dari masing – masing tahap dalam transaction clustering menurut Koh Pears 2010 adalah seperti di bawah ini: 1. Seed Generation Phase 2. Allocation phase Flow chart dari algoritma transaction clustering yang merupakan gabungan algoritma dari dua tahap dalam transaction clustering dapat dilihat pada gambar 3.3. Data.xls Iterasi i=1, k=1, minsup threshold sistem Data basis data Cari kandidat 1- large itemset Cek support kandidat=minsup threshold system k++ iya Cari kandidate k- large itemset Hitung nilai relative support, chi square setiap kandidat Cek setiap kandidat apakah memenuhi persyaratan Iya end Tidak Simpan anggota k- large itemset terakhir yang dihasikan dan jadikan sebagai centroid awal klaster tidak Hitung nilai similarity transaksi terhadap centroid klaster yang terbentuk, menggunakan persamaan Set nilai optimum =0 Hitung nilai optimum klaster saat ini menggunakan persamaan Cek apakah nilai optimum klaster iterasi i nilai optimumklaster iterasi i-1 Iya Iterasi i++ Cari kandidat 1-large item dengan cara mencari item dalam setiap klaster yang memiliki suppport = minsup threshold sistem Simpan setiap klaster dan anggotanya dari iterasi yang terakhir tidak start Gambar 3.3 Algoritma Transaction Clustring. III.2. 2.2. Penerapan Algoritma Apriori Inverse Langkah-langkah penerapan algoritma apriori inverse dapat dijelaskan sebagai berikut: 1. Setelah data dikenai proses transaction clustering data akan terpecah menjadi beberapa kelompok atau klaster dan akan memiliki aturan yang berbeda untuk setiap klasternya. 2. Agar aturan asosiasi langka dapat diperoleh maka terapkan algoritma apriori inverse kedalam setiap klasternya. Algoritma ini menggunakan probabilitas of chance collision yang digunakan untuk mengetahui atribut yang muncul hanya karena kebetulan bukan karena sesuatu yang langka lihat persamaan 2.4. 3. Penerapan apriori inverse ke dalam klaster bisa dilakukan dengan menggunakan minimum absolute support yang di dalamnya terdapat persamaan probabilitas of chance collision Pcc lihat persamaan 2.5. Bila jumlah support himpunan item mencapai nilai minimum absolute support maka himpunan item tersebut masuk dalam proses pembentukan aturan asosiasi langka, sebaliknya bila jumlah support dari himpunan item kurang dari minimum absolute support, maka himpunan item tersebut akan dipangkas dari pembentukan aturan asosiasi langka. Aturan inilah yang nantinya menjadi aturan langka dalam kumpulan data yang tersimpan dalam basis data dalam bentuk file excel. Algoritma apriori inverse yang diambil dari jurnal Koh Pears, 2010 adalah seperti dibawah ini: Proses penentuan aturan asosiasi langka dapat dilihat pada gambar 3.4 berikut ini: Cluster .xls Cari kandidat item k-large itemset k=1, maximum support Cek support item maximum support iya k++ Cari k-large itemset dengan menghitung pcc dan minabssup masing-masing pasangan item kandidat 2-large itemset dengan menggunakan persamaan dan Start Cek apakah ada kandidat item memiliki support minabsup maxsup ? tidak end Iya tidak Hitung nilai confidence large itemset yang memenuhi syarat dengan persamaan Aturan asosiasi langka Gambar 3.4. Proses Penentuan Rare Association Rules menggunakan algoritma Apriori Inverse. III.2 .3. Output Sistem yang akan dibuat ini merupakan sistem untuk menghasilkan aturan asosiasi langka yang nantinya akan digunakan sebagai acuan dalam melakukan pendeteksian dini pristiwa-pristiwa langka dalam basis data. Berikut adalah keluaran yang akan dihasilkan oleh sistem yang diberi nama Sistem Deteksi Aturan Asosiasi Langka : 1. Jumlah data row dan jumlah data coloumn Sistem akan menampilkan jumlah baris dari data excel yang dipilih oleh pengguna serta jumlah kolomnya. Hal ini untuk memastikan bahwa semua data terbaca oleh sistem tanpa terkecuali. 2. Minimum support threshold system Sistem akan menampilkan atribut ini sebagai output untuk memastikan kepada pengguna bahwa pengaturan tentang minimum support threshold system benar sesuai dengan keinginan dari pengguna. 3. Maximum confidence, minimum support dan maximum support Sistem menampilkan output maximum confidence, minimum support dan maximum support untuk memastikan kepada pengguna bahwa masukan konfigurasi penambangan data sudah sesuai dengan nilai yang di masukan oleh pengguna. 4. Jumlah klaster Jumlah klaster dijadikan keluaran program untuk memberitahukan kepada pengguna mengenai jumlah akhir klaster yang terbentuk dari proses penambangan data. 5. Aturan langka rare rules yang ditemukan oleh sistem dalam setiap klaster Tujuan utama dibuatnya sistem ini adalah untuk mencari aturan asosiasi langka. Oleh karena itu maka dalam sistem disediakan hasil keluaran berupa aturan-aturan langka yang ditemukan oleh sistem dengan menggunakan algoritma APIC Apriori Inverse with Clustering.

III. 3. Perancangan Sistem