Teknik – Teknik Data Mining
Beberapa istilah yang ada dalam algoritma FP-Growth diantaranya dapat dijelaskan dengan pemisalan berikut ini :
a. merupakan kumpulan dari item
– item yang ada dalam transaksi database
b. merupakan transaksi yang ada dalam
database dimana merupakan sebuah transaksi
yang mengandung item yang berada pada I. c. Support frekuensi kemunculan dari pattern A adalah angka
dari transaksi yang mengandung item A di dalam DB. d. A merupakan sebuah frequent pattern jika nilai dari supportA
tidak kurang dari minimum support yang telah ditentukan sebelumnya.
Dalam algoritma FP-Growth dikenal pula istilah frequent pattern tree FP-tree yaitu sebuah struktur seperti pohon prefix yang digunakan untuk
mendesain struktur frequent pattern mining secara efisien. Setiap node pada pohon diisi dengan 1 item dan di setiap anak dari node tersebut merepresentasikan
item yang berbeda dengan item yang ada pada induk. Setiap node juga menyimpan informasi pendukung dari isi item di dalam path dari root hingga ke
node. Sebuah root dalam pohon diinisialisasikan dengan nilai null. Dengan menggunakan FP-Tree, algoritma FP-growth dapat langsung mengekstrak
frequent Itemset. Langkah
– langkah yang dijalankan dalam algoritma FP-growth adalah sebagai berikut :
a. Menentukan minimum support yang akan digunakan untuk menentukan rule dalam mencari frequent pattern.
b. Melakukan scanning pada database untuk mendapatkan frekuensi kemunculan suatu item.
c. Melakukan seleksi pembuangan terhadap item yang memiliki count
kurang dari minimum support yang telah ditentukan. Untuk item yang memenuhi minimum support disimpan dalam list L, dan lakukan
sorting secara descending berdasarkan jumlah frekuensi terbesar hingga terkecil.
d. Membentuk root FP-Tree yang diberi nilai dengan “null”.
e. Melakukan scan yang kedua kalinya untuk cabang dari FP-Tree sesuai dengan urutan transaksi pada list L. Apabila item yang ada pada
transaksi berikutnya sudah ada pada transaksi sebelumnya maka nilai indeks dari item tersebut akan bertambah 1, sedangkan jika item belum
ada pada transaksi sebelumnya akan membentuk cabang baru. f. Berdasarkan list L pisahkan tiap frequent itemsets tanpa pengulangan
g. Melakukan analisa FP-Tree yang telah terbentuk dengan cara mencari frequent itemsets yang mengandung nilai ai lalu setarakan nilai
frequent itemsets tersebut dengan nilai ai. Setelah disetarakan, jumlahkan kedua nilai support frequent itemsets yang sama. Untuk
nilai yang diatas maupun sama dengan minimum support lah yang menjadi rule. Langkah analisa diatas dilakukan berulang untuk semua
subset yang ada pada FP-Tree. h. Hasil analisa FP-Tree yang sesuai dengan minimum support itulah
yang digunakan sebagai rule
Berikut adalah contoh dari penerapan algoritma pada sebuah data transaksi : Tabel 2. 1 Transaksi dalam database
TID Items Bought
100 f,a,c,d,g,i,m,p
200 a,b,c,f,l,m,o
300 b,f,h,j,o
400 b,c,k,s,p
500 a,f,c,e,l,p,m,n