Case Representation Indexing Teknik CBR

kasus akan disimpan ke dalam database secara terindeks untuk mempercepat proses retrieval nantinya. Contoh representasi kasus menggunakan bentuk frame seperti terlihat pada gambar 5.2. FRAME BASIS KASUS Nomor Kasus K001 No.Rekam Medis NRM-12345 Nama Pasien1 Alamat Yogyakarta Faktor Resiko : 1. Umur 55 2. Jenis Kelamin Pria 3. Riwayat Keluarga Ya 4. Hipertensi Ya 5. Obesitas Tidak 6. Faktor Ke-N ... Gejala: 1. Gejala 1 Ya 2. Gejala 2 Tidak 3. Gejala 3 Ya 4. Gejala Ke-N ... Penyakit P001 Nama Penyakit Obat T001 Obat, Dosis dan Aturan pakai Gambar 5.2 Representasi kasus

2. Indexing

Untuk mempercepat proses retrieval, maka perlu dilakukan peng-indeks-an terhadap satu atau beberapa fitur dalam basis kasus. Indeks adalah struktur data komputasi yang terletak dalam memori utama dan dapat mempercepat proses pencarian, sehingga komputer tidak perlu mencari tiap record yang ada dalam disk. Secara umum fungsi peng-indeks-an kasus dalam database bertujuan untuk menemukan kasus-kasus yang relevan dengan dalam basis kasus, selanjutnya menghitung similaritas antara kasus target dan kasus-kasus yang relevan. Ilustrasi fungsi peng-indeks-an kasus terlihat pada gambar 5.3 berikut: Gambar 5.3 Ilustrasi Indexing Indeks memungkinkan pengguna untuk secara efektif mengambil semua record yang memenuhi syarat pencarian pada field search key dari indeks. Fitur-fitur yang ada dalam sebuah kasus digolongkan menjadi dua tipe Watson, 1994: 2.1. Indexed Features, fitur yang akan dijadikan indeks sehingga digunakan dalam proses retrieval data. 2.2. Unindexed Features, fitur yang hanya memberi informasi kontekstual dan tidak digunakan sebagai proses retrieval data. Pada gambar 5.4 menunjukkan representasi tipe dari fitur-fitur dalam suatu kasus. Gambar 5.4 Indexed dan unindexed features Indeks adalah sesuatu yang berkaitan erat dengan implementasi, bukan modeling. Seringkali perlu ditambahkan indeks pada sebuah field atau banyak field dikarenakan jika tidak ditambahkan maka performance database tidak menjadi praktis. Setiap kolom yang memiliki rentang nilai cukup banyak, terletak pada tabel yang berisi banyak record dan sering disebutkan di klausa WHERE, ORDER BY atau GROUP BY perlu diberi indeks. Ini dikarenakan indeks membantu mencari secara cepat sebuah nilai dari banyak nilai yang ada. Chen, dkk 2005 membagi proses indexing menjadi dua cara, yaitu manual indexing human indexer dan automated indexing comuputer based. Peng- indeks-an manual seperti halnya daftar isi pada buku, katalog barang dan sebagainya. Dalam perkembangannya proses peng-indeks-an manual mengarah pada penggunaan konten elektronik sehingga ditemukan peng- indeks-an otomatis. Banyak DBMS database management system telah mendukung fitur indexing dalam berbagai metode, salah satu DBMS tersebut adalah database MySQL. MySQL mendukung banyak storage engine dengan berbagai tipe table, dimana storage engine itu sendiri terbagi atas 2 tipe, yaitu engine yang menagani transction-safe table dan yang tidak. Beberapa jenis stored engine tersebut adalah MyISAM, InnoDB, Blackhole, Archive dan beberapa stored engine lainya. MyISAM merupakan engine yang non-transactional table, yang menyediakan proses penyimpanan dan pengambilan data dengan cepat, serta dilengkapi dengan kemampuan fulltext searching. Hal ini menyebabkan MyISAM menjadi default engine pada MySQL. Beberapa tipe indexing juga didikung oleh MySQL seperti B + Tree, Hash Index, Bitmap Index, Clustered Index dan bebereapa tipe lainnya. Tipe indexing dari beberapa DBMS ditampilkan dalam tabel 5.1 berikut Jeffries, 2013: Tabel 5.1 Tipe Indexing

3. Storage

Watson dan Marir 1994 menyatakan bahwa tempat penyimpanan kasus merupakan aspek yang penting dalam perancangan sistem CBR. Case-base harus dapat diorganisasikan ke dalam struktur yang dapat dikelola sehingga mendukung metode retrieval dan pencarian. Keseimbangan harus diperlukan antara metode penyimpanan yang mempertahankan kekayaan pertambahan data-data kasus dan pengindeks-an serta metode yang sederhana untuk mengakses dan mengambil kasus-kasus yang relevan. Kenyataannya banyak sistem CBR menggunakan struktur flat file atau struktur database relasional sebagai tempat penyimpanan kasus dan pengindeks-an.

4. Case Retrieval

Retrieval merupakan inti dari CBR, yaitu proses menemukan dalam case-base, kasus-kasus yang paling dekat dengan kasus saat ini. Pengambilan kasus yang efektif harus menggunakan kriteria seleksi yang menentukan bagaimana basis kasus dicari. Teknik retrieval yang paling sering diselidiki sejauh ini, adalah k-nearest neighbor, pohon keputusan dan turunannya. Teknik ini menggunakan smimilarity metric untuk menentukan ukuran kedekatan similarity antar kasus Pal dan Shiu, 2004. Sebagai salah satu contoh metode similarity yang digunakan adalah weighted minkowski dengan rumus sebagai berikut Nunez, dkk, 2004: 5.1 Keterangan: dC i ,C j C i C j n k w r : : : : : : : nilai similarity antara kasus C i dan kasus C j kasus baru kasus lama jumlah atribut pada masing-masing kasus atribut individu, antara 1 sd n bobot yang diberikan pada atribut ke-k faktor minkowski integer positif Nilai r adalah bilangan prositif ≥ 1, antara 1 sampai dengan tak hingga. Jika r=1 dikenal dengan manhattancity block distance, jika r=2 dikenal dengan euclidean distance Merigó dan Casanovas, 2008 dan jika r= infinity tak hingga dikenal dengan chebyshev distance Rao dkk, 2012.

5. Case Adaptation

Pemecahan masalah dalam CBR, solusi lama digunakan sebagai landasan untuk memecahkan masalah baru. Karena kondisi kasus baru jarang persis dengan yang kasus lama, sehingga solusi kasus lama harus diperbaiki agar sesuai dengan kondisi kasus baru. Langkah perbaikan tersebut dikenal dengan istilah adaptasi, yang terdiri dari dua langkah utama yaitu mencari tahu apa yang perlu disesuaikan dan melakukan perbaikan Kolodner, 1992. Adaptasi merupakan proses memindahkan solusi dari kasus yang berhasil di-retrieve menjadi solusi pada kasus yang baru. Sejumlah pendekatan dapat digunakan untuk adaptasi kasus antara lain Vorobieva dkk, 2003: