Data Mining 10 Gambaran umum sistem 35 Pembangunan Data Warehouse 36 Mekanisme Pengujian 52

8 DAFTAR ISI Halaman DAFTAR GAMBAR xi DAFTAR TABEL xii DAFTAR LAMPIRAN xiii

I. PENDAHULUAN

1.1 Latar belakang 1 1.2. Tujuan Penelitian 2 1.3. Ruang lingkup 2 1.4. Manfaat Penelitian 3 II. TINJAUAN PUSTAKA 2.1. Diabetes Melitus 4 2.2 Data Warehouse 5 2.2.1. Metodologi Perancangan Data Warehouse 7 2.2.2. Star Schema 8

2.3. Data Mining 10

2.3.1. Klasifikasi dan Prediksi 13 2.3.2. Metodologi Data Mining 14 2.3.3. Teknik Data Mining 16 2.3.4. Membangun Model Prediksi 26 III. BAHAN DAN METODE 3.1. Bahan 29 3.2. Metode 31 3.2.1. Kerangka Pemikiran 31 3.2.2. Tata Laksana 33 IV. PERANCANGAN ARSITEKTUR SISTEM DATA MINING

4.1 Gambaran umum sistem 35

4.2. Pembangunan Data Warehouse 36

4.3. Pembangunan Model Klasifikasi 38 4.4. Antarmuka Pemakai 40 4.5. Basis Pengetahuan 40 4.4. Modul Diagnosa dan Terapi 41 9 Halaman V. IMPLEMENTASI 5.1. Preproses Data 44 5.2. Pembentukan Sampel Positif dan Sampel Negatif 46 5.3. Pembentukan PN Array 47 5.4. Pembentukan Gain 48 5.5. Program Aplikasi 51 VI. PENGUJIAN DAN PEMBAHASAN

6.1. Mekanisme Pengujian 52

6.2. Pelatihan Dengan Data Training 52 6.3. Proses Optimalisasi 58 VII. KESIMPULAN DAN SARAN 7.1. Kesimpulan 64 7.2. Saran 64 DAFTAR PUSTAKA 65 LAMPIRAN 66 10 DAFTAR GAMBAR Halaman 1. Arsitektur Data Warehouse 7 2. Relasi antartabel dimensi dan table fakta sederhana 10 3. Data mining sebagai salah satu tahapan dalam proses knowledge discovery 11 4. Model proses pembuatan data mining 15 5. Algoritme Appriori 18 6. Algoritme FOIL 22 7. Algoritma PRM 24 8. Metoda startCPAR 25 9. Metoda cparGeneration 25 10. Langkah-langkah membangun model pred iksi 28 11. Kerangka pemikiran pembangunan model untuk diagnosis penyakit diabetes 32 12. Tahapan Proses data mining 33 13. Model aplikasi diabetes 35 14. Relasi antartabel skema bintang data warehouse diabetes 37 15. Ekstraksi dan Transformasi Basis Data SIM RSPP 38 16. Flowchart Algoritme CPAR 39 17 Grafik Gain data training untuk kelas positip diabetes 55 18. Grafik Gain data training untuk kelas negatip diabetes 55 19. Grafik Gain negatif diabetes setelah proses optimalisasi 60 20. Grafik Gain negatif diabetes setelah proses optimalisasi 60 1 PEMBANGUNAN SISTEM DATA MINING UNTUK DIAGNOSIS PENYAKIT DIABETES MENGGUNAKAN ALGORITME CLASSIFICATION BASED ASSOCIATION HERWANTO SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2006 2 PERNYATAAN MENGENAI TESIS DAN SUMBER INFORMASI Dengan ini saya menyatakan bahwa tesis Pembangunan Sistem Data Mining untuk Diagnosis Penyakit Diabetes Menggunakan Algoritme Classification Based Association adalah karya saya sendiri dan belum diajukan dalam bentuk apa pun kepada pergu ruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini. Bogor, September 2006 Herwanto NIM G651034084 3 PEMBANGUNAN SISTEM DATA MINING UNTUK DIAGNOSIS PENYAKIT DIABETES MENGGUNAKAN ALGORITME CLASSIFICATION BASED ASSOCIATION HERWANTO Tesis Sebagai salah satu syarat untuk memperoleh gelar Magister Sains pada Departemen Ilmu Komputer SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2006 4 ABSTRAK HERWANTO. Pembangunan Sistem Data Mining Untuk Diagnosis Penyakit Diabetes Menggunakan Algoritme Classification Based Association. Dibimbing oleh IMAS S. SITANGGANG dan RINDANG KARYADIN. Basis data rumah sakit umumnya berisi data dalam jumlah besar dengan banyak variasi, tetapi belum dimanfaatkan secara optimal. Diperlukan suatu sistem data mining yang bisa memanfaatkan gunungan data menjadi informasi yang bernilai strategis. Dalam penelitian ini dipelajari bagaimana data bisa digunakan untuk membantu mendiagnosa penyakit, khususnya penyakit diabetes Data-data pasien yang beresiko menderiita penyakit diabetes dikumpulkan ke dalam data warehouse diabetes. Dua tahapan utama yang dilakukan dalam penelitian ini, yaitu proses pembentukan model klasifikasi dan pembuatan program aplikasi untuk mendeteksi penyakit diabetes. Dalam proses pembentukan model klasifikasi ada tiga tahapan yang dilakukan. Tahap pertama adalah menangani data-data yang beragam, tidak lengkap, dan tidak konsisten. Kemudian melakukan proses perubahan data kontinyu menjadi data kategori, dimana setiap variabel dikelompokkan ke dalam sejumlah kategori. Tahap berikutnya adalah membuat rule mining dan klasifikasi. 700 pasien dipilih sebagai data training, 400 pasien dengan diagnosa negatif diabetes dan 300 pasien positif diabetes. Pada pembentukan model klasifikasi dipilih 12 variabel yang digunakan untuk menghasilkan aturan yaitu usia, sex dan hasil-hasil pemeriksaan laboratorium. Didapatkan hasil pemeriksaan glukosa darah 2 jam pasca puasa, glukosa urin 2 jam pasca puasa, serta glukosa darah puasa menjadi penentu utama untuk menentukan apakah pasien positif diabetes atau negatif diabetes. Aturan-aturan yang dihasilkan selanjutnya digunakan dalam program aplikasi untuk mendiagnosa pasien apakah positif diabetes atau negatif diabetes. . 5 PRAKATA Syukur Alhamdulillah penulis panjatkan kepada Allah SWT atas limpahan rahmat dan karuniaNya sehingga penulis akhirnya dapat menyelesaikan karya ilmiah ini. Tema yang dipilih dalam penelitian yang dilaksanakan sejak bulan Juni 2005 ini adalah sistem data mining, dengan judul Pembangunan Sistem Data Mining untuk Diagnosis Penyakit Diabetes Menggunakan Algoritme Classification Based Association. Dalam kesempatan ini penulis ingin menyampaikan ucapan terima kasih dan penghargaan kepada Ibu Imas S Sitanggang, S.Si., M.Kom., dan Bapak Rindang Karyadin S.T., M.Kom. selaku pembimbing yang sejak awal penulisan proposal sampai pada penulisan karya ilmiah ini, telah membimbing dengan penuh keikhlasan, dan kesabaran. Di samping itu penghargaan penulis sampaikan kepada para dosen Program Studi Ilmu Komputer, Sekolah Pascasarjana, Institut Pertanian Bogor, yang telah memberikan wawasan dan pengetahuan baru bagi penulis. Atas do’a, pengorbanan, kesabaran, ketulusan, serta dukungan semangatnya, penulis juga menyampaikan ucapan terima kasih dan rasa hormat yang setulus-tulusnya kepada kedua orang tua, serta seluruh keluarga. Semoga karya ilmiah ini bermanfaat. Bogor, September 2006 Herwanto 6 RIWAYAT HIDUP Penulis dilahirkan di Jakarta pada tanggal 24 May 1962 dari ayah Paridjan dan ibu Parinah. Penulis merupakan putra kelima dari delapan bersaudara. Pada tahun 1982 penulis lulus dari SMA Negeri 43 Jakarta. Pendidikan sarjana ditempuh pada tahun 1991 di Sekolah Tinggi Manajemen Informatika dan Komputer Gunadarma, jurusan Manajemen Informatika, lulus pada tahun 1996. Kesempatan untuk melanjutkan ke program magister pada Program Studi Ilmu Komputer, Sekolah Pascasarjana IPB diperoleh pada tahun 2004. Penulis bekerja di Rumah Sakit Pusat Pertamina Jakarta pada bagian Sistem Informasi Telekomunikasi Elektronika sejak tahun 1997. Bidang yang menjadi tanggung jawab penulis ialah pembangunan dan pengembangan sistem informasi rumah sakit. Pada tahun 2005 penulis dipercaya sebagai kepala bagian Sistem Informasi Telekomunikasi Elektronika. 7 Judul Tesis : Pembangunan Sistem Data Mining Untuk Diagnosis Penyakit Diabetes Menggunakan Algoritme Classification Based Association Nama : Herwanto NIM : G651034084 Disetujui Komisi Pembimbing Imas S Sitanggang, S.Si., M.Kom. Rindang Karyadin, S.T., M.Kom. Ketua Anggota Diketahui Ketua Program Studi Ilmu Komputer Dekan Sekolah Pascasarjana Dr. Sugi Guritman . Dr. Ir. Khairil A. Notodiputro, MS Tanggal Ujian: 5 September 2006 8 DAFTAR ISI Halaman DAFTAR GAMBAR xi DAFTAR TABEL xii DAFTAR LAMPIRAN xiii

I. PENDAHULUAN