Rumusan Masalah Batasan Masalah Tujuan Penelitian Pengertian Knowledge Discovery in Databases KDD

1.2 Rumusan Masalah

Berdasarkan latar belakang yang telah dikemukakan di atas, maka permasalahan yang akan dibahas dalam penelitian ini, yaitu : - Sejauh mana metode agglomerativehierarchicalclustering secara akurat mampu mengelompokkan pasien yang terkena hepatitis A, B atau C?

1.3 Batasan Masalah

Pada pengerjaan penelitian ini diberikan batasan-batasan masalah untuk permasalahan yang ada antara lain, 1. Metode data mining yang digunakan adalah dengan menggunakan agglomerativehierarchical clustering. 2. Jenis pengukuran kemiripan yang digunakan adalah single linkage, average linkage dan complete linkage menggunakan prinsip jarak minimum yang diawali dengan mencari dua obyek terdekat dan keduanya membentuk cluster 3. Penyakit hepatitis yang akan diteliti hanya yang bertipe A, B dan C sampelnya akan diambil dari kumpulan pasien yang berobat pada dokter hepatitisdari tahun 2000 sampai 2010 di rumah sakit di Yogyakarta.

1.4 Tujuan Penelitian

Berdasarkan rumusan permasalahan diatas, maka tujuan yang ingin dicapai dalam penelitian ini, yaitu : 1. Menganalisa, merancang, mengimplementasikan sistem cerdas untuk mengelompokan penyakit hepatitis. 2. Mengetahui hasil pengelompokan pasien yang terkena penyakit hepatitis A, hepatitis B dan hepatitis C dengan metode agglomerative hierarchical clustering. 3. Menguji kehandalan sistem dengan menghitung akurasi pengelompokan.

1.5 Manfaat Penelitian

Manfaat yang diberikan penelitian ini, yaitu : 1. Membantu menganalisa permasalahan yang ada dibidang kedokteran dengan metode data mining. 2. Menjadi referensi bagi penelitian-penelitian berikut yang relevan dengan kasus pengelompokan penyakit hepatitis. 6

BAB II LANDASAN TEORI

Bab ini menjelaskan tentang dasar teori yang digunakan dalam penyusunan tugas akhir ini untuk memperjelas materi-materi yang digunakan dalam penelitian. Penjelasan dimulai dengan Knowledge Discovery in Databases, tentang penyakit hepatitis, cara perhitunganagglomerative hierarchical clustering danmetode akurasi yang akan dipakai.

2.1 Pengertian Knowledge Discovery in Databases KDD

Data mining adalah bagian dari Knowledge Discovery in Databases yang merupakan kegiatan yang meliputi pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola atau hubungan dalam data yang berukuran besar Santoso, 2007. Data mining juga merupakan ilmu pengetahuan yang sekarang sering digunakan untuk mencari informasi yang berada pada kumpulan data yang berjumlah banyak. Pengertian data mining itu merujuk pada extracting atau mining pengetahuan dari sekumpulan besar data HanKamber,2004. Knowledge discovery in databases memiliki proses yang harus dilakukan dalam mencari pengetahuan yang diperlukan, yaitu data cleaning, data integration, data selection, data transformation, data mining dan pattern evaluationyang dapat dilihat pada gambar 2.1. Gambar 2.1 : Han Kamber,2004 Proses KDD 1. Data cleaning Langkah pertama adalah dengan melakukan pembersihan terhadap data. Proses ini bertujuanuntuk menghilangkan noise dan data yang tidak konsisten. 2. Data integration Pada tahap ini, sumber data yang terpecah dan terpisah akan digabungkan dari segala macam tempat penyimpanan menjadi satu tempat. 3. Data selection Pada data selection, data yang relevan diambil dari database untuk dianalisis. Atribut yang tidak relevan tidak akan digunakan dalam proses selanjutnya. 4. Data transformation Pada tahap ini data diubah menjadi bentuk yang tepat untuk ditambang. Hal-hal yang masuk dalam proses data transformation, yaitu smooting, aggregation, generalization dan attribute construction atau feature construction. Contoh metode normalisasi, yaitu [0-1] dan zscore. Definisi rumus normalisasi[0-1], sebagai berikut . � = � − � � � − � � Keterangan : - Xi = nilai yang akan dinormalisasi - Xmin = nilai minimum dari variabel - Xmax = nilai maksimum dari variabel Definisi rumus zscore, sebagai berikut : = � − � � 2.2 Keterangan : - X = nilai yang akan di normalisasi - µ = rata-rata - σ = standar deviasi 5. Data mining Pada proses data mining ini merupakan suatu proses utama saat metode diterapkan untuk menemukan pola dari data. 6. Pattern evaluation Pada tahap ini, mengidentifikasi pola yang benar-benar menarik yang mewakili pengetahuan berdasarkan atas beberapa pengukuran yang penting. 7. Knowledge presentation Langkah terakhir ini informasi yang sudah ditambang akan divisualisasikan dan direpresentasikan kepada user. Langkah 1 sampai dengan 4 merupakan langkah preprocessing. Setelah melakukan serangkaian proses diatas seperti data cleaning, data integration, data selection dan data transformation, maka hasilnya siap untuk dilakukan proses mining. Pada data mining, data yang dipakai merupakan sekumpulan obyek data dan atribut. Atribut merupakan karakteristik yang dimiliki oleh sebuah obyek. Gambar 2.2 memperlihatkan obyek serta atribut pada sekumpulan dataset yang akan diukur dengan menggunakan metode pada data mining. Gambar 2.2 Objek dan Atribut

2.2 Jenis-Jenis Metode Data mining