Latar Belakang Prof. Dr. Tulus 4. Dr. Erna Budhiarti Nababan, M.IT

BAB I PENDAHULUAN

1.1 Latar Belakang

Dalam pemrosesan data pada masa sekarang sangat di butuhkan beberapa metode agar mempermudah pengguna dalam mendapatkan akurasi yang lebih baik. Dengan meningkatnya teknologi informasi TI jumlah data semakin tinggi yang akan diproses dan disimpan dalam database, sehingga tingkat kesulitannya dalam memprosesan cukup tinggi. Untuk pengolahan data yang cukup banyak digunakanlah beberapa metode untuk mempermudah dalam mendapatkan solusinya. Para peneliti banyak menggunakan data mining untuk mengatasi masalah pengelompokan dan pengolahan database yang sangat besar. Data mining adalah bagian dari proses KDD Knowledge Discovery in Database yang terdiri dari beberapa tahapan seperti pemilihan data, pra pengolahan, transformasi, data mining dan evaluasi hasil Maimun dan Last, 2000. Teknik data mining secara garis besar dapat dibagi dalam dua kelompok: verifikasi dan discovery. Metode verifikasi umumnya meliputi teknik-teknik statistik seperti goodness of fit, dan analisis variansi. Metode discovery lebih lanjut dapat dibagi atas model prediktif dan model deskriptif. Teknik prediktif melakukan prediksi terhadap data dengan menggunakan hasil-hasil yang telah diketahui dari data yang berbeda. Model ini dapat dibuat berdasarkan penggunaan data historis lain. Sementara itu, model deskriptif bertujuan mengidentifikasi pola-pola atau hubungan antar data dan memberikan cara untuk mengeksplorasi karakteristik data yang diselidiki Dunham, 2003. Dalam pengolahan data, penulis ingin membuat perbandingan metode dalam memprosesnya, diantaranya menggunakan model preproceesing data Handle missing value as category dan Missing value replenishment yang dipaplikasikan pada pohon keputusan decision tree, random tree dan random forest. Universitas Sumatera Utara Seperti diketahui bahwa pohon keputusan memainkan peran penting dalam berbagai bidang seperti pengenalan pola dan klasifikasi, hal ini karena memiliki kesederhanaan, jelas dan cepat proses penalaran. Han P. H, dan Chao C. L., 1998. Dengan menggunakan perbandingan model ini, penelitian tesis ini akan memberikan aturan preprocessing mana yang paling efisien untuk diaplikaksikan pada decision tree, random tree dan random forest.

1.2. Perumusan masalah