Metode solusi yang digunakan adalah membentuk pohon keputusan dengan algoritma Iterative Dichotomizes versi 3 ID3.
1.3. Batasan Masalah
Untuk menghindari salah pengertian dalam penulisan tesis ini dan untuk lebih menfokuskan terhadap permasalahan, maka fokus permasalahan dititik beratkan
pada pemanfaatan data mining dengan pendekatan model pohon keputusan menggunakan algoritma ID3 untuk penetapan strategi pemasaran pada perguruan
tinggi swasta, meliputi:
1. Data yang akan digunakan dalam studi kasus ini adalah data calon
mahasiswa baru yang kemudian akan diolah berdasarkan proses-proses yang ada dalam data mining.
2. Mengklasifikasikan penetapan metode pemasaran berdasakan sarana
publikasi kampus terhadap fasilitas kampus, dukungan pihak sekolah dan dukungan keluarga.
3. Membangun sebuah pohon keputusan untuk pemodelan dalam mencari
solusi dari persoalan penerimaan mahasiswa baru. 4.
Sebagai prototype sistem, studi kasus dilakukan di AMIK Tunas Bangsa Pematangsiantar.
5. Analisis penerimaan mahasiswa baru tersebut dilakukan dengan
decision tree menggunakan algoritma Iterative Dichotomizes v.3 ID3.
1.4. Tujuan
Tujuan penelitian ini adalah : 1.
Menganalisis data calon mahasiswa dengan decision tree menggunakan algoritma ID3 Iterative Dichotomizes v.3.
2. Memberikan keputusan penetapan strategi pemasaran yang paling
efektif digunakan untuk pencapaian target jumlah mahasiswa baru.
1.5. Manfaat
Kegunaan penelitian ini sangat bermanfaat dan berguna, baik secara teoritis maupun praktis, yaitu :
Universitas Sumatera Utara
1. Manfaat Teoritis
Sebagai sumbangan penting dan memperluas bagi kajian ilmu komputer dalam bidang data mining sehingga dapat dijadikan rujukan
untuk membangun dalam kasus yang berbeda dimasa yang akan datang.
2. Manfaat Praktis
a. Hasil penelitian ini menghasilkan suatu keputusan didalam
penetapan strategi pemasaran dalam penerimaan mahasiswa baru di perguruan tinggi swasta.
b. Penelitian ini dapat menghasilkan keterhubungan antara fasilitas
perguruan tinggi dengan dukungan pihak sekolah dan keluarga terhadap minat calom mahasiswa pada penerimaan mahasiswa
baru. c.
Hasil penelitian ini dapat digunakan sebagai tolak ukur kinerja dari komputer untuk melakukan pencapaian target mahasiswa.
d. Hasil penelitian ini dapat meningkatkan perkembangan dunia
pendidikan khususnya di Indonesia.
Universitas Sumatera Utara
BAB II
TINJAUAN PUSTAKA
2.1. Data Mining
Dengan perkembangan pesat teknologi informasi termasuk diantaranya teknologi pengelolaan data, penyimpanan data, pengambilan data disertai kebutuhan
pengambilan keputusan yang komprehensif, cepat, dan akurat menjadikan data ada dimana-mana disekitar kita. Data terstruktur dikelola oleh database, termasuk
bagaimana me-retrieve datanya. Query yang kompleks yang dibutuhkan analis, dan pengambilan keputusan ditangani oleh OLAP Online Analytical Processing
dengan didukung data warehouse. Data mining merupakan sebuah analisis dari observasi data dalam jumlah
besar untuk menemukan hubungan yang tidak diketahui sebelumnya dan metode baru untuk meringkas data agar mudah dipahami serta kegunaannya untuk
pemilik data Hand,2001. Dengan kecanggihan teknologi yang semakin meningkat, kini database mampu untuk menyimpan data berkapasitas terabytes.
Dalam kumpulan data yang sangat banyak ini, tersimpan informasi tersembunyi yang merupakan strategi penting.
Data mining sesunggunghnya merupakan salah satu rangkaian dari proses pencarian pengetahuan pada database Knowledge Discovery in DatabaseKDD.
KDD berhubungan dengan teknik integrasi dan penemuan ilmiah, interprestasi dan visualisasi dari pola-pola sejumlah kumpulan data. KDD adalah keseluruhan
proses non-trivial untuk mencari dan mengidentifikasi pola pattern dalam data, dimana pola yang ditemukan bersifat sah, baru, dapat bermanfaat dan dapat
dimengerti. Serangkaian proses tersebut yang memiliki tahap sebagai berikut Tan,2004:
Universitas Sumatera Utara
1. Pembersihan data dan integrasi data cleaning and integration
Proses ini digunakan untuk membuang data yang tidak konsisten dan bersifat noise dari data yang terdapat diberbagai basisdata yang mungkin
berbeda format maupun platform yang kemudian diintegrasikan dalam satu database data warehouse.
2. Seleksi dan transformasi data selection and transformation
Data yang terdapat dalam database data warehouse kemudian direduksi dengan berbagai teknik. Proses reduksi diperlukan untuk mendapatkan
hasil yang lebih akurat dan mengurangi waktu komputasi terutama untuk masalah dengan skala besar large scale problem. Beberapa cara seleksi,
antara lain: a.
Sampling, adalah seleksi subset representatif dari populasi data yang besar.
b. Denoising, adalah proses menghilangkan noise dari data yang akan
ditransformasikan c.
Feature extraction, adalah proses membuka spesifikasi data yang signifikan dalam konteks tertentu.
Transformasi data diperlukan sebagai tahap pre-procecing, dimana data yang diolah siap untuk ditambang. Beberapa cara transformasi, antara lain
Santosa,2007: 1.
Centering, mengurangi setiap data dengan rata-rata dari setiap atribut yang ada.
2. Normalization, membagi setiap data yang dicentering dengan
standar deviasi dari atribut bersangkutan. 3.
Scaling, mengubah data sehingga berada dalam skala tertentu.
Universitas Sumatera Utara
Gambar 2.1: Tahap-tahap Knowledge Discovery in Database
3. Penambangan data data mining
Data yang telah diseleksi dan ditransformasi ditambang dengan berbagai teknik. Proses data mining adalah proses mencari pola atau informasi
menarik dalam data terpilih dengan menggunakan fungsi-fungsi tertentu. Fungsi atau algoritma dalam data mining sangat bervariasi. Pemilihan
fungsi atau algoritma yang tepat sangat bergantung pada tujuan dan proses pencarian pengetahuan secara keseluruhan.
4. Evaluasi pola dan presentasi pengetahuan
Tahap ini merupakan bagian dari proses pencarian pengetahuan yang mencakup pemeriksaan apakah pola atau informasi yang ditemukan
bertentangan dengan fakta atau hipotesa yang ada sebelumnya. Langkah terakhir KDD adalah mempresentasikan pengetahuan dalam bentuk yang
mudah dipahami oleh pengguna.
Universitas Sumatera Utara
2.2. Teknik Data Mining