1. Dapat terus dipelihara setelah perangkat lunak selesai dibuat seiring berkembangnya teknologi dan lingkungan maintainability.
2. Dapat diandalkan dengan proses bisnis yang dijalankan dan perubahan yang terjadi dependability dan robust.
3. Efisien dari segi sumber daya dan penggunaan. 4. Kemampuan untuk dipakai sesuai denga kebutuhan usability
Rosa A.S, M. Shalahuddin; 2011: 4-5.
2.3 Proses Rekayasa Perangkat Lunak
Proses perangkat lunak software process adalah sekumpulan aktivitas yang memiliki tujuan mengembangkan atau mengubah perangkat lunak.
Secara umum proses perangkat lunak terdiri dari : 1. Pengumpulan Spesifikasi Specification, yaitu : mengetahui apa saja yang
harus dapat dikerjakan sistem perangkat lunak dan batasan pengembangan perangkat lunak.
2. Pengembangan Development, yaitu : pengembangan perangkat lunak untuk menghasilkan perangat lunak.
3. Validasi Validation yaitu : memeriksa apakah perangkat lunak sudah memenuhi kebutuhan pelanggan custumer.
4. Evolusi Evolution mengubah perangkat lunak untuk memenuhi perubahan kebutuhan pelanggan custumer. Rosa A.S, M. Shalahuddin; 2011: 9.
2.4 Kecerdasan Buatan
Kecerdasan buatan berasal dari bahasa Inggris “Artificial Intelligence” disingkat AI, yaitu intelliegence adalah kata sifat yang berarti cerdas, sedangkan artificial
artinya buatan. Kecerdasan buatan yang dimaksud disini merujuk pada mesin
Universitas Sumatera Utara
yang mampu berfikir, menimbang tindakan yang akan diambil, dan mampu mengambil keputusan seperti yang dilakukan oleh manusia.
Berdasarkan defenisi ini, maka kecerdasan buatan menawarkan media maupun uji teori tentang kecerdasan.Teori-teori ini nantinya dapat dinyatakan
dalam bahasa pemrograman dan eksekusinya dapat dibuktikan pada komputer nyata.
Program konvensional hanya dapat menyelesaikan persoalan yang diprogram secara spesifik.Jika ada informasi baru, sebuah program konvensional
harus diubah untuk menyesuaikan diri dengan informasi tersebut.Hal ini tidak hanya menyebabkan boros waktu, namun juga dapat menyebabkan terjadinya
error. Sebaliknya, kecerdasan buatan memungkinkan komputer untuk berfikir atau menalar dan menirukan proses belajar manusia sehingga informasi baru dapat
diserap sebagai pengetahuan, pengalaman, dan proses pembelajaran serta dapat digunakan sebagai acuan di masa-masa yang akan datang. Dari sini dapat
dikatakan bahwa : cerdas adalah memiliki pengetahuan, pengalaman dan penalaran untuk membuat keputusan dan mengambil tindakan. Jadi, agar mesin
bisa cerdas bertidak seperti manusia maka harus diberi bekal pengetahuan dan diberi kemampuan untuk menalar T. Sutojo, dkk; 2011: 1-3.
2.5 Penambangan Data Data Mining
Data mining penambangan data adalah suatu proses untuk menemukan suatu pengetahuan atau informasi yang berguna dari data berskala besar. Sering juga
disebut segabai bagian proses KDD Knowledge Discovery in Databases. Santosa,2007.
Data mining adalah bagian dari proses KDD Knowledge Discovery in Database yang terdiri dari beberapa tahapan seperti pemilihan data, pra-
pengolahan, transformasi, data mining, dan interpretasi hasil. Opim, 2008: 10.
Universitas Sumatera Utara
Data mining adalah suatu istilah yang digunakan untuk menguraikan penemuan pengetahuan di dalam database. Data mining adalah proses yang
menggunankan teknik statistik, matematika, kecerdasan buatan dan machine learning untukmengekstraksi dan mengindentifikasi informasi yang bermanfaat
dan pengetahuan yang terkait dari berbagai database besar`Turban, dkk. 2005. Menurut Gartner Group data mining adalah suatu proses menemukan
hubungan yang berarti, pola, dan kecendrungan dengan memeriksa dalam sekumpulan besar data yang tersimpan dalam penyimanan dengan menggunakan
teknik pengenalan pola teknik statistik dan matematika.Larose. 2005. Selain defenisi diatas beberapa defenisi juga diberikan seperti tertera di
bawah ini : “data mining adalah serangkaian proses untuk menggali nilai tambah dari suatu kumpulan data berupa pengetahuan yang selama ini tidak diketahui
secara manual.” Pramudiono, 2006. “Data mining adalah analisis otomatis dari data berjumlahbesar atau
komplek dengan tujuan untuk menemukan pola atau kecendrungan yang penting yang biasanya tidak disadari keberadaannya.”Pramudiono, 2006.
“Data mining merupakan bidang dari beberapa bidang keilmuan yang menyatukan teknik dari pembelajaran mesin, pengenalan pola, statistik, database,
dan visualisasi untuk penanganan permasalahan pengambilan informasi dari database yang besar.” Larose, 2005.
Data mining adalah mengenai pemecahan masalah dengan menganalisa data yang ada di dalam database dan sering juga didefinisikan sebagai proses
menemukan pola dalam data, dimana proses tersebut harus otomatis atau semi- otomatis dan pola yang ditemukan harus bermakna Chakrabarti, et al., 2009.
Dari defenisi-defenisi yang telah disampaikan, hal penting yang terkait dengan data mining adalah :
1. Data mining merupakan suatu proses otomatis terhadap data yang sudah ada. 2. Data yang akan diproses berupa data yang sangat besar.
Universitas Sumatera Utara
3. Tujuan data mining adalah mendapatkan hubungan atau pola yang mungkin memberikan indikasi yang bermanfaat.
Hubungan yang dicari dalam data mining dapat berupa hubungan antara dua atau lebih dalam satu dimensi. Misalnya dalam dimensi produk kita dapat
melihat keterkaitan pembelian suatu produk dengan produk yang lain. Selain itu, hubungan juga dapat dilihat antara dua atau lebih atribut dan dua atau lebih objek
Ponniah, 2001. Sementara itu, penemuan pola merupakan keluaran lain dari data mining.
Misalkan sebuah perusahaan yang akan meningkatkan fasilitas kartu kredit dari pelanggan, maka perusahaan akan mencari pola dari pelanggan-pelanggan yang
ada untuk mengetahui pelanggan yang potensial dan pelanggan yang tidak potensial.
Beberapa dari defenisi awal dari data mining mnyertakan fokus pada proses otomatisasi. Bery dan Linoff dalam buku Data Mining Technique For
Marketing, Sales, and Cusstomers Support mendefenisikan data mining sebagai proses ekplorasi dan analisis secara otomatis maupun semiotomatis terhadap data
dalam jumlah besar dengan tujuan menemukan pola atau aturan yang berarti Larose, 2005.
Istilah data mining dan knowledge discovery in database KDD sering kali digunakan secara bergantian untuk menjelaskan proses penggalian informasi
tersembunyi dalam suatu basis data yang besar. Sebenarnya kedua istilah tersebut memiliki konsep berbeda, tetapi berkaitan satu sama lain. Dalam salah satu
tahapan dalam keseluruhan proses KDD adalah data mining. Proses KDD secara garis besar dapat dijelaskan sebagai berikut Fayyad, 1996.
1. Data selection Pemilihan seleksi data dari sekumpulan data operasional perlu dilakukan
sebelum tahap penggalian informasi dalam KDD dimulai. Data hasil seleksi yang akan digunakan utuk proses data mining, disimpan dalam suatu berkas,
terpisah dari basis data operasional. 2. Pre-processing Cleaning
Universitas Sumatera Utara
Sebelum proses data mining dapat dilaksakan, perlu dilakukan proses cleaning pada data yang menjadi fokus KDD. Proses cleaning mencakup
antara lain membuang duplikasi data, memeriksa data yang inkonsisten, dan memperbaiki kesalahan pada data, seperti kesalahan cetak tipografi. Juga
dilakukan proses enrichment, yaitu pro ses “memperkaya” data yang sudah
ada dengan data atau informasi lain yang relevan dan diperlukan untuk KDD, seperti data atau informasi eksternal.
3. Transformation Coding adalah proses transformasi pada data yang telah dipilih, sehingga data
tersebut sesuai dengan proses data mining. Proses coding dalam KDD merupakan proses kreatif dan sangat tergantung pada jenis atau pola
informasi yang akan dicari dalam basis data.
4. Data mining Data mining adalah proses mencari pola atau informasi menarik dalam data
terpilih dengan menggunakan teknik atau metode tertentu. Teknik, metode atau algoritma dalam data mining sangat bervariasi. Pemilihan metode atau
algoritma yang tepat sangat tergantung pada tujuan dan proses KDD secara keseluruhan.
5. InterpretationEvaluation Pola informasi yang dihasilkan dari proses data mining perlu ditampilkan
dalam bentuk yang mudah dimengerti oleh pihak yang berkepentingan. Tahap ini merupakan bagian dari proses KDD yang disebut interpretation. Tahap ini
mencakup pemeriksaan apakah pola atau informasi yang ditemukan bertentangan dengan fakta atau hipotesis yang ada sebelumnya.
Cros-Industry Standart Process For Data Mining CRISP-DM yang dikembangakan tahun 1996 oleh analisis dari beberapa industri seperti
DaimlerChrysler, SPSS dan NCR. CRISP DM menyediakan standar proses data mining sebagai strategi pemecahan masalah secara umum dari bisnis atau unit
penelitian.
Universitas Sumatera Utara
Dalam CRISP DM, sebuah proyek data mining memiliki siklus hidup yang terbagi dalam enam fase. Keseluruhan fase berurutan yang ada tersebut bersifat
adaptif.Fase berikutnya dalam urutan bergantung pada keseluruhan dari fase sebelumnya.Hubungan penting antarfase digambarkan dengan panah. Sebagai
contoh, jika proses berada pada fase modeling. Bedasarkan pada perilaku dan karakteristik model, proses mungkin harus kembali kepada fase data preparation
untuk perbaikan lebih lanjut terhadap data atau perpindahan maju kepada fase evaluation.
Enam fase CRISP DM Larose, 2005 1. Fase Pemahaman Bisnis Business Understanding Phase
a. Menentukan tujuan proyek dan kebutuhan secara detail dalam lingkuo bisnis atau unit penelitian secara keseluruhan.
b. Menerjemahkan tujuan
dan batasan
menjadi formula
dari permasalahan data mining.
c. Menyiapkan strategi awal untuk mencapai tujuan. 2. Fase Pemahaman Data Data Understanding Phase
a. Mengumpulakan data. b. Menggunkan analisis penyelidikan data untuk mengenali lebih lanjut
data dan pencarian pengetahuan awal. c. Mengevaluasi kualitas data.
d. Jika diinginkan, pilih sebagian grup data yang mungkin mengandung pola dari permasalahan.
3. Fase Pengolahan Data Data Preperation Phase a. Siapkan dari data awal, kumpulan data yang akan digunakan untuk
keseluruhan fase berikutnya. Fase ini merupakan pekerjaan berat yang perlu dilaksakan secara intensif.
b. Pilih kasus dari variabel yang ingin dianalisis dan yang sesuai dengann analisis yang aka dilakukan.
c. Lakukan perubahan pada beberapa variabel jika dibutuhkan. d. Siapkan data awal sehingga siap untuk perangkat pemodelan.
Universitas Sumatera Utara
4. Fase Pemodelan Modelling Phase a. Pilih dan aplikasikan teknik pemodelan yang sesuai.
b. Kalibrasi aturan model untuk menoptimalkan hasil. c. Perlu diperhatikan bahwa beberapa teknik mungkin untuk digunakan
pada permasalahan data mining yang sama. d. Jika diperlukan, proses dapat kembali ke fase pengolahan data untuk
menjadikan data ke dalam bentuk yang sesuai dengan spesifikasi kebutuhan teknik data mining tertentu.
5. Fase Evaluasi Evaluation Phase a. Mengevaluasi satu atau lebih model yang digunakan dalam fase
pemodelan untuk mendapatkan kualitas dan efektivitas sebelum disebarkan untuk digunakan.
b. Menetapkan apakah model yang memenuhi tujuan pada fase awal. c. Menetukan apakah permasalahan penting ari bisnis atau penelitian
yang tidak tertangani dengan baik. d. Mengambil keputusan berkaitan dengan penggunaan hasil dari data
mining. 6. Fase Penyebaran Deployment Phase
a. Menggunakan model yang dihasilkan. Terbentuknya model tidak menandakan telah terselesaikannya proyek.
b. Contoh sederhana penyebaran : Pembuatan lapoaran. c. Contoh kompleks penyebaran : Penerapan proses data mining secara
paralel pada departemen lain. 2.5.1 Tahapan Penambangan Data Data mining
Penambangan data data mining dipahami sebagai suatu proses, yang memiliki tahapan - tahapan tertentu yang bersifat interaktif dan juga ada umpan balik dari
setiap tahapan sebelumnya. Kusnawi, 2007.
Universitas Sumatera Utara
Gambar 2.1.Tahap-tahap penambangan data. Han, J., et al,2006
Tahap – tahap tersebut, bersifat interaktif dimana pemakai terlibat
langsung atau dengan perantaraan knowledge base. 1. Pembersihan data
2. Integrasi data 3. Transformasi data
4. Aplikasi teknik penambangan data data mining 5. Evaluasi pola yang ditemukan
6. Presentasi pengetahuan
2.5.2 Pengelompkan Data Mining Data mining dibagi menjadi beberapa kelompok berdasarkan tugas yang dapat
dilakukan, yaitu Larose, 2005. 1. Deskripsi
Universitas Sumatera Utara
Terkadang peneliti dan analis secara sederhana ingin mencoba mancari cara untuk menggambarkan pola dan kecendrungan yang terdapat dalam data.
Deskripsi dari pola dan kecendrungan sering memberikan kemungkinan penjelasan untuk suatu pola atau kecendrungan.
2. Estimasi Estimasi hampir sama dengan klasifikasi, kecuali variabel target estimasi
lebih ke arah numerik dari pada ke arah kategori. 3. Prediksi
Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa dalam prediksi nilai ari hasil akan ada di masa mendatang.
4. Klasifikasi Dalam klasifikasi, terdapat target variabel kategori.
5. Pengklusteran Pengklusteran merupakan pengelompokkan record, pengamatan, atau
memperhatikan dan membentuk kelas objek-objek yang memiliki kemiripan.
6. Asosiasi Tugas asosiasi dalam data mining adalah menemukan atribut yang muncul
dalam satu waktu.
2.6 Clustering