Tinjauan Pustaka T1 672011005 Full text

1

1. Pendahuluan

Setiap siswa yang berprestasi berhak mendapatkan beasiswa sebagaimana yang yang dituangkan dalam Undang-Undang Republik Indonesia Nomor 20 Tahun 2003 tentang Sistem Pendidikan Nasional, Bab V pasal 12 1.c, menyebutkan bahwa setiap peserta didik pada setiap satuan pendidikan berhak mendapatkan beasiswa bagi yang berprestasi yang orang tuanya kurang mampu membiayai pendidikannya. Pasal 12 1.d, menyebutkan bahwa setiap peserta didik pada setiap satuan pendidikan berhak mendapatkan biaya pendidikan bagi mereka yang orang tuanya kurang mampu membiayai pendidikannya. SMA Santo Bernadus Pekalongan merupakan salah satu sekolah swasta yang turut serta membantu siswa kurang mampu dalam menempuh pendidikan di sekolah dengan cara pemberian beasiswa. Keputusan dalam memberikan beasiswa kepada siswa merupakan hak mutlak pihak sekolah. Keterbatasan beasiswa yang tersedia merupakan salah satu faktor betapa pentingnya alokasi beasiswa yang tersedia harus tepat diberikan kepada siswa yang sangat membutuhkan. Oleh sebab itu, dari sekian banyak pelamar beasiswa, sekolah harus melakukan seleksi dan menentukan siapa saja siswa yang layak mendapatkan beasiswa. Masalah utama dalam membuat keputusan penerima beasiswa adalah dari semua siswa yang mengajukan permohonan beasiswa seluruh pelamar memenuhi kualifikasi penerima beasiswa namun beasiswa yang tersedia tidak dapat digunakan untuk seluruh pelamar beasiswa. Sekolah perlu menentukan siapa saja pelamar yang lebih pantas mendapatkan beasiswa. Algoritma K-Means merupakan salah satu algoritma clustering yang paling sederhana dibandingkan dengan algoritma lainnya karena lebih muda diterapkan dan dijalankan, relatif cepat, mudah adaptasi, dan paling banyak digunakan dalam data mining. K-Means membagi data kemudian mengelompokkannya ke dalam berbagai cluster yang memiliki kemiripan dan memisahkan setiap cluster berdasarkan perbedaan antar masing-masing cluster. Algoritma ini telah dikemukakan oleh beberapa peneliti dari disiplin ilmu yang berbeda [1]. Algoritma K-Means dapat mengelompokkan data siswa yang mengajukan permohonan beasiswa ke dalam dua kelompok yakni kelompok prioritas dan tidak prioritas. Pengelompokan ini diharapkan dapat membantu pihak sekolah dalam mengambil keputusan pemberian beasiswa sehingga walaupun semua pelamar beasiswa memenuhi kualifikasi penerima beasiswa namun dengan adanya implementasi algoritma K-Means ini pihak sekolah dapat melihat siapa saja siswa-siswa yang berhak mendapatkan beasiswa. Berdasarkan latar belakang tersebut, maka dilakukan penelitian yang berjudul Implementasi Algoritma K-Means dalam Keputusan Pemberian Beasiswa Studi Kasus SMA Santo Bernadus Pekalongan.

2. Tinjauan Pustaka

Penelitian terdahulu yang berjudul Pengembangan Sistem Penunjang Keputusan Pemberian Beasiswa Tingkat Sekolah menjelaskan bahwa setiap lembaga pendidikan khususnya sekolah banyak sekali beasiswa yang ditujukan 2 kepada siswa, baik yang berprestasi maupun yang kurang mampu. Beasiswa ditujukan untuk membantu meringankan beban biaya siswa yang mendapatkannya. Untuk memperoleh beasiswa tersebut harus sesuai dengan kriteria-kriteria yang telah ditetapkan, seperti jumlah penghasilan orang tua, jumlah tanggungan orang tua, jumlah saudara kandung, nilai rata-rata, dan persentase kehadiran siswa kerajinan. Untuk membantu menentukan seorang siswa menerima beasiswa, maka dapat digunakan sebuah Sistem Penunjang Keputusan SPK, dimana salah satu model keputusan yang dapat digunakan adalah dengan model Fuzzy Multiple Attribute Decision Making FMADM. FMADM adalah suatu metode yang digunakan untuk mencari alternatif optimal dari sejumlah alternatif dengan kriteria tertentu. Hasil dari penelitian ini adalah sebuah aplikasi SPK yang dapat membantu pihak sekolah dalam menentukan siapa yang akan menerima beasiswa berdasarkan kriteria-kriteria serta bobot yang ditentukan [2]. Penelitian lainnya berjudul Sistem Pendukung Keputusan Pemberian Beasiswa Menggunakan Metode Simple Additive Weighting di Universitas Panca Marga Probolinggo. Universitas Panca Marga Probolinggo sebagai tempat perkembangan belajar dan diri, menyediakan fasilitas untuk beasiswa prestasi siswa. Program beasiswa ini diharapkan dapat memacu minat siswa dalam belajar untuk menjadi lebih sempurna. Dalam menentukan penerima beasiswa, administrator memilih calon penerima beasiswa fakultas atas dasar kriteria yang ada. Dalam proses pemilihan, admin fakultas mengalami kesulitan memilih data calon penerima karena setiap jenis kriteria beasiswa dan bobot kriteria yang berbeda sehingga memerlukan ketelitian dalam melakukan perhitungan nilai kriteria. Mengatasi masalah tersebut dikembangkanlah sistem pendukung keputusan penentuan beasiswa dengan menggunakan metode Simple Additive Weighting SAW. Sistem ini dapat membantu admin untuk melakukan keputusan penerima beasiswa dan dapat meminimalkan terjadinya kehilangan data calon penerima beasiswa [3]. Penelitian lain yang menerapkan Algortima K-Means adalah Implementasi Algoritma K-Means untuk Menentukan Kelompok Pengayaan Materi Mata Pelajaran Ujian Nasional Studi Kasus: SMP Negeri 101 Jakarta. Pengayaan materi merupakan salah satu persiapan peserta didik untuk menghadapi Ujian Nasional. Di SMP Negeri 101 Jakarta terdapat dua pengayaan materi, yaitu pengayaan materi wajib dan pengayaan materi khusus. Pengayaan materi khusus dilaksanakan dengan melihat hasil akhir rapor semester 5. Proses pengelompokan kemampuan siswa untuk melaksanakan pengayaan materi khusus masih belum maksimal karena kemampuan siswa tersebut tidak hanya diukur dari rapor terakhir saja, melainkan nilai rapor semester 1 hingga 5 berikut nilai tes terakhir untuk menambah keakuratan data. Untuk itu diperlukan solusi yang dapat mengatasi kesulitan tersebut. Metode clustering dengan menggunakan algoritma K-Means diimplementasikan dalam aplikasi ini. Aplikasi ini selain menampilkan pengelompokan kemampuan siswa pada mata pelajaran Ujian Nasional, juga dapat digunakan untuk memantau perkembangan kemampuan setelah mengikuti pengayaan materi [4]. 3 Berdasarkan penelitian-penelitian terdahulu terkait sistem informasi pendukung keputusan pemberian beasiswa, maka dilakukan penelitian yang membahas tentang implementasi algoritma K-Means dalam sistem keputusan pemberian beasiswa. Terdapat perbedaan metode dengan penelitian terdahulu dalam proses penentuan pemberian beasiswa. Penelitian terdahulu menggunakan metode yang diaplikasikan pada Sistem Pendukung Keputusan sedangkan metode yang digunakan pada penelitian ini adalah sistem clustering dalam pemberian keputusan penerima beasiswa. Sistem pendukung keputusan menghasilkan hasil perhitungan dalam bentuk ranking data mulai dari nilai tertinggi sampai dengan nilai terendah sedangkan sistem clustering dengan menggunakan algoritma K- Means menghasilkan informasi berupa kelompok siswa yang layak menerima beasiswa dan tidak layak menerima beasiswa. Clustering adalah suatu alat untuk analisa data, yang memecahkan permasalahan pengelompokan. Obyeknya ialah untuk kasus pendistribusian orang-orang, objek, peristiwa dan lainnya ke dalam kelompok, sedemikian hingga derajat tingkat keterhubungan antar anggota cluster yang sama adalah kuat dan lemah antar anggota dari cluster yang berbeda. Berdasarkan cara ini masing- masing cluster menguraikan, dalam kaitan dengan kumpulan atau koleksi data, class dimana milik anggota-anggotanya. Cluster disebut juga data item yang dikelompokkan menurut pilihan konsumen atau hubungan logis [5]. Clustering memegang peranan penting dalam aplikasi data mining, misalnya eksplorasi data ilmu pengetahuan, pengaksesan informasi dan text mining, aplikasi basis data spasial, dan analisis web. Clustering diterapkan dalam mesin pencari di Internet. Web mesin pencari akan mencari ratusan dokumen yang cocok dengan kata kunci yang dimasukkan. Dokumen ‐dokumen tersebut dikelompokkan dalam cluster ‐cluster sesuai dengan kata‐ kata yang digunakan Algoritma clustering ke dalam kelompok besar seperti berikut [6]: Pertama adalah Partitioning algorithms, algoritma dalam kelompok ini membentuk bermacam partisi dan kemudian mengevaluasinya dengan berdasarkan beberapa kriteria. Kedua adalah Hierarchy algorithms, pembentukan dekomposisi hirarki dari sekumpulan data menggunakan beberapa kriteria. Ketiga adalah Density ‐based, pembentukan cluster berdasarkan pada koneksi dan fungsi densitas. Keempat adalah Grid ‐based, pembentukan cluster berdasarkan pada struktur multiple ‐level granularity. Kelima adalah Model ‐based, sebuah model dianggap sebagai hipotesa untuk masing ‐ masing cluster dan model yang baik dipilih di antara model hipotesa tersebut. K-means clustering merupakan salah satu metode data clustering non-hirarki yang mengelompokkan data dalam bentuk satu atau lebih clusterkelompok. Data- data yang memiliki karakteristik yang sama dikelompokkan dalam satu clusterkelompok dan data yang memiliki karakteristik yang berbeda dikelompokkan dengan clusterkelompok yang lain sehingga data yang berada dalam satu clusterkelompok memiliki tingkat variasi yang kecil [7]. Langkah-langkah melakukan clustering dengan metode K-Means adalah sebagai berikut [8]: Langkah pertama adalah pilih jumlah cluster k. Langkah kedua adalah inisialisasi k pusat cluster ini bisa dilakukan dengan berbagai cara. Namun yang paling sering dilakukan adalah dengan cara random. Pusat-pusat 4 cluster diberi nilai awal dengan angka-angka random. Langkah ketiga adalah alokasikan semua data objek ke cluster terdekat. Kedekatan dua objek ditentukan berdasarkan jarak kedua objek tersebut, demikian juga kedekatan suatu data ke cluster tertentu ditentukan jarak antara data dengan pusat cluster. Dalam tahap ini perlu dihitung jarak tiap data ke tiap pusat cluster. Jarak paling dekat antara satu data dengan satu cluster tertentu akan menentukan suatu data masuk dalam cluster mana. Untuk menghitung jarak semua data ke setiap titik pusat cluster dapat menggunakan teori jarak Euclidean yang dirumuskan seperti pada Rumus 1. Rumus 1 . Perumusan teori jarak Euclidean Langkah keempat adalah hitung kembali pusat cluster dengan keanggotaan cluster yang sekarang. Pusat cluster adalah rata-rata dari semua dataobjek dalam cluster tertentu. Jika dikehendaki dapat juga menggunakan median dari cluster tersebut. Jadi rata-rata mean bukan satu-satunya ukuran yang dapat digunakan. Langkah kelima adalah tugaskan lagi setiap objek menggunakan pusat cluster yang baru. Jika pusat cluster tidak berubah lagi maka proses clustering selesai. Atau, kembali ke langkah nomor 3 sampai pusat cluster tidak berubah lagi. Ada beberapa kelebihan pada algoritma k-means, yaitu [9]: Mudah untuk diimplementasikan dan dijalankan, waktu yang dibutuhkan untuk menjalankan pembelajaran ini relatif cepat, mudah untuk diadaptasi, dan umum digunakan. Algoritma k-means memiliki beberapa kelebihan, namun ada kekurangannya juga. Kekurangan dari algoritma tersebut yaitu: 1 sebelum algoritma dijalankan, k buah titik diinisialisasi secara random sehingga pengelompokkan data yang dihasilkan dapat berbeda-beda. Jika nilai random untuk inisialisasi kurang baik, maka pengelompokkan yang dihasilkan pun menjadi kurang optimal. 2 Terjebak dalam masalah yang disebut curse of dimensionality. Hal ini dapat terjadi jika data pelatihan memiliki dimensi yang sangat tinggi Contoh jika data pelatihan terdiri dari 2 atribut maka dimensinya adalah 2 dimensi. Namun jika ada 20 atribut, maka akan ada 20 dimensi. Salah satu cara kerja algoritma ini adalah mencari jarak terdekat antara k buah titik dengan titik lainnya. Jika mencari jarak antar titik pada 2 dimensi, masih mudah dilakukan. Namun bagaimana mencari jarak antar titik jika terdapat 20 dimensi. 3 Jika hanya terdapat beberapa titik sampel data, maka cukup mudah untuk menghitung dan mencari titik terdekat dengan k titik yang diinisialisasi secara random. Namun jika terdapat banyak sekali titik data misalnya satu milyar buah data, maka perhitungan dan pencarian titik terdekat akan membutuhkan waktu yang lama. Proses tersebut dapat dipercepat, namun dibutuhkan struktur data yang lebih rumit seperti kD-Tree atau hashing. 5

3. Metode dan Perancangan Sistem