1
1. Pendahuluan
Setiap siswa yang berprestasi berhak mendapatkan beasiswa sebagaimana yang yang dituangkan dalam Undang-Undang Republik Indonesia Nomor 20
Tahun 2003 tentang Sistem Pendidikan Nasional, Bab V pasal 12 1.c, menyebutkan bahwa setiap peserta didik pada setiap satuan pendidikan berhak
mendapatkan beasiswa bagi yang berprestasi yang orang tuanya kurang mampu membiayai pendidikannya. Pasal 12 1.d, menyebutkan bahwa setiap peserta
didik pada setiap satuan pendidikan berhak mendapatkan biaya pendidikan bagi mereka yang orang tuanya kurang mampu membiayai pendidikannya.
SMA Santo Bernadus Pekalongan merupakan salah satu sekolah swasta yang turut serta membantu siswa kurang mampu dalam menempuh pendidikan di
sekolah dengan cara pemberian beasiswa. Keputusan dalam memberikan beasiswa kepada siswa merupakan hak mutlak pihak sekolah. Keterbatasan beasiswa yang
tersedia merupakan salah satu faktor betapa pentingnya alokasi beasiswa yang tersedia harus tepat diberikan kepada siswa yang sangat membutuhkan. Oleh
sebab itu, dari sekian banyak pelamar beasiswa, sekolah harus melakukan seleksi dan menentukan siapa saja siswa yang layak mendapatkan beasiswa.
Masalah utama dalam membuat keputusan penerima beasiswa adalah dari semua siswa yang mengajukan permohonan beasiswa seluruh pelamar memenuhi
kualifikasi penerima beasiswa namun beasiswa yang tersedia tidak dapat digunakan untuk seluruh pelamar beasiswa. Sekolah perlu menentukan siapa saja
pelamar yang lebih pantas mendapatkan beasiswa.
Algoritma K-Means merupakan salah satu algoritma clustering yang paling sederhana dibandingkan dengan algoritma lainnya karena lebih muda diterapkan
dan dijalankan, relatif cepat, mudah adaptasi, dan paling banyak digunakan dalam data mining. K-Means membagi data kemudian mengelompokkannya ke dalam
berbagai cluster yang memiliki kemiripan dan memisahkan setiap cluster berdasarkan perbedaan antar masing-masing cluster. Algoritma ini telah
dikemukakan oleh beberapa peneliti dari disiplin ilmu yang berbeda [1].
Algoritma K-Means dapat mengelompokkan data siswa yang mengajukan permohonan beasiswa ke dalam dua kelompok yakni kelompok prioritas dan tidak
prioritas. Pengelompokan ini diharapkan dapat membantu pihak sekolah dalam mengambil keputusan pemberian beasiswa sehingga walaupun semua pelamar
beasiswa memenuhi kualifikasi penerima beasiswa namun dengan adanya implementasi algoritma K-Means ini pihak sekolah dapat melihat siapa saja
siswa-siswa yang berhak mendapatkan beasiswa.
Berdasarkan latar belakang tersebut, maka dilakukan penelitian yang berjudul
Implementasi Algoritma
K-Means dalam
Keputusan Pemberian Beasiswa Studi Kasus SMA Santo Bernadus Pekalongan.
2. Tinjauan Pustaka
Penelitian terdahulu yang berjudul Pengembangan Sistem Penunjang Keputusan Pemberian Beasiswa Tingkat Sekolah menjelaskan bahwa setiap
lembaga pendidikan khususnya sekolah banyak sekali beasiswa yang ditujukan
2
kepada siswa, baik yang berprestasi maupun yang kurang mampu. Beasiswa ditujukan
untuk membantu
meringankan beban
biaya siswa
yang mendapatkannya. Untuk memperoleh beasiswa tersebut harus sesuai dengan
kriteria-kriteria yang telah ditetapkan, seperti jumlah penghasilan orang tua, jumlah tanggungan orang tua, jumlah saudara kandung, nilai rata-rata, dan
persentase kehadiran siswa kerajinan. Untuk membantu menentukan seorang siswa menerima beasiswa, maka dapat digunakan sebuah Sistem Penunjang
Keputusan SPK, dimana salah satu model keputusan yang dapat digunakan adalah dengan model Fuzzy Multiple Attribute Decision Making FMADM.
FMADM adalah suatu metode yang digunakan untuk mencari alternatif optimal dari sejumlah alternatif dengan kriteria tertentu. Hasil dari penelitian ini adalah
sebuah aplikasi SPK yang dapat membantu pihak sekolah dalam menentukan siapa yang akan menerima beasiswa berdasarkan kriteria-kriteria serta bobot yang
ditentukan [2].
Penelitian lainnya berjudul Sistem Pendukung Keputusan Pemberian Beasiswa Menggunakan Metode Simple Additive Weighting di Universitas Panca
Marga Probolinggo. Universitas Panca Marga Probolinggo sebagai tempat perkembangan belajar dan diri, menyediakan fasilitas untuk beasiswa prestasi
siswa. Program beasiswa ini diharapkan dapat memacu minat siswa dalam belajar untuk
menjadi lebih
sempurna. Dalam
menentukan penerima
beasiswa, administrator memilih calon penerima beasiswa fakultas atas dasar kriteria yang
ada. Dalam proses pemilihan, admin fakultas mengalami kesulitan memilih data calon penerima karena setiap jenis kriteria beasiswa dan bobot kriteria yang
berbeda sehingga memerlukan ketelitian dalam melakukan perhitungan nilai kriteria.
Mengatasi masalah
tersebut dikembangkanlah
sistem pendukung
keputusan penentuan beasiswa dengan menggunakan metode Simple Additive Weighting SAW. Sistem ini dapat membantu admin untuk melakukan keputusan
penerima beasiswa dan dapat meminimalkan terjadinya kehilangan data calon penerima beasiswa [3].
Penelitian lain yang menerapkan Algortima K-Means adalah Implementasi Algoritma K-Means untuk Menentukan Kelompok Pengayaan Materi Mata
Pelajaran Ujian Nasional Studi Kasus: SMP Negeri 101 Jakarta. Pengayaan materi merupakan salah satu persiapan peserta didik untuk menghadapi Ujian
Nasional. Di SMP Negeri 101 Jakarta terdapat dua pengayaan materi, yaitu pengayaan materi wajib dan pengayaan materi khusus. Pengayaan materi khusus
dilaksanakan dengan melihat hasil akhir rapor semester 5. Proses pengelompokan kemampuan siswa untuk melaksanakan pengayaan materi khusus masih belum
maksimal karena kemampuan siswa tersebut tidak hanya diukur dari rapor terakhir saja, melainkan nilai rapor semester 1 hingga 5 berikut nilai tes terakhir
untuk menambah keakuratan data. Untuk itu diperlukan solusi yang dapat mengatasi kesulitan tersebut. Metode clustering dengan menggunakan algoritma
K-Means diimplementasikan dalam aplikasi ini. Aplikasi ini selain menampilkan pengelompokan kemampuan siswa pada mata pelajaran Ujian Nasional, juga
dapat digunakan untuk memantau perkembangan kemampuan setelah mengikuti pengayaan materi [4].
3
Berdasarkan penelitian-penelitian
terdahulu terkait
sistem informasi
pendukung keputusan pemberian beasiswa, maka dilakukan penelitian yang membahas tentang implementasi algoritma K-Means dalam sistem keputusan
pemberian beasiswa. Terdapat perbedaan metode dengan penelitian terdahulu dalam proses penentuan pemberian beasiswa. Penelitian terdahulu menggunakan
metode yang diaplikasikan pada Sistem Pendukung Keputusan sedangkan metode yang digunakan pada penelitian ini adalah sistem clustering dalam pemberian
keputusan penerima beasiswa. Sistem pendukung keputusan menghasilkan hasil perhitungan dalam bentuk ranking data mulai dari nilai tertinggi sampai dengan
nilai terendah sedangkan sistem clustering dengan menggunakan algoritma K- Means menghasilkan informasi berupa kelompok siswa yang layak menerima
beasiswa dan tidak layak menerima beasiswa.
Clustering adalah suatu alat untuk analisa data, yang memecahkan permasalahan pengelompokan. Obyeknya ialah untuk kasus pendistribusian
orang-orang, objek, peristiwa dan lainnya ke dalam kelompok, sedemikian hingga derajat tingkat keterhubungan antar anggota cluster yang sama adalah kuat
dan lemah antar anggota dari cluster yang berbeda. Berdasarkan cara ini masing- masing cluster menguraikan, dalam kaitan dengan kumpulan atau koleksi data,
class dimana milik anggota-anggotanya. Cluster disebut juga data item yang dikelompokkan menurut pilihan konsumen atau hubungan logis [5].
Clustering memegang peranan penting dalam aplikasi data mining, misalnya eksplorasi data ilmu pengetahuan, pengaksesan informasi dan text mining, aplikasi
basis data spasial, dan analisis web. Clustering diterapkan dalam mesin pencari di Internet. Web mesin pencari akan mencari ratusan dokumen yang cocok dengan
kata kunci yang dimasukkan. Dokumen ‐dokumen tersebut dikelompokkan dalam
cluster ‐cluster sesuai dengan kata‐ kata yang digunakan
Algoritma clustering ke dalam kelompok besar seperti berikut [6]: Pertama adalah Partitioning algorithms, algoritma dalam kelompok ini membentuk
bermacam partisi dan kemudian mengevaluasinya dengan berdasarkan beberapa kriteria. Kedua adalah Hierarchy algorithms, pembentukan dekomposisi hirarki
dari
sekumpulan data
menggunakan beberapa
kriteria. Ketiga
adalah Density
‐based, pembentukan cluster berdasarkan pada koneksi dan fungsi densitas. Keempat adalah Grid
‐based, pembentukan cluster berdasarkan pada struktur multiple
‐level granularity. Kelima adalah Model ‐based, sebuah model
dianggap sebagai hipotesa untuk masing ‐ masing cluster dan model yang baik
dipilih di antara model hipotesa tersebut. K-means clustering merupakan salah satu metode data clustering non-hirarki
yang mengelompokkan data dalam bentuk satu atau lebih clusterkelompok. Data- data yang memiliki karakteristik yang sama dikelompokkan dalam satu
clusterkelompok dan
data yang
memiliki karakteristik
yang berbeda
dikelompokkan dengan clusterkelompok yang lain sehingga data yang berada dalam satu clusterkelompok memiliki tingkat variasi yang kecil [7].
Langkah-langkah melakukan clustering dengan metode K-Means adalah sebagai berikut [8]: Langkah pertama adalah pilih jumlah cluster k. Langkah
kedua adalah inisialisasi k pusat cluster ini bisa dilakukan dengan berbagai cara. Namun yang paling sering dilakukan adalah dengan cara random. Pusat-pusat
4
cluster diberi nilai awal dengan angka-angka random. Langkah ketiga adalah alokasikan semua data objek ke cluster terdekat. Kedekatan dua objek ditentukan
berdasarkan jarak kedua objek tersebut, demikian juga kedekatan suatu data ke cluster tertentu ditentukan jarak antara data dengan pusat cluster. Dalam tahap ini
perlu dihitung jarak tiap data ke tiap pusat cluster. Jarak paling dekat antara satu data dengan satu cluster tertentu akan menentukan suatu data masuk dalam cluster
mana. Untuk menghitung jarak semua data ke setiap titik pusat cluster dapat menggunakan teori jarak Euclidean yang dirumuskan seperti pada Rumus 1.
Rumus 1 . Perumusan teori jarak Euclidean
Langkah keempat adalah hitung kembali pusat cluster dengan keanggotaan cluster yang sekarang. Pusat cluster adalah rata-rata dari semua dataobjek dalam
cluster tertentu. Jika dikehendaki dapat juga menggunakan median dari cluster tersebut. Jadi rata-rata mean bukan satu-satunya ukuran yang dapat digunakan.
Langkah kelima adalah tugaskan lagi setiap objek menggunakan pusat cluster yang baru. Jika pusat cluster tidak berubah lagi maka proses clustering selesai.
Atau, kembali ke langkah nomor 3 sampai pusat cluster tidak berubah lagi.
Ada beberapa kelebihan pada algoritma k-means, yaitu [9]: Mudah untuk
diimplementasikan dan dijalankan, waktu yang dibutuhkan untuk menjalankan pembelajaran ini relatif cepat, mudah untuk diadaptasi, dan umum digunakan.
Algoritma k-means memiliki beberapa kelebihan, namun ada kekurangannya
juga. Kekurangan dari algoritma tersebut yaitu: 1 sebelum algoritma dijalankan, k buah titik diinisialisasi secara random sehingga pengelompokkan data yang
dihasilkan dapat berbeda-beda. Jika nilai random untuk inisialisasi kurang baik, maka pengelompokkan yang dihasilkan pun menjadi kurang optimal. 2 Terjebak
dalam masalah yang disebut curse of dimensionality. Hal ini dapat terjadi jika data pelatihan memiliki dimensi yang sangat tinggi Contoh jika data pelatihan terdiri
dari 2 atribut maka dimensinya adalah 2 dimensi. Namun jika ada 20 atribut, maka akan ada 20 dimensi. Salah satu cara kerja algoritma ini adalah mencari jarak
terdekat antara k buah titik dengan titik lainnya. Jika mencari jarak antar titik pada 2 dimensi, masih mudah dilakukan. Namun bagaimana mencari jarak antar titik
jika terdapat 20 dimensi. 3 Jika hanya terdapat beberapa titik sampel data, maka cukup mudah untuk menghitung dan mencari titik terdekat dengan k titik yang
diinisialisasi secara random. Namun jika terdapat banyak sekali titik data misalnya satu milyar buah data, maka perhitungan dan pencarian titik terdekat
akan membutuhkan waktu yang lama. Proses tersebut dapat dipercepat, namun dibutuhkan struktur data yang lebih rumit seperti kD-Tree atau hashing.
5
3. Metode dan Perancangan Sistem