SISTEM PENDUKUNG KEPUTUSAN UNTUK PENGELOMPOKAN NILAI AKADEMIK SISWA MENGGUNAKAN METODE K-MEANS UNTUK SISWA SDN LAKARSANTRI I/472 SURABAYA.

SISTEM PENDUKUNG KEPUTUSAN
UNTUK PENGELOMPOKAN NILAI AKADEMIK SISWA
MENGGUNAKAN METODE K-MEANS
UNTUK SISWA SDN LAKARSANTRI I/472 SURABAYA

SKRIPSI

Disusun oleh :

AYU RAHMAWATI
0934010160

J URUSAN TEKNIK INFORMATIKA
FAKULTAS TEKNOLOGI INDUSTRI
UNIVERSITAS PEMBANGUN NASIONAL “VETERAN”
J AWA TIMUR
2013

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.


SISTEM PENDUKUNG KEPUTUSAN UNTUK PENGELOMPOKAN
NILAI AKADEMIK SISWAMENGGUNAKAN METODE K-MEANS
UNTUK SISWA SDN LAKARSANTRI I/472 SURABAYA

SKRIPSI
Diajukan Untuk Memenuhi Sebagai Persyaratan
Dalam Memperoleh Gelar Sarjana Komputer
Jurusan Teknik Informatika

Disusun oleh :

AYU RAHMAWATI
0934010160
J URUSAN TEKNIK INFORMATIKA
FAKULTAS TEKNOLOGI INDUSTRI
UNIVERSITAS PEMBANGUN NASIONAL “VETERAN”
J AWA TIMUR
2013

Hak Cipta © milik UPN "Veteran" Jatim :

Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

LEMBAR PENGESAHAN
SISTEM PENDUKUNG KEPUTUSAN UNTUK PENGELOMPOKAN
NILAI AKADEMIK SISWAMENGGUNAKAN METODE K-MEANS
UNTUK SISWA SDN LAKARSANTRI I/472 SURABAYA

Disusun Oleh :

AYU RAHMAWATI
0934010160
Telah disetujui untuk mengikuti Ujian Negara Lisan
Gelombang II Tahun Akademik 2013

Pembimbing Utama

Pembimbing Pendamping

Eko Prasetyo, S.Kom, M.Kom
NPT. 0718077901


Dr. Ni Ketut Sari, MT
NIP. 1965073 1199203 2001

Mengetahui,
Ketua J urusan Teknik Infor matika
Fakultas Teknologi Industri
UPN ”Veteran” J awa Timur

Dr. Ni Ketut Sari, MT
NIP. 1965073 1199203 2001

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

SKRIPSI
SISTEM PENDUKUNG KEPUTUSAN UNTUK PENGELOMPOKAN
NILAI AKADEMIK SISWAMENGGUNAKAN METODE K-MEANS
UNTUK SISWA SDN LAKARSANTRI I/472 SURABAYA
Disusun Oleh :


AYU RAHMAWATI
0934010160
Telah diper tahankan di hadapan dan diter ima oleh Tim Penguji Skr ipsi
J ur usan Teknik Infor matika Fakultas Teknologi Industr i
Universitas Pembangunan Nasional ”Veter an” J awa Timur
Pada Tanggal 29 Nopember 2013

Pembimbing :

Tim Penguji :

1.

1.

Eko Prasetyo, S.Kom, M.Kom
NPT. 0718077901

Yisti Vita Via, S.ST, M.Kom

NPT. 3 8604 130 347 1

2.

2.

Dr. Ni Ketut Sari, MT
NIP. 1965073 1199203 2001

Wahyu Syaifullah J S, S.Kom
NPT. 3 8608 10 0295 1

3.
Bar ry Nuqoba, S.Kom, M.Kom
NIP. 1984110220121210002

Mengetahui,
Dekan Fakultas Teknologi Industr i
Universitas Pembangunan Nasional
”Veter an” J awa Timur


Ir . SUTIYONO, MT.
NIP. 19600713 198703 1001

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

YAYASAN KESEJ AHTERAAN PENDIDIKAN DAN PERUM AHAN
UNIVERSITAS PEMBANGUNAN NASIONAL “VETERAN” J AWA TIMUR
FAKULTAS TEKNOLO GI INDUSTRI
PANITIA UJ I AN SKRIPSI / KOMPREHENSIF

KETERANGAN REVISI
Mahasiswa di bawah ini :
Nama

: Ayu Rahmawati

NPM


: 0934010160

Jurusan

: Teknik Informatika

Telah mengerjakan revisi/ tidak ada revisi*) pra rencana (design)/ skripsi ujian
lisan gelombang II, TA 2012/2013 dengan judul:
” SISTEM PENDUKUNG KEPUTUSAN UNTUK PENGELOMPOKAN
NILAI AKADEMIK SISWAMENGGUNAKAN METODE K-MEANS
UNTUK SISWA SDN LAKARSANTRI I/472 SURABAYA”

Surabaya, 29 Nopember 2013
Dosen Penguji yang memerintahkan revisi:

{

}

2) Wahyu Syaifullah JS, S.Kom

NPT. 3 8608 10 0295 1

{

}

3) Barry Nuqoba, S.Kom, M.Kom
NIP. 1984110220121210002

{

}

1) Yisti Vita Via, S.ST, M.Kom
NPT. 3 8604 130 347 1

Mengetahui,

Pembimbing Utama


Pembimbing Pendamping

Eko Prasetyo, S.Kom, M.Kom
NPT. 0718077901

Dr. Ni Ketut Sari, MT
NIP. 1965073 1199203 2001

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

KATA PENGANTAR

Syukur Alhamdulillah saya panjatkan kepada Tuhan Yang Maha Esa
karena atas rahmat dan hidayah, serta kehendak kuasanya penulis dapat
menyelesaikan tugas akhir ini dengan judul “SISTEM PENDUKUNG
KEPUTUSAN UNTUK PENGELOMPOKAN NILAI AKADEMIK SISWA
MENGGUNAKAN

METODE


K-MEANS

UNTUK

SISWA

SDN

LAKARSANTRI I/472 SURABAYA.
Tugas Akhir dengan beban 4 SKS ini disusun dan diajukan sebagai salah
satu syarat untuk menyelesaikan program Strata Satu (S1) pada program studi
Teknik Informatika, Fakultas Teknologi Industri, Universitas Pembangunan
Nasional ”Veteran” Jawa Timur Surabaya.
Disadari bahwa dalam penulisan laporan ini jauh dari kata sempurna, oleh
karena itu penulis akan menerima masukan, saran dan kritik yang sifatnya
membangun dari pada pembaca agar pada penulisan selanjutnya akan menjadi
lebih baik lagi.
Dalam proses penyelesaian laporan ini tidak terlepas dari bantuan dan
bimbingan berbagai pihak, pada kesempatan ini penulis tidak lupa menyampaikan

ucapan terima kasih sedalam-dalamnya kepada semua pihak yang telah banyak
membantu dan mendukung demi rampungnya laporan ini, yaitu kepada :
1. Bapak Ir. Sutiyono, MT selaku Dekan Fakultas Teknologi IndustriUniversitas Pembangunan Nasional “Veteran” Jatim.
2. Ibu Dr.Ir.Ni Ketut Sari, MT selaku Ketua Program Studi Teknik InformatikaUniversitas Pembangunan Nasional “Veteran” Jatim, dan selaku Dosen

i
Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

Pembimbing II yang dengan sabar telah meluangkan banyak waktu untuk
memberikan bimbingan dan kesempatan penulis untuk berkreasi dalam proses
pembuatan Tugas Akhir ini.
3. Bapak Eko Prasetyo,S.Kom,M.Kom, selaku Dosen Pembimbing I yang telah
giat meluangkan banyak waktu, pikiran dan tenaga di antara kesibukan
beban-beban kegiatan akademik untuk memberikan ilmu serta motivasi yang
sangat besar kepada penulis untuk menyelesaikan Tugas Akhir ini.
4. Orang Tua yang senantiasa mengingatkan dan mendoakan serta memberikan
dukungannya supaya Tugas Akhir ini segera dapat penulis selesaikan.
5. Teman-teman spesial yang saya sayangi yang telah banyak membantu
penulis. Siti Nur Hidayati, Lincahya, Dini Diroyati, Merry Kristina, dan
Susanti Nur Asiyah sehingga penulis bersemangat kembali menyelesaikan
tugas akhir ini.
6. Teman spesial saya yang selalu setia membantu dan mendoakan apabila
penulis ada kesulitan dalam pengerjaan Tugas Akhir ini sehingga Tugas
Akhir ini dapat terselesaikan
7. Dan semua orang yang tidak dapat disebutkan satu-persatu yang telah
membantu penulis selama ini.
Akhirnya penulis hanya bisa berharap semoga laporan ini dapat berguna
buat para pembaca dan supaya dapat bermanfaat bagi kelangsungan dan
perkembangan dunia keilmuan. Sekian dan terima kasih.

Surabaya, Nopember 2013

ii
Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

DAFTAR ISI

Hal.
KATA PENGANTAR...........................................................................................

i

DAFTAR ISI.........................................................................................................

iii

DAFTAR TABEL.................................................................................................

vi

DAFTAR GAMBAR............................................................................................. vii
ABSTRAK ...........................................................................................................

ix

BAB I

PENDAHULUAN.................................................................................

1

1.1 Latar Belakang.................................................................................

1

1.2 Rumusan Masalah...........................................................................

7

1.3 Batasan Masalah..............................................................................

7

1.4 Tujuan Penelitian.............................................................................

8

1.5 Manfaat Penelitian...........................................................................

9

BAB II TINJ AUAN PUSTAKA.......................................................................

10

2.1 SDN Lakarsantri I/472 Surabaya..................................................... 10
2.1.1 Sejarah singkat SDN Lakarsantri I/472 Surabaya.................

10

2.1.2 Visi dan Misi SDN Lakarsantri I/472 Surabaya....................

10

2.1.3 Tujuan SDN Lakarsantri I/472 Surabaya..............................

11

2.2 Tinjauan Umum...............................................................................

12

2.3 Landasan Teori...............................................................................

13

2.3.1 Sistem Pendukung Keputusan...............................................

13

2.3.2 Komponen SPK.....................................................................

16

iii
Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

2.3.3 Metode K-Means....................................................................

18

2.3.4 Konsep K-Means.................................................................... 19
2.3.5 Algoritma K-Means...............................................................

20

2.3.6 Kelebihan dan Kelemahan K-Means.....................................

22

2.3.7 Tujuan Metode K-means.......................................................

22

2.3.8 Clustering..............................................................................

23

2.3.9

PHP.......................................................................................

24

2.3.10 Sejarah PHP..........................................................................

25

2.3.11 Kelebihan PHP......................................................................

27

2.3.12 My SQL................................................................................

28

2.3.13 Keunggulan My SQL...........................................................

28

2.3.14 Kelemahan My SQL............................................................. 30
BAB III METODOLOGI PENELITIAN..........................................................

31

3.1 Rancangan Penelitian..................................................................... 31
3.2 Perancangan Sistem.......................................................................

35

3.2.1. Perancangan Proses ............................................................

35

3.2.1.1 Flowchart Admin....................................................

35

3.2.1.2 Flowchart User (karyawan)....................................

37

3.2.1.3 Flowchart Algoritma K-Means...............................

39

3.2.2 Perancangan Basisdata .......................................................

41

3.2.2.1 Tabel Centroid Acak...............................................

42

3.2.2.2 Tabel t_admin ........................................................

44

3.2.2.3 Tabel t_k.................................................................

44

3.2.2.4 Tabel t_nilai............................................................

45

iv
Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

3.2.2.5 Tabel t_siswa..........................................................

46

3.2.3 Rancangan Interface ...........................................................

46

3.2.3.1 Rancangan Interface Untuk Admin .......................

47

3.2.3.2 Rancangan Interface Untuk User (karyawan)........

51

3.3 Rancangan Uji Coba dan Evaluasi .................................................

55

3.4 Jadwal Kegiatan Penelitian ............................................................

55

BAB IV HASIL DAN PEMBAHASAN ............................................................

57

4.1 Implementasi ..................................................................................

57

4.1.1 Implementasi Aplikasi Admin...............................................

58

4.1.2 Implementasi Aplikasi User (karyawan)...............................

68

4.2 Hasil Uji Coba dan Evaluasi ..........................................................

77

4.2.1 Uji Coba Perhitungan 3 Centroid...........................................

77

BAB V PENUTUP ..............................................................................................

84

5.1 Kesimpulan ....................................................................................

84

5.2 Saran ..............................................................................................

85

DAFTAR PUSTAKA

v
Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

Nama
NPM
Judul

: Ayu Rahmawati
: 0934010160
: Sistem pendukung keputusan untuk pengelompokan nilai
akademik siswa menggunakan metode k-means untuk
siswa SDN Lakarsantri I/472 Surabaya
Dosen Pembimbing 1 : Eko Prasetyo S.Kom, M.kom
Dosen Pembimbing 2 : Dr. Ni Ketut Sari, MT

ABSTRAK
Karena banyak beragamnya nilai akademik yang ditempuh oleh para siswa
yang ada di sebuah Sekolah Dasar. Maka dari semua proses pengelompokan nilai
akademik siswa sangat diperlukan nilai-nilai mata pelajaran yang telah ditempuh
oleh para siswa. Bagi pihak sekolah, untuk pengelompokan nilai akademik siswa
ini sangat penting karena dapat mengetahui kadar kemampuan masing-masing
siswa. Untuk meminimalisir kesalahan dalam pengelompokan nilai akademik
siswa, dan bukan hanya menggunakan perkiraan saja.
Oleh karena itu , pada pengerjaan tugas akhir ini akan diimplementasikan
sebuah aplikasi sistem pendukung keputusan untuk pengelompokan nilai
akademik siswa di SDN Lakarsantri I/472 Surabaya. Variabel yang digunakan
dalam sistem ini adalah variabel nilai mata pelajaran yang telah ditempuh oleh
para siswa.
Dari hasil uji coba yang telah dilakukan pada penelitian tersebut, user
(karyawan) dapat melakukan proses pengelompokan nilai akademik siswa secara
otomatis dari sistem dan dapat mengetahui siswa-siswa siapa saja yang tergolong
dalam suatu kelompok-kelompok tertentu. Dan untuk admin dapat mengelola
semua data tentang nilai akademik siswa dan data diri siswa. Dengan demikian
diharapkan sistem yang telah dibuat ini dapat membantu pihak sekolah dalam
pengelompokan nilai akademik siswa dan membantu mengelompokkan siswasiswi kedalam kelompok dengan lebih akurat.

Kata kunci : Sistem pendukung keputusan, metode k-means.

ix
Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

BAB I
PENDAHULUAN

1.1.

Latar Belakang
Seiring dengan perkembangan jaman, peran komputer semakin banyak di

dalam

kehidupan

masyarakat.

Hampir

semua

bidang

kehidupan

telah

menggunakan komputer sebagai alat bantu. Diharapkan pada perkembangannya,
komputer dapat langsung dirasakan manfaatnya oleh masyarakat. Salah satu
golongan masyarakat yang banyak menggunakan komputer adalah mahasiswa.
Pada penelitian sebelumnya, penulis mencoba membangun suatu sistem untuk
mengelompokkan data yang ada berdasarkan status gizi dan ukuran rangkanya
dengan memasukkan parameter kondisi fisik dari orang tersebut. Pengelompokkan
data dilakukan dengan menggunakan metode clustering K-Means yaitu dengan
mengelompokkan n buah objek ke dalam k kelas berdasarkan jaraknya dengan
pusat kelas. Dari hasil penelitian terhadap 20 data sampel diperoleh 3 kelompok
mahasiswa berdasarkan nilai BMI dan ukuran rangka, yaitu : BMI normal dan
kerangka besar, BMI obesitas sedang dan kerangka sedang, BMI obesitas berat
dan kerangka kecil. (Rismawan, 2008)
Perkembangan zaman yang semakin maju seperti sekarang ini membuat
kebutuhan manusia semakin meningkat pula. Terlebih lagi didorong dengan
adanya kemajuan ilmu pengetahuan dan teknologi yang sangat cepat. Sebagai
contoh, dengan adanya komputer segala kegiatan dapat dilakukan dengan cepat
dan resiko kesalahan dapat dikurangi. Di dalam perkembangan komputer, para

1
Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

2

ahli komputer mencoba membangun suatu sistem komputer yang dapat membantu
para ahli dalam mengambil keputusan, sehingga dapat mengurangi resiko
kesalahan yang dapat terjadi karena beberapa kekurangan yang dimiliki oleh
manusia. Sistem inilah yang dikenal dengan istilah sistem pendukung keputusan.
(Rismawan, 2008).
Saat ini begitu banyak data yang terdapat dalam sebuah organisasi,
sehingga menimbulkan kesulitan dalam hal pengelompokkan data. Namun dengan
perkembangan Teknologi Informasi (TI) terdapat berbagai macam solusi untuk
mengatasi kesulitan tersebut, salah satunya adalah dengan menggunakan teknik
Data Mining (DM). (Baskoro, 2010) “DM merupakan proses pencarian pola dan
relasi-relasi yang tersembunyi dalam sejumlah data yang besar dengan tujuan
untuk melakukan klasifikasi, estimasi, prediksi, asosiasi rule, clustering, deskripsi
dan visualisasi”. (Nango, 2012)
Penelitian terdahulu yaitu penelitian yang dilakukan dengan judul
“Aplikasi K-Means Untuk Pengelompokan Mahasiswa Berdasarkan Nilai Body
Mass Index (BMI) & Ukuran Kerangka” yang memiliki tujuan untuk membangun
aplikasi untuk mengelompokkan mahasiswa berdasarkan nilai BMI & ukuran
kerangka menggunakan metode klasifikasi K-Means. Masalah kesehatan
merupakan permasalahan yang sangat penting untuk diperhatikan, diantaranya
adalah masalah BMI dan ukuran kerangka seseorang. Apabila seseorang telah
mengetahui nilai BMInya, orang tersebut dapat mengontrol berat badan sehingga
dapat mencapai berat badan normal yang sesuai dengan tinggi badan. Sedangkan
apabila orang tersebut mengetahui ukuran kerangka tubuhnya maka orang tersebut
dapat mengontrol berat badannya agar dapat selalu berada dalam keadaan ideal.

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

3

Pada penelitian ini, penulis mencoba membangun suatu sistem untuk
mengelompokkan data yang ada berdasarkan status gizi dan ukuran rangkanya
dengan memasukkan parameter kondisi fisik dari orang tersebut. Pengelompokkan
data dilakukan dengan menggunakan metode clustering K-Means yaitu dengan
mengelompokkan n buah objek ke dalam k kelas berdasarkan jaraknya dengan
pusat kelas. Dari hasil penelitian terhadap 20 data sampel diperoleh 3 kelompok
mahasiswa berdasarkan nilai BMI dan ukuran rangka, yaitu : BMI normal dan
kerangka besar, BMI obesitas sedang dan kerangka sedang, BMI obesitas berat
dan kerangka kecil. (Rismawan, 2008)
Penelitian terdahulu yaitu penelitian yang dilakukan dengan judul
“Analisis Algoritma K-Means Untuk Sistem Pendukung Keputusan Penjurusan
Siswa Di MAN Binong Subang” yang memiliki maksud dan tujuan tertentu yaitu
mempunyai maksud untuk menganalisis algoritma K-Means untuk sistem
pendukung keputusan penjurusan siswa di MAN Binong Subang. Dan adapun
tujuan yang ingin dicapai adalah untuk menguji tepat atau tidaknya algoritma kmeans dalam sistem pendukung keputusan penjurusan siswa. MAN Binong,
merupakan salah satu Sekolah Madrasah Aliyah negeri di kabupaten Subang yang
mengadakan penjurusan siswa kelas X (sepuluh) yang akan melanjutkan study ke
kelas XI (sebelas). Kendala yang sering ditemukan dalam proses penjurusan di
MAN Binong yaitu sulitnya menentukan siswa mana yang memenuhi kriteria
untuk menempati jurusan tertentu. Hal ini dikarenakan proses penjurusan masih
dilakukan dengan manual, sehingga membutuhkan waktu yang cukup lama dan
dinilai kurang efisien. Pada penelitian ini akan diangkat suatu kasus yaitu
menganalisis algoritma K-Means untuk sistem pendukung keputusan penjurusan

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

4

siswa di MAN Binong Subang. Algoritma K-Means dapat mengelompokkan
(segmentasi) data yang mempunyai atribut dan mempunyai jumlah data yang
banyak, sehingga dapat dimanfaatkan dalam sistem penentuan penjurusan siswa
yang sesuai dengan kemampuan akademik siswa. Berdasarkan hasil analisis
terhadap algoritma K-Means untuk sistem pendukung keputusan penjurusan,
maka kesimpulan yang dapat diambil adalah algoritma K-Means kurang tepat
untuk sistem pendukung keputusan penjurusan tetapi algoritma K-Means lebih
tepat untuk mengelompokan data siswa berdasarkan data nilai yang bisa
memberikan gambaran untuk penjurusan siswa. (Wijaya, 2010)
Jurnal tentang judul “Sistem Pendukung Keputusan Berbasis Pocket PC
Sebagai Penentu Status Gizi Menggunakan Metode KNN (K-Nearest Neighbor)”
yaitu membahas masalah gizi adalah masalah yang sangat penting yang perlu
perhatian lebih. Jika seseorang tidak tahu tentang status gizi, ia tidak dapat
mengontrol berapa banyak nilai gizi yang harus dibutuhkan oleh tubuhnya. Dalam
penelitian ini, telah dibangun sebuah Sistem Pendukung Keputusan (DSS) untuk
menghitung status gizi. Sistem ini membutuhkan kondisi fisik dari pengguna
melalui

antarmuka

pengguna.

Platform

Pocket

PC

digunakan

untuk

mengembangkan DSS ini. Perhitungan status gizi berdasarkan Neighbor KNearest (K-NN). Metode K-NN akan mencari jarak terpendek antara data dan
dievaluasi K data yang terdekat dalam pelatihan data set Hasil penelitian ini
menunjukkan bahwa sistem ini dapat membantu pengguna untuk mendapatkan
informasi tentang status gizi, sehingga dia bisa menjaga gizi nya yang normal
Status untuk menghindari serangan penyakit dia. (Rismawan, 2008)

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

5

Jurnal internasional tentang judul “Clustering K-Means Optimization with
Multi-Objective Genetic Algorithm” yaitu dengan membahas K-Means merupakan
salah satu teknik pengelompokan dipartisi dimana setiap segmen diwakili oleh
nilai rata-ratanya. Sebuah masalah dalam teknik ini adalah bahwa prosedur iterasi
yang optimal tidak dapat menjamin konvergensi optimal global, karena tergantung
pada titik awal. (Arkeman, 2012)
Algoritma genetika multi-tujuan dengan pendekatan pangkat Pareto dapat
digunakan untuk meningkatkan K-berarti kinerja. Pendekatan ini menghasilkan
seperangkat solusi yang terdiri dari beberapa bidang berdasarkan barisan mereka.
Pertama Pareto depan terdiri dari solusi non-didominasi, dalam penelitian ini
terdiri dari sepasang nilai dimana jarak antara titik dalam cluster adalah minimum,
dan jarak antar-claster antara cluster maksimum. Minimum Davies-Bouldin
indeks validitas dan jumlah cluster yang cocok digunakan untuk mengetahui
solusi optimal. (Arkeman, 2012)
Tujuan dari penelitian ini adalah untuk membandingkan dua teknik, yaitu
K-sarana dan K-means dengan algoritma genetika multi-tujuan dengan nondidominasi peringkat pareto untuk data Iris. K-berarti untuk Iris Data
menghasilkan indeks 0,20. K-berarti algoritma genetika multi-tujuan dengan
ukuran populasi 50 dan 200 generasi menghasilkan indeks optimum 0,18 untuk
jumlah cluster 3. K-berarti untuk data Wine menghasilkan indeks 0,08. K-berarti
algoritma genetika multi-tujuan dengan ukuran populasi 50 dan 100 generasi.
Indeks yang lebih kecil menunjukkan bahwa K-berarti algoritma genetika multitujuan memiliki solusi yang lebih baik dibandingkan dengan K-berarti. (Arkeman,
2012)

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

6

Solusi pemanfaatan teknologi komputer sebagai alat bantu dalam
mendukung kegiatan operasional suatu bidang usaha memudahkan manusia dalam
mendapatkan data atau informasi secara cepat, tepat dan akurat sehingga
efektivitas dan efisiensi kerja tercapai. K-means adalah algoritma clustering untuk
data mining yang diciptakan tahun 70an dan berguna untuk melakukan clustering
secara unsupervised learning (pembelajaran yang tidak terawasi) dalam suatu
kumpulan data berdasarkan parameter tertentu. Menurut Kardi (2007), K-means
adalah sebuah algoritma untuk mengklasifikasikan atau mengelompokkan objekobjek (dalam hal ini data) berdasarkan parameter tertentu ke dalam sejumlah
group, sehingga dapat berjalan lebih cepat daripada hierarchical clustering (jika k
kecil) dengan jumlah variable yang besar dan menghasilkan cluster yang lebih
rapat. (Susanto, 2010)
Terdapat berbagai algoritma yang digunakan dalam teknik DM dengan
metode clustering salah satunya adalah algoritma K-Means. “Algoritma K-Means
adalah salah satu algoritma unsupervised learning yang paling sederhana yang
dikenal dapat menyelesaikan permasalahan clustering dengan baik” (Mac Queen,
1967). Penulis memilih algoritma k-means dalam pengerjaan tugas akhir ini
adalah karena untuk mengelompokan dengan tipe data numeric (angka) paling
cocok menggunakan k-means, dan k-means sangat efisien untuk data dengan
volume besar dengan cepat walaupun ada beberapa kelemahan. maka dengan itu
penulis mengusulkan sebuah penulisan yang berjudul “Sistem Pendukung
Keputusan Untuk Pengelompokan Nilai Akademik Siswa Menggunakan Metode
K-Means Untuk Siswa SDN Lakarsantri I/472 Surabaya”.

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

7

1.2.

Rumusan Masalah
Berdasarkan latar belakang penelitian yang sudah dikemukakan di atas,

maka permasalahan yang akan diteliti dalam Tugas Akhir ini akan dirumuskan
sebagai berikut :
a. Bagaimana

membuat

sistem

pendukung

keputusan

untuk

dapat

mengetahui kelompok nilai akademik siswa SDN Lakarsantri I/472
Surabaya.
b. Bagaimana menemukan siswa-siswi yang mempunyai nilai akademik yang
serupa dengan menerapkan suatu sistem pendukung keputusan yang
menggunakan metode k-means.
c. Bagaimana membuat sistem pendukung keputusan dengan metode kmeans menggunakan bahasa pemrograman PHP, dengan menggunakan
database yaitu My SQL.
d. Bagaimana membuat sistem yang

hanya dapat digunakan dalam

penentuan kelompok nilai akademik para siswa-siswi yang berada di
dalam SDN Lakarsantri I/472 Surabaya.

1.3.

Batasan Masalah
Batasan masalah yang akan ditetapkan dalam penelitian tugas akhir ini

adalah ditujukan untuk membatasi ruang lingkup dari penelitian dan pengerjaan
aplikasi, diantaranya sebagai berikut :
a. Dapat membuat sistem pendukung keputusan yang berguna untuk dapat
mengetahui kelompok nilai akademik siswa SDN Lakarsantri I/472
Surabaya.

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

8

b. Dapat menemukan siswa-siswi yang mempunyai nilai akademik yang
serupa dengan menerapkan suatu sistem pendukung keputusan yang
menggunakan metode k-means.
c. Bahasa pemrograman yang digunakan adalah PHP dengan database yang
digunakan adalah My SQL.
d. Sistem

ini

menggunakan

metode

k-means

didalam

menentukan

pengelompokan nilai akademik para siswa SDN Lakarsantri I/472.
e. Sistem ini hanya dapat digunakan dalam penentuan kelompok nilai
akademik para siswa-siswi yang berada di dalam SDN Lakarsantri I/472
Surabaya.

1.4.

Tujuan Penelitian
Adapun tujuan yang di buat dari pengerjaan aplikasi tugas akhir ini adalah

sebagai berikut:
a. Dapat membuat Sistem pendukung keputusan yang berguna untuk
mengetahui kelompok nilai akademik siswa SDN Lakarsantri I/472
Surabaya.
b. Mampu menemukan kelompok siswa-siswi yang mempunyai nilai
akademik yang sama dengan menerapkan sistem pendukung keputusan
menggunakan metode k-means.
c. Dapat membuat sistem pendukung keputusan dengan metode k-means
menggunakan bahasa pemrograman PHP, dengan menggunakan
database yaitu My SQL.

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

9

d. Sistem ini dapat berguna dan hanya dapat digunakan dalam penentuan
kelompok nilai akademik para siswa-siswi yang berada di dalam SDN
Lakarsantri I/472 Surabaya.

1.5.

Manfaat Penelitian
Adapun manfaat yang ada dari pengerjaan tugas akhir ini adalah sebagai

berikut :
a. Sistem pendukung keputusan ini dapat membantu pihak SDN
Lakarsantri I/472 dalam menentukan kelompok nilai-nilai akademik
siswa yang sama.
b. Sistem pendukung keputusan ini diharapkan lebih mudah dipahami
oleh user / karyawan, sehingga dapat mempermudah user / karyawan
dalam melakukan proses menentukan kelompok nilai akademik siswa.

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

BAB II
TINJ AUAN PUSTAKA

Pada bab berikut ini akan dibahas tentang dasar-dasar ilmu dan teori-teori
yang digunakan sebagai penunjang permasalahan tugas akhir ini.
2.1

SDN Lakarsantri I/472 Surabaya

2.1.1 Sejarah Singkat SDN Lakar santri I/472 Surabaya
SDN Lakarsantri I/467 Surabaya ini terletak di jalan Lakarsantri no.112
Surabaya, Sekolah Dasar Negeri ini mempunyi tanggal pendirian 31 Desember
1969. Dengan prestasi yang telah dicapai sekolah tersebut maka Badan Akreditasi
Sekolah kota Surabaya memberikan peringkat akreditasi Baik (B) untuk Sekolah
Dasar Negeri Lakarsantri I/472 Surabaya.

2.1.2 Visi dan Misi SDN Lakarsantri I/472 Surabaya
Visi :
“Menjadi sekolah terpercaya di masyarakat untuk mencerdaskan bangsa
dalam rangka menyukseskan wajib belajar”
a. Unggul dalam kelulusan
b. Unggul dalam pengembangan kurikulum
c. Unggul dalam proses pembelajaran
d. Unggul dalam tenaga kependidikan
e. Unggul dalam fasilitas pendidikan
f. Unggul dalam mutu dan kelembagaan

10
Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

11

g. Unggul dalam IMTAQ
h. Unggul dalam pengembangan penilaian
i.

Meningkatnya penguasaan dan penggunaan IPTEK

j.

Meningkatnya budaya santun

Misi :
a. Bertaqwa kepada Tuhan Yang Maha Esa
b. Menumbuhkan sikap disiplin, sopan santun, tanggung jawab, kemandirian
dan kecakapan emosional untuk merendahkan diri yang bersahaja
c. Memiliki sikap dan tingkah laku terhadap lingkungan hidup

2.1.3 Tujuan SDN Lakarsantri I/472 Surabaya
a. Terlaksananya peningkatan nilai akademis dan non akademis
b. Terlaksananya pengembangan kurikulum satuan pendidikan (SK, KD,
Pemetaan, Silabus, Indikator, dan RPP) untuk kelas I sampai dengan VI.
c. Terlaksananya pengembangan metode dan strategi pembelajaran.
d. Terlaksananya pengembangan tenaga pendidik dan kependidikan.
e. Terlaksananya pengembangan MBS.
f. Terlaksananya pengembangan pembiayaan terlaksananya pengembangan
fasilitas pendidikan
g. Melalui pengelolaan dan pendayagunaan sumber dana dan potensi sekolah
h. Terlaksananya pengembangan penilaian berbasis kompetensi
i.

Terlaksananya dan meningkatkan penguasaan dan pemanfaatan IPTEK

j.

Terlaksananya dan meningkatkan keimanan dan ketaqwaan

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

12

2.2

Tinjauan Umum
Menurut Hick (1993), Sistem pendukung keputusan sebagai sekumpulan

tools komputer yang terintegrasi yang mengijinkan seorang decision maker untuk
berinteraksi langsung dengan komputer untuk menciptakan informasi yang
berguna dalam membuat keputusan semi terstruktur dan keputusan tak terstruktur
yang tidak terantisipasi.
K-means adalah algoritma clustering untuk data mining yang diciptakan
tahun 70an dan berguna untuk melakukan clustering secara unsupervised learning
(pembelajaran yang tidak terawasi) dalam suatu kumpulan data berdasarkan
parameter tertentu. Menurut Kardi (2007), K-means adalah sebuah algoritma
untuk mengklasifikasikan atau mengelompokkan objek-objek (dalam hal ini data)
berdasarkan parameter tertentu ke dalam sejumlah group, sehingga dapat berjalan
lebih cepat daripada hierarchical clustering (jika k kecil) dengan jumlah variable
yang besar dan menghasilkan cluster yang lebih rapat. (Susanto, 2010)
Sebuah sistem pendukung keputusan dibuat agar dapat membantu
seseorang untuk menyelesaikan permasalahan tertentu tidak terkecuali juga
masalah pengelompokan nilai akademik siswa. Meskipun pengelompokan nilai
siswa ini bisa hanya dengan melihat daftar nilai para siswa tetapi hal tersebut
kurang efektif digunakan, dikarenakan belum tentu sesuai dengan kenyataan.
Dengan itu dibuatlah sistem pendukung keputusan pengelompokan nilai akademik
siswa pada Sekolah Dasar Negeri dengan menggunakan metode K-Means. Metode
K-Means merupakan metode yang bisa dikatakan cocok untuk membuat sebuah
sistem pendukung keputusan pengelompokan nilai akademik siswa, yaitu

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

13

dikarenakan metode K-Means dapat menghasilkan kelompok/cluster yang tepat
pengelompokan nilai-nilai akademik para siswa.

2.3

Landasan Teori
Di dalam landasan teori ini akan dibahas beberapa teori yang mendukung

serta menunjang terselesaikannya proses aplikasi ini. Berikut ini adalah teori-teori
yang membahas tentang aplikasi tersebut.

2.3.1 Sistem Pendukung Keputusan (SPK)
Konsep Sistem Pendukung Keputusan (SPK) / Decision Support Sistem
(DSS) pertama kali diungkapkan pada awal tahun 1970-an oleh Michael S. Scott
Morton dengan istilah Management Decision Sistem.
Sistem Pendukung Keputusan tersebut adalah suatu sistem yang berbasis
komputer yang ditujukan untuk membantu pengambil keputusan dengan
memanfaatkan data dan model tertentu untuk memecahkan berbagai persoalan
yang tidak terstruktur. Istilah SPK mengacu pada suatu sistem yang
memanfaatkan dukungan komputer dalam proses pengambilan keputusan.
Untuk memberikan pengertian yang lebih mendalam, akan diuraikan 10
definisi mengenai Sistem Pendukung Keputusan / Decision Support system yang
dikembangkan oleh beberapa ahli, yaitu (anoname, 2013):
a. Little (1970)
Sistem pendukung keputusan adalah sebuah himpunan / kumpulan
prosedur berbasis model untuk memproses data dan pertimbangan untuk
membantu manajemen dalam pembuatan keputusannya.

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

14

b. Alter (1990)
Membuat

definisi

sistem

pendukung

keputusan

dengan

membandingkannya dengan sebuah sistem pemrosesan data elektronik
(PDE) / Electronic Data Processing tradisional dalam 5 hal :
SPK

PDE

Penggunaan : Pasif

Penggunaan : Aktif

Pengguna : Operator/Pegawai

Pengguna : Manajemen

Tujuan : Efisiensi Mekanis

Tujuan : Efektifitas

Time horizon : Masa Lalu

Time horizon : Sekarang dan
masa depan

Kelebihan : Konsistensi

Kelebihan : Fleksibilitas

c. Keen (1980)
Sistem pendukung keputusan adalah sistem berbasis komputer yang
dibangun lewat sebuah proses adaptif dari pembelajaran, pola-pola
penggunan dan evolusi system.
d. Bonczek (1980)
Sistem pendukung keputusan sebagai sebuah sistem berbasis komputer
yang terdiri atas komponen-komponen antara lain komponen sistem
bahasa (language), komponen sistem pengetahuan (knowledge) dan
komponen sistem pemrosesan masalah (problem processing) yang saling
berinteraksi satu dengan yang lainnya.

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

15

e. Hick (1993)
Sistem pendukung keputusan sebagai sekumpulan tools komputer yang
terintegrasi yang mengijinkan seorang decision maker untuk berinteraksi
langsung dengan komputer untuk menciptakan informasi yang berguna
dalam membuat keputusan semi terstruktur dan keputusan tak terstruktur
yang tidak terantisipasi.
f. Man dan Watson
Sistem pendukung keputusan merupakan suatu sistem yang interaktif,
yang membantu pengambil keputusan melalui penggunaan data dan
model-model keputusan untuk memecahkan masalah yang sifatnya semi
terstruktur maupun yang tidak terstruktur.
g. Moore and Chang
Sistem pendukung keputusan dapat digambarkan sebagai sistem yang
berkemampuan mendukung analisis ad hoc data, dan pemodelan
keputusan, berorientasi keputusan, orientasi perencanaan masa depan, dan
digunakan pada saat-saat yang tidak biasa.
h. Bonczek (1980)
Sistem pendukung keputusan sebagai sebuah sistem berbasis komputer
yang terdiri atas komponen-komponen antara lain komponen sistem
bahasa (language), komponen sistem pengetahuan (knowledge) dan
komponen sistem pemrosesan masalah.
i.

Turban & Aronson (1998)
Sistem penunjang keputusan sebagai sistem yang digunakan untuk
mendukung dan membantu pihak manajemen melakukan pengambilan

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

16

keputusan pada kondisi semi terstruktur dan tidak terstruktur. Pada
dasarnya konsep DSS hanyalah sebatas pada kegiatan membantu para
manajer melakukan penilaian serta menggantikan posisi dan peran
manajer.
j.

Raymond McLeod, Jr. (1998)
Sistem pendukung keputusan merupakan sebuah sistem yang menyediakan
kemampuan

untuk

penyelesaian

masalah

dan komunikasi

untuk

permasalahan yang bersifat semi-terstruktur.

2.3.2 Komponen SPK
Menurut Aji Supriyanto (2005) Sistem Pendukung Keputusan dibangun
oleh tiga komponen, yaitu :
a. Database
Sistem database adalah kumpulan semua data yang dimiliki oleh
perusahaan baik data dasar maupun transaksi sehari-hari.
b. Model base
Model

base

adalah

suatu

model

yang

perepresentasikan

permasalahan dalam format kuantitatif.
c. Software System
Software System adalah paduan antara database dan model base,
setelah sebelumnya direpresentasikan kedalam bentuk model yang
dimengerti oleh sistem komputer.
Sedangkan Sistem Pendukung Keputusan menurut Tata Sutabri (2005)
SPK terdiri dari 4 komponen, yaitu :

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

17

a. Dialog
Alat untuk berinteraksi antara komputer dengan pemakainya.
Pemakai harus bisa mengerti apa arti informasi yang dihasilkan. Ini
berarti, system (komputer beserta programnya) mudah dipakai (user
friendly). Ditinjau dari sudut pemakainya, pemakai harus pula belajar dan
berlatih cara penggunaannya serta arti yang dihasilkan.
b. Model
Model serta sistem yang membolehkan pemakai memilih model
yang cocok. Tiga macam model yang biasa digunakan adalah:
1) Optimalisasi: mencari yang terbaik. Contohnya membuat jadwal,
membuat perbandingan linear programming, simulasi, dan lain
sebagainya.
2) Statistik / matematis: menggambarkan masalah dengan standar
kuantifikasi yang ada. Contohnya forecasting, fungsi kemungkinan
(probabilitas), proyeksi penjualan, dan lain sebagainya.
3) Financial, mencari kesempatan yang baru yang lebih menguntungkan.
Contohnya: investasi, cash flow, manajemen resiko, dan lain
sebagainya.
c. Database
Menurut Indira Rakanita (2008) database adalah kumpulan dari item
data yang saling berhubungan satu dengan yang lainnya yang
diorganisasikan berdasarkan sebuah skema atau struktur tertentu,
tersimpan di hardware computer dan dengan software untuk melakukan
manipulasi untuk kegunaan tertentu.

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

18

d. Data
Data adalah suatu angka atau kelompok angka yang mempunyai arti
atau nilai Dari uraian mengenai komponen SPK diatas, untuk
mengembangkan SPK dengan metode k-means, dipilih komponen SPK
sebagai berikut: Model base, Database, dan Software system.
(Lincahya, 2013)

2.3.3 Metode K-Means
Pengertian K-Means adalah suatu metode penganalisaan data atau metode
Data Mining yang melakukan proses pemodelan tanpa supervisi (unsupervised)
dan merupakan salah satu metode yang melakukan pengelompokan data dengan
sistem partisi. Metode k-means berusaha mengelompokkan data yang ada ke
dalam beberapa kelompok, dimana data dalam satu kelompok mempunyai
karakteristik yang sama satu sama lainnya dan mempunyai karakteristik yang
berbeda dengan data yang ada di dalam kelompok yang lain. Dengan kata lain,
metode ini berusaha untuk meminimalkan variasi antar data yang ada di dalam
suatu cluster dan memaksimalkan variasi dengan data yang ada di cluster lainnya.
(anoname, 2013)
Sedangkan Menurut Kardi (2007), K-means adalah sebuah algoritma
untuk mengklasifikasikan atau mengelompokkan objek-objek (dalam hal ini data)
berdasarkan parameter tertentu ke dalam sejumlah group, sehingga dapat berjalan
lebih cepat daripada hierarchical clustering (jika k kecil) dengan jumlah variable
yang besar dan menghasilkan cluster yang lebih rapat. (Susanto, 2010)

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

19

K-means memiliki propeti yaitu selalu ada K cluster, paling tidak memiliki
satu data dalam tiap cluster, cluster ini merupakan non-hierarki dan tidak akan
terjadi overlap, dan setiap member dari sebuah cluster berdekatan di-cluster
terhadap cluster lainnya karena kedekatan tidak selalu melibatkan pusat dari
cluster itu. (Susanto, 2010)

2.3.4 Konsep K-Means
Dalam statistik dan mesin pembelajaran, pengelompokan K-Means
merupakan metode analisis kelompok yang mengarah pada pemartisian N objek
pengamatan ke dalam K kelompok (cluster) dimana setiap objek pengamatan
dimiliki oleh sebuah kelompok dengan mean (rata-rata) terdekat, mirip dengan
algoritma Expectation-Maximization untuk Gausian Mixture dimana keduanya
mencoba untuk menemukan pusat dari kelompok dalam data sebanyak iterasi
perbaikan yang dilakukan oleh kedua algoritma.
K-Means merupakan salah satu metode pengelompokan data nonhierarki
(sekatan) yang berusaha mempartisi data yang ada kedalam bentuk dua atau lebih
kelompok. Metode ini mempartisi data kedalam kelompok sehingga data
berkarakteristik sama dimasukkan kedalam satu kelompok yang sama dan data
yang berkarakteristik berbeda dikelompokkan kedalam kelompok yang lain.
Adapun tujuan pengelompokan data ini adalah untuk meminimalkan fungsi
objektif yang diset dalam proses pengelompokan, yang pada umumnya berusaha
meminimalkan variasi didalam suatu kelompok dan memaksimalkan variasi antar
kelompok.

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

20

Pengelompokan data dengan metode K-Means ini secara umum dilakukan
dengan algoritma sebagai berikut :
1. Tentukan jumlah kelompok
2. Alokasikan data kedalam kelompok secara acak
3. Hitung pusat kelompok (centroid/rata-rata) dari data yang ada di masingmasing kelompok
4. Alokasikan masing-masing data ke centroid/rata-rata terdekat
5. Kembali ke langkah 3, apabila masih ada data yang berpindah kelompok,
atau apabila ada perubahan nilai centroid diatas nilai ambang yang
ditentukan, atau apabila perubahan nilai pada fungsi objektif yang
digunakan masih diatas nilai ambang yang ditentukan
(Prasetyo. 2012)

2.3.5 Algoritma K-Means
Algoritma k-means merupakan algoritma yang membutuhkan parameter
input sebanyak k dan membagi sekumpulan n objek kedalam k cluster sehingga
tingkat kemiripan antar anggota dalam satu cluster tinggi sedangkan tingkat
kemiripan dengan anggota pada cluster lain sangat rendah. Kemiripan anggota
terhadap cluster diukur dengan kedekatan objek terhadap nilai mean pada cluster
atau dapat disebut sebagai centroid cluster atau pusat massa (Widyawati, 2010).
Berikut rumus pengukuran jarak menurut (Santosa, 2007) :
Rumus perhitungan jarak didefinisikan sebagai berikut :

( , )=

(

− )

+ (

− )

.....................................................(1)

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

21

Keterangan :
d = titik dokumen
x = data record
y = data centroid
Jarak yang terpendek antara centroid dengan dokumen menentukan posisi
cluster suatu dokumen. Misalnya dokumen A mempunyai jarak yang paling
pendek ke centroid 1 dibanding ke yang lain, maka dokumen A masuk ke group
1. Hitung kembali posisi centroid baru untuk tiap-tiap centroid dengan mengambil
rata-rata dokumen yang masuk pada cluster. Iterasi dilakukan terus hingga posisi
group tidak berubah. Adapun rumus iterasi lainnya didefinisikan sebagai berikut :

( )=

...



................................................................(2)

Keterangan :
= nilai data record ke-1
= nilai data record ke-2
= nilai data record ke-n
∑x

= jumlah data record
K-Means merupakan algoritma clustering yang bersifat partitional yaitu

membagi himpunan objek data ke dalam sub himpunan (cluster) yang tidak
overlap, sehingga setiap objek data berada tepat dalam satu cluster. Strategi
partitional-clustering yang paling sering digunakan adalah berdasarkan kriteria
square error. Secara umum, tujuan kriteria square error adalah untuk
memperoleh partisi (jumlah cluster tetap) yang meminimalkan total square error.

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

22

start

Banyaknya jumlah
cluster K

Tentukan pusat

Hitung jarak obyek ke pusat

Kelompokkan obyek berdasar jarak
minimum

Apakah masih ada
obyek yang berpindah?

ya

tidak
end

Gambar 2.1 Flowchart algoritma K-Means

Pada gambar 2.1 Tahapan proses algoritma K-Means (Widyawati, 2010),
menyatakan sebagai berikut :
a. Pilih

secara acak

objek

sebanyak

k,

objek-objek tersebut

akan

direpresentasikan sebagai mean pada cluster.
b. Untuk setiap objek dimasukan kedalam cluster yang tingkat kemiripan
objek terhadap cluster tersebut tinggi. Tingkat kemiripan ditentukan dengan
jarak objek terhadap mean atau centroid cluster tersebut.
c. Hitung nilai centroid yang baru pada masing-masing cluster.
d. Proses tersebut diulang hingga anggota pada kumpulan cluster tersebut tidak
berubah.

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

23

2.3.6 Kelebihan dan Kelemahan K-Means
Kelebihan yang ada dalam metode k-means diantaranya adalah mampu
mengelompokan objek besar dengan sangat cepat sehingga mempercepat proses
pengelompokan.
Sedangkan kekurangan yang dimiliki oleh k-means sangat sensitif pada
pembangkitan titik pusat awal secara random, Memungkinkan suatu gerombol
tidak mempunyai anggota, Hasil pengelompokan bersifat tidak unik (selalu
berubah-ubah) terkadang bagus terkadang tidak, Sangat sulit mencapai global
optimum, Algoritma k-means clustering walaupun proses pengerjaannya cepat
tetapi keakuratannya tidak dijamin. (anoname, 2013)

2.3.7 Tujuan metode K-Means
Adapun

tujuan

dari

data

clustering

ini

adalah

untuk

meminimalisasikan objective function yang diset dalam proses clustering, yang
pada umumnya berusaha meminimalisasikan variasi di dalam suatu cluster dan
memaksimalisasikan variasi antar cluster. (anoname, 2013)

2.3.8 Clustering
Baskoro (2010) menyatakan bahwa Clustering atau clusterisasi adalah
salah satu alat bantu pada data mining yang bertujuan mengelompokkan obyekobyek ke dalam cluster-cluster. Cluster adalah sekelompok atau sekumpulan
obyek-obyek data yang similar satu sama lain dalam cluster yang sama dan
dissimilar

terhadap

obyek-obyek

yang

berbeda

cluster.

Obyek

akan

dikelompokkan ke dalam satu atau lebih cluster sehingga obyek-obyek yang
berada dalam satu cluster akan mempunyai kesamaan yang tinggi antara satu

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

24

dengan

lainnya.

Obyek-obyek

dikelompokkan

berdasarkan

prinsip

memaksimalkan kesamaan obyek pada cluster yang sama dan memaksimalkan
ketidaksamaan pada cluster yang berbeda. Kesamaan obyek biasanya diperoleh
dari nilai-nilai atribut yang menjelaskan obyek data, sedangkan obyek-obyek data
biasanya direpresentasikan sebagai sebuah titik dalam ruang multidimensi.
Dengan menggunakan clusterisasi, kita dapat mengidentifikasi daerah
yang padat, menemukan pola-pola distribusi secara keseluruhan, dan menemukan
keterkaitan yang menarik antara atribut-atribut data. Dalam data mining, usaha
difokuskan pada metode-metode penemuan untuk cluster pada basis data
berukuran besar secara efektif dan efisien. Beberapa kebutuhan clusterisasi dalam
data mining meliputi skalabilitas, kemampuan untuk menangani tipe atribut yang
berbeda, mampu menangani dimensionalitas yang tinggi, menangani data yang
mempunyai noise, dan dapat diterjemahkan dengan mudah.

Gambar 2.2 Contoh Clustering (Baskoro 2010)

Adapun tujuan dari data clustering ini adalah untuk meminimalisasikan
objective function yang diset dalam proses clustering, yang pada umumnya
berusaha

meminimalisasikan

variasi

di

dalam

suatu

memaksimalisasikan variasi antar cluster. (Nango, 2012)

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

cluster

dan

25

Dan adapun manfaat dari klasterisasi adalah :
o Identifikasi obyek (Recognition) :
Dalam bidang mage Processing , Computer Vision atau robot vision
o Decission Support System dan data mining
Segmentasi pasar, pemetaan wilayah, Manajemen marketing dll.
(Satriyanto. 2013)

2.3.9 PHP
PHP

sendiri

sebenarnya

merupakan

singkatan

dari

“Hypertext

Preprocessor”, yang merupakan sebuah bahasa scripting tingkat tinggi yang
dipasang pada dokumen HTML. Sebagian besar sintaks dalam PHP mirip dengan
bahasa C, Java dan Perl, namun pada PHP ada beberapa fungsi yang lebih
spesifik. Sedangkan tujuan utama dari penggunaan bahasa ini adalah
untuk memungkinkan perancang web yang dinamis dan dapat bekerja secara
otomatis. (anoname, 2013).
File
browser,

html

ini

dikirimkan

kemudian browser

oleh

server

(atau

file)

ke

menerjemahkan kode-kode tersebut sehingga

menghasilkan suatu tampilan yang indah. L