Hertartik Clarasita Devy Student ID : 065314080 INFORMATICS ENGINEERING DEPARTMENT FACULTY OF SCIENCE AND TECHNOLOGY SANATA DHARMA UNIVERCITY YOGYAKARTA 2010

  

PENGELOMPOKAN HASIL EVALUASI PEMBELAJARAN

MENGGUNAKAN METODE KLASTERING K-MEANS

STUDI KASUS DI FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS SANATA DHARMA

SKRIPSI

  Diajukan Untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Teknik Program Studi Teknik Informatika

  Oleh: Hertartik Clarasita Devy

  NIM : 065314080

  

CLUSTERING THE RESULTS OF LEARNING EVALUATION

USING K-MEANS CLUSTERING METHOD

A CASE STUDY IN THE FACULTY OF SCIENCE AND TECHNOLOGY

OF SANATA DHARMA UNIVERSITY

THESIS

  

Presented as Partial Fulfillment Of The Requirements

To Obtain The Sarjana Teknik Degree

In Informatics Engineering Study Program

  Hertartik Clarasita Devy Student ID : 065314080

HALAMAN PERSEMBAHAN

  

“Usaha dan kerja keras adalah modal untuk maju”

  Skripsi ini kupersembahkan untuk :

  Kedua orangtuaku

  

ABSTRAK

PENGELOMPOKAN HASIL EVALUASI PEMBELAJARAN

MENGGUNAKAN METODE KLASTERING K-MEANS

STUDI KASUS DI FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS SANATA DHARMA

  Pusat Pengembangan dan Penjaminan Mutu Pembelajaran Universitas Sanata Dharma (P3MP) setiap akhir semester melaksanakan evaluasi pembelajaran matakuliah-matakuliah. Evaluasi dilakukan dengan kuesioner yang diisi mahasiswa. Kuesioner memuat 18 pertanyaan dengan skala penilaian antara1 sampai 7.

  Dalam tugas akhir ini, penulis mengelompokkan data hasil evaluasi pembelajaran matakuliah-matakuliah di prodi-prodi Fakultas Sains dan Teknologi pada semester gasal 2008/2009 dan semester genap 2008/2009 kedalam kelompok-kelompok dengan hasil evaluasi yang mirip. Pengelompokan dilakukan dengan metode K-Means clustering. Metode K-Means clustering mengelompokkan data-data berdasarkan jarak tiap data dengan centroid.

  Hasil pengelompokan selanjutnya dapat dimanfaatkan untuk penentuan langkah tindak lanjut bagi prodi maupun P3MP guna meningkatkan kualitas pembelajaran di USD secara berkelanjutan.

  ABSTRACT

CLUSTERING THE RESULTS OF LEARNING EVALUATION

USING K-MEANS CLUSTERING METHOD

A CASE STUDY IN THE FACULTY OF SCIENCE AND TECHNOLOGY

OF SANATA DHARMA UNIVERSITY

  At the end of each semester, The Center of Development and Learning

Quality Assurance of Sanata Dharma University evaluates each course learning.

Evaluation was performed using questionnaires filled in by students. The

questionnaire consist of 18 questions with a rating scale between 1 up to 7.

  In this thesis, the author cluster the results of learning evaluation of all

departments in the Faculty of Science and Technology of Sanata Dharma

University into groups with similar evaluation results. The data was taken from

odd and even semester 2008/2009. The clustering was done by using K-Means

clustering method. K-Means clustering method groups data based on the distance

of each data with the centroid.

  The clustering results can be used to determine the following steps for

each departments as well as for The Center of Development and Learning

Quality Assurance of Sanata Dharma University to continously improve the

quality of teaching in Sanata Dharma University.

KATA PENGANTAR

  Puji syukur penulis panjatkan atas Kehadirat Tuhan YME, yang telah melimpahkan rahmat dan berkatNya sehingga penulis dapat menyelesaikan tugas akhir yang berjudul PENGELOMPOKAN HASIL EVALUASI PEMBELAJARAN MENGGUNAKAN METODE KLASTERING K-MEANS STUDI KASUS DI FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS SANATA DHARMA. Tugas akhir ini ditulis sebagai salah satu syarat memperoleh gelar sarjana program studi Teknik Informatika, Fakultas Sains dan Teknologi Universitas Sanata Dharma.

  Dalam kesempatan ini, penulis mengucapkan terimakasih yang sebesar- besarnya kepada :

  1. Ibu P.H. Prima Rosa, S.Si., M.Sc., selaku dosen pembimbing, terimakasih atas segala bimbingan, kritik, saran dan kesabarannya dalam mengarahkan dan membimbing penulis dalam menyelesaikan tugas akhir ini.

  2. Bapak Puspaningtyas Sanjoyo Adi, S.T., M.T., selaku kaprodi Teknik Informatika.

  3. Ibu Ridowati Gunawan, S.Kom., M.T. dan Ibu Sri Hartati Wijono, S.Si, M.Kom., selaku dosen penguji.

  6. Agung Arie Pratama, Asteria Indharlina, Cresensia Devi, Alim Untung Widodo dan Agnes Retnaningsih, terimakasih atas segala bantuan dan dukungannya.

  7. Teman-teman prodi Teknik Informatika angkatan 2006, atas kebersamaanya selama penulis menjalani masa studi.

  8. Serta semua pihak yang tidak dapat disebutkan satu-persatu yang telah membantu penulis dalam menyelesaikan tugas akhir ini.

  Penulis menyadari bahwa tugas akhir ini jauh dari sempurna, oleh karena itu kritik dan saran yang sifatnya membangun sangat penulis harapkan.

  Yogyakarta,

  19 Juli 2010 Penulis

  Daftar Isi

  Halaman HALAMAN JUDUL …………………………….…………………………. i HALAMAN JUDUL (bahasa Inggris)……….…………………………. ii HALAMAN PERSETUJUAN ……………………………………………… iii HALAMAN PENGESAHAN ……………………………………………… iv HALAMAN PERSEMBAHAN …………………………….……………… v PERNYATAAN KEASLIAN KARYA ………………………….………… vi ABSTRAK…………………………………………………………………… vii ABSTRACT ………………………………………………………………… viii PERNYATAAN PERSETUJUAN PUBLIKASI …………………………. ix KATA PENGANTAR ………………………………………………………. x Daftar Isi ……………………………………………………………………. xii Daftar Gambar …………………………………………………….………… xvi Daftar Tabel ………………………………………………………………… xx

  Bab I. Pendahuluan …………………………………………….…………

  1

  1.1. Latar Belakang ……………………………………………..…

  1 1.2. Rumusan Masalah …………………………………………....

  2 1.3. Tujuan dan Manfaat ……………………………………….….

  2

  • norm)………………………….…….. 10 2.5.

  3.1. Identifikasi dan Analisis Sistem………………………………

  46 3.3.4 Diagram Kelas ………………………………..…....

  32 3.3.3 Diagram Aktivitas ………………..………………...

  31 3.3.2 Diagram Use Case ……………….…….…………...

  31 3.3.1 Diagram Konteks …………………………………...

  3.3. Perancangan ……………………………….…………………

  29

  28 3.2.4. Output……………………………………………….

  27 3.2.3. Proses ……………………………………………….

  23 3.2.2. Pemrosesan Awal Data……………………….……..

  23 3.2.1. Input ……………………………….……………….

  3.2. Perancangan Sistem …………………………..………………

  22

  22

  2.2. Analisis Pengelompokan (Clustering Analysis) …………..….

  17 Bab III. Analisis dan Perancangan Sistem ………………….………………

  12 2.6.2. Contoh kasus K-Means Menggunakan SSE ….…….

  2.6.1. Contoh kasus K-Means Tanpa SSE …………..……

  2.6. Contoh kasus K-Means ………………………………….…… 11

  11

  Sum Of Squared-error (SSE) ……………………………………..

  2

  2.4.1. Euclidean (L

  9

  2.4. Kemiripan dan Ketidakmiripan ………………………………

  7

  6 2.3. Klastering K-Means (K-Means Clustering) …………………..

  53

  3.4.2 Desain Pengelompokan Data ……………………….

  80 4.1.1 Antar Muka Menu Utama Program ……………..….

  4.2.1 Membaca Data dari File xls …………….……….…

  88

  4.2. Program Sistem Pengelompokan Data Hasil Evaluasi Pembelajaran ……………………………………..…….……

  88

  86 4.1.6 Antar Muka Bantuan ………………………..….….

  84 4.1.5 Antar Muka Detail Hasil Evaluasi Setiap Data …….

  4.1.4 Antar Muka Detail Data Setiap Klaster ……………

  82

  81 4.1.3 Antar Muka Pengelompokan…………………….….

  80 4.1.2 Antar Muka Pemilihan File Data ………………..….

  4.1. Implementasi Antar Muka Pengguna…………………………

  73 3.4.3 Desain Hasil Pengelompokan Data …………..…….

  80

  78 Bab IV. Implementasi ………………………………………………………

  3.4.8 Desain Petunjuk Penggunaan ……………..……..…

  78

  3.4.7 Desain Antar Muka Detail Data Hasil Evaluasi Seiap Data ………………………………….………….….

  77

  3.4.6 Desain Antar Muka Pie Chart Persentase Prodi Setiap Klaster …………………………..…………..

  76

  3.4.5 Desain Detail Anggota Setiap Klaster………………

  75

  74 3.4.4 Desain Antar Muka Pie Chart Persentase Klaster ….

  88

  4.2.5 Mengelompokkan Data ………………………….….

  95 4.2.6 Menghitung Centroid ……………………..………..

  96 4.2.6.1 Menghitung Centroid Tanpa SSE …….….

  96

  4.2.6.2 Menghitung Centroid beserta SSE …….…

  97 4.2.7 Pemberian Label Klaster ………………………..….

  99

  4.2.8 Validasi Hasil Pengelompokan …………….……… 101

  4.2.9 Pengurutan Data di Setiap Klaster …………………. 102

  4.2.10 Menampilkan Grafik ……………….……………… 103

  4.2.11 Menghitung Rata-Rata Kategori Setiap Data ……… 105

  4.2.12 Menyimpan Hasil Pengelompokan ………………… 106

  4.3. Uji Percobaan ………………………………………………… 108

  Bab V. Kesimpulan dan Saran ………………………………………… 115 Daftar Pustaka Lampiran

  Daftar Gambar Gambar 2.1. Tahap-tahap Data Mining ........................................................

  5 Gambar 2.2. Pengelompokan Obyek Menggunakan K-Means Clustering ...

  9 Gambar 2.3. Koordinat Data Obat ................................................................

  12 Gambar 2.4. Koordinat obat iterasi ke-0 .......................................................

  13 Gambar 2.5. Koordinat obat iterasi ke-1 .......................................................

  15 Gambar 2.6. Koordinat obat iterasi ke-2 .......................................................

  16 Gambar 3.1. Diagram Konteks .....................................................................

  31 Gambar 3.2. Diagram Use Case ....................................................................

  32 Gambar 3.3. Diagram Aktivitas Memilih File Data .....................................

  46 Gambar 3.4. Diagram Aktivitas Mengelompokkan Data .............................

  47 Gambar 3.5. Diagram Aktivitas Melihat Detail Anggota Setiap Klaster .....

  48 Gambar 3.6. Diagram Aktivitas Melihat Detail Data Hasil Evaluasi

Gambar 3.9. Diagram Aktivitas Melihat Grafik Presentase Prodi ...............

  50 Gambar 3.10. Diagram Aktivitas Menyimpan Hasil Pengelompokan ...........

  50 Gambar 3.11. Diagram Aktivitas Mengurutkan Klaster Berdasarkan Centroid ...............................................................

  51 Gambar 3.12. Diagram Aktivitas Mengurutkan Data Dalam Klaster .............

  52 Gambar 3.13. Diagram Kelas Keseluruhan ....................................................

  53 Gambar 3.14. Diagram Kelas .........................................................................

  54 Gambar 3.15. Diagram Kelas Lanjutan ..........................................................

  55 Gambar 3.16. Diagram Sequence Memilih File Data .....................................

  66 Gambar 3.17. Diagram Sequence Mengelompokkan Data .............................

  67 Gambar 3.18. Diagram Sequence Melihat Detail Anggota Setiap Klaster .....

  68 Gambar 3.19. Diagram Sequence Melihat Detail Data Hasil Evaluasi Setiap Data ...............................................................................

  68 Gambar 3.20. Diagram Sequence Melihat Rata-Rata Data Setiap Kategori ..

  69

Gambar 3.24. Diagram Sequence Mengurutkan Klaster Berdasarkan Centroid ...............................................................

  71 Gambar 3.25. Diagram Sequence Mengurutkan Klaster Dalam Klaster ........

  72 Gambar 3.26. Desain Antar Muka Menu utama .............................................

  73 Gambar 3.27. Desain Antar Muka Submenu ..................................................

  73 Gambar 3.28. Desain Antar Muka Pengelompokan Data ...............................

  74 Gambar 3.29. Desain Antar Muka Hasil Pengelompokan Data .....................

  75 Gambar 3.30. Desain Antar Muka Pie Chart Persentase Klaster ....................

  76 Gambar 3.31. Desain Antar Muka Hasil Pengelompokan Data Setiap Klaster ...........................................................................

  77 Gambar 3.32. Desain Antar Muka Pie Chart Persentase Prodi Setiap Klaster .................................................................................... ..

  77 Gambar 3.33. Desain Antar Muka Detail Data Hasil Evaluasi Setiap Data ...

  78 Gambar 3.34. Desain Antar Muka Bantuan Petunjuk Penggunaan ................

  79

Gambar 4.4. Antar Muka Hasil Pengelompokan ..........................................

  82 Gambar 4.5. Antar Muka Pie Chart Persentase Anggota Klaster .................

  83 Gambar 4.6. Antar Muka Detail Anggota Setiap Klaster .............................

  84 Gambar 4.7. Antar Muka Pie Chart Persentase Prodi Setiap Klaster ...........

  84 Gambar 4.8. Antar Muka Lihat Detail Hasil Evaluasi Setiap Data ..............

  86 Gambar 4.9. Antar Muka Input Dialog Jumlah Kategori .............................

  86 Gambar 4.10. Antar Muka Lihat Rata Data setiap Kategori ..........................

  87

  Daftar Tabel Tabel 2.1. Data Obat .................................................................................

  12 Tabel 2.2. Hasil Pengelompokkan Obat dengan K-Means .......................

  17 Tabel 3.1. Pedoman Label Output P3MP .................................................

  22 Tabel 3.2. Atribut Tabel Hasil Evaluasi ....................................................

  23 Tabel 3.3. Urutan Kolom Data Hasil Evaluasi ..........................................

  26 Tabel 3.4. Detail Algoritma Method Kelas InputData ..............................

  56 Tabel 3.5. Detail Algoritma Method Kelas Pengelompokan ....................

  56 Tabel 3.6. Detail Algoritma Method Kelas DetailDataSetiapKlaster .......

  62 Tabel 3.7. Detail Algoritma Method Kelas DetailHasilEvaluasiSetiapData ................................................

  64 Tabel 3.8. Detail Algoritma Method Kelas PieChart ................................

  65 Tabel 4.1. Hasil Percobaan ....................................................................... 108

Bab I PENDAHULUAN

1.1. Latar Belakang

  Universitas Sanata Dharma (USD) merupakan suatu perguruan tinggi swasta di Yogyakarta yang memiliki sebuah lembaga bernama Pusat Pengembangan dan Penjaminan Mutu Pembelajaran (P3MP). P3MP memiliki tugas untuk menjaga kestabilan kualitas pembelajaran, mengelola komponen pengembangan dan penjaminan mutu pembelajaran, serta mengelola kegiatan peningkatan mutu pembelajaran di USD. Salah satu program yang dilaksanakan P3MP adalah melaksanakan evaluasi kegiatan belajar mengajar di akhir semester. Evaluasi mencakup tiga kategori, yaitu kinerja dosen, konstribusi mahasiswa dan kepuasan mahasiswa terhadap suatu matakuliah. Evaluasi dilakukan dengan kuesioner yang diisi mahasiswa, berjumlah 18 pertanyaan dengan skor penilaian berupa bilangan bulat antara 1 sampai dengan 7.

  Dengan adanya evaluasi tersebut, maka saat ini P3MP memiliki data hasil evaluasi yang banyak dalam bentuk digital. Data-data tersebut dapat dikelompokkan menggunakan teknik data mining diantaranya metode klastering K-Means. Algoritma K-Means akan menghitung jarak tiap data dengan pusat klaster (centroid) kemudian mengelompokkan data-data tersebut berdasarkan meningkatkan kualitas pembelajaran di USD secara berkelanjutan.

  Dalam tugas akhir ini penulis bermaksud memanfaatkan data-data hasil evaluasi pembelajaran matakuliah-matakuliah yang diselenggarakan oleh prodi- prodi di lingkungan Fakultas Sains dan Teknologi (FST). Pengelompokan menggunakan metode klastering K-Means.

  1.2. Rumusan Masalah

  Dari latar belakang masalah di atas dapat dirumuskan masalah : Bagaimana mengelompokkan hasil evaluasi pembelajaran matakuliah- matakuliah di FST USD kedalam kelompok-kelompok dengan hasil evaluasi yang mirip dengan menggunakan metode klastering K-Means?

  1.3. Tujuan dan Manfaat Tujuan Mengelompokkan hasil evaluasi pembelajaran matakuliah-matakuliah di FST USD.

  Manfaat Hasil pengelompokan dapat digunakan sebagai bahan pertimbangan bagi prodi maupun P3MP untuk melakukan pendampingan terhadap para dosen dalam aspek proses belajar mengajar dan memfasilitasi terjadinya sharing pengalaman antar kelompok.

  1.4. Batasan Masalah matakuliah-matakuliah untuk prodi-prodi di lingkungan FST USD pada semester gasal 2008/2009 dan genap 2008/2009.

  3. Pengelompokan berdasarkan rata-rata jawaban semua responden untuk setiap pertanyaan yang termuat di kuesioner yaitu pertanyaan nomor 1 sampai 18.

  4. Pelabelan klaster hasil klastering didasarkan pada ketentuan pelabelan yang berlaku di P3MP yaitu sangat tinggi, tinggi, cukup, rendah dan sangat rendah.

  5. Sistem hanya dapat memproses data input yang berasal dari file xls.

  6. Sistem tidak menyediakan fasilitas preprocessing data.

1.5. Metodologi Penelitian

  Metode penelitian dilakukan dengan teknik data mining, yaitu :

  1. Pembersihan data, yaitu menghilangkan noise dan data yang tidak konsisten.

  2. Integrasi data, yaitu menggabungkan bermacam-macam data storage.

  3. Seleksi data, yaitu mengambil data yang relevan dari database.

  4. Tranformasi data, yaitu mentransformasikan data ke dalam bentuk yang tepat untuk diolah.

  5. Penambangan data Proses pokok mengimplemetasikan metode yang sesuai untuk untuk menyajikan informasi hasil penambangan kepada pengguna.

1.6. Sistematika Penulisan

  Adapun sistematika penulisan Tugas akhir adalah sebagai berikut :

  1. Halaman Judul 2. Abstrak, berisi tentang rangkuman Tugas Akhir.

  3. Daftar Isi

  4. Bab I Pendahuluan Pendahuluan berisi tentang latar belakang, rumusan masalah, tujuan dan manfaat, batasan masalah, metodologi penelitian dan sistematika penulisan.

  5. Bab II Landasan Teori Landasan teori berisi tentang teori yang akan digunakan dalam penulisan Tugas Akhir.

  6. Bab III Analisis dan Perancangan Sistem Analisis dan perancangan sistem berisi tentang identifikasi dan analisis sistem, perancangan sistem.

  7. Bab IV Implementasi Program Implementasi Program berisi implementasi program dan analisis hasil.

  8. Bab V Kesimpulan dan Saran Kesimpulan dan saran berisi tentang kesimpulan dan saran.

Bab II LANDASAN TEORI

2.1 Penambangan Data

  Penambangan data (data mining) menarik perhatian dalam bidang industri dan kalangan masyararakat pada umumnya. Penambangan data berkenaan dengan pengolahan data dalam skala besar supaya menjadi informasi maupun pengetahuan yang berguna. Penambangan data yang sering juga disebut

  

knowledge discovery in database (KDD) merupakan kegiatan pengumpulan data,

  pemakaian data historis untuk menemukan keteraturan, pola atau hubungan data dalam ukuran data yang besar (Santosa, 2007). Penambangan data dapat digambarkan dalam gambar 2.1 yang terdiri dari langkah-langkah berikut :

  1. Pembersihan data Dalam pembersihan data dilakukan pengapusan noise dan data yang tidak konsisten.

  2. Integrasi data Dalam langkah ini dilakukan penggabungan beberapa data storage.

  3. Seleksi data Yaitu mengambil data yang relevan dari basis data.

  4. Transformasi data Mentransformasikan data ke dalam bentuk yang tepat untuk diolah, dengan meringkas atau operasi agregasi.

  5. Penambangan data Sebuah proses esensial dimana metode yang tepat diaplikasikan untuk mengekstrak pola data.

  6. Evaluasi pola Mengidentifikasi pola-pola didasarkan pada pengukuran yang menarik.

  7. Presentasi pengetahuan Menggunakan visualisasi dan presentasi untuk menyajikan informasi hasil mining kepada user.

2.2 Analisis Pengelompokan (Clustering Analysis)

  Clustering analysis merupakan metode penambangan data yang

  Data dikelompokkan berdasarkan prinsip kemiripan (similarity) ataupun ketidakmiripan (dissimilarity). Data yang berada dalam satu kelompok (intraclass) memiliki kemiripan (similarity) yang tinggi. Sedangkan data yang berbeda kelompok (interclass) memiliki kemiripan (similarity) yang rendah.

2.3 Klastering K-Means (K-Means Clustering)

  mengambil input parameter, k, dan mempartisi himpunan n

  K-Means

  objek ke dalam k klaster. Setiap klaster terdiri dari obyek-obyek yang memiliki kemiripan yang tinggi dengan data-data dalam klaster tersebut dan memiliki kemiripan yang rendah terhadap data di klaster lain. Kemiripan klaster diukur berdasarkan jarak data dengan centroid yaitu nilai rata-rata dari obyek dalam sebuah klaster.

  Cara kerja k-means pertama memilih k obyek secara acak yang diinisialisasikan sebagai rata-rata klaster atau pusat klaster. Obyek yang lain ditetapkan menjadi anggota klaster tertentu yang paling mirip dengan obyek tersebut berdasarkan jarak antara obyek dengan rata-rata klaster. Kemudian dihitung rata-rata yang baru untuk setiap klaster. Proses ini berulang hingga fungsi ukuran bertemu di satu titik, yaitu tidak ada perpindahan obyek disetiap klaster.

  Tidak ada perpindahan obyek disetiap klaster dapat diartikan dengan tidak ada perubahan nilai pusat klaster atau jika menggunakan nilai SSE, nilai SSE yang dihasilkan lebih kecil dari nilai SSE maksimal yang dikehendaki.

  Output : klaster sebanyak k Algoritma :

  (1) Secara acak memilih k obyek dari D yang di inisialisasikan sebagai pusat klaster (centroid) (2) Repeat (3) Tempatkan setiap objek ke klaster yang memiliki kemiripan yang tinggi, berdasarkan rata-rata obyek-obyek dalam klaster

  (4) Ubah rata-rata klaster, yaitu hasil perhitungan nilai rata-rata obyek-obyek di setiap klaster.

  (5) Sampai tidak ada perubahan anggota disetiap klaster atau tidak ada perubahan centroid.

  Metode klastering k-means relatif terukur dan efisien dalam mengolah sekumpulan data yang besar karena kompleksitas komputasi dari algoritma ini adalah O(nkt), di mana n adalah jumlah total obyek, k adalah jumlah klaster, dan t adalah jumlah iterasi. Biasanya, k <<n dan t <<n.

  Algoritma k-means hanya dapat diterapkan ketika centroid didefinisikan. Jika pusat klaster belum di definisikan maka tidak ada pusat kemana data akan Gambar 2.2(A) merupakan gambar satu set o objek dengan jumlah klaster 3. Berdasarkan teori klastering k-means, secara random dipilih tiga objek sebagai pusat klaster awal yang ditandai dengan symbol ‘+’. Setiap objek didistribusikan ke klaster berdasarkan pusat klaster terdekat. Setiap klaster dikelilingi oleh kurva putus-putus.

  Kemudian pusat klaster diperbaharui. Pusat klaster baru merupakan nilai rata-rata semua obyek di setiap klaster. Setelah pusat klaster diperbaharui, setiap obyek didistribusikan kembali ke klaster berdasarkan pusat klaster terdekat, sehingga dihasilkan klaster-klaster baru seperti pada Gambar 2.2 (B).

  Proses iterasi tersebut akan terus berulang selama masih ada obyek yang berpindah klaster. Jika sudah tidak ada obyek yang berpindah klaster, maka proses berakhir dan menghasilkan klaster-klaster seperti yang terlihat pada Gambar 2.2 (C).

Gambar 2.2 Pengelompokan Obyek Menggunakan K-Means kesamaan dua buah obyek. Dalam ukuran kemiripan, semakin besar nilai kemiripan berarti semakin mirip, semakin kecil nilai kemiripan semakin tidak mirip. Sedangkan ketidakmiripan antara dua obyek adalah ukuran numerik tingkat perbedaan dua obyek. Dalam ukuran ketidakmiripan, semakin besar nilai ketidakmiripan berarti semakin tidak mirip, semakin kecil nilai ketidakmiripan semakin mirip. Semakin mirip dua obyek semakin tinggi peluang untuk dikelompokkan ke dalam satu klaster. Sebaliknya, semakin tidak mirip semakin rendah peluang untuk dikelompokkan menjadi satu klaster.

  Untuk mengukur kemiripan dan ketidakmiripan obyek-obyek/data-data dapat digunakan beberapa ukuran. Kemiripan dapat diukur menggunakan cosinus,

  

kovarian dan korelasi. Ketidakmiripan dapat diukur menggunakan konsep jarak

Euclidean , Manhattan atau Cityblock, Minkowski, Chebyshev dan Mahalanobis.

2.4.1 Euclidean (L 2 -norm)

  Setiap data hasil evaluasi memiliki jumlah atibut yang sama sehingga pengukuran jarak dapat menggunakan konsep Euclidean. Jarak Euclidean antara dua data didefinisikan sebagai :

  2 n

2

  ∑ ( ab ) ……………………….2.1

  d(a,b)= ║ a-b║ = i = 1 i i

  dimana :

  2.5 Sum Of Squared-error (SSE)

  Untuk membuat klaster beranggotakan data-data yang memiliki kemiripan tinggi, dapat menggunakan fungsi kriteria yang dapat mengukur kualitas klastering. Salah satu persamaan yang sering dipakai dan cukup sederhana adalah jumlah dari kesalahan kuadrat (sum of squared-error, SSE). SSE didefinisikan sebagai berikut : k 2 J = xm ……………2.2 e i

  ∑ ∑ i = 1 xD i

  dimana : J = SSE

  e

  k = jumlah klaster D = dataset x = obyek m = pusat klaster (centroid) SSE juga dapat dijadikan ukuran untuk penghentian iterasi proses pengelompokan. Jika nilai SSE hasil pengelompokan lebih kecil dari pada SSE yang dimasukkan pengguna, maka proses pengelompokan selesai.

  K-Means

  2.6 Contoh Kasus

  Berikut adalah contoh penyelesaian kasus dengan algoritma k-means yang di peroleh dari website dengan alamat :

Tabel 2.1 Tabel Data Obat

  Object Attribute 1 (X):weight index Attribute 2

  (Y): pH Medicine A 1 1 Medicine B 2 1 Medicine C

  4 3

  Medicine D

  5 4

2.6.1 Contoh kasus K-Means Tanpa SSE

  Data-data dalam tabel 2.1 akan dikelompokkan ke dalam 2 kelompok obat yang didasarkan pada dua fitur yaitu pH dan indeks berat. Iterasi dalam proses pengelompokan akan dikendalikan oleh perubahan anggota di setiap klaster.

Gambar 2.3 Koordinat Data Obat

  Obyek atribut 1 (X): indeks berat d dan c (2,1) menyatakan n koordinat centroid . C Centroid dila ambangkan

  2=

  d dengan simb ol bintang, s seperti yang terlihat pada a gambar 2.1 1.

  Gambar 2

2.4 Koordin nat obat iter rasi ke-0

  2. Menguku ur jarak obye ek ke centro id Pengukuran j P jarak antara obyek ke ce entroid meng ggunakan m etode jarak

  2

  E Euclidean . S etiap kolom dalam matr iks jarak me elambangkan n obyek :

  Contoh peng C ghitungan jar rak obyek ke e centroid :

  • Jarak obat C = (4 , 3) ke centr roid kedua c c =(2,1) :
  • n 2

      2

      ( a b )

      d(x,y y) = ∑ − i = 1 i i

      4

      2 2 ) (

      3 1 )

      2.83

      = − − = 2 2 Sehingga ma S atriks jarak p pada iterasi 0 0 adalah :

    • (

      Baris pertam B ma dari matri iks jarak ses suai dengan jarak setiap p obyek ke centroid pert c ama dan bar ris kedua ada alah jarak se etiap obyek k ke centroid kedua. k

      3. M Mengelompo okkan obyek k Obyek dikel O lompokkan berdasarkan n jarak min nimum. Jad di, obat A d dikelompokk kan ke kelom mpok 1, ob bat B ke ke elompok 2, obat C ke kelompok 2 d k dan obat D k ke kelompok k 2. Element ma E atriks di ba awah ini te erdiri dari nilai 1 da an 0 yang menunjukan m posisi obye ek terhadap p suatu klas ster. 1 berar rti anggota k klaster dan 0 berarti b bukan angg gota klaster r. Misalnya obyek A IIterasi 1 :

      1. Menentukan nilai centro id M

      C Centroid di ihitung ber rdasarkan r rata-rata se mua data di setiap

      k kelompok. K Kelompok 1 memiliki sa atu anggota sehingga pu usat klaster te etap di c =( (1,1). Kelom mpok 2 mem miliki tiga an nggota, sehin ngga pusat

      1

      k klaster kelom mpok 2 : .

      Gambar 2

    2.5 Koordin nat obat iter rasi ke-1

      2. M Mengukur ja arak obyek k e pusat klast ter

      3. M Mengelompo okkan obyek k O Obyek dike elompokkan n berdasark kan jarak minimum, sehingga dihasilkan m d matrik kelomp pok :

      Iterasi 2 :

      I

      1. M Menentukan nilai pusat k klaster P Pusat klaste r dihitung berdasarkan n rata-rata semua data a di setiap

      1

      2

      1

      1

      4

      5

      3

      4

      1

      1 ⎛ ⎞ ⎛ ⎞ ⎞ ⎛ + ⎞ ⎛ ⎞ k kelompok. c = , =

      1 + + + + +

      1 , 1 c = , = = 4 ,

      3 1 1 ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ 2

      2

      2

      2

      2

      2

      2

      2

      2

      2 ⎝ ⎠ ⎝ ⎠ ⎠ ⎝ ⎠ ⎝ ⎠

      Gambar 2

    2.6 Koordin nat obat iter rasi ke-2

      2. M Mengukur ja arak obyek k e pusat klast ter

      3. M Mengelompo okkan obyek k Obyek dike O elompokkan n berdasark kan jarak minimum, sehingga dihasilkan m d matrik kelomp pok :

      1

      

    2

    Dari hasil it D terasi 2 terl lihat bahwa G =G , yan ng berarti ba ahwa tidak ada obyek

      yang berpin y ndah kelomp pok lagi. Den ngan demiki ian, perhitun ngan dari kl lastering k- m means telah mencapai st tabilitas dan tidak memb butuhkan iter rasi lagi.

      Hasil akhir p H pengelompo kan obat terl lihat pada ta abel 2.2.

      ans Tab bel 2.2 Tabe l Hasil Peng gelompokka an Obat den ngan K-Mea

      Feature 1 (X X): Obje ect Feat ture 2 (Y): p pH Group p (result) weight ind dex

      Medicin ne A

      1

      1

      1 Medicin ne B

      2

      1

      1 Medicin ne C

      4

      3

      2 Medicin ne D

      5

      4

      2

    2.6.2 Cont 2 toh kasus K K-Means Me enggunakan n SSE

      Dala am tabel 2 2.1 terdapat t 4 objek sebagai ti itik data y yang akan

    • Jarak

      1 4 ( − dan indeks b pusat klaster r pertama d nyatakan koo simbol bin ke pusat klas obyek ke p kolom dal rak obyek ke

      usat klaster rlihat pada kan metode ambangkan

      1=

      (1,1) obat B. c

      1

      3.61 obat A dan o at klaster. pu rti yang ter menggunak jarak mela er: tama c

      =

      1 − + erat. r dimisalkan o ordinat pusa ntang, seper ster pusat klaster lam matriks e pusat klaste t klaster pert

      1 ) 3 (

      − 2 2 )

      b a

      , 3) ke pusat 2 ) ( i i

      = =

      d

      ∑

      y) = 1 n i

      . Setiap ghitungan jar obat C = (4

      dean

      (2,1) men an dengan arak obyek k jarak antara

      2=

      ur yaitu pH d n nilai awal p pusat klaster c

      d(x,y

      Pengukuran j arak Euclid obyek : Contoh peng

      Menentukan Nilai awal p (1,1) dan c dilambangk gambar 2.1. Mengukur ja

      2. P ja o C pada dua fitu

      I didasarkan p Iterasi 0 : 1.

      : Baris pertam B ma dari matri iks jarak ses suai dengan jarak setiap p obyek ke p pusat klaster r pertama d an baris ked dua adalah jarak setiap p obyek ke pusat klaster p kedua.

      3. Mengelompo okkan obyek k M

      O Obyek dikel lompokkan berdasarkan n jarak min nimum. Jad di, obat A d dikelompokk kan ke kelom mpok 1, ob bat B ke ke elompok 2, obat C ke kelompok 2 d k dan obat D k ke kelompok k 2. Element ma E atriks di ba awah ini te erdiri dari nilai 1 da an 0 yang m menunjukan posisi obye ek terhadap p suatu klas ster. 1 berar rti anggota klaster dan k 0 berarti b bukan angg gota klaster r. Misalnya obyek A memiliki nila m ai 1 di kelo mpok 1 dan n memiliki n nilai 0 di ke elompok 2, yang berarti y obyek A merupakan anggota ke elompok 1. Obyek B memiliki nila m ai 0 di kelo mpok 1 dan n memiliki n nilai 1 di ke elompok 2, y yang berarti o obyek B me rupakan ang ggota kelomp pok 2 dan se eterusnya.

      4. Menghitung pusat klaster r yang baru dan nilai SS SE M

      S SSE di iteras si 0 adalah :

      2

      2

      2

      2 SSE = ||1 + ||1-2.67|| + 1-1|| + ||1-1| | + ||2-3.67| |

      2

      2

      2

      2

      ||4 4-3.67|| + ||3 3-2.67|| +||5- -3.67|| + ||4- -2.67|| = 0 + 0 + 2.79 + 2.79 + 0.1 1+0.11 + 1. 77+1.77 = 9

      9.34 N Nilai SSE ya ang dikehen ndaki adalah h 3 dan nilai i SSE yang dihasilkan pada iterasi p 0 adalah 9.3 34, karena 9 9.34 tidak le ebih kecil da ari 3 maka it terasi akan b berlanjut.

      I Iterasi 1 :

      1. Menentukan nilai pusat k klaster M

      Pusat klaste P r dihitung berdasarkan n rata-rata semua data a di setiap k kelompok. K Kelompok 1 memiliki sa atu anggota sehingga pu usat klaster te etap di c =( (1,1). Kelom mpok 2 mem miliki tiga an nggota, sehin ngga pusat

      1

      klaster kelom k mpok 2 :

      2. Mengukur ja arak obyek k e centroid M

      Pengukuran P jarak data a terhadap centroid m mengggunaka an metode

      Euclidean, E se ehingga diha asilkan matri ik jarak :

    • 1 ,

      2

      1

      4

      2

      4

      3 si 1 adalah : 1-1.5||

      2

      2

      ⎟ ⎠ ⎞

      1 ⎟ ⎠ ⎞

      2

      1 3 ,

      1

      1 ⎜ ⎝ ⎛

      2

      2 +||5-4.

      25 + 0.25+ 0 ndaki adalah 75, karena 1 ilai SSE

      ||

      2

      2

      5||

      2

      .75 lebih ke

      2

      2

      = ⎟ ⎠ ⎞

      2

      1

      4. M

      c c

    • 2

      S N p s Menghitung

      ⎜ ⎝ ⎛ +

      =

      1 ,

      2

      2

      1 1

      c

      ⎜ ⎝ ⎛ +

      =

      3 ,

      2

      5

      4 2

      c

      SSE di iteras SSE = ||1

      ||4 = 0.

      Nilai SSE ya pada iterasi selesai. pusat klaster

      ⎜ ⎝ ⎛

      = ⎟ ⎠ ⎞

      2

      1

    • ||1- 4-4.5||
      • 1||

    • ||2-1.5
    • ||1-1.5||
    • ||
    • ||3- .25 + 0 + 0.2 ang dikehen 1 adalah 1.7 r baru dan n
      • 3.5||

    • ||4-3.5| 0.25 + 0.25 + h 3 dan nilai
    • 0.25 +0.25 i SSE yang ecil dari 3 m

      = 1.75 dihasilkan maka iterasi

    Bab III ANALISIS DAN PERANCANGAN SISTEM

    3.1 Identifikasi dan Analisis Sistem

      Pusat Pengembangan dan Penjaminan Mutu Pembelajaran (P3MP) merupakan sebuah lembaga milik Universitas Sanata Dharma (USD). P3MP memiliki tugas untuk menjaga kestabilan kualitas pembelajaran, mengelola komponen pengembangan dan penjaminan mutu pembelajaran, serta mengelola kegiatan peningkatan mutu pembelajaran di USD. P3MP setiap akhir semester melakukan evaluasi terhadap pelaksanaan matakuliah. Evaluasi mencakup tiga kategori, yaitu kinerja dosen, kontribusi mahasiswa dan kepuasan mahasiswa yang tercakup dalam 18 pertanyaan.

      Dalam tugas akhir ini akan dikelompokkan data hasil evaluasi ke dalam kelompok-kelompok yang memiliki kemiripan yang tinggi. Data yang dikelompokkan adalah data hasil evaluasi di Fakultas Sains dan Teknologi (FST) USD pada semester gasal 2008/2009 dan semester genap 2008/2009.

      Pengelompokan berdasarkan 18 pertanyaan yang termuat dalam kuesioner. Data semester gasal 2008/2009 yang diperoleh berjumlah 62 record. Data semester genap 2008/2009 yang diperoleh berjumlah 74 record. Hasil pengelompokan akan diberi label menurut ketentuan yang berlaku di P3MP, yaitu :

      3,92 – 4,89 56% - 69% Cukup 3,22 – 3,91 46% - 55% Rendah … – 3,22 … - 46% sangat rendah

    3.2 Perancangan Sistem

    3.2.1 Input

      Sistem yang akan dibuat menerima inputan yang berupa data hasil evaluasi pembelajaran. Dalam tugas akhir ini data yang digunakan adalah data di Fakultas Sains dan Tekonologi (FST). FST mencakup prodi Teknik Informatika, Teknik Elektro, Teknik Mesin, Mekatronika, Matematika dan Fisika. Data hasil evaluasi diperoleh dari P3MP Universitas Sanata Dharma. Satu record data hasil evaluasi merupakan data satu matakuliah. Data evaluasi mencakup prodi, NIP dosen, namaDosen, nama matakuliah, fakultas dan nilai rata-rata jawaban semua responden untuk setiap pertanyaan yang termuat dalam kesioner. Data evaluasi mencakup 23 atribut, yaitu :

    Tabel 3.2 Atribut Data Hasil Evaluasi

      Nama Atribut Penjelasan Nilai Data berupa nama-nama program studi. Data prodi tidak termasuk dalam atribut yang akan dihitung

      Atribut ini menyimpan prodi jaraknya, tetapi hanya sebagai nama prodi. identitas prodi penyelenggara sebagai identitas dosen pengampu matakuliah.

      Data berupa nama dosen yang mengampu mata kuliah yang dievaluasi. Data dosen yang

      Atribut ini menyimpan namaDosen dipakai dalam tugas akhir bukan nama dosen. nama yang sebenarnya, melainkan nama samaran mengingat kerahasiaan data. Nama-nama kelas dan matakuliah di prodi FST, misalnya Kalkulus A,

      Atribut ini menyimpan Kalkulus B, Ststistik A dll. Data Nama nama matakuliah matakuliah tidak termasuk dalam matakuliah beserta kelasnya atribut yang akan dihitung jaraknya, tetapi hanya sebagai identitas matakuliah.