Clustering Penggunaan Bandwidth Menggunakan Metode K-means Algorithm Pada Penerapan Single Sign On (SSO) Universitas Sebelas Maret.

CLUSTERING PENGGUNAAN BANDWIDTH MENGGUNAKAN
METODE K-MEANS ALGORITHM PADA PENERAPAN SINGLE SIGN
ON (SSO) UNIVERSITAS SEBELAS MARET
HALAMAN JUDUL
SKRIPSI
Diajukan untuk memenuhi salah satu syarat mencapai gelar Strata Satu
Program Studi Informatika

Disusun oleh:
VIGNASARI KOKASIH
M0511048

PROGRAM STUDI INFORMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SEBELAS MARET
SURAKARTA

2016

SKRIPSI


CLUSTERING PENGGUNAAN BANDWIDTH MENGGUNAKAN
METODE K-MEANS ALGORITHM PADA PENERAPAN SINGLE SIGN
ON (SSO) UNIVERSITAS SEBELAS MARET
HALAMAN PENGAJUAN

Disusun oleh:
Vignasari Kokasih
M0511048

Ditulis dan diajukan untuk memenuhi sebagian persyaratan memperoleh gelar Strata
Satu Program Studi Informatika

PROGRAM STUDI INFORMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SEBELAS MARET
SURAKARTA

2016

2


SKRIPSI

CLUSTERING PENGGUNAAN BANDWIDTH MENGGUNAKAN
METODE K-MEANS ALGORITHM PADA PENERAPAN SINGLE SIGN
ON (SSO) UNIVERSITAS SEBELAS MARET
HALAMAN PERSETUJUAN

Disusun oleh:
Vignasari Kokasih
M0511048

Skripsi ini telah disetujui untuk dipertahankan dihadapan dewan penguji,
Pada tanggal: 18 Januari 2016

Pembimbing 1,

Pembimbing 2,

Dr. Wiranto, M.Kom., M.Cs.


Afrizal Doewes, S.Kom., M.Sc.

NIP. 19661230 199302 1 001

NIP. 19850831 201212 1 004

3

SKRIPSI

CLUSTERING PENGGUNAAN BANDWIDTH MENGGUNAKAN
METODE K-MEANS ALGORITHM PADA PENERAPAN SINGLE SIGN
ON (SSO) UNIVERSITAS SEBELAS MARET
HALAMAN PENGESAHAN
Disusun oleh:
Vignasari Kokasih
M0511048
Telah dipertahankan dihadapan Dewan Penguji,
pada tanggal: 18 Januari 2016

Susunan Dewan Penguji
1. Dr. Wiranto, M.Kom., M.Cs.

(

)

(

)

(

)

(

)

NIP. 19661230 199302 1 001

2. Afrizal Doewes, S.Kom., M.Sc.
NIP. 19850831 201212 1 004
3. Hasan Dwi Cahyono, S.Kom., M.Kom.
NIP. 19820524 201404 1 001
4. Ristu Saptono, S.Si., M.T.
NIP. 19790210 200212 1 001
Disahkan oleh,
Kepala Program Studi Informatika

Drs. Bambang Harjito, M.App.Sc, Ph.D.
NIP. 19621130 199103 1 002

4

HALAMAN MOTTO

“Ready Steady GO” by Larch En Ciel

5


HALAMAN PERSEMBAHAN
Skripsi ini penulis persembahkan untuk:
Keluarga Kokasih tercinta,
Ayahanda Tri Wahyu Kokasih, Ibunda Slamet Handayani
Abang Tyas Kokasih, dan Dik Orisativa Kokasih
Kak Dina Kharismawati, dan Kirana Kokasih
Teman Seatap-Seperjuangan,
Lia Primadani,S.Kom.; Miranda Nur Qolbi Aprilina,S.Kom.;
Arissa Aprilia Nurcahyani,S.Kom.; Arba Sasmoyo,S.Kom.,OCA.
Kelompok Umak-Umik,
Lia Primadani; Vivi Dyah Hapsoro Wati; Yunita Primasari;
Ainun Fajriyah; Widyaningdyah Hidayati; Astrid Noviana Paradhita
Sahabat Pena,
Wulan Ciptaning Pangestuti
Anak Traktirmen,
Lia Primadani; Faisal Dharma Adhinata; Muhammad Hezby Alhaq
dan Keluarga SAT PUSKOM UNS

6


KATA PENGANTAR
Segala puji syukur penulis panjatkan kehadirat Allah SWT atas segala limpahan
rahmat dan karunia-Nya, sehingga penulis dapat menyelesaikan penulisan penelitian
yang berjudul “Clustering Penggunaan Bandwidth Menggunakan Metode K-means
Algorithm Pada Penerapan Single Sign On (SSO) Universitas Sebelas Maret”. Sholawat
dan salam senantiasa penulis haturkan kepada junjungan kita Nabi Muhammad SAW
sebagai pembimbing seluruh umat manusia. Pada pengerjaan penelitian ini penulis
banyak memerlukan bantuan, bimbingan dan motivasi dari berbagai pihak. Oleh karena
itu, ucapan terimakasih yang sepantasnya penulis ucapkan kepada:
1. Bapak Drs. Bambang Harjito, M.App.Sc., Ph.D. selaku kepala program studi
Informatika FMIPA UNS.
2. Bapak Dr. Wiranto, M.Kom., M.Cs. selaku pembimbing I terimakasih untuk setiap
diskusi, ilmu, wejangan, semangat dan bimbingannya.
3. Bapak Afrizal Doewes, S.Kom., M.Sc. selaku pembimbing II terimakasih atas
pertanyaan kritis yang memicu penggalian informasi lebih lanjut.
4. Bapak Triyadi Joko Purwanto, S.Si., Bapak Bagus Setiawan, S.Si., dan admin
jaringan lainnya yang memberikan dukungan data dan masukan pada penelitian ini.
Semoga Allah SWT membalas kebaikan yang telah diberikan dengan balasan
yang lebih baik. Penulis menyadari bahwa penelitian ini masih banyak kekurangan,
oleh karena itu mohon kritik dan saran dari pembaca. Semoga penelitian ini dapat

memberikan manfaat kepada pembaca umumnya dan penulis pada khususnya.
Surakarta, 29 Oktober 2015
Penulis

7

CLUSTERING PENGGUNAAN BANDWIDTH MENGGUNAKAN
METODE K-MEANS ALGORITHM PADA PENERAPAN SINGLE SIGN
ON (SSO) UNIVERSITAS SEBELAS MARET

VIGNASARI KOKASIH
Program Studi Informatika, Fakultas Matematika dan Ilmu Pengetahuan Alam,
Universitas Sebelas Maret

ABSTRAK
Akses internet melalui sistem Single Sign On (SSO) di Universitas Sebelas
Maret telah banyak di manfaatkan oleh civitas akademik seperti mahasiswa dan
karyawan/dosen. Data dari aktifitas penggunaan SSO tersebut tercatat pada log SSO
dan telah terkumpul banyak. Pada log tersebut tercatat mengenai: (1) status perangkat
jaringan yang di gunakan, (2) riwayat login pengguna dan (3) riwayat logout pengguna

SSO. Pada riwayat login dan logout pengguna terdapat detail data seperti akun
pengguna, lokasi dan tanggal mengakses, jumlah penggunaan bandwidth download dan
upload, waktu login dan waktu logout.
Teknik data mining dapat di terapkan untuk menggali informasi dari data log
SSO yang telah terkumpul banyak. Tujuan penelitian ini untuk menganalisa
penggunaan bandwidth Universitas Sebelas Maret (UNS) berdasarkan data trafik
internet dari log SSO dengan menggunakan metode data clustering untuk
mengelompokkan data yang mempunyai kesamaan dalam satu cluster, yaitu
menggunakan algoritma K-means.
Kata kunci: data mining, clustering, k-means, Single Sign On

8

CLUSTERING BANDWIDTH USAGE USING K-MEANS ALGORITHM
ON THE SINGLE SIGN ON (SSO) APPLICATION UNIVERSITAS
SEBELAS MARET

VIGNASARI KOKASIH
Department of Informatics, Faculty of Mathematics and Natural Sciences,
Universitas Sebelas Maret


ABSTRACT
Internet access through Single Sign On (SSO) system at Universitas Sebelas
Maret has been widely used by academic community as student, staff or faculty. Data
from the SSO usage activity recorded in the SSO log that has accumulated a lot. The
SSO log recorded: (1) network devices status, (2) user login history, and (3) user logout
history through SSO. The login and logout record have have more detailed data such
as username, location, date of access, total download and upload data, login time, and
logout time.
Data mining techniques can be applied to extract information from the SSO log
data. The purpose of this study was to analyze the bandwidth usage of Universitas
Sebelas Maret (UNS) based on the internet traffic recorded on SSO log using the data
clustering methods for grouping data that have similarities in clusters, using the Kmeans Algorithm.
Keywords: data mining, clustering, k-means, Single Sign On

9

DAFTAR ISI
HALAMAN JUDUL..................................................................................................... 1
HALAMAN PENGAJUAN .......................................................................................... 2

HALAMAN PERSETUJUAN ...................................................................................... 3
HALAMAN PENGESAHAN....................................................................................... 4
HALAMAN MOTTO ................................................................................................... 5
HALAMAN PERSEMBAHAN ................................................................................... 6
KATA PENGANTAR .................................................................................................. 7
ABSTRAK .................................................................................................................... 8
ABSTRACT .................................................................................................................. 9
DAFTAR ISI ............................................................................................................... 10
DAFTAR TABEL ....................................................................................................... 13
DAFTAR GAMBAR .................................................................................................. 15
DAFTAR LAMPIRAN ............................................................................................... 16
BAB I PENDAHULUAN ........................................................................................... 17
1.1. Latar Belakang ..................................................................................................... 17
1.2. Rumusan Masalah ................................................................................................ 20
1.3. Batasan Masalah................................................................................................... 20
1.4. Tujuan Penelitian ................................................................................................. 20
1.5. Manfaat Penelitian ............................................................................................... 21
1.6. Sistematika Penulisan .......................................................................................... 21
BAB II TINJAUAN PUSTAKA................................................................................. 22

10

2.1. Dasar Teori ........................................................................................................... 22
2.1.1. Bandwidth ......................................................................................................... 22
2.1.2. Single Sign On (SSO) ........................................................................................ 23
2.1.3. Data Clustering ................................................................................................. 25
2.1.4. Algoritma K-means ........................................................................................... 29
2.2. Penelitian Terkait ................................................................................................. 40
2.3. Rencana Penelitian ............................................................................................... 42
BAB III METODOLOGI ............................................................................................ 43
3.1. Pengumpulan Data ............................................................................................... 43
3.2. Preprocessing Data .............................................................................................. 46
3.2.1. Data Cleaning .................................................................................................... 46
3.2.2. Attribute Selections ........................................................................................... 47
3.2.3. Data preparation ................................................................................................ 48
3.3. Clustering Data .................................................................................................... 48
3.4. Analisa Data ......................................................................................................... 49
BAB IV HASIL DAN PEMBAHASAN .................................................................... 50
4.1. Deskripsi data ....................................................................................................... 50
4.2. Clustering Data .................................................................................................... 50
4.2.1. Bulan Maret ....................................................................................................... 51
4.2.2. Bulan April ........................................................................................................ 52
4.2.3. Bulan Mei .......................................................................................................... 53
4.2.4. Bulan Juni ......................................................................................................... 54

11

4.2.5. Bulan Juli .......................................................................................................... 56
4.2.6. Bulan Agustus ................................................................................................... 57
4.2.7. Bulan September ............................................................................................... 58
4.2.8. Bulan Oktober ................................................................................................... 59
4.3. Analisa Data ......................................................................................................... 61
4.3.1. Kategori Bulan .................................................................................................. 61
4.3.2. Penggunaan Bandwidth..................................................................................... 63
4.3.3. Waktu akses pengguna ...................................................................................... 66
4.3.4. Lokasi Pada Keseluruhan Bulan ....................................................................... 69
BAB V KESIMPULAN DAN SARAN ...................................................................... 71
5.1. Kesimpulan .......................................................................................................... 71
5.2. Saran ..................................................................................................................... 71
DAFTAR PUSTAKA ................................................................................................ 72
LAMPIRAN ................................................................................................................ 75

12

DAFTAR TABEL
Tabel 2.1. Data CDR dan CBR tahun 1994 (ESCAP Population Data, 1996) ........... 32
Tabel 2.2. Hasil Perhitungan Iterasi-1 ........................................................................ 34
Tabel 2.3. Hasil Cluster Iterasi-1 ................................................................................ 35
Tabel 2.4. Hasil Penghitungan Iterasi-2 ...................................................................... 36
Tabel 2.5. Hasil Cluster Iterasi-2 ................................................................................ 37
Tabel 2.6. Hasil Perhitungan Iterasi-3 ........................................................................ 38
Tabel 2.7. Hasil Cluster Iterasi-3 ................................................................................ 39
Tabel 2.8. Rangkuman Penelitian Terkait ................................................................... 41
Tabel 4.1. Distribusi clustering jumlah pengakses pada bulan Maret ........................ 51
Tabel 4.2. Range min-max total download dan upload bulan Maret .......................... 52
Tabel 4.3. Waktu yang di gunakan pengakses bulan Maret ........................................ 52
Tabel 4.4. Distribusi clustering jumlah penggakses pada bulan April ....................... 52
Tabel 4.5. Range min-max total download dan upload bulan April ........................... 53
Tabel 4.6. Waktu yang digunakan pengakses bulan April .......................................... 53
Tabel 4.7. Distribusi clustering jumlah pengakses pada bulan Mei ........................... 53
Tabel 4.8. Range min-max total download dan upload bulan Mei ............................. 54
Tabel 4.9. Waktu yang digunakan pengakses bulan Mei ............................................ 54
Tabel 4.10. Distribusi clustering jumlah pengakses pada bulan Juni ......................... 54
Tabel 4.11. Range min-max total download dan upload bulan Juni ........................... 55
Tabel 4.12. Waktu yang digunakan pengakses bulan Juni.......................................... 55
Tabel 4.13. Distribusi clustering jumlah pengakses pada bulan Juli .......................... 56
Tabel 4.14. Range min-max total download dan upload bulan Juli ............................ 56
Tabel 4.15. Waktu yang digunakan pengakses bulan Juli .......................................... 57
Tabel 4.16. Distribusi clustering jumlah pengakses pada bulan Agustus ................... 57
Tabel 4.17. Range min-max total download dan upload bulan Agustus .................... 58
Tabel 4.18. Waktu yang digunakan pengakses bulan Agustus ................................... 58
Tabel 4.19. Distribusi clustering jumlah pengakses pada bulan September ............... 58

13

Tabel 4.20. Range min-max total download dan upload bulan September ................ 59
Tabel 4.21. Waktu yang digunakan pengakses September ......................................... 59
Tabel 4.22. Distribusi clustering jumlah pengakses pada bulan Oktober ................... 59
Tabel 4.23. Range min-max total download dan upload bulan Oktober .................... 60
Tabel 4.24. Waktu yang digunakan pengakses bulan Oktober ................................... 60
Tabel 4.25. Hasil clustering ........................................................................................ 62
Tabel 4.26. Persentase pengakses per bulan dalam tiap cluster .................................. 62
Tabel 4.27. Waktu akses pengguna pada cluster 1...................................................... 66
Tabel 4.28. Waktu akses pengguna pada cluster 2...................................................... 67
Tabel 4.29. Waktu akses pengguna pada cluster 3...................................................... 67

14

DAFTAR GAMBAR
Gambar 1.1. Sistem Single Sign On (Abdurrahman, 2012) ........................................ 18
Gambar 1.2. Sistem Sign On biasa (Abdurrahman, 2012) .......................................... 18
Gambar 2.1. OSI Model (Wikibooks, 2015) ............................................................... 22
Gambar 2.2. Arsitektur SSO (Haryanto, 2014) ........................................................... 24
Gambar 2.3. Peran Data Mining (Gan, Ma, & Wu, 2007) .......................................... 26
Gambar 2.4. Diagram algoritma clustering (Gan, Ma, & Wu, 2007) ......................... 27
Gambar 3.1. Kerangka Pemikiran ............................................................................... 43
Gambar 3.2. Contoh blok status router ....................................................................... 44
Gambar 3.3. Contoh blok status pengguna login ........................................................ 44
Gambar 3.4. Contoh blok status pengguna logout ...................................................... 45
Gambar 3.5. Diagram alir algoritma K-means (Nainggolan, 2014) ........................... 48
Gambar 4.1. Jumlah pengakses internet harian tiap bulan .......................................... 61
Gambar 4.2. Perbandingan range total penggunaan bandwidth pada cluster 1 .......... 63
Gambar 4.3. Perbandingan range total penggunaan bandwidth pada cluster 2 .......... 64
Gambar 4.4. Perbandingan range total penggunaan bandwidth pada cluster 3 .......... 65
Gambar 4.5. Jumlah pengguna tiap lokasi per bulan .................................................. 69
Gambar 4.6. Jumlah pengakses tiap cluster per bulan ................................................ 70

15

DAFTAR LAMPIRAN
Lampiran 1. Penjelasan log SSO blok status perangkat jaringan................................ 75
Lampiran 2. Penjelasan log SSO blok status login ..................................................... 75
Lampiran 3. Penjelasan log SSO blok status logout ................................................... 77
Lampiran 4. Distribusi penggunaan bandwidth bulan Maret ...................................... 80
Lampiran 5. Distribusi penggunaan bandwidth bulan April ....................................... 80
Lampiran 6. Distribusi penggunaan bandwidth bulan Mei ......................................... 81
Lampiran 7. Distribusi penggunaan bandwidth bulan Juni ......................................... 81
Lampiran 8. Distribusi penggunaan bandwidth bulan Juli.......................................... 82
Lampiran 9. Distribusi penggunaan bandwidth bulan Agustus .................................. 82
Lampiran 10. Distribusi penggunaan bandwidth bulan September ............................ 83
Lampiran 11. Distribusi penggunaan bandwidth bulan Oktober ................................ 83
Lampiran 12. Distribusi clustering penggunaan bandwidth bulan Maret ................... 84
Lampiran 13. Distribusi clustering penggunaan bandwidth bulan April .................... 84
Lampiran 14. Distribusi clustering penggunaan bandwidth bulan Mei ...................... 85
Lampiran 15. Distribusi clustering penggunaan bandwidth bulan Juni ...................... 85
Lampiran 16. Distribusi clustering penggunaan bandwidth bulan Juli....................... 86
Lampiran 17. Distribusi clustering penggunaan bandwidth bulan Agustus ............... 86
Lampiran 18. Distribusi clustering penggunaan bandwidth bulan September ........... 87
Lampiran 19. Distribusi clustering penggunaan bandwidth bulan Oktober ............... 87
Lampiran 20. Waktu yang digunakan pengakses bulan Maret ................................... 88
Lampiran 21. Waktu yang digunakan pengakses pada bulan April ............................ 88
Lampiran 22. Waktu yang digunakan pengakses pada bulan Mei .............................. 89
Lampiran 23. Waktu yang digunakan pengakses pada bulan Juni ............................. 89
Lampiran 24. Waktu yang digunakan pengakses pada bulan Juli .............................. 90
Lampiran 25. Waktu yang digunakan pengakses pada bulan Agustus ....................... 90
Lampiran 26. Waktu yang digunakan pengakses pada bulan September ................... 91
Lampiran 27. Waktu yang digunakan pengakses pada bulan Oktober ....................... 91

16