Aplikasi Clustering Mahasiswa Berdasarka. pdf

APLIKASI CLUSTERING UNTUK PENGELOMPOKAN MAHASISWA STMIK ASIA BERDASARKAN USIA & DATA AKADEMIK MENGGUNAKAN METODE K-MEANS TUGAS AKHIR

Diajukan Untuk Memenuhi Salah Satu Syarat Kelulusan Sarjana Strata 1

Oleh Rochmah Hidayati 10201486 TEKNIK INFORMATIKA

SEKOLAH TINGGI MANAJEMEN INFORMATIKA DAN KOMPUTER ASIA

MALANG

2014

ABSTRAKSI

Rochmah Hidayati. 10201486 APLIKASI CLUSTERING UNTUK PENGELOMPOKAN MAHASISWA STMIK ASIA

BERDASARKAN USIA & DATA AKADEMIK MENGGUNAKAN METODE K-MEANS Teknik Informatika, Sekolah Tinggi Manajemen Informatika dan Komputer ASIA Malang,

2014 Kata kunci: Clustering, usia, data akademik, K-Means (xv + 112 + lampiran)

Masalah ketidakseimbangan antara jumlah mahasiswa baru dan mahasiswa yang menyelesaikan studi tepat waktu merupakan permasalahan yang penting untuk diperhatikan. Karena salah satu factor yang menentukan kualitas perguruan tinggi adalah presentase kemampuan mahasiswa untuk menyelesaikan studi tepat waktu. Ketidakseimbangan tersebut bisa jadi karena mahasiswa menempuh studi tidak tepat waktu, memiliki status non-aktif atau bahkan dropout.

Pada penelitian ini penulis mencoba membangun sistem untuk mengelompokkan mahasiswa menjadi dua cluster yaitu cluster pertama (rawan dropout) dan cluster kedua (tidak dropout), dengan mengambil dataset mahasiswa STMIK ASIA jurusan teknik informatika angkatan 2006-2008 pada tahun ajaran 2012/2013. Total record dataset dari angkatan 2006-2008 adalah 576 record. Data tersebut dibagi menjadi 2 berdasarkan angkatan , yaitu untuk angkatan 2006-2007 adalah 315 record sebagai data training dan angkatan 2008 adalah 261 record sebagai data testing. Dalam penelitian ini menggunakan teknik clustering dengan metode K-Means untuk pengelompokan data. Tahap pertama pengujian terhadap data training dengan mengambil centroid awal secara random, pengujian ini bertujuan untuk mencari centroid awal yang tepat untuk disimpan dan digunakan pada saat pengujian data testing. Pemilihan pusat cluster yang tepat pada pengujian data training akan memberikan hasil dengan tingkat kebenaran pengelompokan yang lebih tinggi saat pengujian data testing.

Hasil pengujian terhadap data testing dengan 261 record data dan setelah tahap preprocessing menjadi 174 record, menggunakan centroid awal C1= 42, 8, 0.59 dan C2=

24, 4, 2.56 menghasilkan 10 iterasi dengan hasil akhir cluster 1 (rawan dropout) sebanyak

40 anggota atau sebesar 23% dan Cluster 2 (tidak dropout) sebanyak 134 anggota atau sebesar 77%. Dengan tingkat kebenaran/ketepatan pengelompokan berkisar antara 70% sampai dengan 73.13%.

Daftar Pustaka (1994-2013)

KATA PENGANTAR

Dengan memanjatkan rasa syukur kehadirat Tuhan YME atas segala rahmad dan hidayah-Nya yang diberikan kepada penulis sehingga laporan Tugas Akhir dengan judul “APLIKASI CLUSTERING UNTUK

PENGELOMPOKAN MAHASISWA STMIK ASIA BERDASARKAN USIA

& DATA AKADEMIK MENGGUNAKAN METODE K-MEANS ” dapat terselesaikan dengan baik.

Laporan Tugas Akhir ini merupakan salah satu persyaratan kelulusan Program Strata Satu di STMIK ASIA Malang yang harus dipenuhi oleh setiap mahasiswa.

Dalam penyusunan ini tidak terlepas dari bantuan, dorongan dan do’a restu dari berbagai pihak, untuk itu penulis menyampaikan rasa terima kasih dengan tulus kepada:

1. Bapak Ir. Teguh Widodo, MM., selaku Ketua STMIK Asia Malang

2. Bapak Sunu Jatmika, M.Kom., selaku Pembantu Ketua I STMIK Asia

3. Ibu Rina Dewi Indah Sari, M.Kom., selaku Ketua Jurusan Teknik Informatika

4. Bapak Budi Santoso, B.Eng., selaku Dosen Wali

5. Bapak Tria Aprilianto, S.Kom., selaku Dosen Pembimbing. Terimakasih atas bimbingan, saran, waktu dan kesabaran yang diberikan kepada penulis dalam proses bimbingan.

6. Bapak Samsul Arifin, S.ST., selaku Dosen Pembanding.

Terimakasih atas saran, bimbingan dan pengarahan yang telah diberikan kepada penulis dalam proses penyelesaian tugas akhir ini.

7. Bapak Broto Poernomo T.P.,S.Kom., selaku Dosen Penguji. Terimakasih atas pengarahan, saran dan bimbingan yang telah diberikan kepada penulis, sehingga tugas akhir ini dapat terselesaikan dengan baik.

8. BAAK yang telah bersedia memberikan data sampel untuk penelitian.

9. Kedua orang tua tercinta, yang telah memberikan dorongan semangat serta bantuan moral, doa dan materi kepada penulis dalam penyelesaian tugas akhir ini.

10. Teman - teman yang selalu memberikan dukungan kepada penulis terutama pihak yang telah banyak membantu dan memotivasi penulis, dan seluruh pihak yang tidak dapat penulis sebutkan satu persatu.

Penulis menyadari sebagai manusia yang penuh dengan keterbatasan, mengakui bahwa masih banyak terdapat kesalahan dan kekurangan pada laporan tugas akhir ini. Oleh karena itu diharapkan kritik dan saran yang bersifat membangun. Akhir kata, semoga laporan ini dapat memberikan manfaat.

Malang, 28 Maret 2014

( Rochmah Hidayati )

BAB I PENDAHULUAN

1.1 Latar Belakang

Perguruan Tinggi ASIA Malang merupakan salah satu perguruan tinggi yang cukup menarik banyak mahasiswa. Tetapi ada beberapa hal yang tidak seimbang antara masuk dan keluarnya mahasiswa yang telah menyelesaikan studinya. Mahasiswa yang masuk dalam jumlah besar, tetapi mahasiswa yang lulus tepat waktu sesuai dengan ketentuan jauh sangat kecil dibandingkan masuknya. Artinya terdapat mahasiswa yang tidak diketahui statusnya. Ketidakjelasan status tersebut bisa jadi karena mahasiswa menempuh studi tidak tepat waktu, memiliki status non-aktif atau bahkan drop out.

Beberapa penyebab kegagalan studi mahasiswa diantaranya adalah rendahnya kemampuan akademik, faktor pembiayaan, domisili saat menempuh studi dan faktor lainnya. Tingginya presentasi mahasiswa yang memiliki status non aktif juga menyebabkan tingginya mahasiswa lulus tidak tepat waktu. Hal tersebut menjadi sangat penting bagi manajemen perguruan tinggi mengingat presentase mahasiswa lulus tepat waktu adalah salah satu elemen penilaian akreditasi yang ditetapkan oleh Badan Akreditasi.

Oleh karena itu untuk meningkatkan kualitas pada perguruan tinggi ASIA Malang, maka haruslah ada filter pada mahasiswa yang sedang menempuh perkuliahan. Database perguruan tinggi menyimpan

data akademik, administrasi dan biodata mahasiswa. Data tersebut apabila digali dengan tepat maka diketahui pola atau pengetahuan untuk mengambil keputusan. Serangkaian proses mendapatkan pengetahuan atau pola dari kumpulan data disebut dengan data mining. Data mining memecahkan masalah dengan menganalisis data yang telah ada dalam database. Clustering merupakan salah satu metode data mining yang bersifat tanpa arahan (unsupervised). KMeans merupakan salah satu metode clustering non hirarki yang berusaha mempartisi data kedalam bentuk satu/lebih cluster/kelompok. Metode ini mempartisi data ke dalam cluster sehingga karakteristik yang sama dikelompokkan kedalam satu cluster yang sama.

Berdasaran latar belakang tersebut dibuatlah aplikasi untuk mendapatkan informasi presentase pengelompokkan mahasiswa STMIK ASIA dengan judul “Aplikasi Clustering Untuk Pengelompokan

Mahasiswa STMIK ASIA berdasarkan Usia & Data Akademik

Menggunakan Metode K-Means ”.

1.2 Rumusan Masalah

Bagaimana membangun aplikasi clustering untuk pengelompokan mahasiswa STMIK ASIA berdasarkan usia & data akademik menggunakan metode K-Means.

1.3 Batasan Masalah

1. Data yang digunakan adalah biodata dan data akademik mahasiswa STMIK ASIA angkatan 2006 sampai dengan angkatan 2008 jurusan teknik informatika pada tahun ajaran 2012/2013

2. Atribut yang digunakan untuk mengelompokan data adalah usia mahasiswa, lama masa studi minimal (tahun), dan IPK terakhir

3. Pembagian cluster terdiri dari 2 kelompok, yaitu cluster rawan dropout dan cluster tidak dropout

4. Teknik yang digunakan adalah clustering menggunakan metode K- Means

5. Sistem hanya mencakup data mining dengan analisis pengelompokan mahasiswa rawan dropout dan tidak dropout

6. Hasil clustering berupa presentase jumlah dari cluster rawan dropout dan cluster tidak dropout, anggota dari cluster rawan dropout dan cluster tidak dropout dan presentase kebenaran pengelompokan

7. Bahasa pemrograman yang digunakan adalah css dan php

8. Database yang digunakan adalah MySQL

1.4 Tujuan dan Manfaat

1.4.1 Tujuan

Adapun tujuan utama dari penelitian ini adalah :

1. Bagi penulis sebagai salah satu syarat kelulusan program studi

strata-1 (S1) jurusan teknik informatika STMIK ASIA Malang.

2. Bagi instansi sebagai program alternatif untuk pengelompokkan mahasiswa yang mengelompokkan mahasiswa STMIK ASIA menjadi kelompok rawan dropout dan kelompok tidak dropout berdasarkan usia dan data akademik dengan teknik clustering menggunakan metode K-Means.

1.4.2 Manfaat

Adapun manfaat penelitian ini adalah:

1. Bagi penulis Dapat Menambah pengetahuan dan merupakan salah satu kesempatan untuk menerapkan ilmu pengetahuan yang didapatkan dalam perkuliahan

2. Bagi peneliti selanjutnya Dapat memberikan tambahan referensi terutama penelitian yang berkaitan dengan analisa data mining menggunakan metode lain yang dapat mempermudah penyelesaian masalah dengan tepat.

3. Bagi instansi Agar dapat memberikan gambaran sekiranya perancangan program seperti apa yang tepat untuk pengelompokkan mahasiswa.

1.5 Metodologi Penelitian

Untuk mendukung penyelesaian laporan tugas akhir ini digunakan beberapa metodologi, yaitu: Untuk mendukung penyelesaian laporan tugas akhir ini digunakan beberapa metodologi, yaitu:

b. Sampling, yaitu teknik pengumpulan data yang dilakukan dengan cara melakukan pengambilan data arsip/formulir/catatan yang berkaitan dengan obyek penelitian. Dalam penelitian ini data sampling yang diambil adalah biodata dan data akademik mahasiswa STMIK ASIA jurusan teknik informatika angkatan 2006 –2008 tahun ajaran 2012/2013.

1.6 Sistematika Penulisan

Secara garis besar laporan tugas akhir ini terbagi menjadi beberapa bab yang tersusun sebagai berikut:

BAB I PENDAHULUAN

Bab ini menjelaskan latar belakang masalah, rumusan masalah, batasan masalah, tujuan & manfaat, metodologi penelitian dan sistematika penulisan tugas akhir aplikasi clustering untuk pengelompokan mahasiswa STMIK ASIA berdasarkan usia & data akademik menggunakan metode K- Means.

BAB II LANDASAN TEORI

Bab ini menguraikan tentang teori-teori dari sumber pustaka dan referensi yang bersangkutan dengan penelitian tugas akhir diantaranya adalah konsep dan proses data mining, teknik clustering, metode K- means, flowchart, konsep dasar sistem, konsep dasar informasi, konsep dasar sistem informasi, DFD, konsep dasar database management system , PHP, dan MYSQL.

BAB III ANALISA DAN PERANCANGAN

Bab ini menjelaskan tentang analisa dan perancangan dalam penelitian atau studi kasus pada data mahasiswa STMIK ASIA angkatan 2006 – angkatan 2008 dan tahap penyelesaian masalah menggunakan teknik clustering dengan menerapkan metode K-Means. Pembahasan terdiri dari deskripsi sistem, arsitektur sistem, analisa kebutuhan input,proses dan output, desain sistem, desain database,tahap-tahap mengolah data, desain menu dan desain user interface.

BAB IV IMPLEMENTASI DAN PENGUJIAN

Bab ini menjelaskan implementasi serta pengujian dari aplikasi clustering untuk pengelompokan mahasiswa STMIK ASIA berdasarkan usia & data akademik menggunakan metode K-Means.

BAB V PENUTUP

Pada bab ini berisi mengenai kesimpulan dari analisa dan hasil implementasi dari bab sebelumnya serta saran-saran untuk pengembangan lebih lanjut.

BAB II LANDASAN TEORI

2.1 Knowledge Discovery in Database (KDD)

KDD terdiri dari serangkaian langkah perubahan, termasuk data preprocessing dan juga post processing. Data preprocessing merupakan langkah untuk mengubah data mentah menjadi format yang sesuai untuk tahap analisis berikutnya. Selain itu data preprocessing juga digunakan untuk membantu dalam pengenalan atribut dan data segmen yang relevan dengan task data mining. Data preprocessing kemungkinan akan membutuhkan waktu yang sangat lama, hal ini dikarenakan data yang mentah kemungkinan disimpan dengan format dan database yang berbeda. Post processing meliputi semua operasi yang harus dilakukan agar hasil dari data mining dapat diakses dan lebih mudah untuk diinterpretasikan oleh para analis. Teknik visualisasi juga dapat digunakan untuk mempermudah para analis untuk menggali dan memahami kegunaan dari data mining. Kumpulan proses dalam KDD meliputi :

1. Pembersihan data (data cleaning)

2. Integrasi data (data integration)

3. Pemilihan data (data selection)

4. Transformasi data (data transformation)

5. Penambangan data (data mining)

6. Evaluasi pola (pattern evaluation)

7. Presentasi pengetahuan (knowledge presentation).

Berdasarkan definisi ini terlihat bahwa data mining hanya merupakan salah satu proses dari keseluruhan proses yang ada pada KDD, tetapi merupakan proses yang sangat penting dalam usaha menemukan pola-pola yang berguna dari sejumlah data yang besar (data tersebut bisa disimpan dalam basis data, data warehouse, atau media penyimpanan informasi lainnya).

Menurut Jiawei Han Secara garis besar proses KDD dapat direpresentasikan dengan gambar sebagai berikut :

Gambar 2.1 Tahapan proses KDD

2.1.1 Data Selection

Pemilihan (seleksi) data dari sekumpulan data operasional perlu dilakukan sebelum tahap penggalian informasi dalam KDD dimulai. Data hasil seleksi yang akan digunakan untuk proses data mining, disimpan dalam suatu berkas, terpisah dari basis data operasional.

2.1.2 Preprocessing

Sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses awal pada data yang menjadi fokus KDD untuk meyakinkan Sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses awal pada data yang menjadi fokus KDD untuk meyakinkan

A. Alasan pentingnya preprocessing

1. Jika data tidak berkualitas, maka hasil Mining juga tidak berkualitas

a. Kualitas keputusan harus didasarkan kepada kualitas data (misal, duplikasi data atau data hilang bisa menyebabkan ketidak- benaran atau bahkan statistik yang menyesatkan.

b. Data warehouse memerlukan kualitas integrasi data yang konsisten

2. Ekstraksi data, pembersihan dan transformasi merupakan kerja utama dari pembuatan suatu data warehouse

3. Data preprocessing membantu didalam memperbaiki presisi dan kinerja data Mining dan mencegah kesalahan didalam data Mining

B. Data yang harus dikoreksi

1. Data Incomplete Berisi nilai yang salah yang disebabkan karena :

a. Tidak tercatat (not recorded)

b. Tidak tersedia (not available)

c. Sengaja dihapus karena dianggap salah atau tidak penting

2. Data Noisy

Berisi data salah yang tidak wajar (Anomalies/outliers) karena :

a. Instrumen pengumpulan data yang digunakan mungkin salah

b. Kesalahan manusia atau komputer yang terjadi pada saat entri data.

c. Kesalahan dalam transmisi data.

3. Data Inconsistent Berisi data yang tidak konsisten dan berbeda dari sewajarnya disebabkan oleh : Perubahan kode di sistem yang menjadikan data tidak konsisten

C. Alasan data kotor dan harus dikoreksi

Ketidak-lengkapan data dari :

a. Nilai data tidak tersedia saat dikumpulkan

b. Perbedaan pertimbangan waktu antara saat data dikumpulkan dan saat data dianalisa

c. Masalah manusia, hardware dan software Noisy data datang dari proses data :

a. Pengumpulan

b. Pemasukan (entry)

c. Transmisi Ketidak-konsistenan data datang dari :

a. Sumber data yang berbeda

b. Pelanggaran kebergantungan fungsional

D. Tugas utama preprocessing

a. Pembersihan data (data yang kotor)

b. Integrasi data (data heterogen)

c. Transformasi data (data detail)

d. Reduksi data (jumlah data yang besar) d. Reduksi data (jumlah data yang besar)

E. Cara Koreksi Data Incomplete

1. Elimination : membuang semua data yang mempunyai satu atau lebih atribut hilang.

Risiko dan tantangan :

a. Tidak efektif ketika nilai-nilai yang hilang tidak teratur.

b. Kerugian dalam kehilangan informasi.

2. Inspection : memeriksa setiap nilai – nilai yang hilang yang dilakukan ahli IT pada sistem aplikasi

Risiko dan tantangan :

a. Subyektifitas dan dominasi kewenangan

b. Membutuhkan waktu untuk data set yang besar

c. Tindakan korektif yang paling akurat bila menguasai data

3. Identification : tidak membuang data, tetapi menggunakan nilai- nilai konvensional yang wajar

Risiko dan tantangan :

a) Nilai atribut konvensional berbeda dari yang diasumsikan

4. Substitution : mengganti data yang hilang dengan data yang diprediksi

Risiko dan tantangan :

a) Data estimasi memakan waktu dan cukup rumit

F. Data Integration Menggabungkan data dari berbagai sumber penyimpanan data.

a. Penggabungan Schema perlu adanya standarisasi Problem : Penamaan atribut ataupun field yang berbeda

G. Data Transformation

Data ditransformasikan menjadi bentuk yang sesuai untuk proses Data Mining Metode :

a. Smoothing : binning, clustering, dan regresi

b. Agregasi : summary data pada konstruksi kubus

c. Generalisasi : nilai data mentah digeneralisasi pada kelompok data yang general seperti Usia : muda, setengah baya dan senior

d. Normalisasi : data atribut diperkecil sehingga jatuh dalam kisaran tertentu. Seperti 0.0 – 1.0

2.1.3 Data mining

Data mining adalah proses mencari pola atau informasi menarik dalam data terpilih dengan menggunakan teknik atau metode tertentu. Teknik, metode, atau algoritma dalam data mining sangat bervariasi. Pemilihan metode dan algoritma yang tepat sangat bergantung pada tujuan dan proses KDD secara keseluruhan.

2.1.4 Interpretation/Evalution

Pola informasi yang dihasilkan dari proses data mining perlu ditampilkan dalam bentuk yang mudah dimengerti oleh pihak yang berkepentingan. Tahap ini merupakan bagian dari proses KDD yang disebut interpretation. Tahap ini mencakup pemeriksaan apakah pola atau Pola informasi yang dihasilkan dari proses data mining perlu ditampilkan dalam bentuk yang mudah dimengerti oleh pihak yang berkepentingan. Tahap ini merupakan bagian dari proses KDD yang disebut interpretation. Tahap ini mencakup pemeriksaan apakah pola atau

2.2 Data Mining

2.2.1 Pengertian Data Mining

Tan (2006) mendefinisikan data Mining sebagai proses untuk mendapatkan informasi yang berguna dari gudang basis data yang besar. Data Mining juga dapat diartikan sebagai pengekstrakan informasi baru yang diambil dari bongkahan data besar yang membantu dalam pengambilan keputusan. Istilah data Mining kadang disebut juga knowledge discovery.

Salah satu teknik yang dibuat dalam data Mining adalah bagaimana menelusuri data yang ada untuk membangun sebuah model, kemudian menggunakan model tersebut agar dapat mengenali pola data yang lain yang tidak berada dalam basis data yang tersimpan. Kebutuhan untuk prediksi juga dapat memanfaatkan teknik ini. Dalam data Mining, pengelompokan data juga bisa dilakukan. Tujuannya adalah agar kita dapat mengetahui pola universal data-data yang ada. Anomali data transaksi juga perlu dideteksi untuk dapat mengetahui tindak lanjut berikutnya yang dapat diambil. Semua hal tersebut bertujuan mendukung kegiatan operasional perusahaan sehingga tujuan akhir perusahaan diharapkan dapat tercapai. Gambar 2.2 mengilustrasikan posisi antara data Mining dan data warehouse yang menunjukkan perbedaan antara keduanya.

BUSINESS INTELIGENCE

PERFORMANCE

ENTERPRISE

DATA MINING

MANAGEMENT

REPORTING

DATA WAREHOUSE

EXTRACT, TRANSFORM, LOAD

TRANSACTIONAL DATABASE

Gambar 2.2 Posisi data Mining dalam bisnis cerdas (business intelligent)

Dari gambar tersebut, dapat dilihat bahwa data Mining adalah bidang yang sepenuhnya menggunakan apa yang dihasilkan oleh data warehouse, bersama dengan bidang yang menangani masalah pelaporan dan manajemen data. Sementara, data warehouse sendiri bertugas untuk menarik/meng-query data dari basis data mentah untuk memberikan hasil data yang nantinya digunakan oleh bidang yang menangani manajemen, pelaporan, dan data Mining. Dengan data Mining inilah, penggalian informasi baru dapat dilakukan dengan bekal data mentah yang diberikan oleh data warehouse. Hasil yang diberikan oleh ketiga bidang tersebut berguna untuk mendukung aktivitas bisnis cerdas (business intelligence).

(Prasetyo, 2012:2)

2.2.2 Pekerjaan Dalam Data Mining

Pekerjaan yang berkaitan dengan data mining dapat dibagi Pekerjaan yang berkaitan dengan data mining dapat dibagi

1. Model prediksi Model prediksi berkaitan dengan pembuatan sebuah model yang dapat melakukan pemetaan dari setiap himpunan variabel ke setiap targetnya, kemudian menggunakan model tersebut untuk memberikan nilai target pada himpunan baru yang didapat. Ada dua jenis model prediksi, yaitu klasifikasi dan regresi. Klasifikasi digunakan untuk variabel target diskret, sedangkan regresi untuk variabel target kontinu.

2. Analisis kelompok Analisis kelompok melakukan pengelompokan data-data ke dalam sejumlah kelompok (cluster) berdasarkan kesamaan karakteristik masing-masing data pada kelompok-kelompok yang ada. Data-data yang masuk dalam batas kesamaan dengan kelompoknya akan bergabung dalam kelompok tersebut, dan akan terpisah dalam kelompok yang berbeda jika keluar dari batas kesamaan dengan kelompok tersebut.

3. Analisis asosiasi Analisis asosiasi (association analysis) digunakan untuk menemukan pola yang menggambarkan kekuatan hubungan fitur dalam data. Pola yang ditemukan biasanya merepresentasikan bentuk aturan implikasi atau subset fitur. Tujuannya adalah untuk menemukan pola yang 3. Analisis asosiasi Analisis asosiasi (association analysis) digunakan untuk menemukan pola yang menggambarkan kekuatan hubungan fitur dalam data. Pola yang ditemukan biasanya merepresentasikan bentuk aturan implikasi atau subset fitur. Tujuannya adalah untuk menemukan pola yang

4. Deteksi anomali Pekerjaan deteksi anomali (anomaly detection) berkaitan dengan pengamatan sebuah data dari sejumlah data yang secara signifikan mempunyai karakteristik yang berbeda dari sisa data yang lain. Data- data yang karakteristiknya menyimpang (berbeda) dari data yang lain disebut outlier. Algoritma deteksi anomali yang baik harus mempunyai laju deteksi yang tinggi dan laju eror yang rendah.

(Prasetyo, 2012:5)

2.3 Clustering

Salah satu metode yang diterapkan dalam KDD adalah clustering. Clustering adalah membagi data ke dalam grup-grup yang mempunyai obyek yang karakteristiknya sama. Garcia-Molina et al menyatakan clustering adalah mengelompokkan item data ke dalam sejumlah kecil grup sedemikian sehingga masing-masing grup mempunyai sesuatu persamaan yang esensial.

Clustering memegang peranan penting dalam aplikasi data Mining, misalnya eksplorasi data ilmu pengetahuan, pengaksesan informasi dan text mining, aplikasi basis data spasial, dan analisis web. Clustering diterapkan dalam mesin pencari di Internet. Web mesin pencari akan mencari ratusan dokumen yang cocok dengan kata kunci yang dimasukkan. Dokumen-dokumen tersebut dikelompokkan dalam cluster- cluster sesuai dengan kata-kata yang digunakan.

Tan, dkk membagi clustering dalam dua kelompok, yaitu hierarchical and partitional clustering. Partitional Clustering disebutkan sebagai pembagian obyek-obyek data ke dalam kelompok yang tidak saling overlap sehingga setiap data berada tepat di satu cluster. Hierarchical clustering adalah sekelompok cluster yang bersarang seperti sebuah pohon berjenjang (hirarki).

William membagi algoritma clustering ke dalam kelompok besar seperti berikut:

1. Partitioning algorithms: algoritma dalam kelompok ini membentuk bermacam partisi dan kemudian mengevaluasinya dengan berdasarkan beberapa criteria.

2. Hierarchy algorithms: pembentukan dekomposisi hirarki dari sekumpulan data menggunakan beberapa criteria.

3. Density-based: pembentukan cluster berdasarkan pada koneksi dan fungsi densitas.

4. Grid-based: pembentukan cluster berdasarkan pada struktur multiple- level granularity

5. Model-based: sebuah model dianggap sebagai hipotesa untuk masing- masing cluster dan model yang baik dipilih diantara model hipotesa tersebut.

(Andayani, 2007)

2.4 K-Means

Algoritma K-Means adalah algoritma clustering yang paling popular dan banyak digunakan dalam dunia industry. Algoritma ini disusun atas dasar ide yang sederhana. Ada awalnya ditentukan berapa cluster yang akan dibentuk. Sebarang obyek atau elemen pertama dalam cluster dapat dipilih untuk dijadikan sebagai titik tengah (centroid point) cluster. Algoritma K-Means selanjutnya akan melakukan pengulangan langkah- langkah berikut sampai terjadi kestabilan (tidak ada obyekyang dapat dipindahkan):

1. Menentukan koordinat titik tengah setiap cluster

2. Menentukan jarak setiap obyek terhadap koordinat titik tengah

3. Mengelompokkan obyek-obyek tersebut berdasarkan pada jarak minimumnya.

(Andayani, 2007)

Secara sederhana algoritma K-Means dapat digambarkan dalam Flowchart seperti berikut : Start

Tentukan jumlah cluster k

Tentukan asumsi titik ya

pusat cluster (centroids)

Hitung jarak obyek ke

obyek yang

End

berpindah ?

Kelompokkan obyek berdasarkan jarak minimum

2.4.1 Perkembangan Penerapan K-Means

Beberapa alternatif penerapan K-Means dengan beberapa pengembangan teori-teori penghitungan terkait telah diusulkan. Hal ini termasuk pemilihan :

1. Distance space untuk menghitung jarak di antara suatu data dan centroid

2. Metode pengalokasian data kembali ke dalam setiap cluster

3. Objective function yang digunakan

A. Distance Space Untuk Menghitung Jarak Antara Data dan Centroid

Beberapa distance space telah diimplementasikan dalam menghitung jarak (distance) antara data dan centroid termasuk di antaranya L1 (Manhattan/City Block) distance space, L2 (Euclidean)

distance space, dan Lp (Minkowski) distance space, Jarak antara dua titik x1 dan x2 pada Manhattan/City Block distance space dihitung dengan menggunakan rumus sebagai berikut :

Dimana : p : dimensi data

| . | : Nilai absolute

sedangkan untuk L 2 (Euclidean) distance space, jarak antara dua titik sedangkan untuk L 2 (Euclidean) distance space, jarak antara dua titik

Dimana : p

: Dimensi data

Lp (Minkowski) distance space yang merupakan generalisasi dari beberapa distance space yang ada seperti L1 (Manhattan/City Block) dan L2 (Euclidean), juga telah diimplementasikan. Tetapi secara umum distance space yang sering digunakan adalah

Manhattan dan Euclidean. Euclidean sering digunakan karena penghitungan jarak dalam distance space ini merupakan jarak terpendek yang bisa didapatkan antara dua titik yang diperhitungkan, sedangkan Manhattan sering digunakan karena kemampuannya dalam mendeteksi keadaan khusus seperti keberadaaan outliers dengan lebih baik.

B. Metode Pengalokasian Ulang Data ke Dalam Masing-Masing Cluster

Secara mendasar, ada dua cara pengalokasian data kembali ke dalam masing-masing cluster pada saat proses iterasi clustering. Kedua cara tersebut adalah pengalokasian dengan cara tegas (hard), dimana data item secara tegas dinyatakan sebagai anggota Secara mendasar, ada dua cara pengalokasian data kembali ke dalam masing-masing cluster pada saat proses iterasi clustering. Kedua cara tersebut adalah pengalokasian dengan cara tegas (hard), dimana data item secara tegas dinyatakan sebagai anggota

a. Hard K-Means Pengalokasian kembali data ke dalam masing-masing cluster dalam metode Hard K-Means didasarkan pada perbandingan jarak antara data dengan centroid setiap cluster yang ada. Data dialokasikan ulang secara tegas ke cluster yang mempunyai

data tersebut. Pengalokasian ini dapat dirumuskan sebagai berikut :

(3) Dimana :

aik : keanggotaan data ke-k cluster ke-i vi

: nilai centroid cluster ke-i

b. Fuzzy K-Means Metode Fuzzy K-Means (atau lebih sering disebut sebagai

Fuzzy C-Means) mengalokasikan kembali data ke dalam masing- masing cluster dengan memanfaatkan teori Fuzzy. Teori ini mengeneralisasikan metode pengalokasian yang bersifat tegas

(hard) seperti yang digunakan pada metode Hard K-Means. Dalam metode Fuzzy K-Means dipergunakan variabel membership function, uik , yang merujuk pada seberapa besar kemungkinan suatu data bisa menjadi anggota ke dalam

suatu cluster. Pada Fuzzy K-Means yang diusulkan oleh Bezdek, diperkenalkan juga suatu variabel m yang merupakan weighting exponent dari membership function. Variabel ini dapat mengubah besaran pengaruh dari membership function, uik, dalam proses clustering menggunakan metode Fuzzy K-Means. m mempunyai wilayah nilai m>1. Sampai sekarang ini tidak ada ketentuan yang jelas berapa besar nilai m yang optimal dalam melakukan proses optimasi suatu permasalahan clustering. Nilai m yang umumnya digunakan adalah 2.

Membership function untuk suatu data ke suatu cluster tertentu dihitung menggunakan rumus sebagai berikut :

Dimana : Uik

: Membership function data ke-k ke cluster ke-i Vi

: Nilai centroid cluster ke-i

: Weighting Exponent

Membership function, uik , mempunyai wilayah nilai 0≤ uik ≤1. Data item yang mempunyai tingkat kemungkinan yang lebih Membership function, uik , mempunyai wilayah nilai 0≤ uik ≤1. Data item yang mempunyai tingkat kemungkinan yang lebih

C. Objective Function Yang Digunakan

Objective function yang digunakan khususnya untuk Hard K- Means dan Fuzzy K-Means ditentukan berdasarkan pada pendekatan yang digunakan dalam poin 2.4.1. dan poin 2.4.2. Untuk metode Hard K-Means, objective function yang digunakan adalah sebagai berikut :

Dimana : N : jumlah data

C : jumlah cluster aik : keanggotaan data ke-k ke cluster ke-i vi : nilai centroid cluster ke-i

aik mempunyai nilai 0 atau 1. Apabila suatu data merupakan anggota suatu kelompok maka nilai aik = 1 dan sebaliknya. Untuk

metode fuzzy K-Means, objective function yang digunakan adalah sebagai berikut :

: jumlah data

C : jumlah cluster M

: weighting exponent

Uik : membership function data ke-k ke cluster ke-i Vi : nilai centroid cluster ke-i Di sini Uik bisa mengambil nilai mulai dari 0 sampai 1.

(Agusta, 2007)

2.4.2 Permasalahan yang Terkait Dengan K-Means

Beberapa permasalahan yang sering muncul pada saat menggunakan metode K-Means untuk melakukan pengelompokan data adalah :

1. Ditemukannya beberapa model clustering yang berbeda

2. Pemilihan jumlah cluster yang paling tepat

3. Kegagalan untuk converge

4. Pendeteksian outliers

5. Bentuk masing-masing cluster

6. Masalah overlapping Keenam permasalahan ini adalah beberapa hal yang perlu diperhatikan pada saat menggunakan K-Means dalam mengelompokkan data. Permasalahan 1 umumnya disebabkan oleh perbedaan proses inisialisasi anggota masing-masing cluster. Proses initialisasi yang sering digunakan adalah proses inisialisasi secara random. Dalam suatu studi perbandingan, proses

inisialisasi

secara random mempunyai secara random mempunyai

Permasalahan 2 merupakan masalah laten dalam metode K- Means. Beberapa pendekatan telah digunakan dalam menentukan jumlah cluster yang paling tepat untuk suatu dataset yang dianalisa termasuk di antaranya Partition Entropy (PE) dan GAP Statistics. Satu hal yang patut diperhatikan mengenai metode-metode ini adalah pendekatan yang digunakan dalam mengembangkan metode-metode tersebut tidak sama dengan pendekatan yang digunakan oleh K-Means dalam mempartisi data items ke masing-masing cluster.

Permasalahan kegagalan untuk converge, secara teori memungkinkan untuk terjadi dalam kedua metode K-Means yang telah dijelaskan. Kemungkinan ini akan semakin besar terjadi untuk metode Hard K-Means, karena setiap data di dalam dataset dialokasikan secara tegas (hard) untuk menjadi bagian dari suatu cluster tertentu. Perpindahan suatu data ke suatu cluster tertentu dapat mengubah karakteristik model clustering yang dapat menyebabkan data yang telah dipindahkan tersebut lebih sesuai untuk berada di cluster semula sebelum data tersebut dipindahkan. Demikian juga dengan keadaan sebaliknya. Kejadian seperti ini tentu akan mengakibatkan pemodelan tidak akan berhenti dan kegagalan untuk converge akan terjadi. Untuk Fuzzy K-Means, walaupun ada, kemungkinan permasalahan ini untuk terjadi sangatlah kecil, karena Permasalahan kegagalan untuk converge, secara teori memungkinkan untuk terjadi dalam kedua metode K-Means yang telah dijelaskan. Kemungkinan ini akan semakin besar terjadi untuk metode Hard K-Means, karena setiap data di dalam dataset dialokasikan secara tegas (hard) untuk menjadi bagian dari suatu cluster tertentu. Perpindahan suatu data ke suatu cluster tertentu dapat mengubah karakteristik model clustering yang dapat menyebabkan data yang telah dipindahkan tersebut lebih sesuai untuk berada di cluster semula sebelum data tersebut dipindahkan. Demikian juga dengan keadaan sebaliknya. Kejadian seperti ini tentu akan mengakibatkan pemodelan tidak akan berhenti dan kegagalan untuk converge akan terjadi. Untuk Fuzzy K-Means, walaupun ada, kemungkinan permasalahan ini untuk terjadi sangatlah kecil, karena

Permasalahan keempat merupakan permasalahan umum yang terjadi hampir di setiap metode yang melakukan pemodelan terhadap data. Khusus untuk metode K-Means hal ini memang menjadi permasalahan yang cukup menentukan. Beberapa hal yang perlu diperhatikan dalam melakukan pendeteksian outliers dalam proses pengelompokan data termasuk bagaimana menentukan apakah suatu data item merupakan outliers dari suatu cluster tertentu dan apakah data dalam jumlah kecil yang membentuk suatu cluster tersendiri dapat dianggap sebagai outliers. Proses ini memerlukan suatu pendekatan khusus yang berbeda dengan proses pendeteksian outliers di dalam suatu dataset yang hanya terdiri dari satu populasi yang homogen.

Permasalahan kelima adalah menyangkut bentuk cluster yang ditemukan. Tidak seperti metode data clustering lainnya termasuk Mixture Modelling, K-Means umumnya tidak mengindahkan bentuk dari masing- masing cluster yang mendasari model yang terbentuk, walaupun secara natural masing-masing cluster umumnya berbentuk bundar. Untuk dataset yang diperkirakan mempunyai bentuk yang tidak biasa, beberapa pendekatan perlu untuk diterapkan.

Masalah overlapping sebagai permasalahan terakhir sering sekali diabaikan karena umumnya masalah ini sulit terdeteksi. Hal ini terjadi untuk metode Hard K-Means dan Fuzzy K-Means, karena Masalah overlapping sebagai permasalahan terakhir sering sekali diabaikan karena umumnya masalah ini sulit terdeteksi. Hal ini terjadi untuk metode Hard K-Means dan Fuzzy K-Means, karena

(Agusta, 2007)

2.4.3 K-Means sebagai Metode Semi-Supervised Classification

K-Means merupakan metode data clustering yang digolongkan sebagai metode pengklasifikasian yang bersifat unsupervised (tanpa arahan). Pengkategorian metode-metode pengklasifikasian data antara supervised dan unsupervised classification didasarkan pada adanya dataset yang data itemnya sudah sejak awal mempunyai label kelas dan dataset yang data itemnya tidak mempunyai label kelas. Untuk data yang sudah mempunyai label kelas, metode pengklasifikasian yang digunakan merupakan metode supervised classification dan untuk data yang belum mempunyai label kelas, metode pengklasifikasian yang digunakan adalah metode unsupervised classification.

Selain masalah optimasi pengelompokan data ke masing-masing cluster, data clustering juga diasosiasikan dengan permasalahan penentuan jumlah cluster yang paling tepat untuk data yang dianalisa. Untuk kedua jenis K-Means, baik Hard K-Means dan Fuzzy K-Means, yang telah dijelaskan di atas, penentuan jumlah cluster untuk dataset yang dianalisa umumnya dilakukan secara supervised atau ditentukan dari awal oleh pengguna, walaupun dalam penerapannya ada beberapa metode yang sering dipasangkan dengan metode K-Means. Karena Selain masalah optimasi pengelompokan data ke masing-masing cluster, data clustering juga diasosiasikan dengan permasalahan penentuan jumlah cluster yang paling tepat untuk data yang dianalisa. Untuk kedua jenis K-Means, baik Hard K-Means dan Fuzzy K-Means, yang telah dijelaskan di atas, penentuan jumlah cluster untuk dataset yang dianalisa umumnya dilakukan secara supervised atau ditentukan dari awal oleh pengguna, walaupun dalam penerapannya ada beberapa metode yang sering dipasangkan dengan metode K-Means. Karena

Melihat keadaan dimana pengguna umumnya sering menentukan jumlah cluster sendiri secara terpisah, baik itu dengan menggunakan metode tertentu atau berdasarkan pengalaman, di sini, kedua metode K- Means ini dapat disebut sebagai metode semi-supervised classification, karena metode ini mengalokasikan data items ke masing-masing cluster secara unsupervised dan menentukan jumlah cluster yang paling sesuai dengan data yang dianalisa secara supervised.

(Agusta, 2007)

2.4.4 Algoritma K-Means

1. Hard K-Means Metode Hard K-Means melakukan proses clustering dengan mengikuti algoritma sebagai berikut :

a. Tentukan jumlah cluster

b. Alokasikan data sesuai dengan jumlah cluster yang ditentukan

c. Hitung nilai centroid masing-masing cluster

d. Alokasikan masing-masing data ke centroid terdekat

e. Kembali ke Step c. apabila masih terdapat perpindahan data dari satu cluster ke cluster yang lain, atau apabila perubahan pada nilai centroid masih di atas nilai threshold yang ditentukan, atau apabila perubahan pada nilai objective function masih di atas nilai e. Kembali ke Step c. apabila masih terdapat perpindahan data dari satu cluster ke cluster yang lain, atau apabila perubahan pada nilai centroid masih di atas nilai threshold yang ditentukan, atau apabila perubahan pada nilai objective function masih di atas nilai

Dimana : 𝑁 𝑖 : jumlah data yang menjadi anggota cluster ke-i

Untuk perhitungan membership function digunakan rumus pada persamaan (3).

2. Fuzzy K-Means

Metode Fuzzy K-Means melakukan proses clustering dengan mengikuti algoritma sebagai berikut :

a. Tentukan jumlah cluster

b. Alokasikan data sesuai dengan jumlah cluster yang ditentukan

c. Hitung nilai centroid dari masing-masing cluster

d. Hitung nilai membership function masing-masing data ke masing- masing cluster

e. Kembali ke Step c. apabila perubahan nilai membership function

masih di atas nilai threshold yang ditentukan, atau apabila perubahan pada nilai centroid masih di atas nilai threshold yang ditentukan, atau apabila perubahan pada nilai objective function masih di atas nilai threshold yang ditentukan.

Untuk menghitung centroid cluster ke-i, vi , digunakan rumus Untuk menghitung centroid cluster ke-i, vi , digunakan rumus

Dimana : 𝑁

: Jumlah data

: Weighting exponent 𝑢 𝑖𝑘 : Membership function data ke-k ke cluster ke-i

Sedangkan untuk menghitung membership function data ke-k ke cluster ke-i digunakan rumus pada persamaan (4).

(Agusta, 2007)

2.4.5 Kelebihan dan Kekurangan K-Means

a) Kelebihan K-Means :

1. Selalu konvergen atau mampu melakukan klusterisasi

2. Tidak membutuhkan operasi matemais yang rumit, bisa dibilang operasinya sederhana

3. Beban komputasi relatif lebih ringan sehingga klusterisasi bisa dilakukan dengan cepat walaupun relatif tergantung ppada banyak jumlah data dan jumlah kluster yang ingin dicapai

b) Kekurangan K-Means :

1. Jumlah kluster harus ditentukan

2. Nilai centroids yang diberikan di awal bisa mempengaruhi hasil klusterisasi apabila nilainya berbeda (sensitive terhadap nilai centroids awal)

3. Solusi kluster yang dihasilkan hanya bersifat local optima sehingga kita tidak tahu apakah itu sudah merupakan konfigurasi optimal atau belum

4. Tergantung pada mean (rerata)

5. Operasi matematis nya sangat sederhana

2.5 Flowchart

Flowchart adalah penggambaran secara grafik dari langkah- langkah dan urut-urutan prosedur dari suatu program. Flowchart menolong analis dan programmer untuk memecahkan masalah kedalam segmen- segmen yang lebih kecil dan menolong dalam menganalisis alternatif- alternatif lain dalam pengoperasian.

Flowchart biasanya mempermudah penyelesaian suatu masalah khususnya masalah yang perlu dipelajari dan dievaluasi lebih lanjut.

2.5.1 Pedoman-pedoman dalam membuat Flowchart

Bila seorang analis dan programmer akan membuat Flowchart, ada beberapa petunjuk yang harus diperhatikan, seperti :

1. Flowchart digambarkan dari halaman atas ke bawah dan dari kiri ke kanan.

2. Aktivitas yang digambarkan harus didefinisikan secara hati-hati dan definisi ini harus dapat dimengerti oleh pembacanya.

3. Kapan aktivitas dimulai dan berakhir harus ditentukan secara jelas.

4. Setiap langkah dari aktivitas harus diuraikan dengan menggunakan deskripsi kata kerja.

5. Setiap langkah dari aktivitas harus berada pada urutan yang benar.

6. Lingkup dan range dari aktifitas yang sedang digambarkan harus ditelusuri dengan hati-hati. Percabangan-percabangan yang memotong aktivitas yang sedang digambarkan tidak perlu digambarkan pada Flowchart yang sama. Simbol konektor harus digunakan dan percabangannya diletakan pada halaman yang terpisah atau hilangkan seluruhnya bila percabangannya tidak berkaitan dengan sistem.

7. Gunakan simbol-simbol Flowchart yang standar.

2.5.2 Jenis-jens Flowchart

Flowchart terbagi atas lima jenis, yaitu :

1. Flowchart Sistem (System Flowchart). Flowchart Sistem merupakan bagan yang menunjukkan alur kerja atau apa yang sedang dikerjakan di dalam sistem secara keseluruhan dan menjelaskan urutan dari prosedur-prosedur yang ada di dalam sistem. Dengan kata lain, Flowchart ini merupakan deskripsi secara grafik dari urutan prosedur-prosedur yang terkombinasi yang membentuk suatu sistem.

Flowchart system terdiri dar data yang mengalir melalui system dan proses yang mentransformasikan data itu. Data dan proses dalam Flowchart system dapat digambarkan secara online (dihubungkan langsung dengan computer) atau offline (tidak dihubungkan langsung dengan computer, misalnya mesin tik, cash register atau kalkulator).

2. Flowchart Paperwork / Flowchart Dokumen (Document Flowchart).

Flowchart Paperwork menelusuri alur dari data yang ditulis melalui sistem. Flowchart Paperwork sering disebut juga dengan Flowchart Dokumen.

Kegunaan utamanya adalah untuk menelusuri alur form dan laporan sistem dari satu bagian ke bagian lain baik bagaimana alur form dan laporan diproses, dicatat dan disimpan.

3. Flowchart Skematik (Schematic Flowchart). Flowchart Skematik mirip dengan Flowchart Sistem yang menggambarkan suatu sistem atau prosedur. Flowchart Skematik ini bukan hanya menggunakan simbol-simbol Flowchart standar, tetapi juga menggunakan gambar-gambar komputer, peripheral, form-form atau peralatan lain yang digunakan dalam sistem.

Flowchart Skematik digunakan sebagai alat komunikasi antara analis sistem dengan seseorang yang tidak familiar dengan simbol- simbol Flowchart yang konvensional. Pemakaian gambar sebagai ganti dari simbol-simbol Flowchart akan menghemat waktu yang dibutuhkan oleh seseorang untuk mempelajari simbol abstrak sebelum dapat mengerti Flowchart.

4. Flowchart Program (Program Flowchart). Flowchart Program dihasilkan dari Flowchart Sistem. Flowchart Program merupakan keterangan yang lebih rinci tentang bagaimana setiap langkah program atau prosedur sesungguhnya dilaksanakan.

Flowchart ini menunjukkan setiap langkah program atau prosedur dalam urutan yang tepat saat terjadi.

Programmer menggunakan Flowchart program untuk menggambarkan urutan instruksi dari program komputer. Analis Sistem menggunakan Flowchart program untuk menggambarkan urutan tugas-tugas pekerjaan dalam suatu prosedur atau operasi.

5. Flowchart Proses (Process Flowchart). Flowchart Proses merupakan teknik penggambaran rekayasa industrial yang memecah dan menganalisis langkah-langkah selanjutnya dalam suatu prosedur atau sistem.

Flowchart Proses digunakan oleh perekayasa industrial dalam mempelajari dan mengembangkan proses-proses manufacturing. Dalam analisis sistem, Flowchart ini digunakan secara efektif untuk menelusuri alur suatu laporan atau form.

2.5.3 Simbol-simbol Flowchart

Simbol-simbol Flowchart yang biasanya dipakai adalah simbol- simbol Flowchart standar yang dikeluarkan oleh ANSI dan ISO. Simbol-simbol ini dapat dilihat pada Tabel 2.1 Simbol Flowchart Standar berikut ini :

Tabel 2.1 Simbol Flowchart Standar

Tabel 2.1 Lanjutan

Tabel 2.1 Lanjutan

Tabel 2.1 Lanjutan

2.6 Konsep Dasar Sistem

2.6.1 Pengertian Sistem

Sistem dilihat dari segi etimologinya berasal dari bahasa inggris yaitu sistem yang berarti susunan, cara, jaringan (Echols dan Shadily, 2000:575). Menurut Hartono (1999:683), sistem adalah suatu kesatuan yang terdiri dua atau lebih komponen atau subsistem yang berinteraksi untuk mencapai suatu tujuan.

Pengertian sistem dalam kamus besar bahasa Indonesia berarti Perangkat unsur yang secara teratur saling berkaitan sehingga membentuk suatu totalitas.

2.6.2 Elemen Sistem

Elemen yang terdapat dalam sistem meliputi: tujuan sistem, batasan sistem, control, input, proses, output dan umpan balik. Hubungan antar elemen dalam sistem dapat dilihat pada gambar dibawah ini (Kristianto, 2003:2):

TUJUAN BATASAN UMPAN BALIK

Gambar 2.4 Elemen Sistem

Dari gambar di atas bisa dijelaskan sebagai berikut : tujuan, batasan, dan kontrol sistem akan berpengaruh pada input, proses, dan output. Input dalam sistem akan diproses dan diolah sehingga menghasilkan output, dimana output tersebut akan dianalisis dan akan menjadi umpan balik bagi si penerima. Kemudian dari umpan balik ini akan muncul segala macam pertimbangan untuk input selanjutnya. Selanjutnya siklus ini akan berlanjut dan berkembang sesuai dengan permasalahan yang ada (Kristanto, 2003:2).

1. Tujuan Sistem Tujuan sistem dapat berupa tujuan organisasi, kebutuhan organisasi, permasalahan yang ada dalam suatu organisasi maupun urutan prosedur untuk mencapai tujuan organisasi. Jadi, dapat dikatakan bahwa tujuan sistem adalah tujuan yang akan dicapai dari pembuatan suatu sistem.

2. Batasan Sistem Batasan sistem adalah sesuatu yang membatasi sistem dalam pencapaian tujuan. Batasan sistem dapat berupa peraturan yang ada dalam organisasi, sarana dan prasarana, maupun batasan yang lain.

3. Kontrol Sistem Sistem merupakan pengawasan terhadap pelaksanaan pencapaian tujuan dari sistem tersebut. Control sistem dapat berupa control terhadap pemasukan data (input), output, pengolahan data, umpan balik, dan sebagainya.

4. Input Merupakan suatu elemen dari sistem yang bertugas untuk menerima seluruh masukan data yang dapat berupa jenis data, frekuensi pemasukan data, dan lainnya.

5. Proses Merupakan elemen dari sistem yang bertugas untuk mengolah atau memproses seluruh masukan data menjadi suatu informasi yang lebih berguna.

6. Output Merupakan hasil dari input yang telah diproses oleh bagian pengolah dan merupakan tujuan akhir dari sistem.

7. Umpan Balik Umpan balik merupakan elemen dalam sistem yang bertugas mengevaluasi bagian dari output yang dikeluarkan, dimana elemen ini sangat penting demi kemajuan sebuah sistem. Umpan balik in dapat berupa perbaikan sistem, pemeliharaan sistem, dan sebagainya (Kristanto, 2003:3-4).

2.7 Konsep Dasar Informasi

2.7.1 Pengertian Informasi

Menurut Kristanto (2003:6), Informasi merupakan kumpulan data yang diolah menjadi bentuk yang lebih berguna dan lebih berarti bagi yang menerimanya.