Pengelompokan Mahasiswa Potensial Drop Out Menggunakan Metode Clustering Pada Program Studi Strata 1 Ilmu Komputer Dan Teknologi Informasi Universitas Sumatera Utara

(1)

MENGGUNAKAN METODE CLUSTERING PADA PROGRAM

STUDI STRATA 1 ILMU KOMPUTER DAN TEKNOLOGI

INFORMASI UNIVERSITAS SUMATERA UTARA

SKRIPSI

NURUL MASITHAH GUCHI

071402059

PROGRAM STUDI TEKNOLOGI INFORMASI

FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI

UNIVERSITAS SUMATERA UTARA

MEDAN

2013

(2)

PENGELOMPOKAN MAHASISWA POTENSIAL DROP OUT

MENGGUNAKAN METODE CLUSTERING PADA PROGRAM

STUDI STRATA 1 ILMU KOMPUTER DAN TEKNOLOGI

INFORMASI UNIVERSITAS SUMATERA UTARA

SKRIPSI

NURUL MASITHAH GUCHI

071402059

PROGRAM STUDI TEKNOLOGI INFORMASI

FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI

UNIVERSITAS SUMATERA UTARA

MEDAN

2013

(3)

PENGELOMPOKAN MAHASISWA POTENSIAL DROP OUT MENGGUNAKAN METODE CLUSTERING PADA PROGRAM

STUDI STRATA 1 ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA

SKRIPSI

Diajukan Untuk Melengkapi Tugas Dan Memenuhi Syarat Memperoleh Ijazah Sarjana Teknologi Informasi

NURUL MASITHAH GUCHI 071402059

PROGRAM STUDI TEKNOLOGI INFORMASI

FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI

UNIVERSITAS SUMATERA UTARA

MEDAN

2013

(4)

Judul : PENGELOMPOKAN MAHASISWA POTENSIAL DROP OUT MENGGUNAKAN METODE

CLUSTERING PADA PROGRAM STUDI STRATA 1 ILMU KOMPUTER DAN

TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA

Kategori : SKRIPSI

Nama : NURUL MASITHAH GUCHI

Nomor Induk Mahasiswa : 071402059

Program Studi : SARJANA (S1) TEKNOLOGI INFORMASI

Departemen : TEKNOLOGI INFORMASI

Fakultas : ILMU KOMPUTER DAN TEKNOLOGI

INFORMASI

Diluluskan di

Medan, 08 Mei 2013 Komisi Pembimbing :

Pembimbing 2 Pembimbing 1

Dra. Elly Rosmaini, M.Si Syahril Efendi, S.Si, M.IT

NIP.196005 20198 503 NIP. 19671110 199602 100

Diketahui/Disetujui Oleh

Program Studi Teknologi Informasi Ketua,

Prof. Dr. Opim Salim Sitompul, M.Sc NIP. 19610817 198701 1001

(5)

PENGELOMPOKAN MAHASISWA POTENSIAL DROP OUT MENGGUNAKAN METODE CLUSTERING PADA PROGRAM

STUDI STRATA 1 ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA

SKRIPSI

Saya mengakui bahwa skripsi ini adalah hasil karya sendiri, kecuali kutipan dan ringkasan yang masing-masing telah disebutkan sumbernya.

Medan, 08 Mei 2013

Nurul Masithah Guchi 071402059

(6)

Puji dan syukur penulis panjatkan kehadirat Allah SWT yang telah melimpahkan berkat dan rahmat-Nya sehingga penulis dapat menyelesaikan skripsi ini. Penulis sangat menyadari bahwah Allah SWT lah yang sangat berperan membantu dan mengingatkan disaat penulis jatuh ataupun terlena selama mengerjakan skripsi ini.

Dalam menyelesaikan skripsi ini penulis menyadari banyak mendapatkan bantuan dari berbagai pihak baik bantuan secara materi maupun moril. Pada kesempatan ini dengan segala kerendahan hati, penulis ingin mengucapkan terimakasih yang sedalam-dalamnya kepada:

1. Kedua orang tua penulis, yaitu Muhammad Bakti dan Junidar, karena berkat dukungan dan kesabarannya baik secara moril maupun materil sehingga penulis dapat menyelesaikan skripsi ini. Kepada Abang, Ramdhan Purnama Guchi dan Kakak, Rika Ramadhana Guchi,Amd, Muharni Firdaus Guchi, Bapak Prof. Dr. Muhammad Zarlis serta orang terkasih saya Jefriansyah, ST yang selalu memberikan dukungan kepada penulis. Jazakallah Khoiron Katsir.

2. Kepada Bapak Sahril Efendi, S.Si, MIT dan Ibu Dra. Elly Rosmaini, M.Si selaku dosen pembimbing penulis yang telah memberikan saran dan masukan serta bersedia meluangkan waktu, tenaga dan fikiran untuk menyelesaikan skripsi ini.

3. Kepada dosen penguji saya Bapak Dedy Arisandi, ST, M.Kom dan Bapak Sajadin Sembiring, S.Si, M.Sc yang banyak memberikan masukan.

4. Kepada Ketua dan Sekretaris jurusan Prof. Dr. Opim Salim Sitompul, M.Sc dan Drs. Syawaluddin, M.IT.

5. Kepada Seluruh Dosen yang mengajar program studi Teknologi Informasi Universitas Sumatera Utara.

6. Teman-teman seangkatan di jurusan Teknologi Informasi 2007 : Boy Utomo Manalu, Fanindya, Masyita Oktaviani, Khairunnisa, Agnes Margaretha, Ilham, seluruh teman-teman sejawat yang tidak dapat saya sebutkan satu persatu. Terima kasih banyak atas bantuan kalian.

7. Teman-teman satu asrama putri USU, Sri Wulandari, Musfika Rati, Siti Hardianti, Mawa, Dewi. Dan seluruh teman asrama putri USU yang tidak bisa saya sebutkan

(7)

Ardiansyah, Wendra, Fidel. Terima kasih atas dukungannya. 9. Saudara-saudara dan Keluarga Terdekat.

Semoga Allah SWT membalas kebaikan dan jasa-jasa kalian.

Penulis menyadari bahwa hasil penulisan skripsi ini masih banyak kesalahan dan jauh dari sempurna. Oleh karena itu, kritik dan saran dari pembaca sangatlah penulis harapkan bagi perbaikan dan kesempurnaan di masa yang akan datang. Penulis memohon maaf apabila terdapat kekurangan dan kesalahan dalam penulisan skripsi ini.

Akhir kata, penulis mengucapkan terima kasih kepada semua pihak terkait dalam penyelesaian skripsi ini, yang tidak bisa di sebutkan satu persatu, biarlah Allah SWT yang membalas semua kebaikan kalian. Aamiin...

(8)

ABSTRAK

Kegiatan mengelompokkan jumlah mahasiswa potensial drop out merupakan hal penting bagi institusi pendidikan khususnya perguruan tinggi. Untuk menanggulangi kecendrungan mahasiswa-mahasiswa yang memiliki indeks prestasi rendah sehingga memiliki kemungkinan mahasiswa untuk di drop out. Pada penelitian ini teknik data mining dalam metode clustering akan di implementasikan untuk mengelompokkan jumlah mahasiswa-mahasiswa yang di potensial drop out untuk angkatan 2010/2011 pada program studi Strata 1 Teknologi Informasi dan Ilmu Komputer di Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Sumatera Utara.

(9)

GROUPING STUDENTS POTENTIAL DROP OUT USING CLUSTERING METHODE AT DEGREE PROGRAM IN COMPUTER SCIENCE AND INFORMATION TECHNOLOGY UNIVERSITY OF NORTH SUMATRA

ABSTRACT

Activities classified number of potential students drop out is important for educational institutions especially universities. To overcome the tendency of students who have a low GPA that has the possibility for students to drop out. In this research, the data mining techniques such as clustering metohod used to classify the number of students who is potential drop out at information technology and Computer Science Program at Season 2010/2011 University of North Sumatra.

(10)

DAFTAR ISI

ABSTRAK 1

ABSTRACT 2

DAFTAR ISI 3

DAFTAR TABEL 5

DAFTAR GAMBAR 6

BAB I PENDAHULUAN 7

1.1.1 Latar Belakang 7

1.1.2 Perumusan Masalah 9

1.1.3 Batasan Masalah 9

1.1.4 Tujuan Penelitian 10

1.1.5 Manfaat Penelitian 10

1.1.5.1Metodologi Penelitian 10

1.1.6 Sistematik Penulisan 12

BAB II LANDASAN TEORI 14

2.1Perangkat Lunak 14

2.2 Rekayasa Perangkat Lunak 16

2.3 Proses Rekayasa Perangkat Lunak 17

2.4 Kecerdasan Buatan 17

2.5 Penambangan Data (Data Mining) 18

2.5.1 Tahapan Penambangan Data (Data Mining) 23

2.5.2 Pengelompokan Data Mining 24

2.6 Clustering 25

2.7 K-Means 25

2.8 Penelitian Terdahulu 31

2.9 Visual Basic.Net 38

BAB III ANALISA DAN PERANCANGAN 40

3.1 Analisis 40

3.1.1 Analisis Masalah 40

3.1.2 Analisis Data Sistem 41

3.1.3 Analisis Kebutuhan Fungsional 42

3.1.4 Analisis Kebutuhan Non Fungsional 42

3.2 Perancangan Sistem 43

3.2.1 Diagram Context 43

3.2.2 Data Flow Diagram Level 1 44

3.2.3 Flow Chart 45

3.3 Rancangan Antarmuka Pengguna 50

(11)

3.3.2 Rancangan Antarmuka Pembacaan Data IP Mahasiswa 51

3.3.3 Rancangan Antarmuka Iterasi-1 53

3.3.4 Rancangan AntarmukaIterasi – n 54

3.3.5 Rancangan Antarmuka Menu Pilihan Cetak Data

Pengelompokan 55

3.3.6 Ranacangan Antarmuka Cetak Data Prediksi 56

BAB IV IMPLEMENTASI DAN PENGUJIAN SISTEM 57

4.1 ImplementasiSistem 57

4.1.1 Lingkungn Implementasi 57

4.1.2 Tampilan Implementasi Program 58

4.2 Pengujian Sistem 59

BAB V KESIMPULAN DAN SARAN 69

5.1 Kesimpulan 69

5.2 Saran 70

DAFTAR PUSTAKA 72

(12)

DAFTAR TABEL

Tabel 2.1 Sampel Data 26

Tabel 2.2 Tabel Iterasi 1 27

Tabel 2.3 Tabel Iterasi 2 30

Tabel 2.4 Tabel Iterasi 3 31

(13)

DAFTAR GAMBAR

Gambar 2.1 Tahap-tahap Penambangan Data 23

Gambar 3.1 Diagram Context 43

Gambar 3.2 DFD Level 1 44

Gambar 3.3 Flow Chart 45

Gambar 3.4 Tabel Iterasi 1 48

Gambar 3.5 Rancangan Antarmuka Menu Aplikasi 50

Gambar 3.6 Rancangan Antarmuka Pembacaan Data IP Mahasiswa 51 Gambar 3.7 Tampilan Data Rancangan Antarmuka Pembacaan Data IP

Mahasiswa 52

Gambar 3.8 Rancangan Antarmuka Iterasi-1 53

Gambar 3.9 Rancangan AntarmukaIterasi-n 54

Gambar 3.10 Rancangan Antarmuka Menu Pilihan Cetak Data Pengelompokan 55 Gambar 3.11 Rancangan Antarmuka Cetak Data Pengelompokan 56

Gambar 4.1 Antarmuka Menu Utama Pengelompokan 58

Gambar 4.2 Antarmuka Pembacaan Data IP Mahasiswa 59

Gambar 4.3 Antarmuka Iterasi-1 60

Gambar 4.4 Antarmuka Iterasike-n 61

Gambar 4.5 Antarmuka Pilihan Cetak Data Pengelompokan 62

(14)

ABSTRAK

(15)

GROUPING STUDENTS POTENTIAL DROP OUT USING CLUSTERING METHODE AT DEGREE PROGRAM IN COMPUTER SCIENCE AND INFORMATION TECHNOLOGY UNIVERSITY OF NORTH SUMATRA

ABSTRACT

(16)

BAB I

PENDAHULUAN

1.1 Latar Belakang

Beberapa institusi yang memanfaatkan sistem informasi berbasis komputer selama bertahun-tahun sudah pasti memiliki jumlah data yang cukup besar pula. Data yang dihasilkan dan disimpan dalam sistem komputer dirancang agar cepat dan akurat baik dalam mengoperasikan maupun administrasinya. Data ini dirancang untuk pelaporan dan analisa yang menggunakan data. Data tersedia secara luar biasa melimpah. Sedemikian melimpahnya data, sehingga membuat kita semakin tertantang untuk bertanya “Pengetahuan apakah yang dapat dihasilkan dari data tersebut”.

Perguruan tinggi adalah salah satu institusi yang sudah pasti memiliki data yang tidak kecil volumenya. Database perguruan tinggi menyimpan data akademik, administrasi dan data mahasiswa. Data tersebut apabila digali dengan tepat maka dapat diketahui pola atau pengetahuan untuk mengambil keputusan.

Salah satu data yang dapat digali adalah pemahaman informasi mahasiswa yang potensial drop out. Hal ini penting untuk diketahui dan dipahami. Pemahaman dapat dilakukan dengan mengungkapkan pengetahuan yang dimiliki untuk memahami dan mengelompokkan. Pencegahan kegagalan adalah sangat penting bagi managemen perguruan tinggi. Pengetahuan ini dapat digunakan dalam membantu pihak perguruan tinggi untuk lebih mengenal situasi para mahasiswanya dan dapat dijadikan sebagai pengetahuan dini dalam proses pengambilan keputusan untuk tindakan preventif dalam hal mengantisipasi mahasiswa drop-out, untuk meningkatkan prestasi mahasiswa, untuk meningkatkan kurikulum, meningkatkan proses kegiatan belajar dan mengajar dan

(17)

banyak lagi keuntungan lain yang bisa diperoleh dari hasil penambangan data tersebut.

Ukuran keberhasilan atau prestasi mahasiswa dapat dilihat dari Indeks Prestasi (IP) yang mencerminkan seluruh nilai yang diperoleh mahasiswa sampai semester yang sedang berjalan. IP diperoleh dengan cara menjumlahkan seluruh nilai mata kuliah yang telah diambil dan membaginya dengan total sks (satuan kredit semester). Ada beberapa faktor yang menjadi penghalang bagi mahasiswa mencapai dan mempertahankan IP tinggi yang mencerminkan usaha mereka secara keseluruhan selama masa kuliah di perguruan tinggi. Faktor tersebut dapat dijadikan target oleh pihak perguruan tinggi sebagai strategi untuk mengambil tindakan dalam mengembangkan dan meningkatkan prestasi mahasiswa serta meningkatkan kinerja akademik dengan cara memantau perkembangan kinerja mereka.

Evaluasi kinerja merupakan salah satu dasar untuk memantau perkembangan nilai prestasi akademik mahasiswa di dalam perguruan tinggi dan pengelompokkan mahasiswa kedalam kategori yang berbeda sesuai dengan prestasi mereka sudah menjadi kewajiban dalam tugas mereka. Dengan pengelompokkan mahasiswa secara manual berdasarkan nilai rata-rata mereka, maka tidak begitu mudah untuk memperoleh pandangan yang menyeluruh mengenai keadaan nilai prestasi mahasiswa.

Dengan bantuan teknik data mining, seperti algoritma clustering, yang memungkinkan untuk menemukan karakteristik-karakteristik dari nilai prestasi mahasiswa dan menggunakan karakteristik mereka. Algoritma clustering yang baik idealnya menghasilkan kelompok dengan batasan cluster yang berbeda, meskipun dalam praktek pemisahan yang sempurna biasanya tidak bisa dicapai.

Berdasarkan uraian di atas, penulis terdorong untuk mengambil judul “Pengelompokan Mahasiswa Potensial Drop Out Dengan Menggunakan Metode Clustering Pada Program Studi Teknologi Informasi dan Ilmu Komputer Fakultas

(18)

Ilmu Komputer dan Teknologi Informasi Universitas Sumatera Utara T.A. 2010/2011.”

1.2 Perumusan Masalah

Sebelumnya mahasiswa dan Instansi perguruan tinggi sering tidak menyadari jumlah mahasiswa yang akan terkena dro out. Seringkali pihak instansi dan mahasiswa mengetahui belakangan mahasiswa yang akan di drop out. Maka dalam hal ini masalah yang dapat dirumuskan adalah : “Bagaimana mengelompokkan mahasiswa drop out akademik agar kecenderungan terhadap mahasiswa drop out berkurang serta dapa mengantisipasi mahasiswa yang akan terkena drop out.

1.3 Batasan Masalah

Mengingat akan keterbatasan waktu peulisan dan kemampuan, penulis membatasi masalah yang akan dibahas pada skripsi ini. Batasan-batasan masalah yang akan dibahas di dalam skripsi ini antara lain:

1. Penelitian ini hanya mengelompokkan mahasiswa drop out di program studi S1 Teknologi Informasi dan Ilmu Komputer Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Sumatera Utara, angkatan 2010 dan 2011. 2. Objek yang dikelompokkan drop out adalah nilai Indeks Prestasi Mahasiswa. 3. Data yang digunakan merupakan data IP mahasiswa dari semester awal

hingga IP semester yang sedang berlangsung.

4. Algoritma yang digunakan dalam melakukan clusterring adalah algoritma K-Means.

5. Sistem yang dibangun hanya menghasilkan kelompok jumlah mahasiswa akademik yang potensial di drop out untuk angkatan 2010/2011.

(19)

1.4 Tujuan Penelitian

Adapun tujuan penelitian ini adalah untuk melakukan pengelompokan tentang jumlah mahasiswa yang akan di drop out oleh suatu instansi pendidikan yang bergerak di bidang perguruan tinggi.

1.5 Manfaat Penelitian

Adapun manfaat penelitian ini adalah: 1. Bagi instansi pendidikan

Penelitian ini dilakukan agar instansi pendidikan dapat mengambil keputusan yang dapat mengantisipasi dan memberi pemberitahuan mengenai mahasiswa yang potensial untuk di drop out.

2. Bagi penulis

Mengetahui bagaimana cara mengimplementasikan metode clusterig pada sistem komputer serta mengetahui tingkat keakuratan metode tersebut berdasarkan hasil perhitungannya pada penelitian ini.

3. Bagi perkembangan ilmu pengetahuan

Penelitian ini digunakan sebagai bahan referensi dalam menambah pengetahuan bagi peneliti lain yang ada relevansinya.

1.6 Metodologi Penelitian

Metodologi penelitian yang digunakan dalam pembuatan skripsi ini adalah: 1. Studi Literatur

(20)

Studi literatur yang dilakukan dalam penelitian ini adalah mengumpulkan bahan referensi baik dari buku-buku, jurnal, makalah, internet dan beberapa sumber lainnya.

2. Pengumpulan Data

Pada tahap ini akan dilakukan pengumpulan data mahasiswa akademik program studi S1 Teknologi Informasi dan Ilmu Komputer Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Sumatera Utara dari T.A. 2010 – 2011.

3. Analisis Permasalahan

Pada tahap ini dilakukan analisis terhadap hasil studi literatur untuk mengetahui dan mendapatkan pemahaman mengenai metode clustering untuk menyelesaikan masalah pengelompokan mahasiswa yang potensial drop out melalui suatu indeks prestasi mahasiswa akademik.

4. Perancangan Sistem

Pada tahap perancangan sistem dilakukan perancangan sistem, pengumpulan data dan merancang antarmuka. Proses perancangan dilakukan berdasarkan hasil analisis studi literatur yang telah telah didapatkan.

5. Implementasi Sistem

Pada tahapan implementasi sistem ini akan dilakukan pengkodean program dalam sistem computer menngunakan bahasa pemrograman Visual Basic 2010 dan database MySQL 5.

6. Pengujian

Pada tahap ini akan dipastikan apakah sistem pengelompokan mahasiswa drop out pada program studi Imu Komputer dan Teknologi Informasi yang telah dibuat

Sudah berjalan sesuai harapan.

7. Dokumentasi dan Penyusunan laporan

Pada tahap ini dilakukan dokumentasi hasil analisis metode clutering untuk menyelesaikan masalah pengelompokan mahasiswa potensial drop out program sudi S1 Ilmu Komputer dan Teknologi Informasi angkatan 2010/2011.

(21)

1.7. Sistematika Penulisan

Sistematika pembahasan yang digunakan untuk menyelesaikan skripsi ini adalah sebagai berikut:

BAB I : PENDAHULUAN

Menjelaskan mengenai latar belakang, perumusan masalah, tujuan penelitian, manfaat penelitian, metodologi penelitian dan sistematika penulisan.

BAB II : LANDASAN TEORI

Membahas beberapa teori penunjang berhubungan dengan pokok pembahasan dalam skripsi ini yang secara garis besar berisi tentang sistem pengelompokan mahasiswa potensial drop out.

BAB III : ANALISA DAN PERANCANGAN

Pada bab ini akan dibahas analisis sistem, deskripsi sistem, desain sistem yang digunakan dalam pembuatan sistem pengelompokan mahasiswa potensial drop out pada program studi S1 Ilmu Komputer dan Teknologi Informasi angkatan 2010/2011 menggunakan metode clustering.

BAB IV : IMPLEMENTASI DAN PENGUJIAN SISTEM

Pada bab ini akan dijelaskan mengenai implementasi dan pengujian sistem berdasarkan hasil rancangan yang telah dibuat sebelumnya.

(22)

BAB V : KESIMPULAN DAN SARAN

Bab ini memuat kesimpulan dari keseluruhan uraian bab-bab sebelumnya dan saran-saran yang diajukan untuk pengembangan program selanjutnya.

(23)

BAB II

LANDASAN TEORI

Bab ini membahas teori penunjang yang berhubungan dengan penerapan metode clustering pada sistem pengelompokan mahasiswa potensial drop out.

2.1 Perangkat Lunak

Perangkat Lunak (software) adalah program komputer yang terasosiasi dengan dokumentasi perangkat lunak seperti dokumentasi kebutuhan, model desain, dan cara penggunaan (user manual). Sebuah program komputer tanpa terasosiasi dengan dokumentasinya maka belum dapat dikatakan perangkat lunak (software).

Karakter perangkat lunak adalah sebagai berikut :

1. Perangkat lunak dibangun dengan rekayasa (software engineering) bukan diproduksi secara manufaktur atau pabrikan.

2. Perangkat lunak tidak pernah usang (wear out) karena kecacatan dalam perangkat lunak dapat diperbaiki.

3. Barang produksi pabrikan biasanya komponen barunya akan terus diproduksi, sedangkan perangkat lunak biasanya terus diperbaiki seiring bertambahnya kebutuhan.

Aplikasi dari perangkat lunak adalah sebagai berikut : 1. Perangkat lunak sistem (system software)

(24)

Adalah kumpulan program dimana program yang satu ditulis untuk memenuhi kebutuhan program lainnya.

2. Perangkat lunak waktu nyata (real time software)

Merupakan perangkat lunak yang memonitor, menganalisis, mengontrol sesuatu secara waktu nyata (real time).Reaksi yang dibutuhkan pada perangkat lunak harus langsung menghasilkan respon yang diinginkan.

3. Perangkat lunak bisnis (business software)

Merupakan perangkat lunak pengelola informasi bisnis (seperti akuntansi, penjualan, pembayaran, dan penyimpanan (inventory)).

4. Perangkat lunak untuk keperluan rekayasa dan keilmuan (engineering and scientific software)

Merupakan perangkat lunak yang mengimplementasikan algoritma yang terkait dengan keilmuan ataupun perangkat lunak yang membantu keilmuan, misalkan perangkat lunak di bidang astronomi, di bidang matematika, dan lain sebagainya.

5. Perangkat lunak tambahan untuk membantu mengerjakan suatu fungsi dari perangkat lunak yang lainnya (embedded software)

Misalnya perangkat lunak untuk mencetak dokumen ditambahkan agar perangkat lunak yang memerlukan dapat mencetak laporan, maka perangkat lunak untuk mencetak dokumen ini disebut embedded software.

6. Perangkat lunak komputer personal (personal computer software)

Merupakan perangkat lunak untuk PC misalnya perangkat lunak pemroses teks, pemroses grafik, dan lain sebagainya.

7. Perangkat lunak berbasis web (web based software)

Merupakan perangkat lunak yang dapat diakses dengan menggunakan web browser.

8. Perangkat lunak intelijensia buatan (artificial intelligence software)

Merupakan perangkat lunak yang menggunakan algoritma tertentu untuk mengelola data sehingga seakan-akan memiliki intelijensia seiring bertambahnya data yang diproses.

(25)

Produk perangkat lunak yang dibuat oleh pengembang (developer) perangkat lunak terdiri dari dua jenis :

1. Produk Generik

Produk perangkat lunak yang dibuat oleh pengembang perangkat lunak untuk dijual atau dipopulerkan (open source) tanpa ada yang memesan terlebih dahulu, perangkat lunak yang termasuk dalam produk generik misalnya perangkat lunak sistem operasi, perangkat lunak pendukung perkantoran untuk membuat dokumen, slide presentasi, atau perhitungan dalam bentuk papersheet dan lain sebagainya.

2. Produk Pemesanan

Produk perangkat lunak yang dibuat karena ada pelanggan yang melakukan pemesanan, misalnya sebuah instansi memerlukan perangkat lunak untuk memenuhi proses bisnis yang terjadi di instansinya, maka instansi itu akan bekerja sama dengan pengembang untuk membuat perangkat lunak yang diinginkan. (Rosa A.S, M. Shalahuddin; 2011: 2-4)

2.2 Rekayasa Perangkat Lunak

Rekayasa Perangkat Lunak (software engineering) merupakan pembangunan dengan menggunakan prinsip atau konsep rekayasa dengan tujuan menghasilkan perangkat lunak yang bernilai ekonomi yang dipercaya dan bekerja secara efisien menggunakan mesin. Perangkat lunak banyak dibuat dan pada akhirnya sering tidak digunakan karena tidak memenuhi kebutuhan pelanggan atau bahkan karena masalah non-teknis seperti keengganan pemakai perangkat lunak (user) untuk mengubaha cara kerja dari manual ke otomatis, atau ketidakmampuan user menggunakan komputer. Oleh karena itu, rekayasa perangkat lunak dibutuhkan agar perangkat lunak yang dibuat tidak hanya menjadi perangkat lunak yang tidak terpakai.

Rekayasa perangkat lunak lebih fokus pada bagaimana membuat perangkat lunak yang memenuhi kriteria berikut :

(26)

1. Dapat terus dipelihara setelah perangkat lunak selesai dibuat seiring berkembangnya teknologi dan lingkungan (maintainability).

2. Dapat diandalkan dengan proses bisnis yang dijalankan dan perubahan yang terjadi (dependability dan robust).

3. Efisien dari segi sumber daya dan penggunaan.

4. Kemampuan untuk dipakai sesuai denga kebutuhan (usability) (Rosa A.S, M. Shalahuddin; 2011: 4-5).

2.3 Proses Rekayasa Perangkat Lunak

Proses perangkat lunak (software process) adalah sekumpulan aktivitas yang memiliki tujuan mengembangkan atau mengubah perangkat lunak.

Secara umum proses perangkat lunak terdiri dari :

1. Pengumpulan Spesifikasi (Specification), yaitu : mengetahui apa saja yang harus dapat dikerjakan sistem perangkat lunak dan batasan pengembangan perangkat lunak.

2. Pengembangan (Development), yaitu : pengembangan perangkat lunak untuk menghasilkan perangat lunak.

3. Validasi (Validation) yaitu : memeriksa apakah perangkat lunak sudah memenuhi kebutuhan pelanggan (custumer).

4. Evolusi (Evolution) mengubah perangkat lunak untuk memenuhi perubahan kebutuhan pelanggan (custumer). (Rosa A.S, M. Shalahuddin; 2011: 9).

2.4 Kecerdasan Buatan

Kecerdasan buatan berasal dari bahasa Inggris “Artificial Intelligence” disingkat AI, yaitu intelliegence adalah kata sifat yang berarti cerdas, sedangkan artificial artinya buatan. Kecerdasan buatan yang dimaksud disini merujuk pada mesin

(27)

yang mampu berfikir, menimbang tindakan yang akan diambil, dan mampu mengambil keputusan seperti yang dilakukan oleh manusia.

Berdasarkan defenisi ini, maka kecerdasan buatan menawarkan media maupun uji teori tentang kecerdasan.Teori-teori ini nantinya dapat dinyatakan dalam bahasa pemrograman dan eksekusinya dapat dibuktikan pada komputer nyata.

Program konvensional hanya dapat menyelesaikan persoalan yang diprogram secara spesifik.Jika ada informasi baru, sebuah program konvensional harus diubah untuk menyesuaikan diri dengan informasi tersebut.Hal ini tidak hanya menyebabkan boros waktu, namun juga dapat menyebabkan terjadinya error. Sebaliknya, kecerdasan buatan memungkinkan komputer untuk berfikir atau menalar dan menirukan proses belajar manusia sehingga informasi baru dapat diserap sebagai pengetahuan, pengalaman, dan proses pembelajaran serta dapat digunakan sebagai acuan di masa-masa yang akan datang. Dari sini dapat dikatakan bahwa : cerdas adalah memiliki pengetahuan, pengalaman dan penalaran untuk membuat keputusan dan mengambil tindakan. Jadi, agar mesin bisa cerdas (bertidak seperti manusia) maka harus diberi bekal pengetahuan dan diberi kemampuan untuk menalar (T. Sutojo, dkk; 2011: 1-3).

2.5 Penambangan Data (Data Mining)

Data mining (penambangan data) adalah suatu proses untuk menemukan suatu pengetahuan atau informasi yang berguna dari data berskala besar. Sering juga disebut segabai bagian proses KDD (Knowledge Discovery in Databases). (Santosa,2007).

Data mining adalah bagian dari proses KDD (Knowledge Discovery in Database) yang terdiri dari beberapa tahapan seperti pemilihan data, pra-pengolahan, transformasi, data mining, dan interpretasi hasil. (Opim, 2008: 10).

(28)

Data mining adalah suatu istilah yang digunakan untuk menguraikan penemuan pengetahuan di dalam database. Data mining adalah proses yang menggunankan teknik statistik, matematika, kecerdasan buatan dan machine learning untukmengekstraksi dan mengindentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari berbagai database besar`(Turban, dkk. 2005).

Menurut Gartner Group data mining adalah suatu proses menemukan hubungan yang berarti, pola, dan kecendrungan dengan memeriksa dalam sekumpulan besar data yang tersimpan dalam penyimanan dengan menggunakan teknik pengenalan pola teknik statistik dan matematika.(Larose. 2005).

Selain defenisi diatas beberapa defenisi juga diberikan seperti tertera di bawah ini : “data mining adalah serangkaian proses untuk menggali nilai tambah dari suatu kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara manual.” (Pramudiono, 2006).

“Data mining adalah analisis otomatis dari data berjumlahbesar atau komplek dengan tujuan untuk menemukan pola atau kecendrungan yang penting yang biasanya tidak disadari keberadaannya.”(Pramudiono, 2006).

“Data mining merupakan bidang dari beberapa bidang keilmuan yang menyatukan teknik dari pembelajaran mesin, pengenalan pola, statistik, database, dan visualisasi untuk penanganan permasalahan pengambilan informasi dari database yang besar.” (Larose, 2005).

Data mining adalah mengenai pemecahan masalah dengan menganalisa data yang ada di dalam database dan sering juga didefinisikan sebagai proses menemukan pola dalam data, dimana proses tersebut harus otomatis atau semi-otomatis dan pola yang ditemukan harus bermakna (Chakrabarti, et al., 2009). Dari defenisi-defenisi yang telah disampaikan, hal penting yang terkait dengan data mining adalah :

1. Data mining merupakan suatu proses otomatis terhadap data yang sudah ada. 2. Data yang akan diproses berupa data yang sangat besar.

(29)

3. Tujuan data mining adalah mendapatkan hubungan atau pola yang mungkin memberikan indikasi yang bermanfaat.

Hubungan yang dicari dalam data mining dapat berupa hubungan antara dua atau lebih dalam satu dimensi. Misalnya dalam dimensi produk kita dapat melihat keterkaitan pembelian suatu produk dengan produk yang lain. Selain itu, hubungan juga dapat dilihat antara dua atau lebih atribut dan dua atau lebih objek (Ponniah, 2001).

Sementara itu, penemuan pola merupakan keluaran lain dari data mining. Misalkan sebuah perusahaan yang akan meningkatkan fasilitas kartu kredit dari pelanggan, maka perusahaan akan mencari pola dari pelanggan-pelanggan yang ada untuk mengetahui pelanggan yang potensial dan pelanggan yang tidak potensial.

Beberapa dari defenisi awal dari data mining mnyertakan fokus pada proses otomatisasi. Bery dan Linoff dalam buku Data Mining Technique For Marketing, Sales, and Cusstomers Support mendefenisikan data mining sebagai proses ekplorasi dan analisis secara otomatis maupun semiotomatis terhadap data dalam jumlah besar dengan tujuan menemukan pola atau aturan yang berarti (Larose, 2005).

Istilah data mining dan knowledge discovery in database (KDD) sering kali digunakan secara bergantian untuk menjelaskan proses penggalian informasi tersembunyi dalam suatu basis data yang besar. Sebenarnya kedua istilah tersebut memiliki konsep berbeda, tetapi berkaitan satu sama lain. Dalam salah satu tahapan dalam keseluruhan proses KDD adalah data mining. Proses KDD secara garis besar dapat dijelaskan sebagai berikut (Fayyad, 1996).

1. Data selection

Pemilihan (seleksi) data dari sekumpulan data operasional perlu dilakukan sebelum tahap penggalian informasi dalam KDD dimulai. Data hasil seleksi yang akan digunakan utuk proses data mining, disimpan dalam suatu berkas, terpisah dari basis data operasional.

(30)

Sebelum proses data mining dapat dilaksakan, perlu dilakukan proses cleaning pada data yang menjadi fokus KDD. Proses cleaning mencakup antara lain membuang duplikasi data, memeriksa data yang inkonsisten, dan memperbaiki kesalahan pada data, seperti kesalahan cetak (tipografi). Juga dilakukan proses enrichment, yaitu proses “memperkaya” data yang sudah ada dengan data atau informasi lain yang relevan dan diperlukan untuk KDD, seperti data atau informasi eksternal.

3. Transformation

Coding adalah proses transformasi pada data yang telah dipilih, sehingga data tersebut sesuai dengan proses data mining. Proses coding dalam KDD merupakan proses kreatif dan sangat tergantung pada jenis atau pola informasi yang akan dicari dalam basis data.

4. Data mining

Data mining adalah proses mencari pola atau informasi menarik dalam data terpilih dengan menggunakan teknik atau metode tertentu. Teknik, metode atau algoritma dalam data mining sangat bervariasi. Pemilihan metode atau algoritma yang tepat sangat tergantung pada tujuan dan proses KDD secara keseluruhan.

5. Interpretation/Evaluation

Pola informasi yang dihasilkan dari proses data mining perlu ditampilkan dalam bentuk yang mudah dimengerti oleh pihak yang berkepentingan. Tahap ini merupakan bagian dari proses KDD yang disebut interpretation. Tahap ini mencakup pemeriksaan apakah pola atau informasi yang ditemukan bertentangan dengan fakta atau hipotesis yang ada sebelumnya.

Cros-Industry Standart Process For Data Mining (CRISP-DM) yang dikembangakan tahun 1996 oleh analisis dari beberapa industri seperti DaimlerChrysler, SPSS dan NCR. CRISP DM menyediakan standar proses data mining sebagai strategi pemecahan masalah secara umum dari bisnis atau unit penelitian.

(31)

Dalam CRISP DM, sebuah proyek data mining memiliki siklus hidup yang terbagi dalam enam fase. Keseluruhan fase berurutan yang ada tersebut bersifat adaptif.Fase berikutnya dalam urutan bergantung pada keseluruhan dari fase sebelumnya.Hubungan penting antarfase digambarkan dengan panah. Sebagai contoh, jika proses berada pada fase modeling. Bedasarkan pada perilaku dan karakteristik model, proses mungkin harus kembali kepada fase data preparation untuk perbaikan lebih lanjut terhadap data atau perpindahan maju kepada fase evaluation.

Enam fase CRISP DM (Larose, 2005)

1. Fase Pemahaman Bisnis (Business Understanding Phase)

a. Menentukan tujuan proyek dan kebutuhan secara detail dalam lingkuo bisnis atau unit penelitian secara keseluruhan.

b. Menerjemahkan tujuan dan batasan menjadi formula dari permasalahan data mining.

c. Menyiapkan strategi awal untuk mencapai tujuan. 2. Fase Pemahaman Data (Data Understanding Phase)

a. Mengumpulakan data.

b. Menggunkan analisis penyelidikan data untuk mengenali lebih lanjut data dan pencarian pengetahuan awal.

c. Mengevaluasi kualitas data.

d. Jika diinginkan, pilih sebagian grup data yang mungkin mengandung pola dari permasalahan.

3. Fase Pengolahan Data (Data Preperation Phase)

a. Siapkan dari data awal, kumpulan data yang akan digunakan untuk keseluruhan fase berikutnya. Fase ini merupakan pekerjaan berat yang perlu dilaksakan secara intensif.

b. Pilih kasus dari variabel yang ingin dianalisis dan yang sesuai dengann analisis yang aka dilakukan.

c. Lakukan perubahan pada beberapa variabel jika dibutuhkan. d. Siapkan data awal sehingga siap untuk perangkat pemodelan.

(32)

4. Fase Pemodelan (Modelling Phase)

a. Pilih dan aplikasikan teknik pemodelan yang sesuai. b. Kalibrasi aturan model untuk menoptimalkan hasil.

c. Perlu diperhatikan bahwa beberapa teknik mungkin untuk digunakan pada permasalahan data mining yang sama.

d. Jika diperlukan, proses dapat kembali ke fase pengolahan data untuk menjadikan data ke dalam bentuk yang sesuai dengan spesifikasi kebutuhan teknik data mining tertentu.

5. Fase Evaluasi (Evaluation Phase)

a. Mengevaluasi satu atau lebih model yang digunakan dalam fase pemodelan untuk mendapatkan kualitas dan efektivitas sebelum disebarkan untuk digunakan.

b. Menetapkan apakah model yang memenuhi tujuan pada fase awal. c. Menetukan apakah permasalahan penting ari bisnis atau penelitian

yang tidak tertangani dengan baik.

d. Mengambil keputusan berkaitan dengan penggunaan hasil dari data mining.

6. Fase Penyebaran ( Deployment Phase)

a. Menggunakan model yang dihasilkan. Terbentuknya model tidak menandakan telah terselesaikannya proyek.

b. Contoh sederhana penyebaran : Pembuatan lapoaran.

c. Contoh kompleks penyebaran : Penerapan proses data mining secara paralel pada departemen lain.

2.5.1 Tahapan Penambangan Data (Data mining)

Penambangan data (data mining) dipahami sebagai suatu proses, yang memiliki tahapan - tahapan tertentu yang bersifat interaktif dan juga ada umpan balik dari setiap tahapan sebelumnya. (Kusnawi, 2007).

(33)

Gambar 2.1.Tahap-tahap penambangan data.( Han, J., et al,2006) Tahap – tahap tersebut, bersifat interaktif dimana pemakai terlibat langsung atau dengan perantaraan knowledge base.

1. Pembersihan data 2. Integrasi data 3. Transformasi data

4. Aplikasi teknik penambangan data (data mining) 5. Evaluasi pola yang ditemukan

6. Presentasi pengetahuan

2.5.2 Pengelompkan Data Mining

Data mining dibagi menjadi beberapa kelompok berdasarkan tugas yang dapat dilakukan, yaitu (Larose, 2005).

(34)

Terkadang peneliti dan analis secara sederhana ingin mencoba mancari cara untuk menggambarkan pola dan kecendrungan yang terdapat dalam data. Deskripsi dari pola dan kecendrungan sering memberikan kemungkinan penjelasan untuk suatu pola atau kecendrungan.

2. Estimasi

Estimasi hampir sama dengan klasifikasi, kecuali variabel target estimasi lebih ke arah numerik dari pada ke arah kategori.

3. Prediksi

Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa dalam prediksi nilai ari hasil akan ada di masa mendatang.

4. Klasifikasi

Dalam klasifikasi, terdapat target variabel kategori. 5. Pengklusteran

Pengklusteran merupakan pengelompokkan record, pengamatan, atau memperhatikan dan membentuk kelas objek-objek yang memiliki kemiripan.

6. Asosiasi

Tugas asosiasi dalam data mining adalah menemukan atribut yang muncul dalam satu waktu.

2.6 Clustering

Clustering adalah suatu metode pengelompokan berdasarkan ukuran kedekatan(kemiripan).Clustering berbeda dengan group, kalau group berarti kelompok yang samakondisinya kalau tidak ya pasti bukan kelompoknya.Tetapi kalau cluster tidak harus sama akan tetapi pengelompokannya berdasarkan pada kedekatan dari suatu karakteristik sample yang ada, salah satunya dengan menggunakan rumus jarak euclidean.Aplikasinya cluster ini sangat banyak,

(35)

karena hampir dalam mengidentifikasi permasalahan atau pengambilan keputusan selalu tidak sama persis akan tetapi cenderung memiliki kemiripan saja. (Edi satriyanto, M,Si)

Clustering adalah suatu alat untuk analisa data, yangmemecahkan permasalahan penggolongan.(http://www.bandmservices.com)

Clustering berarti penyatuan sekelompok data yang mempunyai korelasi atau karakteristik sejenis atau dengan kata lain mempunyai kemiripan (http:www//bestbuydoc.com).

2.7 K-Means

K-Means merupakan algoritma clustering yang berulang. Algoritma K-Means dimulai dengan pemilihan secara acak K, K disini merupakan banyaknya cluster yang ingin dibentuk kemudian tetapkan nilai-nilai K secara acak, untuk sementara nilai tersebut menjadi pusat dari cluster atau biasa disebut dengan centroid, mean atau “means” hitung jarak setiap data yang ada terhadap masing-masing centroid menggunakan rumus Euclidean hingga ditemukan jarak yang paling dekat dari setiap data dengan centroid. Klasifikasikan setiap data berdasarkan kedekatannya dengan centroid. Lakukan langkah tersebut hingga nilai centroid stabil.(Rismawan, 2008).

Sebagai gambaran, akan diambil contoh kasus berikut : anda diberi data tentang 8 nasabah yang pernah memperoleh kredit dari Bank Bhatara Putra. Selain itu, data mereka menyangkut jumlah rumah dan jumlah mobil yang mereka miliki data lengkapnya sebagai berikut :

(36)

Tabel 2.1 Sampel Data

Nasabah Jumlah Rumah Jumlah Mobil

A 1 3

B 3 3

C 4 3

D 5 3

E 1 2

F 4 2

G 1 1

H 2 1

Kita akan menerapkan algoritma K-Means pada data di atas. Adapun langkah-langkah pada algoritma K-Means adalah sebagai berikut :

1. Tentukan K.

2. Pilih K buah catatan dari sekian catatan yang ada sebagai pusat kelompok awal (mi)

3. Untuk langkah ke – 3 ini lakukan :

a. Untuk setiap catatan, tentukan pusat kelompok terdekatnya dan tetapkan catatan tersebut sebagai kelompok anggota dari kelompok yang terdekat pusat kelompoknya.

b. Hitung BCV ( Between Cluster Variation ) = Jarak Antar Cluster c. Hitung WCV( Within cluster Variation ) = Jarak antara anggota

dalam Cluster. d. rasio = BCV

WCV

e. Bandingkan rasio tersebut dengan rasio sebelumnya jika sudah ada, jika rasio tersebut nilainya semakin besar maka lanjutkan ke langkah ke -4, namun jika tidak hentikan prosesnya.

4. Perbaharui pusat-pusat kelompok (bedasarkan kelompok yang di dapat dari langkah ke – 3) dan kembalilah ke langkah ke-3.

Implementasi dari algoritma k-means untuk kasus di atas adalah sebagai berikut ini :

(37)

2) B  m1 = (3,3) E  m2 = (1,2) F  m3.= (4,2) 3) Iterasi 1

A  C1= 1−3 2₊ ₃₋₃ 2₌₋₂ 2₊ ₀ 2₌ _{4 = 2}

C2 = 1−1 2₊ ₃₋₂ 2₌ ₀ 2₊ ₁ 2₌ _{1 = 1}

C3 = 1−4 2+ 3−2 2= −3 2+ 1 2= 10 = 3,162 Dari hasil tersebut diperoleh tabel iterasi 1 sebagai berikut :

Tabel 2.2 Tabel Iterasi 1

Catatan C1 C2 C3 Jarak Terdekat

A 2 1 3,162 C2

B 0 2,236 1,414 C1

C 1 3,162 1 C3

D 2 4,123 1,414 C3

E 2,236 0 3 C2

F 1,414 3 0 C3

G 2,828 1 3,162 C2

H 2,236 1,414 2,236 C2

Dari tabel iterasi 1 C1 = B  (3,3) C2 = A,E,G,H

= (1,3), (1,2), (1,1), (2,1) C3 =.C, D, F

(38)

= (4,3), (15,3), (4,2)

 Hitung BCV

BCV = d (m1, m2) + d (m2, m3) + d (m1,m3)

= 3−1 2₊ ₃−₂ 2₊ ₁−₄ 2₊ ₂−₂ 2₊ ₃−₄ 2₊ ₃−₂ 2 = 2 2₊ ₁ 2₊ −₃ 2₊ ₀ 2₊ −₁ 2₊ ₁ 2

= 5 + 9 + 2

= 2,263 + 3 + 1,414 = 6,650

 Hitung WCV (diambil dari jarak terdekat) A  C2 = 1

B  C1 = 0 C  C3 = 1 D  C3 = 1,414 E  C2 = 0 F  C3 = 0 G  C2 =1 H  C2 = 1,414

WCV = (1)2 + (0)2 + (1)2 + (1,414)2 +(0)2 + (0)2 + (1)2 + (1,414)2 = 1 + 0 + 1 + 1,999 + 0 + 0 + 1 +1,999 = 6,998

*Rasio =BCV

(39)

= 6,650

6,998= 0,950

4) m1 rata-rata C1 (mB) = (3,3) m2 rata-rata C2 (mA, mE, mG, mH)

(1,3) ; (1,2) ; (1,1) ; (2,1) 1+1+1+2

∶

3+2+1+1 4

 5

:

7 4

(1,25 ; 1,75)

m3rata-rata C3 (mC, mD, mF)

(4,3) ; (5,3) ; (4,2) (4+5+4)

∶

(3+3+2) 3

 13

:

8 3

(4,333 ; 2,666)

5) A  C1 = 1−3 2+ 3−3 2 = −2 2₊ ₀ 2 = 4 = 2

(40)

C2 = 1−1,25 2+ 3−1,75 2 = 0,25 2₊ _1,25 2

= 0,062 2₊ _1,562 2 = 1,624 = 1,274 C3= dst…

Dari hasil tersebut diperoleh tabel iterasi 2 sebagai berikut : Tabel 2.3 Tabel Iterasi 2

Catatan C1 C2 C3 Jarak

Terdekat

A 2 1,275 3,350 C2

B 0 1,768 1,374 C1

C 1 3,021 0,471 C3

D 2 3,953 0,745 C3

E 2,236 0,354 3,399 C2

F 1,414 2,813 0,745 C3

G 2,828 0,791 3,727 C2

H 2,236 1,061 2,867 C2

Dari tabel iterasi 2 C1 = B

C2 = A,E,G,H C3 =.C, D, F

= (4,3), (15,3), (4,2) *Hitung BCV

(41)

= (3−1,25)2_{+ (3}−_1,75)2₊ ₍₃−_4,333)2_{+ (3}−_2,666)2₊

(1,25−4,333)2_{+ (1,75}−_2,666)2

= (1,75)2_{+ (1,25)}2₊ ₍−_1,333)2_{+ (0,334)}2₊

(−3,083)2_{+ (}−_0,916)2 = 6,714

*Hitung WCV (diambil dari jarak terdekat) WCV = sama

= 4,833 *Rasio = BCV

WCV= 1,394

* Rasio ke-2 (1,394) lebih besar dari rasio ke 1 (0,950) sehingga proses dilanjutkan ke iterasi ke -3

6) m1 rata-rata (mB) = (3,3) m2 rata-rata (mA, mE, mG, mH) (1,25 ; 1,75)

m3rata-rata (mC, mD, mF) (4,333 ; 2,667)

(42)

Tabel 2.4 Tabel Iterasi 3

Catatan C1 C2 C3 Jarak Terdekat

A 2 1,275 3,350 C2

B 0 1,768 1,374 C1

C 1 3,021 0,471 C3

D 2 3,953 0,745 C3

E 2,236 0,354 3,399 C2

F 1,414 2,813 0,745 C3

G 2,828 0,791 3,727 C2

H 2,236 1,061 2,867 C2

Dari tabel iterasi 3 C1 = B

C2 = A,E,G,H C3 =.C, D, F *Hitung BCV BCV = 6,741

*Hitung WCV WCV = 4,833 *Rasio = BCV

(43)

Rasio 3 tidak lagi lebih besar nilainya dari rasio 2 sehingga algoritma dihentikan (Susanto; 2010 : 81-92).

2.8 Penelitian Terdahulu

Pada penulisan skripsi ini digunakan beberapa penelitian terdahulu yang berkaitan dengan skripsi ini:

Tabel 2.5.Penelitian Terdahulu

No Pengarang Judul Keterangan

1 Gerben W. Dekker, 2009

Predicting students drop out: a case study

Menyebutkan bahwa monitoring dan dukunganterhadap mahasiswa di tahun pertama sangat penting dilakukan. Mahasiswa jurusan teknik elektro Universitas Eindhovenyang berhenti studi pada tahun pertama mencapai hingga 40%. Kurikulum yang sulit dianggap sebagai salah satu penyebab tingginya jumlah mahasiswa drop out. Selain itu, nilai, prestasi, kepribadian, latar belakang sosial mempunyai peran dalam kesuksesan akademik mahasiswa. Dekker menggunakan algoritma Decision tree, Bayesian

(44)

classifiers, logistic models,

rule-based learner dan random forest.

Dalam penelitian ini, dilakukan analisis komparasi empat algoritma klasifikasi data mining yaitu logistic regression,decision tree, naïve bayes dan neural network dengan menggunakan 3681 data set mahasiswa yang terdiri atas datademografi dan akademik mahasiswa sehingga dapat diketahui algoritma yang paling akurat untuk memprediksi mahasiswa non-aktif.

2 Md.

Hedayetul Islam Shovon, Mahfuza Haque, 2012

An Approach of Improving Student’s Academic Performance by using K-means clustering algorithm and Decision tree

Dalam penelitianini mereka menggunakan proses data mining dalam database siswa menggunakan algoritma k-means clustering dan teknik pohon keputusan untuk memprediksi kegiatan belajar siswa. Mereka

berharap bahwa informasi yang dihasilkan setelah penerapan teknik pertambangan dan pengelompokan data data dapat membantu untuk instruktur serta bagi siswa. Karya ini dapat meningkatkan kinerja siswa, mengurangi rasio gagal dengan

(45)

mengambil langkah yang tepat pada waktu yang tepat untuk meningkatkan kualitas pendidikan. Untuk pekerjaan di masa depan, kami berharap dapat memperbaiki teknik kam iuntuk mendapat kanoutput lebih berharga dan akurat, berguna untuk instruktur untuk meningkatkan hasil belajar siswa.

3 Bhise R.B., Thorat S.S., Supekar A.K., 2013

Importance of Data Mining in Higher Education System

Dalam studi ini mereka membuat penggunaan proses data mining dalam database siswa menggunakan K-means algoritma untuk memprediksi hasil siswa. Mereka berharap bahwa informasi yang dihasilkan setelah pelaksanaan data Teknik pertambangan dapat membantu untuk instruktur serta bagi siswa. Untuk pekerjaan di masa depan mereka mendefinisikan teknik mereka untuk mendapatkan output yang lebih berharga dan akurat yang berguna instruktur untuk meningkatkan hasil belajar siswa. Beberapa perangkat lunak yang berbeda mungkin akan memanfaatkan sementara pada kadang-kadang berbagai faktor

(46)

akan digunakan. 4 Eko Nur

Wahyudi, Arief Jananto dan Narwati, 2011

Analisa Profil Data Mahasiswa Baru terhadap Program Studi yang dipilih di

Perguruan Tinggi Swasta Jawa Tengah dengan Menggunakan Teknik Data Mining

Berdasarkan analisa profil data mahasiswa baru terhadap program studi yang dipilih di perguruan tinggi swasta jawa tengah dengan menggunakan teknik data mining maka dapat disimpulkan bahwa :

1. Data mining dengan teknik klustering pada data mahasiswa baru pada PTS di lingkungan Kopertis Wilayah VI Jawa Tengah berdasarkan jumlah mahasiswa yang melakukan registrasi menghasilkan informasi mengenai kelompok bidang ilmu dan program studi mulai dari jumlah yang paling banyak hingga jumlah yang paling sedikit 2. Hasil klastering

menunjukkan bahwa beberapa bidang ilmu mempunyai dominasi yang cukup tinggi terhadap minat masuk mahasiswa baru, namun demikian tidak semua program studi yang ada pada bidang ilmu

(47)

yang dominan meraih jumlah mahasiswa yang banyak, hanya beberapa program studi saja yang memiliki dominasi yang cukup tinggi sesuai hasil klaster pada bidang ilmu 3. Trend minat mahasiswa

terhadap bidang ilmu cukup signifikan terhadap program studi yang dipilihnya

5 Ahmad Yusuf, Hari Ginardi dan Isye Arieshanti, 2012 Pengembangan Perangkat Lunak Prediktor Nilai Mahasiswa Menggunakan Metode Spectral Clustering dan Bagging Regresi Linier

Berdasarkan hasil penelitian yang telah dilakukan,terdapat beberapa kesimpulan yang dapat diambil, yaitu:

1. Perangkat lunak yang dikembangkan dengan algoritma Spectral

Clustering yang

mendukung algoritma Bootstrap Aggregating Regresi Linier terbukti

mampu melakukan

prediksi nilai mahasiswa. Hal ini terlihat dari nilai kesalahan RMSE sekitar 0.05 – 0.08 dari dataset yang digunakan.

(48)

dilakukan, perangkat lunak yang memanfaatkan algoritma Spectral

Clustering yang

mendukung Bootstrap Aggregating Regresi Linier memiliki performa yang lebih baik jika dibandingkan dengan perangkat lunak yang menggunakan algoritma K-Means Clustering.

3. Parameter jumlah cluster yang tidak tepat dapat menyebabkan kesalahan hasil prediksi yang cukup tinggi.

4. Dari uji coba yang dilakukan, jumlah atribut prediktor yang lebih banyak dapat menghasilkan hasil prediksi menjadi lebih baik.

2.9 Visual Basic.Net

Microsoft Visual Basic.Net merupakan bagian dari kelompok bahasa pemrograman Visual Studio yang dikembangkan oleh Microsoft.Visual Studio terdiri dari beberapa bahasa pemrograman diantaranya adalah Microsoft Visual Basic.Net, Microsoft Visual C#.Net, Microsoft Visual C++.Net, dan lain-lain.

(49)

Visual Studio ini telah mengalami perubahan versi mulai dari Visual Studio 6.0, Visual Studio 2005, Visual Studio 2006, Visual Studio 2008, Visual Studio 2010. Visual Studio 2011, dan Visual Studio 2012.

Microsoft Visual Basic.Net memiliki kelebihan-kelebihan yaitu suport dengan bahasa queryLanguange- Integreted Query (LINQ) dan suport dengan database Microsoft SQL Server. Selain itu, kelebihan lain adalah memiliki Object Relation Designer (O/R Designer) untuk membantu mengedit LINQ ke SQL dihubungkan dengan database dan fiture lain, seperti WPF (Windows Presentation Foundation) dan WCF (Windows Communication Foundation). Semua hal yang baru tersebut di atas menambah kelengkapan aplikasi Microsoft Visual Basic.Net dalam membuat media dan dokumen. (Raharjo, Budi ; 2011)

Microsoft Visual Basic.Net menggunakan teknologi .Netyang didasarkan atas susunan berupa .NetFramework, sehingga setiap produk baru yang terkait dengan teknologi .Netakan selalu berkembang mengikuti perkembangan .Net Framwork-nya. Pada perkembangan nantinya, mungkin untuk membuat program dengan teknologi .Net, dan memungkinkan para pengembang perangkat lunak akan dapat menggunakan lintas sistem operasi, yaitu dapat dikembangkan di sistem operasi Windows juga dapat dijalankan pada sistem operasi Linux, seperti yang telah dilakukan pada pemrograman Java oleh Sun Microsystem. Pada saat ini perusahaan-perusahaan sudah banyak meng-update aplikasi yang lama yang dibuat dengan Microsoft Visual Basic 6.0 ke teknologi.Net karena kelebihan-kelebihan yang ditawarkan, terutama memungkinkan pengembang perangkat lunak secara cepat mampu membuat program yang robust, serta berbasiskan intergrasi ke internet yang dikenal dengan XML Web Service. (Ketut Darmayuda ; Pemrograman Aplikasi Database dengan Microsoft Visual Basic .Net 2008 ; 2009 :1-2).

(50)

BAB III

ANALISIS DAN PERANCANGAN SISTEM

3.1. Analisis

Sub bab ini berisikan tentang analisis sistem yang akan dibangun. Sub bab ini membahas teknik pemecahan masalah yang menguraikan sebuah sistem menjadi bagian-bagian komponen dengan tujuan mempelajari seberapa baik bagian-bagian komponen tersebut bekerja dan berinteraksi.

3.1.1 Analisis Masalah

Dari hasil analisis dijumpai masalah sebagai berikut :

1. Perguruan tinggi adalah salah satu institusi yang sudah pasti memiliki data yang tidak kecil volumenya. Database perguruan tinggi menyimpan data

(51)

akademik, administrasi dan data mahasiswa. Data tersebut apabila digali dengan tepat maka dapat diketahui pola atau pengetahuan untuk mengambil keputusan

2. Pemahaman informasi mahasiswa yang potensial drop out penting untuk diketahui, pemahaman dapat dilakukan dengan mengungkapkan pengetahuan yang dimiliki untuk memahami, mengelompokkan, dan pencegahan kegagalan adalah sangat penting bagi managemen perguruan tinggi. Pengetahuan ini dapat digunakan dalam membantu pihak perguruan tinggi untuk lebih mengenal situasi para mahasiswanya, dan dapat dijadikan sebagai pengetahuan dini dalam proses pengambilan keputusan untuk tindakan preventif dalam hal mengantisipasi mahasiswa-mahasiswa potensial drop-out, untuk meningkatkan prestasi mahasiswa, untuk meningkatkan kurikulum, meningkatkan proses kegiatan belajar dan mengajar dan banyak lagi keuntungan lain yang bisa diperoleh dari hasil penambangan data.

3. Evaluasi merupakan salah satu dasar untuk memantau perkembangan prestasi akademik mahasiswa di dalam perguruan tinggi dan pengelompokkan mahasiswa kedalam kategori yang berbeda sesuai dengan prestasi mereka menjadi tugas yang rumit. Dengan pengelompokkan mahasiswa secara tradisional berdasarkan nilai rata-rata mereka, maka sulit untuk memperoleh pandangan yang menyeluruh mengenai keadaan prestasi mahasiswa. Dengan bantuan teknik data mining, seperti algoritma clustering, memungkinkan untuk menemukan karakteristik-karakteristik dari prestasi mahasiswa dan menggunakan karakteristik mereka untuk memprediksi prestasi dimasa depan.

3.1.2 Analisis Data Sistem

Data sampel yang digunakan dalam penelitian inidiperoleh dari administrasi akademik Universitas Sumatera Utara Fakultas Ilmu Komputer dan Teknologi Informasi. Adapun data yang dijadikan sampel dalam penelitian ini adalah data mahasiswa dan data transkrip mahasiswa program studi Ilmu Komputer dan

(52)

Teknologi Informasi untuk angkatan 2010 dan 2011. Dengan total jumlah data sampel sebanyak 473 data dengan rincian sebagai berikut :

Tabel 3.1 Data Sampel Penelitian

Angkatan Program Studi Jumlah Data

Teknologi Informasi Ilmu Komputer

2010 113 100 213

2011 117 143 260

Total Data 473

Untuk angkatan 2010, data transkrip niai yang dijadikan objek pengelompokkan adalah data IP untuk semester ganjil 2010, semester genap 2010, semester ganjil 2011, semester genap 2011, dan semester ganjil 2012.Sedangkan untuk angkatan 2011, data transkrip niai yang dijadikan objek pengelompokkan adalah data IP untuk semester ganjil 2011, semester genap 2011, dan semester ganjil 2012.

3.1.3 Analisis Kebutuhan Fungsional

Kebutuhan fungsional adalah jenis kebutuhan yang berisi proses-proses apa saja yang nantinya dilakukan oleh sistem. Kebutuhan fungsional juga berisi informasi-informasi apa saja yang harus ada dan dihasilkan oleh sistem. Berikut kebutuhan fungsional yang terdapat pada sistem yang dibangun :

1. Mengimplementasikan penggunaan Visual Basic.Net dalam membuat Aplikasi Pengelompokan mahasiswa potensial Drop Out Akademik Dengan Menggunakan Metode Clustering Pada Program Studi Teknologi Informasi dan Ilmu Komputer Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Sumatera Utara T.A. 2010/2011.

2. Algoritma yang digunakan dalam melakukan clusterring adalah algoritma K-Means.

(53)

3. Objek yang dikelompokkan adalah nilai Indeks Prestasi Mahasiswa.

4. Hasil yang didapatkan dari aplikasi ini adalah kelompok mahasiswa potensial drop out pada masing-masing angkatan (2010/2011) dan program studi (Teknologi Informasi/Ilmu Komputer).

3.1.4 Analisis Kebutuhan Non Fungsional

Kebutuhan ini adalah tipe kebutuhan yang berisi properti perilaku yang dimiliki oleh sistem. Berikut adalah kebutuhan nonfungsional yang dimiliki sistem :

1.Digunakan pada sistem operasi Microsoft Windows, minimal Microsoft Windows XP SP3.

2.Aplikasi dibangun dengan menggunakan komponen sebagai berikut :

a. Paket software Visual Studio 2010, untuk aplikasi pemrograman aplikasi, bahasa pemrograman yang digunakan adalah Visual Basic 2010.

b. Paket software XAMPP yang akan difungsikan sebagai DBMS MySQL.

3.Spesifikasi komputer standard Processor Pentium IV 2,6 GHz, Memori 512 MB, Kartu Grafik 128 MB.

3.2 Perancangan Sistem

Sub bab ini berisikan tentang rancangan sistem yang akan dibangun, dalam hal ini perancangan terhadap sistem.

3.2.1 Diagram Context

Diagram context atau disebut juga diagram sistem inti (fundamental system model) atau DFD Level 0 adalah penggambaran desain informasi yang diaplikasikan pada saat data bergerak dari input menjadi output secara garis besar.

(54)

Gambar 3.1 Diagram Context

Keterangan gambar :

User : Pengguna aplikasi

Jlh cluster = 3 : Jumlah cluster awal yang diberikan adalah 3 buah statistik : Data proses dari masing-masing iterasi yang terjadi Data prediksi drop out : Output yang diterima user berupa data prediksi drop out

3.2.2 Data Flow Diagram Level 1 User

Jlh Cluster = 3

Statistik

Data Kelompok Potensial drop out

Pengelompokan mahasiswa potensial Drop Out

Akademik Dengan Menggunakan Metode Clustering Pada Program Studi Teknologi Informasi dan Ilmu Komputer Fakultas

Ilmu Komputer dan Teknologi Informasi Universitas Sumatera Utara

(55)

user 1 Proses Clustering

2 Prediksi DO jlh cluster = 3

statistik

centroid_x

centroidb_x Data IP angkatan 2010 tercluster

Data IP angkatan 2011 tercluster

Cluster data IP angkatan 2010

Cluster data IP angkatan 2011 Data prediksi DO

Gambar 3.2 DFD Level 1 Keterangan gambar :

User : Pengguna aplikasi

Jlh cluster = 3 : Jumlah cluster awal yang diberikan adalah 3 buah Statistik : Data proses dari masing-masing iterasi yang terjadi Data IP Angkatan 2010

tercluster

: Data dari hasil proses clustering untuk IP angkatan 2010

Data IP Angkatan 2011 tercluster

: Data dari hasil proses clustering untuk IP angkatan 2011

Centroid_x : Tabel untuk menampung data hasil proses iterasi untuk mahasiswa angkatan 2010

Centroidb_x : Tabel untuk menampung data hasil proses iterasi untuk mahasiswa angkatan 2011

Cluster data IP angkatan 2010

: Data cluster hasil proses iterasi untuk mahasiswa angkatan 2010

Cluster data IP angkatan 2011

: Data cluster hasil proses iterasi untuk mahasiswa angkatan 2011

Data prediksi DO : Output yang diterima user berupa data kelompok

Kelompok DO

(56)

mahasiswa potensial drop out

3.2.3 Flow Chart

mulai

Jumlah Centroid = 3

m1 = 0.404 m2 = 2.052 m3 = 3.144

Baca data IP mahasiswa (prodi TI dan Ilkom angkatan 2010 dan

angkatan 2011)

Hitung jarak setiap data dengan masing-masing

centroid

Pengelompokkan data berdasarkan jarak terdekat pada

masing-masing centroid

EOF tidak

Perubahan centroid cluster baru (m1,m2,m3

baru)

Hitung BCV

Hitung WCV

Hitung Ratio

Perubahan centroid cluster baru (m1,m2,m3

baru) Apakah rasio sebelumnya sudah

ada ?

Rasio sekarang <= rasio sebelumnya ? tidak

selesai _ya tidak

Gambar 3.3 Flowchart Keterangan flowchart :

1. Penentuan k  k = 3 (C1, C2, C3)

2. Untuk mendapatkan m1, penulis mencari nilai min yang terdapat pada data transkrip nilai mahasiswa angkatan 2010 pada nilai ganjil_2010, genap_2010,ganjil_2011, genap_2011, ganjil_2012

Kemudian dari nilai – nilai ini penulis mengambil nilai rata-ratanya sehingga didapatkan m1 = 0.404

(57)

Kemudian untuk mencari m2, penulis mencari nilai rata-rata dari rata-rata yang terdapat pada data transkrip nilai mahasiswa angkatan 2010 pada nilai ganjil_2010, genap_2010,ganjil_2011, genap_2011, ganjil_2012 , sehingga didapatkan hasil sebagai berikut :

Dari data tersebut didapatkan nilai m2 = 2.052

Kemudian untuk mencari nilai m3, penulis mencari nilai rata-rata dari nilai tertinggi yang terdapat pada data transkrip nilai mahasiswa angkatan 2010 pada nilai ganjil_2010, genap_2010,ganjil_2011, genap_2011, ganjil_2012”, sehingga didapatkan hasil sebagai berikut :

Dari data tersebut didapatkan nilai m3 = 3.144

3. Baca data IP Mahasiswa, diambil dari prodi Teknologi informasi dan Ilmu Komputer untuk angkatan 2010 dan angkatan 2011

4. Hitung jarak setiap data dengan masing-masing centroid, Untuk mendapatkan jarak dari masing-masing IP mahasiswa ke C1, C2, dan C3 digunakan rumus

euclidean distance sebagai berikut :

Iterasi 1 : Berdasarkan data yang ada dapat di ambil satu contoh untuk proses perhitungan Cluster (C), dimana :

K = 3 m1 = 0,404 m2 = 2,052 m3 = 3,144 maka :

(58)

C1=

�� 2010−0,4042₊ �� ₂₀₁₀−_0,404 2₊

�� 2011−0,4042₊ ��_� _{� ��}₂₀₁₁₋_0,404 2₊

�� 2012−0,404 2

= 2,6−0,404 2₊ _2,9−_0,404 2₊ _3,18−_0,404 2₊ _2,83−_0,404 2₊ ₀−_0,404 2

= 4,8224 + 6,23 + 7,7062 + 5,8855 + 0,1632 = 24,8073

= 4,980693

C2=

�� 2010−2,0522₊_��_� _{� ��}₂₀₁₀₋_2,052 2₊

�� 2011−2,0522₊_��_� _{� ��}₂₀₁₁₋_2,052 2₊

�� 2012−2,052 2

= 2,6−2,052 2₊ _2,9−_2,052 2₊ _3,18−_2,0522₊ _2,83−_2,052 2₊ ₀−_2,052 2 = 0,300304 + 0,719104 + 1,272384 + 0,605284 + 4,210704

= 7,10778 = 2,6660421

C3=

�� 2010−3,1442₊_��_� _{� ��}₂₀₁₀₋_3,144 2₊

�� 2011−3,1442₊ �� ₂₀₁₁−_3,144 2₊

�� 2012−3,144 2

= 2,6−3,1442₊ _2,9₋_3,1442₊ _3,18₋_3,144 2₊ _2,83₋_3,144 2₊ ₀₋_3,144 2

= 0,295936 + 0,059536 + 0,001296 + 0,098596 + 9,884701 = 10,3401= 3,215602581

Cara di atas dilakukan untuk masing-masing data.

5. Kelompokkan data berdasarkan jarak terdekat dengan centroid Dari hasil tersebut diperoleh tabel iterasi 1 sebagai berikut :

(59)

Gambar 3.4 Tabel Iterasi 1

6. Jika belum EOF, ulangi langkah 3 sampai langkah ke 5, jika sudah EOF, update perubahan centroid terbaru

7. Hitung BCV

BCV = d (m1, m2) + d (m2, m3) + d (m1,m3) Dimana :

m1 = 0,404 m2 = 2,052 m3 = 3,144

BCV = 0,404−2,052 2₊ _4,404₋_3,144 2₊ _2,052₋_3,144 2 = −1,684 2₊ −_2,740 2₊ −_1,092 2

= 2,715904 + 7,5076 + 1,192464

= 11,415968 = 3,378752

8. Hitung WCV

WCV = =1 _�= (�, )2

dari data setelah di hitung di peroleh nilai WCV = 1614,6384 9. Hitung rasio

(60)

Ratio =

= 3,378752

1614 ,638 = 0,00209257555

Kemudian hitung mi (m1,m2,m3) untuk iterasi yang ke 2

m

=

dari tabel hasil iterasi, didapat untuk ∑ C1 = 50,52682 dan untuk n1 = 35, ∑ C2 = 330,5643 dan untuk n2 = 122, ∑ C3 = 172,6519 dan untuk n3 = 56

maka :

m1 = 50,52682

35 = 1,443623

m2 = 330,5643

122 = 2.709543

m3 = 50,172,6519

56 = 3.257545

kemudian ulangi langkah ke 7 sampai 9 untuk menghitung BCV,WCV dan Ratio untuk melakuan iterasi yang ke 3.

10.Bandingkan rasio tersebut dengan rasio sebelumnya jika sudah ada, jika rasio tersebut nilainya semakin besar maka lanjutkan ke langkah berikutnya namun jika tidak hentikan prosesnya.

3.3 Rancangan Antarmuka Pengguna

Berikut ini adalah paerancangan tampilan yang akan dibangun oleh penulis dalam “Pengelompokan mahasiswa potensial Drop Out Akademik Dengan Menggunakan Metode Clustering Pada Program Studi Teknologi Informasi dan

(61)

Ilmu Komputer Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Sumatera Utara T.A. 2010/2011”.

3.3.1 Rancangan Antarmuka Menu Utama Aplikasi

Gambar 3.5 Rancangan Antarmuka Menu Utama Aplikasi

Rancangan antarmuka ini merupakan form awal yang akan ditampilkan pada saat aplikasi dijalankan, pengguna diharuskan memilih angkatan yang akan di-cluster.

3.3.2 Rancangan Antarmuka Pembacaan Data IP Mahasiswa

Pengelompokan mahasiswa potensial Drop Out Akademik Dengan Menggunakan Metode

Clustering Pada Program Studi Teknologi Informasi dan Ilmu Komputer Fakultas Ilmu Komputerdan Teknologi Informasi Universitas Sumatera Utara

T.A 2010/2011

LANJUT ᴠ K-Means

Clustering

Pilih Angkatan

K-Means Clustering Angkatan 2010

NIM

Nama

Mahasiswa Angktan

Program

(62)

Gambar 3.6 Rancangan Antarmuka Pembacaan Data IP Mahasiswa Rancangan antarmuka ini adalah antarmuka yang akan menampilkan data lengkap mahasiswa sesuai dengan angkatan yang dipilih, adapun data yang akan ditampilkan adalah nim, nama_lengkap, angkatan, program_studi, ganjil_2010, genap_2010, ganjil_2011, genap_2011, ganjil_2012.

(63)

Gambar 3.7 Tampilan Data Rancangan Antarmuka Pembacaan Data IP Mahasiswa

(64)

3.3.3 Rancangan Antarmuka Iterasi – 1

Gambar 3.8 Rancangan Antarmuka Iterasi-1

Rancangan antarmuka ini adalah antarmuka yang akan menampilkan data iterasi-1 sesuai dengan angkatan yang dipilih, adapun data yang akan ditampilkan adalah penghitungan jarak setiap data dengan masing-masing centroid, Untukmendapatkan jarak dari masing-masing IP mahasiswa ke C1, C2, dan C3 digunakan rumus euclidean distance sebagai berikut :

Iterasi-1

Angkatan 2010

M2 M3

BCV MCV Ratio

(65)

3.3.4 Rancangan Antarmuka Iterasi – n

Gambar 3.9 Rancangan Antarmuka Iterasi-n

Rancangan antarmuka ini adalah antarmuka yang akan menampilkan data iterasi-n sesuai dengan angkatan yang dipilih, adapun data yang akan ditampilkan adalah nilai m1, m2, dan m3 berdasarkan ietrasi sebelumnya, penghitungan jarak

Iterasi-n

Angkatan 2010

M1 M2 M3

BCV MCV Ratio

(66)

setiap data dengan masing-masing centroid, Untuk mendapatkan jarak dari masing-masing IP mahasiswa ke C1, C2, dan C3 digunakan rumus euclidean distance juga.Lalu ditampilkan juga nilai BCV, WCV, dan rasio yang menjadi barometer dihentikan atau diteruskannya iterasi.

3.3.5 Rancangan Antarmuka Menu Pilihan Cetak Data Pengelompokkan

Gambar 3.10 Rancangan Antarmuka Menu Pilihan Cetak Data Pengelompokan Potensial DO

Rancangan antarmuka ini adalah antarmuka yang akan menampilkan pilihan untuk mencetak data mahasiswa yang dikelompokkan potensial DO. Pilihan yang diberikan ada dua yakni prodi “Teknologi Informasi” dan “Ilmu Komputer”.

CETAK MAHASISWA YANG DI KELOMPOKKAN POTENSIAL DO (ANGKATAN 2010)

Program Studi

TEKNOLOGI INFORMASI

(1)

"'),2))+(pow((transkrip.ganjil_2012-'" & Val(lblm3.Text) & "'),2)))) < " & _

"(SQRT((pow((transkrip.ganjil_2011-'" & Val(lblm1.Text) & "'),2))+(pow((transkrip.genap_2011-'" & Val(lblm1.Text) &

"'),2))+(pow((transkrip.ganjil_2012-'" & Val(lblm1.Text) & "'),2)))) and " & _

"(SQRT((pow((transkrip.ganjil_2011-'" & Val(lblm3.Text) & "'),2))+(pow((transkrip.genap_2011-'" & Val(lblm3.Text) &

"'),2))+(pow((transkrip.ganjil_2012-'" & Val(lblm3.Text) & "'),2)))) < " & _

"(SQRT((pow((transkrip.ganjil_2011-'" & Val(lblm2.Text) & "'),2))+(pow((transkrip.genap_2011-'" & Val(lblm2.Text) &

"'),2))+(pow((transkrip.ganjil_2012-'" & Val(lblm2.Text) & "'),2)))) " & _ "THEN 'C3' " & _

"END AS Jarak_Terdekat " & _

"FROM mahasiswa INNER JOIN transkrip on mahasiswa.Nim=transkrip.NIM where mahasiswa.Nim like '11%'", Conn)

ds = New DataSet ds.Clear()

da.Fill(ds, "mahasiswa")

DGV.DataSource = (ds.Tables("mahasiswa")) DGV.ReadOnly = True

End Sub Sub dgvku() With DGV

.Columns("NIM").HeaderText = "NIM" .Columns("NIM").Width = 70

.Columns("NIM").ReadOnly = True

.Columns("nama_lengkap").HeaderText = "NAMA MAHASISWA" .Columns("nama_lengkap").Width = 180

.Columns("nama_lengkap").ReadOnly = True .Columns("Angkatan").HeaderText = "ANGKATAN" .Columns("Angkatan").Width = 70

.Columns("Angkatan").ReadOnly = True

.Columns("Program_Studi").HeaderText = "PROGRAM STUDI" .Columns("Program_Studi").Width = 100

.Columns("Program_Studi").ReadOnly = True

.Columns("ganjil_2011").HeaderText = "GANJIL 2011" .Columns("ganjil_2011").Width = 50

.Columns("ganjil_2011").ReadOnly = True

.Columns("genap_2011").HeaderText = "GENAP 2011" .Columns("genap_2011").Width = 50

.Columns("genap_2011").ReadOnly = True

.Columns("ganjil_2012").HeaderText = "GANJIL 2012" .Columns("ganjil_2012").Width = 50

.Columns("ganjil_2012").ReadOnly = True .Columns("c1").HeaderText = "C1"

.Columns("c1").Width = 120 .Columns("c1").ReadOnly = True .Columns("c2").HeaderText = "C2" .Columns("c2").Width = 120 .Columns("c2").ReadOnly = True .Columns("c3").HeaderText = "C3" .Columns("c3").Width = 120 .Columns("c3").ReadOnly = True

(2)

.Columns("jarak_terdekat").HeaderText = "JARAK TERDEKAT" .Columns("jarak_terdekat").Width = 120

.Columns("jarak_terdekat").ReadOnly = True End With

End Sub

Sub djieChangeColorGrid(ByVal pDataGridView As System.Windows.Forms.DataGridView)

For Each iRow As DataGridViewRow In pDataGridView.Rows For Each iCell As DataGridViewCell In iRow.Cells If iRow.Index Mod 2 = 0 Then

iCell.Style.BackColor = Color.GreenYellow Else

iCell.Style.BackColor = Color.White End If

Next Next End Sub Sub tampil()

cmd = New OdbcCommand("SELECT mahasiswa.nim,

mahasiswa.Nama_Lengkap, mahasiswa.Angkatan, mahasiswa.Program_Studi, " & _ "transkrip.Ganjil_2011, transkrip.Genap_2011, transkrip.Ganjil_2012, " & _

"SQRT((pow((transkrip.ganjil_2011-'" & Val(lblm1.Text) & "'),2))+(pow((transkrip.genap_2011-'" & Val(lblm1.Text) &

"'),2))+(pow((transkrip.ganjil_2012-'" & Val(lblm1.Text) & "'),2))) as C1, " & _

"SQRT((pow((transkrip.ganjil_2011-'" & Val(lblm2.Text) & "'),2))+(pow((transkrip.genap_2011-'" & Val(lblm2.Text) &

"'),2))+(pow((transkrip.ganjil_2012-'" & Val(lblm2.Text) & "'),2))) as C2, " & _

"SQRT((pow((transkrip.ganjil_2011-'" & Val(lblm3.Text) & "'),2))+(pow((transkrip.genap_2011-'" & Val(lblm3.Text) &

"'),2))+(pow((transkrip.ganjil_2012-'" & Val(lblm3.Text) & "'),2))) as C3, " & _

"CASE " & _

"WHEN (SQRT((pow((transkrip.ganjil_2011-'" & Val(lblm1.Text) & "'),2))+(pow((transkrip.genap_2011-'" & Val(lblm1.Text) &

"'),2))+(pow((transkrip.ganjil_2012-'" & Val(lblm1.Text) & "'),2)))) < " & _

"(SQRT((pow((transkrip.ganjil_2011-'" & Val(lblm2.Text) & "'),2))+(pow((transkrip.genap_2011-'" & Val(lblm2.Text) &

"'),2))+(pow((transkrip.ganjil_2012-'" & Val(lblm2.Text) & "'),2)))) and " & _

"(SQRT((pow((transkrip.ganjil_2011-'" & Val(lblm1.Text) & "'),2))+(pow((transkrip.genap_2011-'" & Val(lblm1.Text) &

"'),2))+(pow((transkrip.ganjil_2012-'" & Val(lblm1.Text) & "'),2)))) < " & _

"(SQRT((pow((transkrip.ganjil_2011-'" & Val(lblm3.Text) & "'),2))+(pow((transkrip.genap_2011-'" & Val(lblm3.Text) &

"'),2))+(pow((transkrip.ganjil_2012-'" & Val(lblm3.Text) & "'),2)))) " & _ "THEN 'C1' " & _

"WHEN (SQRT((pow((transkrip.ganjil_2011-'" & Val(lblm2.Text) & "'),2))+(pow((transkrip.genap_2011-'" & Val(lblm2.Text) &

(3)

"'),2))+(pow((transkrip.ganjil_2012-'" & Val(lblm2.Text) & "'),2)))) < " & _

"(SQRT((pow((transkrip.ganjil_2011-'" & Val(lblm1.Text) & "'),2))+(pow((transkrip.genap_2011-'" & Val(lblm1.Text) &

"'),2))+(pow((transkrip.ganjil_2012-'" & Val(lblm1.Text) & "'),2)))) and " & _

"(SQRT((pow((transkrip.ganjil_2011-'" & Val(lblm2.Text) & "'),2))+(pow((transkrip.genap_2011-'" & Val(lblm2.Text) &

"'),2))+(pow((transkrip.ganjil_2012-'" & Val(lblm2.Text) & "'),2)))) < " & _

"(SQRT((pow((transkrip.ganjil_2011-'" & Val(lblm3.Text) & "'),2))+(pow((transkrip.genap_2011-'" & Val(lblm3.Text) &

"'),2))+(pow((transkrip.ganjil_2012-'" & Val(lblm3.Text) & "'),2)))) " & _ "THEN 'C2' " & _

"WHEN (SQRT((pow((transkrip.ganjil_2011-'" & Val(lblm3.Text) & "'),2))+(pow((transkrip.genap_2011-'" & Val(lblm3.Text) &

"'),2))+(pow((transkrip.ganjil_2012-'" & Val(lblm3.Text) & "'),2)))) < " & _

"(SQRT((pow((transkrip.ganjil_2011-'" & Val(lblm1.Text) & "'),2))+(pow((transkrip.genap_2011-'" & Val(lblm1.Text) &

"'),2))+(pow((transkrip.ganjil_2012-'" & Val(lblm1.Text) & "'),2)))) and " & _

"(SQRT((pow((transkrip.ganjil_2011-'" & Val(lblm3.Text) & "'),2))+(pow((transkrip.genap_2011-'" & Val(lblm3.Text) &

"'),2))+(pow((transkrip.ganjil_2012-'" & Val(lblm3.Text) & "'),2)))) < " & _

"(SQRT((pow((transkrip.ganjil_2011-'" & Val(lblm2.Text) & "'),2))+(pow((transkrip.genap_2011-'" & Val(lblm2.Text) &

"'),2))+(pow((transkrip.ganjil_2012-'" & Val(lblm2.Text) & "'),2)))) " & _ "THEN 'C3' " & _

"END AS Jarak_Terdekat " & _

"FROM mahasiswa INNER JOIN transkrip on mahasiswa.Nim=transkrip.NIM where mahasiswa.Nim like '11%'", Conn)

rd = cmd.ExecuteReader Do While rd.Read

On Error Resume Next nimnya = rd.Item("nim")

namanya = rd.Item("nama_lengkap") angkatannya = rd.Item("angkatan") prodinya = rd.Item("program_studi") ganjil2011 = rd.Item("Ganjil_2011") genap2011 = rd.Item("Genap_2011") ganjil2012 = rd.Item("Ganjil_2012") c1nya = rd.Item("C1")

c2nya = rd.Item("C2") c3nya = rd.Item("C3")

terdekatnya = rd.Item("Jarak_Terdekat") Call simpan_centroid_temp()

Call simpan_centroid_x() Loop

End Sub

Sub simpan_centroid_temp()

Dim sqltambah As String = "Insert into centroidb_temp (iterasi,terdekat) values " & _

(4)

"('3','" & terdekatnya & "')" cmd = New OdbcCommand(sqltambah, Conn) cmd.ExecuteNonQuery()

End Sub

Sub simpan_centroid_x()

Dim sqltambah As String = "Insert into centroidb_x

(nim,nama_lengkap,angkatan,prodi,ganjil_2011,genap_2011,ganjil_2012, " & _ "iterasi,c1,c2,c3,terdekat) values " & _

"('" & nimnya & "','" & namanya & "','" & angkatannya & "','" & prodinya & "','" & ganjil2011 & "', " & _

"'" & genap2011 & "','" & ganjil2012 & "','3','" & c1nya & "','" & c2nya & "','" & c3nya & "','" & terdekatnya & "')"

cmd = New OdbcCommand(sqltambah, Conn) cmd.ExecuteNonQuery()

End Sub

Sub hitung_bcv()

Dim bcvnya As Single Dim selisih1 As Single Dim selisih2 As Single Dim selisih3 As Single

Dim kuadrat_selisih1 As Single Dim kuadrat_selisih2 As Single Dim kuadrat_selisih3 As Single Dim jumlah_kuadrat As Single

selisih1 = (Val(lblm1.Text) - Val(lblm2.Text)) selisih2 = (Val(lblm1.Text) - Val(lblm3.Text)) selisih3 = (Val(lblm2.Text) - Val(lblm3.Text)) kuadrat_selisih1 = (selisih1) ^ 2

kuadrat_selisih2 = (selisih2) ^ 2 kuadrat_selisih3 = (selisih3) ^ 2

jumlah_kuadrat = kuadrat_selisih1 + kuadrat_selisih2 + kuadrat_selisih3

bcvnya = Math.Sqrt(jumlah_kuadrat) lblBCV.Text = bcvnya

End Sub

Sub hitung_wcv1()

On Error Resume Next

cmd = New OdbcCommand("select sum(pow(c1,2)) as jumlah_kuadrat_c1 from centroidb_x where terdekat ='C1' and iterasi='3'", Conn)

rd = cmd.ExecuteReader rd.Read()

wcv1 = rd.GetValue(0) End Sub

Sub hitung_wcv2()

On Error Resume Next

cmd = New OdbcCommand("select sum(pow(c2,2)) as jumlah_kuadrat_c2 from centroidb_x where terdekat ='C2' and iterasi='3'", Conn)

rd = cmd.ExecuteReader rd.Read()

wcv2 = rd.GetValue(0) End Sub

(5)

Sub hitung_wcv3()

On Error Resume Next

cmd = New OdbcCommand("select sum(pow(c3,2)) as jumlah_kuadrat_c3 from centroidb_x where terdekat ='C3' and iterasi='3'", Conn)

rd = cmd.ExecuteReader rd.Read()

wcv3 = rd.GetValue(0) End Sub

Sub hitung_wcv() Call hitung_wcv1() Call hitung_wcv2() Call hitung_wcv3() wcv = wcv1 + wcv2 + wcv3 lblWCV.Text = wcv

End Sub

Sub hitung_ratio()

lblRatio.Text = Val(lblBCV.Text) / Val(lblWCV.Text) End Sub

Private Sub Button1_Click(sender As System.Object, e As System.EventArgs) Handles Button1.Click

Call tampil() Call hitung_bcv() Call hitung_wcv() Call hitung_ratio() Button2.Visible = True End Sub

Private Sub Button2_Click(sender As System.Object, e As System.EventArgs) Handles Button2.Click

Form10.Show() End Sub

End Class

Form 10

Imports System.Data.Odbc Public Class Form10

Private Sub Button2_Click(sender As System.Object, e As System.EventArgs) Handles Button2.Click

cmd = New OdbcCommand("SELECT * FROM centroidb_x WHERE

terdekat='C1' AND iterasi='3' and prodi='Teknologi Informasi'", Conn) rd = cmd.ExecuteReader

rd.Read()

If rd.HasRows = True Then Lap.Show()

Lap.CRV.ReportSource = Nothing Lap.CRV.RefreshReport()

Lap.CRV.SelectionFormula = "{centroidb_x1.terdekat}='C1' and {centroidb_x1.iterasi}='3' and {centroidb_x1.prodi}='Teknologi Informasi'" Lap.CRV.ReportSource = Application.StartupPath &

(6)

Else

MsgBox("Data tidak ada", MsgBoxStyle.OkOnly, "Info") End If

End Sub

Private Sub Button1_Click(sender As System.Object, e As System.EventArgs) Handles Button1.Click

cmd = New OdbcCommand("SELECT * FROM centroidb_x WHERE terdekat='C1' AND iterasi='3' and prodi='ILMU KOMPUTER'", Conn) rd = cmd.ExecuteReader

rd.Read()

If rd.HasRows = True Then Lap.Show()

Lap.CRV.ReportSource = Nothing Lap.CRV.RefreshReport()

Lap.CRV.SelectionFormula = "{centroidb_x1.terdekat}='C1' and {centroidb_x1.iterasi}='3' and {centroidb_x1.prodi}='ILMU KOMPUTER'" Lap.CRV.ReportSource = Application.StartupPath &

"\laporan\do2011.rpt" Else

MsgBox("Data tidak ada", MsgBoxStyle.OkOnly, "Info") End If

End Sub

Private Sub Form10_Load(sender As System.Object, e As System.EventArgs) Handles MyBase.Load

Call Koneksi() End Sub

End Class

Lap.

Public Class Lap

Private Sub Lap_Load(ByVal sender As System.Object, ByVal e As System.EventArgs) Handles MyBase.Load

End Sub End Class

Pengelompokan Mahasiswa Potensial Drop Out Menggunakan Metode Clustering Pada Program Studi Strata 1 Ilmu Komputer Dan Teknologi Informasi Universitas Sumatera Utara

MENGGUNAKAN METODE CLUSTERING PADA PROGRAM

STUDI STRATA 1 ILMU KOMPUTER DAN TEKNOLOGI

INFORMASI UNIVERSITAS SUMATERA UTARA

NURUL MASITHAH GUCHI

071402059

PROGRAM STUDI TEKNOLOGI INFORMASI

FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI

UNIVERSITAS SUMATERA UTARA

MEDAN

2013

PENGELOMPOKAN MAHASISWA POTENSIAL DROP OUT

MENGGUNAKAN METODE CLUSTERING PADA PROGRAM

STUDI STRATA 1 ILMU KOMPUTER DAN TEKNOLOGI

INFORMASI UNIVERSITAS SUMATERA UTARA

NURUL MASITHAH GUCHI

071402059

PROGRAM STUDI TEKNOLOGI INFORMASI

FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI

UNIVERSITAS SUMATERA UTARA

MEDAN

2013

PROGRAM STUDI TEKNOLOGI INFORMASI

FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI

UNIVERSITAS SUMATERA UTARA

MEDAN

2013

ABSTRACT

ABSTRACT

∶

:

∶

:

m

=

Form 10

Lap.

Parts

Dokumen yang terkait

Studi dokumentasi tentang kecenderungan penelitian mahasiswa departemen ilmu komunikasi fakultas ilmu social dan ilmu politik Universitas Sumatra Utara 2010 - 2013

Model Profil Mahasiswa Yang Potensial Drop Out Menggunakan Teknik Kernel K-Mean Clustering Dan Decision Tree

Citra Departemen Ilmu Komunikasi dan Ekspektasi Mahasiswa (Studi Deskriptif tentang Citra Departemen Ilmu Komunikasi dan Ekspektasi Mahasiswa Ilmu Komunikasi FISIP USU)

Perilaku Pencarian Informasi Mahasiswa Dalam Menyelesaikan Skripsi Pada Program Studi Ilmu Perpustakaan Universitas Sumatera Utara

Perilaku Pencarian Informasi Mahasiswa Dalam Menyelesaikan Skripsi Pada Program Studi Ilmu Perpustakaan Universitas Sumatera Utara

Kewirausahaan Informasi (Infopreneur) Kelompok Mahasiswa Program Studi Ilmu Perpustakaan Universitas Sumatera Utara

PengaruhHarga, KualitasProduk, dan Citra Merek Terhadap Keputusan Pembelian Smartphone Merek Apple (iPhone) Pada Mahasiswa Ilmu Komputer dan Teknologi Informasi Universitas Sumatera Utara

View of Pengelompokan Mahasiswa Potensial Drop Out Menggunakan Metode Clustering K-Means

Pengelompokan Mahasiswa Potensial Drop Out Menggunakan Metode Clustering Pada Program Studi Strata 1 Ilmu Komputer Dan Teknologi Informasi Universitas Sumatera Utara

Hubungan Lama Penggunaan Komputer dengan Kejadian Miopia di Fakultas Ilmu Komputer dan Teknologi Informasi Departemen Teknologi Informasi Universitas Sumatera Utara Tahun 2012

Dokumen yang Anda mencari sudah siap untuk unduhkan