Implementasi Algoritmaa Fuzzy K-Nearest Neigbour (Fuzzy K-NN) Untuk Klasifikasi Proposal Skripsi Berdasarkan Kelompok Keilmuan Di Teknik Informatika UNIKOM
IMPLEMENTASI ALGORITMA
FUZZY K-NEAREST
NEIGHBOUR (FUZZY K-NN) UNTUK KLASIFIKASI
PROPOSAL SKRIPSI BERDASARKAN KELOMPOK
KEILMUAN DI TEKNIK INFORMATIKA UNIKOM
SKRIPSI
Diajukan untuk Menempuh Ujian Akhir Sarjana
YOSEP AMIN
10111648
PROGRAM STUDI TEKNIK INFORMATIKA
FAKULTAS TEKNIK DAN ILMU KOMPUTER
UNIVERSITAS KOMPUTER INDONESIA
2016
KATA PENGANTAR
Segala puji dan syukur penulis panjatkan kepada yang Mahakuasa Allah
Subhanahu wa ta'ala atas rahmat dan karunia-Nya sehingga penulis dapat
menyelesaikan tugas akhir yang berjudul“Implementasi Algoritma Fuzzy K-
Nearest Neighbour (Fuzzy K-NN) Untuk Klasifikasi Proposal Skripsi
Berdasarkan Kelompok Keilmuan Di Teknik Informatika Unikom”, yang
diajukan untuk menempuh ujian akhir sarjana Program Strata I pada Jurusan Teknik
Informatika Universitas Komputer Indonesia. Sholawat serta salam semoga selalu
terlimpah kepada junjungan kita, Rasulullah Muhammad Shallallahu‘alaihi wasallam, kepada keluarga yang beriman, para shahabat, tabi’in, tabi’ut, tabi’in
serta umatnya yang senantiasa mengamalkan dan mengemban risalah Islam hingga
akhir zaman.Dalam melakukan penelitiannya, penulis di dukung oleh berbagai pihak
yang mendukung sehingga penelitian ini dapat terealisasi. Maka penulis ingin
berterima kasih kepada :
1. Keluarga tercinta, Ibunda Iski binti sayad, Ayahanda Taryono bin Kodir, dan
Kakanda Yuli ani, Yeni, dan Roy Sobana yang selalu memberikan do’a, kasih sayang, semangat serta dorongan moril maupun materiil.
2. Bapak Irawan Afrianto, S.T, M.T., selaku Ketua Jurusan Teknik Informatika
Universitas Komputer Indonesia yang telah memberikan izin untuk melakukan penelitian Tugas Akhir di jurusan Teknik Informatika.
3. Ibu Nelly Indriani Widiastuti, S.Si., M.T., selaku pembimbing yang telah
mengarahkan serta membimbing penulis dalam menyelesaikan Penulisan Laporan Tugas Akhir ini.4. Ibu Kania Evita Dewi, SPd., M.Si. selaku Dosen Penguji Satu.
5. Ibu Gentisya Tri Mardiani, S.Kom., M.Kom., selaku Dosen Wali IF-14
angkatan 2011.
6. Seluruh staf pengajar dan sekretariat Teknik Informatika yang telah membantu
7. Teman-teman seperjuangan Teknik Informatika angkatan 2011 khususnya
kelas IF-14/2011 terima kasih atas saran, dukungan serta kebersamaannya.
8. Teman-teman LDK UMMI UNIKOM yang telah banyak memberikan doa dan
dorongan semangat dalam menyelesaikan skripsi ini.
9. Sahabat sekaligus keluarga yang selalu memberikan banyak warna dan
kenangan di hidup penulis. Para sahabat Amburadoel, F4, Badminton Sport Club, Best Brother Forever dan Ourway Badminton Club.
10. Pihak-pihak lain yang membantu penulis untuk dapat menyelesaikan tugas
akhir ini yang tidak dapat disebutkan satu per satu.Penulis menyadari bahwa penulisan laporan ini masih jauh dari sempurna
maka kritik dan saran dari semua pihak dibutuhkan untuk menambah wawasan
penulis.Akhir kata semoga Allah Subhanahu wa ta'ala membalas segala kebaikan
yang telah penulis terima dan harapan penulis semoga laporan tugas akhir ini dapat
bermanfaat bagi pihak yang membutuhkan.Bandung, 27 Februari 2016 Penulis
DAFTAR ISI
ABSTRAK ............................................................................................................... i
ABSTRACT .............................................................................................................. ii
KATA PENGANTAR ........................................................................................... iii
DAFTAR ISI ........................................................................................................... v
DAFTAR GAMBAR ........................................................................................... viii
DAFTAR TABEL .................................................................................................. ix
DAFTAR SIMBOL ............................................................................................... xii
DAFTAR LAMPIRAN ........................................................................................ xiv
BAB 1 PENDAHULUAN ...................................................................................... 1
1.1 Latar Belakang Masalah ........................................................................... 1
1.2 Rumusan Masalah .................................................................................... 2
1.3 Maksud dan Tujuan .................................................................................. 2
1.4 Batasan Masalah ....................................................................................... 3
1.5 Metodologi Penelitian .............................................................................. 3
1.5.1 Pengumpulan Data ................................................................................... 4
1.5.2 Analisis ..................................................................................................... 5
1.5.3 Implementasi ............................................................................................ 5
1.5.4 Pengujian .................................................................................................. 6
1.5.5 Penarikan Kesimpulan .............................................................................. 6
1.6 Sistematika Penulisan ............................................................................... 6
BAB 2 LANDASAN TEORI .................................................................................. 9
2.1 Proposal Skripsi ........................................................................................ 9
2.2.1 Text Preprocessing ................................................................................. 11
BAB 3 ANALISIS DAN PERANCANGAN ....................................................... 35
3.4 Analisis Metode ...................................................................................... 46
3.3.2 Analisis Data Keluaran ........................................................................... 45
3.3.1 Analisis Data Masukan ........................................................................... 45
3.3 Analisis Data .......................................................................................... 45
3.2.3 Klasifikasi ............................................................................................... 43
3.2.2 Term Weigthing ...................................................................................... 41
3.2.1 Preprocessing ......................................................................................... 37
3.2 Analisis Proses ....................................................................................... 36
3.1 Analisis Masalah .................................................................................... 35
2.10 Confusion Matrix .................................................................................... 34
2.3 Term Weighting ...................................................................................... 17
2.9 C# ........................................................................................................... 32
2.8.3 Kamus Data ............................................................................................ 32
2.8.2 Data Flow Diagram (DFD) .................................................................... 31
2.8.1 Entity Relationship Diagram (ERD) ...................................................... 30
2.8 Pemrograman Terstruktur ....................................................................... 29
2.7 Metode Linear ........................................................................................ 27
2.6 Fuzzy K- Nearest Neighbour .................................................................. 25
2.5 Algoritma K-Nearest Neighbour ............................................................ 22
2.4.1 Konsep Fuzzy Logic ............................................................................... 19
2.4 Logika Fuzzy .......................................................................................... 18
3.4.1 Analisis Tahap Pelatihan ........................................................................ 46
3.5 Analisis Kebutuhan Perangkat Lunak .................................................... 58
3.5.1 Analisis Kebutuhan Non Fungsional ...................................................... 58
3.5.2 Analisis Kebutuhan Fungsional .............................................................. 58
3.6 Perancangan Sistem ................................................................................ 73
3.6.1 Perancangan Antarmuka ......................................................................... 76
3.6.2 Jaringan Semantik .................................................................................. 79
BAB 4 IMPLEMENTASI DAN PENGUJIAN .................................................... 81
4.1 Implementasi .......................................................................................... 81
4.2 Pengujian Performansi ........................................................................... 84
4.3 Kesimpulan Pengujian ............................................................................ 97
BAB 5 KESIMPULAN DAN SARAN ................................................................ 99
5.1 Kesimpulan ............................................................................................. 99
5.2 Saran ....................................................................................................... 99
DAFTAR PUSTAKA ......................................................................................... 101
DAFTAR PUSTAKA
[1] Farid Hamid,S.Sos.,M.Si., dan Drs.A.Rachman,MM.,M.Si., Panduan Skripsi FIKOM UMB, hal 21 [2] Prasetyo, Dimas. Muflikhah, Laili. Ridok, Achmad.
“klasifikasi genre film
berdasarkan judul dan sinopsis menggunakan fuzzy k-nearest neighbour (Fuzzy K-
NN)”, Prodi ilmu komputer, Program teknologi informasi dan ilmu komputer, Universitas Brawijaya.
[3] Nazir, Moh.
Ph.D, “Metode Penelitian”, Edisi Ketujuh, Bogor : Ghalia Indonesia, 2011.
[4] Pressman, Roger S, Ph.D,”Rekayasa Perangkat Lunak”, Edisi 7,Yogyakarta:
ANDI, 2012.[5] S.A, Rosa, Shalahudin.M. “Rekayasa Perangkat Lunak: Tertruktur dan Berorientasi Objek ”. Bandung: Informatika. 2015.
[6] Sianipar, R., H. “Panduan Praktis Pemrograman C# Bagi Pemula”.
Yogyakarta: ANDI. 2014.
[7] Raymond J. Mooney. CS 391L: Machine Learning Text Categorization.
University Of Texas at Austin, 2006.[8] Gregorius, S. Gunawan, Ibnu.
Yunono, Ferry. “Algoritma Porter Stemmer For
Bahasa Indonesia untuk pre-processing text mining berbasis Metode Market Basket
Analysis”. Jurusan Teknik Informatika, UK.
[9] Lasmedi, Afuan.”Stemming Dokumen Teks Bahasa Indonesia Menggunakan
Algoritma Porter”, Prodi Teknik Informatika, Fakultas Sains dan Teknik, Universitas Jendral Sudirman.
[10] Budiharto,W., and Suharton o, D.,”Artificial Intelligence”, Yogyakarta : Andi,
[11] Keller JM, Gray MR, Givens J.A. A Fuzzy K-Nearest Neighbor .Algorithm
IEEE Transaction on Systems, Man, and Cybernetics. Vol SMC-15. No 4. 1985.
[12] Prasetyo, Eko. Fuzzy K-Nearest Neighbor In Every Class Untuk Klasifikasi
Data. Seminar Nasional Teknik Informatika. Jurusan Teknik Informatika Fakultas
Teknologi Industri Universitaas Pembangunan Nasional Veteran Jawa Timur. Pp
57-60. 2012.[13] Wisdarianto, Ardhy. Ridok, Achmad. Rahman, Arif, Muh.
“Penerapan
Metode fuzzy k-nearest neighbour (Fuzzy K-NN) untuk Pengklasifikasian Spam
Email”, Prodi ilmu komputer, Program teknologi informasi dan ilmu komputer, Universitas Brawijaya.
[14] W., Teguh, Hardika. Mardji. Furqon, Tanzil, M.
“Penerapan Metode fuzzy k-
nearest neighbour (Fuzzy K-NN) untuk Diagnosa Penderita Liver Berdasarkan
Indian Patient Dataset(ILPD)”, Prodi ilmu komputer, Program teknologi informasi dan ilmu komputer, Universitas Brawijaya.
[15] M.,Selly, Yanita. Ridok, Achmad. Muflikhah, Laili.
“Perbandingan K-Nearest
Neighbor dan fuzzy k-nearest neighbour (Fuzzy K-NN) Pada Diagnosis Penyakit
diabetes Melitus”, Prodi ilmu komputer, Program teknologi informasi dan ilmu komputer, Universitas Brawijaya.
[16] S., Amiratus, Rahmi. Ridok, Achmad. Muflikhah, Laili.
“Penerapan Metode
fuzzy k-nearest neighbour (Fuzzy K-NN) untuk menentukan Kualitas Hasil
Rendemen Tanaman Tebu”, Prodi ilmu komputer, Program teknologi informasi dan ilmu komputer, Universitas Brawijaya.
[17] Puspasari, Maslikha. Dewi, Candra. Rahman, Arif, Muh.
“Prediksi Tingkat
Resiko Penyakit Jantung Koroner(PJK) Menggunakan Metode fuzzy k-nearest
neighbour (Fuzzy K-NN)”, Prodi ilmu komputer, Program teknologi informasi dan ilmu komputer, Universitas Brawijaya.
[18] Lestiyanto, Yudha, Dony.
“Stemming Bahasa Indonesia Sebagai Media Belajar Siswa Sekolah Menggunakan Algoritma Porter ”. Sistem Informasi.
Universitas Dian Nuswantoro. Semarang. 2014. [19] Agusta, Ledy, “Perbandingan Algoritma Stemming Porter dengan algoritma nazief & adriani untuk stemming dokumen teks bahasa indonesia ” konferensi
nasional sistem dan informatika 2009. Fakultas Teknologi Informasi. Universitas
Kristen Satya Wacana. KSN&109-036. 2009.[20 ] Herman; Andani Achmad; dan Amil ahmad ilham, “klasifikasi dokumen
naskah dinas menggunakan algorita term frequency-inversed document frequency
dan vector space model”, balai besar pengkajian dan pengembangan komunikasi
dan informatika makassar, kemkominfo & Jurusan elektro, prodi informatika,
fakultas teknik, UNHAS.[21] Indriani, Aida, “Klasifikasi Data Forum dengan menggunakan Metode Naive
Bayes Classifier”, Seminar Nasional Aplikasi Teknologi Informasi(SNATI) 2014,
Program studi Teknik Infomatika, STMIK PPKIA Tarakan Rahmawati. ISSN:
1907-5022.BAB 1 PENDAHULUAN
1.1 Latar Belakang Masalah
Skripsi merupakan matakuliah penutup yang diambil oleh
mahasiswa/mahasiswi yang sedang menempuh jenjang pendidikan strata 1 di
perguruan tinggi negeri atau pun perguruan tinggi swasta, skripsi menjadi salah satu
syarat untuk kelulusannya. Skripsi merupakan istilah yang digunakan di indonesia
untuk mengilustrasikan suatu karya tulis ilmiah berupa paparan tulisan hasil
penelitian sarjana S1 yang membahas permasalahan/fenomena dalam bidang ilmu
tertentu dengan menggunakan kaidah- –kaidah yang berlaku[1]. Karya
tulis/penelitian ilmiah ini akan dilaporkan kedalam laporan skripsi, sebelum
melakukan skripsi, biasanya para mahasiswa/mahasiswi akan membuat terlebih
dahulu usulan penelitian atau biasanya disebut proposal skripsi yang akan diajukan
ke panitia sidang proposal skripsi untuk disidangkan.
Berkembangnya ilmu pengetahuan setiap waktunya membuat semakin beragamnya tema
- – tema skripsi yang dibermunculan yang diajukan sebagai tema
penelitian, yang kemudian dituangkan dalam proposal skripsi, dari perbedaan tema
proposal skripsi yang dibuat oleh mahasiswa, menimbulkan adanya
keanekaragaman proposal skripsi baik dari segi latar belakang, tujuan, metodologi,
atau data penelitian. Sehingga pihak akademik membuat sebuah pengelompokan
kepada tema - – tema skripsi tersebut, ini dilakukan agar proposal skripsi dapat
dikenali dan membantu menempatkan proposal skripsi ke kelompok keilmuan yang
sesuai. Walaupun demikian masih saja terjadi kesalahan pengelompokan proposal
skripsi, mahasiswa terkadang salah memilih kelompok keilmuan. Jika ini terjadi
maka penanganan terhadap proposal skripsi seperti masukan untuk arah pengerjaan
skripsi tersebut akan tidak maksimal, karena proposal skripsi tidak ditangani oleh
penguji yang ahli di bidangnya. Faktor pemicu salah memilih kelompok keilmuan
karena masih berkaitannya satu kelompok keilmuan dengan kelompok keilmuan
yang lain. Untuk melakukan identifikasi proposal skripsi dapat dilakukan dengan
2 Metode Fuzzy k-Nearest Neighbour merupakan salah satu metode yang digunakan
untuk klasifikasi, metode ini dikembangkan pertama kali oleh James M. Keller
dasar dari algoritma ini adalah pemberian nilai membership sebagai fungsi nilai
pola jarak dari sejumlah himpunan k-Nearest Neighbour dan pemberian nilai
keanggotaan Neighbour pada kelas tertentu[2]. Pada penelitian yang pernah
dilakukan yang berhubungan dengan kasus ini yaitu berjudul Web Document
Classification Based on Fuzzy k-NN Algorithm yang dilakukan oleh Zhang, Yi Niu,
dan Huabei nie[2]. Mengatakan kelebihan dari metode fuzzy k-NN terletak pada
tingkat keakurasian yang dihasilkan lebih baik daripada metode klasifikasi lain
seperti k-Nearest Neighbour (k-NN), dan Support Vektor Machine(SVM). Pada
penelitian tersebut juga mengatakan bahwa kekurangan yang dimiliki oleh Fuzzy k-
NN ini, yakni terletak pada kecepatan pengklasifikasian yang lebih lambat
dibandingkan dua metode klasifikasi pembanding diatas[2].Berdasarkan penjelasan diatas, dalam penelitian ini akan dilakukan
implementasi algoritma fuzzy k-Nearest Neighbour untuk menyelesaikan
permasalahan kasus klasifikasi proposal skripsi. Diambil studi kasus di program
studi Teknik Informatika UNIKOM.1.2 Rumusan Masalah Berdasarkan pemaparan latar belakang diatas dapat dirumuskan masalahnya,
antara lain : Bagaimana implementasi metode Fuzzy k-Nearest Neighbour untuk
melakukan klasifikasi proposal skripsi.1.3 Maksud dan Tujuan Maksud dari penelitian ini adalah untuk implementasi Fuzzy k-Nearest Neighbour dalam melakukan klasifikasi Proposal Skripsi.
Tujuan dari penelitian ini adalah untuk mengetahui keakuratan metode Fuzzy k-Nearest Neighbour dalam melakukan klasifikasi proposal skripsi.
1.4 Batasan Masalah
Adapun batasan masalah yang dapat dijelaskan adalah sebagai berikut:
1. Data training dan data testing diperoleh dari proposal skripsi mahasiswa/mahasiswi Teknik Informatika UNIKOM.
3
3. Sumber data diambil dari situs if.unikom.ac.id/skripsi dan disimpan dalam format file text dengan ekstensi txt (*.txt).
4. Pengelompokan dokumen proposal skripsi mengikuti pengelompokan yang sudah ditetapkan pada prodi Teknik Informatika yang disebut dengan kelompok keilmuan.
5. Term Frequency Inverse Document Fequency (TF-IDF) sebagai metode pembobotan term. [2] 6. porter stemmer sebagai algortima yang digunakan untuk proses stemming.[19]
7. euclidean distance digunakan sebagai metode penghitungan jarak antara dokumen testing dan dokumen training[11].
1.5 Metodologi Penelitian
Metode penelitian yang digunakan dalam penelitian ini yaitu metode
penelitian deskriptif. Merupakan suatu metode dalam meneliti status sekelopok
manusia, suatu objek, suatu set kondisi, suatu sistem pemikiran, ataupun suatu kelas
peristiwa pada masa sekarang. Tujuan dari penelitian deskriptif ini adalah untuk
membuat deskripsi, gambaran atau lukisan secara sistematis, faktual dan akurat
mengenai fakta-fakta, sifat-sifat serta hubungan antar fenomena yang diselidiki.
Serta memiliki ciri-ciri menerangkan hubungan, menguji hipotesis-hipotesis,
membuat prediksi serta mendapatkan makna(kesimpulan) dan implikasi dari suatu
masalah yang ingin dipecahkan[3]. alur penelitan yang akan dilakukan pada
penelitian ini dapat dilihat pada gambar 1.1 sebagai berikut:4
Pengumpulan Data
Analisis Pelatih an Pengujian
Preprocessing Preprocessing (tokenizing, filtering, (tokenizing, filtering, stemming, stemming, weighting) weighting)
Klasifikasi Implementasi
Pengujian Penarikan
Kesimpulan
Gambar 1.1 Alur Penelitian1.5.1 Pengumpulan Data
Pengumpulan data bertujuan untuk mengumpulkan data
- – data yang
mempunyai kaitannya dengan penelitian yang dilakukan, seperti data proposal
skripsi yang akan digunakan sebagai data latih dan data uji, jurnal penelitian dan
buku - –buku yang berkaitan dengan penelitian. Adapun metode yang dilakukan
5
1. Studi Literatur Pengumpulan data yang dilakukan dengan cara mempelajari sumber kepustakaan diantaranya hasil penelitian, buku referensi, dan bacaan- bacaan yang berkaitan dengan penelitian.
2. Observasi Teknik pengumpulan data observasi dilakukan dengan mengadakan pengamatan atau penelitian langsung terhadap objek penelitian.
1.5.2 Analisis Analisis dilakukan untuk mendapat gambaran secara mendetail mengenai
tahapan-tahapan apa saja yang akan dilakukan. Dalam hal ini tahapan analisis
terbagi menjadi dua sub yakni tahap pelatihan dan tahapan pengujian yang masing
memiliki sub lain yakni tahapan preprocessing yang terdapat pada pelatihan dan
pengujian serta tahap klasifikasi yang terdapat pada pengujian. Kemudian
dilakukan perhitungan manual untuk masing-masing tahapan yang bertujuan
sebagai simulasi yang nantinya akan diterapkan pada tahap selanjutnya yakni
implementasi.1.5.3 Implementasi Implementasi merupakan tahap pembangunan perangkat lunak yang
kontennya disesuaikan dengan tahap analisis. Metode pembangunan perangkat
lunak yang akan digunakan yakni metode skuensial linier yang sudah disesuaikan
dengan kebutuhan penelitian, fase- – fasenya antara lain:
1. Analisis Pada fase ini pengumpulan kebutuhan diintensifkan dan difokuskan pada sistem yang akan dibangun meliputi identifikasi domain informasi, tingkah laku sistem, unjuk kerja, dan antarmuka sistem.
2. Desain Fase ini difokuskan pada proses desain struktur data, arsitektur sistem, representasi interface, dan algoritma program.
3. Kode Fase ini dilakukan setelah menyelesaikan proses desain, hasil yang ada di
6 proses desain akan diterjemahkan kedalam suatu bahasa pemrograman tertentu untuk menghasilkan sebuah sistem.
4. Test Fase ini dilakukan untuk menemukan kesalahan-kesalahan yang mungkin terjadi pada proses pengkodean serta memastikan bahwa input yang dibatasi memberikan hasil yang sesuai dengan kebutuhan.
Pemodelan Sistem
Analisis Desain Kode Test
Gambar 1.2 Metode Pembangunan Perangkat Lunak [4]1.5.4 Pengujian Fase ini adalah fase untuk menghitung keakuratan dari metode Fuzzy k- nearest neighbour yang diimplementasikan untuk klasifikasi proposal skripsi.
1.5.5 Penarikan Kesimpulan Fase ini akan menyajikan hasil penelitian dan nilai keakuratan dari metode
Fuzzy k- nearest neighbour serta kesimpulan terkait hasil pengujian yang telah
dilakukan.1.6 Sistematika Penulisan
Sistematika penulisan skripsi ini disusun untuk memberikan gambaran umum
tentang penelitian yang dijalankan. Sistematika penulisan tugas akhir ini adalah
sebagai berikut:BAB 1 PENDAHULUAN Bab ini berisi latar belakang, rumusan masalah, maksud dan tujuan, batasan masalah, metodologi penelitian dan sistematika penulisan. BAB 2 LANDASAN TEORI Bab ini berisi uraian tentang proposal, skripsi, proposal skripsi, text
preprocessing, tokenizing, filtering, stemming, weighting, Logika Fuzzy, Algoritma
K-nearest neighbour, dan Fuzzy k- nearest neighbour, teori mengenai
Pemrograman Terstruktur, Entity Relationship Digram, Data Flow Diagram,
7
BAB 3 ANALISIS DAN PERANCANGAN Bab ini membahas mengenai analisis masalah, analisis metode yang
digunakan, analisis penyelesaian masalah, analisis simulasi (perhitungan metode
Fuzzy K-Nearest Neighbour) klasifikasi dan analisis perancangan sistem.BAB 4 IMPLEMENTASI DAN PENGUJIAN Bab ini membahas tentang pengujian akurasi algoritma fuzzy k-nearest
neighbour (FK-NN) pada klasifikasi proposal skripsi dengan menggunakan
program simulasi yang telah dibangun.BAB 5 KESIMPULAN DAN SARAN Bab ini berisi kesimpulan dan saran dari penelitian yang dilakukan.
8
BAB 2 LANDASAN TEORI
2.1 Proposal Skripsi
Skripsi adalah istilah yang digunakan di Indonesia untuk mengilustrasikan
suatu karya tulis ilmiah berupa paparan tulisan hasil penelitian sarjana S1 yang
membahas suatu permasalahan/fenomena dalam bidang ilmu tertentu dengan
menggunakan kaidah-kaidah yang berlaku[1]. Proposal skripsi sendiri merupakan
Suatu permintaan, pengajuan ide kepada pihak lain untuk mendapatkan perizinan
topik, tempat penelitian, dan lain sebagainya yang diajukan oleh seorang
mahasiswa dalam usahanya untuk melakukan skripsi sebagai syarat kelulusannya
sebagai sarjana.Fungsi porposal skripsi penting untuk seorang mahasiswa tingkat akhir yang akan melakukan penelitian sebagai syarat kelulusannya, antara lain:
1. Untuk mengajukan persetujuan topik tugas akhir.
2. Untuk mengajukan tempat penelitian.
3. Untuk mendapatkan perizinan yang menunjang penelitian seperti akses data, melakukan observasi, melakukan wawancara, dan lain sebagainya di tempat penelitian. Dalam menyusun proposal skripsi harus memperhatikan sistematika
penulisannya, sistematika penulisan sendiri disusun untuk memberikan gambaran
umum tentang penelitian yang akan dilakukan. Sistematika penulisan proposal
tergantung pada jenis penelitiannya, tapi pada umumnya isi dari sistematika
penulisan seperti dibawah ini:1. Halaman Judul Berisi judul dari proposal skripsi, logo universitas, dan keterangan fakultas, program studi dan nama universitas beserta tahun penyusunan.
2. Daftar Isi
3. Daftar Tabel Berisi daftar tabel yang digunakan pada proposal skripsi.
4. Daftar Gambar Berisi daftar gambar yang terdapat pada proposal skripsiDaftar Lampiran Berisi daftar data penunjang penelitian.
5. Bab I Pendahuluan Berisi latar belakang, rumusan masalah, maksud dan tujuan, batasan masalah, metodologi penelitian dan sistematika penulisan.
6. Bab II Landasan Teori Berisi pembahasan seluruh buku
- – buku, jurnal ilmiah, dan ataupun sumber lain yang menjadi materi pembangun penelitian.
7. Bab III Metode Penelitian Berisi pembahasan metode penelitian yang digunakan pada penelitian yang akan dilakukan, meliputi metode pengumpulan data dan metode analisis data,
8. Daftar Pustaka Berisi seluruh kepustakaan yang digunakan dalam penyusunan proposal.
Dicantumkan dibagian ini kemudian disusun secara alfabet dari A – Z.
2.2 Text Mining
Text Mining merupakan penerapan konsep dan teknik data mining untuk
mencari pola dalam teks, proses penganalisisan teks guna menyarikan informasi
yang bermanfaat untuk tujuan tertentu. Proses data mining untuk data dokumen atau
teks memerlukan lebih banyak tahapan, mengingat data teks memiliki karakteristik
yang lebih kompleks dari pada data biasa. Tujuannya yakni mencari kata- – kata
yang dapat mewakili isi dari dokumen sehingga dapat dilakukan analisa
keterhubungan antar dokumen diproses[7]. Langkah – langkah yang dilakukan pada
text mining pada penelitian ini antara lain text preprocessing, term weighting, dan
klasifikasi.2.2.1 Text Preprocessing
Pada Tahap text preprocessing dilakukan beberapa proses menyiapkan judul
dan deksripsi proposal skripsi agar menjadi dokumen teks yang siap diolah ditahap
selanjutnya, umumnya pada tahap ini terdapat beberapa proses , diantaranya:
tokenizing, filtering, stemming.2.2.1.1 Tokenizing Tahap tokenizing adalah tahap pemotongan string input berdasarkan tiap
kata yang menyusunnya. Setiap kalimat yang ada di dokumen akan disusun menjadi
kata per kata, semua tanda baca dan tanda hubung akan dihapuskan. Contoh dari
tahap ini adalah sebagai berikut:Teks Input: Teknik Informatika adalah sebuah program studi di unikom.
Hasil Token: Teknik Informatika Adalah Sebuah Program Studi Di Unikom
2.2.1.2 Filtering Tahap Filtering adalah tahap mengambil kata
- – kata penting dari hasil
token, dalam proses ini bisa menggunakan algoritma stop list (membuang kata yang
kurang penting) atau word list(menyimpan kata penting). stop list adalah daftar kata
yang sering digunakan dan tidak menjelaskan isi dari dokumen atau stopword. Contoh dari tahap ini adalah sebagai berikut: Hasil Token:
2.2.1.3 Stemming
Tahap Stemming adalah tahap dimana kata hasil filtering akan dirubah
kedalam bentuk dasarnya(Stem). Untuk kata dalam bahasa inggris, metode
stemming yang paling populer adalah menggunakan alg oritma Martin porter’sstammer atau biasa disebut porter stemmer. Algoritma ini juga bisa diaplikasikan
untuk bahasa selain inggris, dalam hal ini akan diterapkan pada bahasa indonesia
juga.Porter stemmer for Bahasa Indonesia dikembangkan oleh Fasillah Z. Tala
pada tahun 2003. Implementasi porter stemmer for Bahasa Indonesia berdasarkan
English Porter Stemmer yang dikembangkan oleh W.B Frake pada tahun 1992[8].
Algoritma Porter Stemmer untuk bahasa indonesia dapat dilihat pada gambar 2.1.
Gambar 2.1 Algoritma Porter Stemmer[8]Adapun langkah
- – langkah pada algortima porter[9] adalah sebagai berikut:
1. Hapus Particle, 2. Hapus Possesive Pronoun.
3. Hapus awalan pertama. Jika tidak ada lanjutkan ke langkah 4a, jika ada cari maka lanjutkan ke langkah 4b. 4. a. Hapus awalan kedua, lanjutkan ke langkah 5a. b.Hapus akhiran, jika tidak ditemukan maka kata tersebut diasumsikan sebagai root word. Jika ditemukan maka lanjutkan ke langkah 5b. 5. a. Hapus akhiran. Kemudian kata akhir diasumsikan sebagai root word b.Hapus awalan kedua. Kemudian kata akhir diasumsikan sebagai root word.
Algoritma poter stemmer untuk bahasa indonesia ini mempunyai 5
kelompok aturan[9]. Aturan tersebut dapat dilihat pada tabel 2.1 sampai Tabel 2.5.
Tabel 2.1 Aturan untuk Inflectional Particel
Akhiran Replacement Measure Condition Additional Condition Contoh
- kah NULL
2 NULL Bukukah
- lah NULL
2 NULL Pergilah
- pun NULL
2 NULL Bukupun
Tabel 2.2 Aturan untuk inflectional possesive pronoun
Akhiran Replacement Measure Condition Additional Condition Contoh
- ku NULL
2 NULL Bukuku
- mu NULL
2 NULL Bukumu
- nya NULL
2 NULL Bukunya
Tabel 2.3 Aturan untuk first order derivational prefixAwalan Replacement Measure Condition Additional Condition Contoh Meng- NULL
2 NULL Mengukur > ukur Meny- S
2 V... Menyapu > sapu Men- NULL
2 NULL Menduga > duga Mem- P
2 V... Memaksa > Paksa Mem- NULL
2 NULL Membaca > baca Me- NULL
2 NULL Merusak > rusak Peng- NULL
2 NULL Pengukur > ukur Peny- S
2 V... Penyapu > sapu Pen- NULL
2 NULL Penduga > duga Pem- P
2 V... Pemaksa > paksa Pem- NULL
2 NULL Pembaca > baca di- NULL
2 NULL Diukur > ukur Ter- NULL
2 NULL Tersapu > sapu Ke- NULL
2 NULL Kekasih > kasih
Tabel 2.4 Aturan untuk second order derivational prefixAwalan Replacement Measure Condition Additional Condition Contoh Ber- NULL
2 NULL Berlari > lari Bel- NULL
2 Ajar Belajar > ajar Be- NULL
2 Ker Bekerja > kerja Per- NULL
2 NULL Perjelas > jelas Pel- NULL
2 Ajar Pelajar > ajar Pe- NULL
2 NULL Pekerja > kerja
Tabel 2.5 Aturan untuk derivational suffixAkhiran Replacement Measure Additional Condition Contoh Condition
- kan NULL
2 Prefix bukan anggota {ke, Tarikkan > tarik, peng} Mengambilkan > ambil
- an NULL
2 Prefix bukan anggota {di, Makanan > makan, meng, ter} Perjanjian > janji.
- i NULL
2 Prefix bukan anggota Tandai > tanda, mendapati {ber, ke, peng} > dapat.
Contoh umum dari tahap ini adalah sebagai berikut: Hasil Filter: Membacakan Membersihkan Dikurangi Pandangan mining text Hasil Stemming: Baca Bersih Kurang Pandang Mine Text
2.3 Term Weighting
Tahap Term weighting adalah tahap pembobotan kata yang dihasilkan dari
proses stemming. Metode yang sering digunakan yaitu menggunakan metode TF-
IDF (Term Frequency - Inverse Document Frequency). Pada metode ini,
perhitungan bobot term(kata) dalam sebuah dokumen dilakukan dengan
mengalikan nilai Term Frequency dengan Inverse Document Frequency.Term Frequency (TF) adalah faktor yang menentukan bobot term pada suatu
dokumen berdasarkan jumlah kemunculannya dalam dokumen tersebut. Nilai
jumlah kemunculan suatu kata (term frequency) diperhitungkan dalam pemberian
bobot terhadap suatu kata. Semakin besar jumlah kemunculan suatu term dalam
dokumen, semakin besar pula bobotnya dalam dokumen atau akan memberikan
nilai kesesuian yang semakin besar.Inverse Document Frequency (IDF) adalah pengurangan dominansi term
yang sering muncul di berbagai dokumen. Hal ini diperlukan karena term yang
banyak muncul di berbagai dokumen, dapat dianggap sebagai term umum (common
term) sehingga tidak penting nilainya. Sebaliknya faktor kejarangmunculan kata
(term scarcity) dalam koleksi dokumen harus diperhatikan dalam pemberian bobot.
Kata yang muncul pada sedikit dokumen harus dipandang sebagai kata yang lebih
penting (uncommon term) daripada kata yang muncul pada banyak dokumen.
Pembobotan akan memperhitungkan faktor kebalikan frekuensi dokumen yang
mengandung suatu kata (inverse document frequency). Hal ini merupakan usulan
dari George Zipf. Zipf mengamati bahwa frekuensi dari sesuatu cenderung
kebalikan secara proposional dengan urutannya[2].Untuk menghitung bobot kata (Wi) dalam dokumen dihitung dengan menggunakan rumus: (2.1) = �� , � × ���
Dimana: = bobot kata (term) dalam dokumen �.
= indeks kata (term).
�� , � = banyaknya kata (term) yang muncul dalam dokumen �.
= inverse document frequency dari kata (term) . ��� Untuk menghitung dapat menggunakan rumus:
��� �
(2.2) ��� = log �� �
Dimana: = inverse document frequency dari kata (term) ��� .
� = jumlah dokumen keseluruhan.
= jumlah dokumen yang memiliki kata (term) . ��
2.4 Logika Fuzzy
Dasar logika fuzzy adalah teori himpunan fuzzy. Pada teori himpunan fuzzy,
peranan derajat keanggotaan sebagai penentu keberadaan elemen dalam suatu
himpunan sangatlah penting. Nilai keanggotaan atau derajat keanggotaan atau
membership function menjadi ciri utama dari penalaran dengan logika fuzzy
tersebut.Logika fuzzy digunakan untuk menerjemahkan suatu besaran yang
diekspresikan menggunakan bahasa (linguistik). Misalnya besaran kecepatan laju
kendaraan yang diekspresikan dengan pelan , agak cepat, cepat, dan sangat
cepat[10]. Fuzzy logic pertama kali diperkenalkan oleh Jan Lukasiewicz pada tahun
1920-an sebagai teori kemungkinan. Logika kemungkinan ini memperluas
jangkauan dari nilai kebenaran untuk semua bilangan riil pada interval antara 0 dan
1. Pada tahun 1965, profesor dan kepala departemen teknik elektrik di university of
california, Berkeley, yaitu Lotfi Zadeh, menemukan kembali , mengidentifikasi,
mengeksplorasi, mempromosikan, dan berjuang untuk fuzzy logic. Beliau