Implementasi Algoritmaa Fuzzy K-Nearest Neigbour (Fuzzy K-NN) Untuk Klasifikasi Proposal Skripsi Berdasarkan Kelompok Keilmuan Di Teknik Informatika UNIKOM

IMPLEMENTASI ALGORITMA

FUZZY K-NEAREST

NEIGHBOUR (FUZZY K-NN) UNTUK KLASIFIKASI

PROPOSAL SKRIPSI BERDASARKAN KELOMPOK

KEILMUAN DI TEKNIK INFORMATIKA UNIKOM

SKRIPSI

Diajukan untuk Menempuh Ujian Akhir Sarjana

YOSEP AMIN

10111648

PROGRAM STUDI TEKNIK INFORMATIKA

FAKULTAS TEKNIK DAN ILMU KOMPUTER

UNIVERSITAS KOMPUTER INDONESIA

2016

KATA PENGANTAR

Segala puji dan syukur penulis panjatkan kepada yang Mahakuasa Allah

Subhanahu wa ta'ala atas rahmat dan karunia-Nya sehingga penulis dapat

menyelesaikan tugas akhir yang berjudul

“Implementasi Algoritma Fuzzy K-

Nearest Neighbour (Fuzzy K-NN) Untuk Klasifikasi Proposal Skripsi

Berdasarkan Kelompok Keilmuan Di Teknik Informatika Unikom

”, yang

diajukan untuk menempuh ujian akhir sarjana Program Strata I pada Jurusan Teknik

Informatika Universitas Komputer Indonesia. Sholawat serta salam semoga selalu

terlimpah kepada junjungan kita, Rasulullah Muhammad Shallallahu

‘alaihi wasallam, kepada keluarga yang beriman, para shahabat, tabi’in, tabi’ut, tabi’in

serta umatnya yang senantiasa mengamalkan dan mengemban risalah Islam hingga

akhir zaman.

Dalam melakukan penelitiannya, penulis di dukung oleh berbagai pihak

yang mendukung sehingga penelitian ini dapat terealisasi. Maka penulis ingin

berterima kasih kepada :

1. Keluarga tercinta, Ibunda Iski binti sayad, Ayahanda Taryono bin Kodir, dan

Kakanda Yuli ani, Yeni, dan Roy Sobana yang selalu memberikan do’a, kasih sayang, semangat serta dorongan moril maupun materiil.

2. Bapak Irawan Afrianto, S.T, M.T., selaku Ketua Jurusan Teknik Informatika

Universitas Komputer Indonesia yang telah memberikan izin untuk melakukan penelitian Tugas Akhir di jurusan Teknik Informatika.

3. Ibu Nelly Indriani Widiastuti, S.Si., M.T., selaku pembimbing yang telah

mengarahkan serta membimbing penulis dalam menyelesaikan Penulisan Laporan Tugas Akhir ini.

4. Ibu Kania Evita Dewi, SPd., M.Si. selaku Dosen Penguji Satu.

5. Ibu Gentisya Tri Mardiani, S.Kom., M.Kom., selaku Dosen Wali IF-14

angkatan 2011.

6. Seluruh staf pengajar dan sekretariat Teknik Informatika yang telah membantu

7. Teman-teman seperjuangan Teknik Informatika angkatan 2011 khususnya

kelas IF-14/2011 terima kasih atas saran, dukungan serta kebersamaannya.

8. Teman-teman LDK UMMI UNIKOM yang telah banyak memberikan doa dan

dorongan semangat dalam menyelesaikan skripsi ini.

9. Sahabat sekaligus keluarga yang selalu memberikan banyak warna dan

kenangan di hidup penulis. Para sahabat Amburadoel, F4, Badminton Sport Club, Best Brother Forever dan Ourway Badminton Club.

10. Pihak-pihak lain yang membantu penulis untuk dapat menyelesaikan tugas

akhir ini yang tidak dapat disebutkan satu per satu.

Penulis menyadari bahwa penulisan laporan ini masih jauh dari sempurna

maka kritik dan saran dari semua pihak dibutuhkan untuk menambah wawasan

penulis.

Akhir kata semoga Allah Subhanahu wa ta'ala membalas segala kebaikan

yang telah penulis terima dan harapan penulis semoga laporan tugas akhir ini dapat

bermanfaat bagi pihak yang membutuhkan.

Bandung, 27 Februari 2016 Penulis

DAFTAR ISI

ABSTRAK ............................................................................................................... i

ABSTRACT .............................................................................................................. ii

KATA PENGANTAR ........................................................................................... iii

DAFTAR ISI ........................................................................................................... v

DAFTAR GAMBAR ........................................................................................... viii

DAFTAR TABEL .................................................................................................. ix

DAFTAR SIMBOL ............................................................................................... xii

DAFTAR LAMPIRAN ........................................................................................ xiv

BAB 1 PENDAHULUAN ...................................................................................... 1

1.1 Latar Belakang Masalah ........................................................................... 1

1.2 Rumusan Masalah .................................................................................... 2

1.3 Maksud dan Tujuan .................................................................................. 2

1.4 Batasan Masalah ....................................................................................... 3

1.5 Metodologi Penelitian .............................................................................. 3

1.5.1 Pengumpulan Data ................................................................................... 4

1.5.2 Analisis ..................................................................................................... 5

1.5.3 Implementasi ............................................................................................ 5

1.5.4 Pengujian .................................................................................................. 6

1.5.5 Penarikan Kesimpulan .............................................................................. 6

1.6 Sistematika Penulisan ............................................................................... 6

BAB 2 LANDASAN TEORI .................................................................................. 9

2.1 Proposal Skripsi ........................................................................................ 9

2.2.1 Text Preprocessing ................................................................................. 11

BAB 3 ANALISIS DAN PERANCANGAN ....................................................... 35

3.4 Analisis Metode ...................................................................................... 46

3.3.2 Analisis Data Keluaran ........................................................................... 45

3.3.1 Analisis Data Masukan ........................................................................... 45

3.3 Analisis Data .......................................................................................... 45

3.2.3 Klasifikasi ............................................................................................... 43

3.2.2 Term Weigthing ...................................................................................... 41

3.2.1 Preprocessing ......................................................................................... 37

3.2 Analisis Proses ....................................................................................... 36

3.1 Analisis Masalah .................................................................................... 35

2.10 Confusion Matrix .................................................................................... 34

2.3 Term Weighting ...................................................................................... 17

2.9 C# ........................................................................................................... 32

2.8.3 Kamus Data ............................................................................................ 32

2.8.2 Data Flow Diagram (DFD) .................................................................... 31

2.8.1 Entity Relationship Diagram (ERD) ...................................................... 30

2.8 Pemrograman Terstruktur ....................................................................... 29

2.7 Metode Linear ........................................................................................ 27

2.6 Fuzzy K- Nearest Neighbour .................................................................. 25

2.5 Algoritma K-Nearest Neighbour ............................................................ 22

2.4.1 Konsep Fuzzy Logic ............................................................................... 19

2.4 Logika Fuzzy .......................................................................................... 18

3.4.1 Analisis Tahap Pelatihan ........................................................................ 46

3.5 Analisis Kebutuhan Perangkat Lunak .................................................... 58

3.5.1 Analisis Kebutuhan Non Fungsional ...................................................... 58

3.5.2 Analisis Kebutuhan Fungsional .............................................................. 58

3.6 Perancangan Sistem ................................................................................ 73

3.6.1 Perancangan Antarmuka ......................................................................... 76

3.6.2 Jaringan Semantik .................................................................................. 79

BAB 4 IMPLEMENTASI DAN PENGUJIAN .................................................... 81

4.1 Implementasi .......................................................................................... 81

4.2 Pengujian Performansi ........................................................................... 84

4.3 Kesimpulan Pengujian ............................................................................ 97

BAB 5 KESIMPULAN DAN SARAN ................................................................ 99

5.1 Kesimpulan ............................................................................................. 99

5.2 Saran ....................................................................................................... 99

DAFTAR PUSTAKA ......................................................................................... 101

DAFTAR PUSTAKA

[1] Farid Hamid,S.Sos.,M.Si., dan Drs.A.Rachman,MM.,M.Si., Panduan Skripsi FIKOM UMB, hal 21 [2] Prasetyo, Dimas. Muflikhah, Laili. Ridok, Achmad.

“klasifikasi genre film

berdasarkan judul dan sinopsis menggunakan fuzzy k-nearest neighbour (Fuzzy K-

NN)

”, Prodi ilmu komputer, Program teknologi informasi dan ilmu komputer, Universitas Brawijaya.

[3] Nazir, Moh.

Ph.D, “Metode Penelitian”, Edisi Ketujuh, Bogor : Ghalia Indonesia, 2011.

[4] Pressman, Roger S, Ph.D,”Rekayasa Perangkat Lunak”, Edisi 7,Yogyakarta:

ANDI, 2012.

[5] S.A, Rosa, Shalahudin.M. “Rekayasa Perangkat Lunak: Tertruktur dan Berorientasi Objek ”. Bandung: Informatika. 2015.

[6] Sianipar, R., H. “Panduan Praktis Pemrograman C# Bagi Pemula”.

Yogyakarta: ANDI. 2014.

[7] Raymond J. Mooney. CS 391L: Machine Learning Text Categorization.

University Of Texas at Austin, 2006.

[8] Gregorius, S. Gunawan, Ibnu.

Yunono, Ferry. “Algoritma Porter Stemmer For

Bahasa Indonesia untuk pre-processing text mining berbasis Metode Market Basket

Analysis

”. Jurusan Teknik Informatika, UK.

[9] Lasmedi, Afuan.”Stemming Dokumen Teks Bahasa Indonesia Menggunakan

Algoritma Porter

”, Prodi Teknik Informatika, Fakultas Sains dan Teknik, Universitas Jendral Sudirman.

[10] Budiharto,W., and Suharton o, D.,”Artificial Intelligence”, Yogyakarta : Andi,

[11] Keller JM, Gray MR, Givens J.A. A Fuzzy K-Nearest Neighbor .Algorithm

IEEE Transaction on Systems, Man, and Cybernetics. Vol SMC-15. No 4. 1985.

[12] Prasetyo, Eko. Fuzzy K-Nearest Neighbor In Every Class Untuk Klasifikasi

Data. Seminar Nasional Teknik Informatika. Jurusan Teknik Informatika Fakultas

Teknologi Industri Universitaas Pembangunan Nasional Veteran Jawa Timur. Pp

57-60. 2012.

[13] Wisdarianto, Ardhy. Ridok, Achmad. Rahman, Arif, Muh.

“Penerapan

Metode fuzzy k-nearest neighbour (Fuzzy K-NN) untuk Pengklasifikasian Spam

Email

”, Prodi ilmu komputer, Program teknologi informasi dan ilmu komputer, Universitas Brawijaya.

[14] W., Teguh, Hardika. Mardji. Furqon, Tanzil, M.

“Penerapan Metode fuzzy k-

nearest neighbour (Fuzzy K-NN) untuk Diagnosa Penderita Liver Berdasarkan

Indian Patient Dataset(ILPD)

”, Prodi ilmu komputer, Program teknologi informasi dan ilmu komputer, Universitas Brawijaya.

[15] M.,Selly, Yanita. Ridok, Achmad. Muflikhah, Laili.

“Perbandingan K-Nearest

Neighbor dan fuzzy k-nearest neighbour (Fuzzy K-NN) Pada Diagnosis Penyakit

diabetes Melitus

”, Prodi ilmu komputer, Program teknologi informasi dan ilmu komputer, Universitas Brawijaya.

[16] S., Amiratus, Rahmi. Ridok, Achmad. Muflikhah, Laili.

“Penerapan Metode

fuzzy k-nearest neighbour (Fuzzy K-NN) untuk menentukan Kualitas Hasil

Rendemen Tanaman Tebu

”, Prodi ilmu komputer, Program teknologi informasi dan ilmu komputer, Universitas Brawijaya.

[17] Puspasari, Maslikha. Dewi, Candra. Rahman, Arif, Muh.

“Prediksi Tingkat

Resiko Penyakit Jantung Koroner(PJK) Menggunakan Metode fuzzy k-nearest

neighbour (Fuzzy K-NN)

”, Prodi ilmu komputer, Program teknologi informasi dan ilmu komputer, Universitas Brawijaya.

[18] Lestiyanto, Yudha, Dony.

“Stemming Bahasa Indonesia Sebagai Media Belajar Siswa Sekolah Menggunakan Algoritma Porter ”. Sistem Informasi.

Universitas Dian Nuswantoro. Semarang. 2014. [19] Agusta, Ledy, “Perbandingan Algoritma Stemming Porter dengan algoritma nazief & adriani untuk stemming dokumen teks bahasa indonesia ” konferensi

nasional sistem dan informatika 2009. Fakultas Teknologi Informasi. Universitas

Kristen Satya Wacana. KSN&109-036. 2009.

[20 ] Herman; Andani Achmad; dan Amil ahmad ilham, “klasifikasi dokumen

naskah dinas menggunakan algorita term frequency-inversed document frequency

dan vector space model

”, balai besar pengkajian dan pengembangan komunikasi

dan informatika makassar, kemkominfo & Jurusan elektro, prodi informatika,

fakultas teknik, UNHAS.

[21] Indriani, Aida, “Klasifikasi Data Forum dengan menggunakan Metode Naive

Bayes Classifier

”, Seminar Nasional Aplikasi Teknologi Informasi(SNATI) 2014,

Program studi Teknik Infomatika, STMIK PPKIA Tarakan Rahmawati. ISSN:

1907-5022.

BAB 1 PENDAHULUAN

1.1 Latar Belakang Masalah

Skripsi merupakan matakuliah penutup yang diambil oleh

mahasiswa/mahasiswi yang sedang menempuh jenjang pendidikan strata 1 di

perguruan tinggi negeri atau pun perguruan tinggi swasta, skripsi menjadi salah satu

syarat untuk kelulusannya. Skripsi merupakan istilah yang digunakan di indonesia

untuk mengilustrasikan suatu karya tulis ilmiah berupa paparan tulisan hasil

penelitian sarjana S1 yang membahas permasalahan/fenomena dalam bidang ilmu

tertentu dengan menggunakan kaidah

–kaidah yang berlaku[1]. Karya
tulis/penelitian ilmiah ini akan dilaporkan kedalam laporan skripsi, sebelum

melakukan skripsi, biasanya para mahasiswa/mahasiswi akan membuat terlebih

dahulu usulan penelitian atau biasanya disebut proposal skripsi yang akan diajukan
ke panitia sidang proposal skripsi untuk disidangkan.

Berkembangnya ilmu pengetahuan setiap waktunya membuat semakin beragamnya tema

– tema skripsi yang dibermunculan yang diajukan sebagai tema
penelitian, yang kemudian dituangkan dalam proposal skripsi, dari perbedaan tema

proposal skripsi yang dibuat oleh mahasiswa, menimbulkan adanya

keanekaragaman proposal skripsi baik dari segi latar belakang, tujuan, metodologi,

atau data penelitian. Sehingga pihak akademik membuat sebuah pengelompokan
kepada tema
– tema skripsi tersebut, ini dilakukan agar proposal skripsi dapat
dikenali dan membantu menempatkan proposal skripsi ke kelompok keilmuan yang

sesuai. Walaupun demikian masih saja terjadi kesalahan pengelompokan proposal

skripsi, mahasiswa terkadang salah memilih kelompok keilmuan. Jika ini terjadi

maka penanganan terhadap proposal skripsi seperti masukan untuk arah pengerjaan

skripsi tersebut akan tidak maksimal, karena proposal skripsi tidak ditangani oleh

penguji yang ahli di bidangnya. Faktor pemicu salah memilih kelompok keilmuan

karena masih berkaitannya satu kelompok keilmuan dengan kelompok keilmuan

yang lain. Untuk melakukan identifikasi proposal skripsi dapat dilakukan dengan

2 Metode Fuzzy k-Nearest Neighbour merupakan salah satu metode yang digunakan

untuk klasifikasi, metode ini dikembangkan pertama kali oleh James M. Keller

dasar dari algoritma ini adalah pemberian nilai membership sebagai fungsi nilai

pola jarak dari sejumlah himpunan k-Nearest Neighbour dan pemberian nilai

keanggotaan Neighbour pada kelas tertentu[2]. Pada penelitian yang pernah

dilakukan yang berhubungan dengan kasus ini yaitu berjudul Web Document

Classification Based on Fuzzy k-NN Algorithm yang dilakukan oleh Zhang, Yi Niu,

dan Huabei nie[2]. Mengatakan kelebihan dari metode fuzzy k-NN terletak pada

tingkat keakurasian yang dihasilkan lebih baik daripada metode klasifikasi lain

seperti k-Nearest Neighbour (k-NN), dan Support Vektor Machine(SVM). Pada

penelitian tersebut juga mengatakan bahwa kekurangan yang dimiliki oleh Fuzzy k-

NN ini, yakni terletak pada kecepatan pengklasifikasian yang lebih lambat

dibandingkan dua metode klasifikasi pembanding diatas[2].

Berdasarkan penjelasan diatas, dalam penelitian ini akan dilakukan

implementasi algoritma fuzzy k-Nearest Neighbour untuk menyelesaikan

permasalahan kasus klasifikasi proposal skripsi. Diambil studi kasus di program

studi Teknik Informatika UNIKOM.

1.2 Rumusan Masalah Berdasarkan pemaparan latar belakang diatas dapat dirumuskan masalahnya,

antara lain : Bagaimana implementasi metode Fuzzy k-Nearest Neighbour untuk

melakukan klasifikasi proposal skripsi.

1.3 Maksud dan Tujuan Maksud dari penelitian ini adalah untuk implementasi Fuzzy k-Nearest Neighbour dalam melakukan klasifikasi Proposal Skripsi.

Tujuan dari penelitian ini adalah untuk mengetahui keakuratan metode Fuzzy k-Nearest Neighbour dalam melakukan klasifikasi proposal skripsi.

1.4 Batasan Masalah

Adapun batasan masalah yang dapat dijelaskan adalah sebagai berikut:

1. Data training dan data testing diperoleh dari proposal skripsi mahasiswa/mahasiswi Teknik Informatika UNIKOM.

3. Sumber data diambil dari situs if.unikom.ac.id/skripsi dan disimpan dalam format file text dengan ekstensi txt (*.txt).

4. Pengelompokan dokumen proposal skripsi mengikuti pengelompokan yang sudah ditetapkan pada prodi Teknik Informatika yang disebut dengan kelompok keilmuan.

5. Term Frequency Inverse Document Fequency (TF-IDF) sebagai metode pembobotan term. [2] 6. porter stemmer sebagai algortima yang digunakan untuk proses stemming.[19]

7. euclidean distance digunakan sebagai metode penghitungan jarak antara dokumen testing dan dokumen training[11].

1.5 Metodologi Penelitian

Metode penelitian yang digunakan dalam penelitian ini yaitu metode

penelitian deskriptif. Merupakan suatu metode dalam meneliti status sekelopok

manusia, suatu objek, suatu set kondisi, suatu sistem pemikiran, ataupun suatu kelas

peristiwa pada masa sekarang. Tujuan dari penelitian deskriptif ini adalah untuk

membuat deskripsi, gambaran atau lukisan secara sistematis, faktual dan akurat

mengenai fakta-fakta, sifat-sifat serta hubungan antar fenomena yang diselidiki.

Serta memiliki ciri-ciri menerangkan hubungan, menguji hipotesis-hipotesis,

membuat prediksi serta mendapatkan makna(kesimpulan) dan implikasi dari suatu

masalah yang ingin dipecahkan[3]. alur penelitan yang akan dilakukan pada

penelitian ini dapat dilihat pada gambar 1.1 sebagai berikut:

Pengumpulan Data

Analisis Pelatih an Pengujian

Preprocessing Preprocessing (tokenizing, filtering, (tokenizing, filtering, stemming, stemming, weighting) weighting)

Klasifikasi Implementasi

Pengujian Penarikan

Kesimpulan

Gambar 1.1 Alur Penelitian

1.5.1 Pengumpulan Data

Pengumpulan data bertujuan untuk mengumpulkan data

– data yang
mempunyai kaitannya dengan penelitian yang dilakukan, seperti data proposal

skripsi yang akan digunakan sebagai data latih dan data uji, jurnal penelitian dan
buku
–buku yang berkaitan dengan penelitian. Adapun metode yang dilakukan

1. Studi Literatur Pengumpulan data yang dilakukan dengan cara mempelajari sumber kepustakaan diantaranya hasil penelitian, buku referensi, dan bacaan- bacaan yang berkaitan dengan penelitian.

2. Observasi Teknik pengumpulan data observasi dilakukan dengan mengadakan pengamatan atau penelitian langsung terhadap objek penelitian.

1.5.2 Analisis Analisis dilakukan untuk mendapat gambaran secara mendetail mengenai

tahapan-tahapan apa saja yang akan dilakukan. Dalam hal ini tahapan analisis

terbagi menjadi dua sub yakni tahap pelatihan dan tahapan pengujian yang masing

memiliki sub lain yakni tahapan preprocessing yang terdapat pada pelatihan dan

pengujian serta tahap klasifikasi yang terdapat pada pengujian. Kemudian

dilakukan perhitungan manual untuk masing-masing tahapan yang bertujuan

sebagai simulasi yang nantinya akan diterapkan pada tahap selanjutnya yakni

implementasi.

1.5.3 Implementasi Implementasi merupakan tahap pembangunan perangkat lunak yang

kontennya disesuaikan dengan tahap analisis. Metode pembangunan perangkat

lunak yang akan digunakan yakni metode skuensial linier yang sudah disesuaikan

dengan kebutuhan penelitian, fase

– fasenya antara lain:

1. Analisis Pada fase ini pengumpulan kebutuhan diintensifkan dan difokuskan pada sistem yang akan dibangun meliputi identifikasi domain informasi, tingkah laku sistem, unjuk kerja, dan antarmuka sistem.

2. Desain Fase ini difokuskan pada proses desain struktur data, arsitektur sistem, representasi interface, dan algoritma program.

3. Kode Fase ini dilakukan setelah menyelesaikan proses desain, hasil yang ada di

6 proses desain akan diterjemahkan kedalam suatu bahasa pemrograman tertentu untuk menghasilkan sebuah sistem.

4. Test Fase ini dilakukan untuk menemukan kesalahan-kesalahan yang mungkin terjadi pada proses pengkodean serta memastikan bahwa input yang dibatasi memberikan hasil yang sesuai dengan kebutuhan.

Pemodelan Sistem

Analisis Desain Kode Test

Gambar 1.2 Metode Pembangunan Perangkat Lunak [4]

1.5.4 Pengujian Fase ini adalah fase untuk menghitung keakuratan dari metode Fuzzy k- nearest neighbour yang diimplementasikan untuk klasifikasi proposal skripsi.

1.5.5 Penarikan Kesimpulan Fase ini akan menyajikan hasil penelitian dan nilai keakuratan dari metode

Fuzzy k- nearest neighbour serta kesimpulan terkait hasil pengujian yang telah

dilakukan.

1.6 Sistematika Penulisan

Sistematika penulisan skripsi ini disusun untuk memberikan gambaran umum

tentang penelitian yang dijalankan. Sistematika penulisan tugas akhir ini adalah

sebagai berikut:

BAB 1 PENDAHULUAN Bab ini berisi latar belakang, rumusan masalah, maksud dan tujuan, batasan masalah, metodologi penelitian dan sistematika penulisan. BAB 2 LANDASAN TEORI Bab ini berisi uraian tentang proposal, skripsi, proposal skripsi, text

preprocessing, tokenizing, filtering, stemming, weighting, Logika Fuzzy, Algoritma

K-nearest neighbour, dan Fuzzy k- nearest neighbour, teori mengenai

Pemrograman Terstruktur, Entity Relationship Digram, Data Flow Diagram,

BAB 3 ANALISIS DAN PERANCANGAN Bab ini membahas mengenai analisis masalah, analisis metode yang

digunakan, analisis penyelesaian masalah, analisis simulasi (perhitungan metode

Fuzzy K-Nearest Neighbour) klasifikasi dan analisis perancangan sistem.

BAB 4 IMPLEMENTASI DAN PENGUJIAN Bab ini membahas tentang pengujian akurasi algoritma fuzzy k-nearest

neighbour (FK-NN) pada klasifikasi proposal skripsi dengan menggunakan

program simulasi yang telah dibangun.

BAB 5 KESIMPULAN DAN SARAN Bab ini berisi kesimpulan dan saran dari penelitian yang dilakukan.

BAB 2 LANDASAN TEORI

2.1 Proposal Skripsi

Skripsi adalah istilah yang digunakan di Indonesia untuk mengilustrasikan

suatu karya tulis ilmiah berupa paparan tulisan hasil penelitian sarjana S1 yang

membahas suatu permasalahan/fenomena dalam bidang ilmu tertentu dengan

menggunakan kaidah-kaidah yang berlaku[1]. Proposal skripsi sendiri merupakan

Suatu permintaan, pengajuan ide kepada pihak lain untuk mendapatkan perizinan

topik, tempat penelitian, dan lain sebagainya yang diajukan oleh seorang

mahasiswa dalam usahanya untuk melakukan skripsi sebagai syarat kelulusannya

sebagai sarjana.

Fungsi porposal skripsi penting untuk seorang mahasiswa tingkat akhir yang akan melakukan penelitian sebagai syarat kelulusannya, antara lain:

1. Untuk mengajukan persetujuan topik tugas akhir.

2. Untuk mengajukan tempat penelitian.

3. Untuk mendapatkan perizinan yang menunjang penelitian seperti akses data, melakukan observasi, melakukan wawancara, dan lain sebagainya di tempat penelitian. Dalam menyusun proposal skripsi harus memperhatikan sistematika

penulisannya, sistematika penulisan sendiri disusun untuk memberikan gambaran

umum tentang penelitian yang akan dilakukan. Sistematika penulisan proposal

tergantung pada jenis penelitiannya, tapi pada umumnya isi dari sistematika

penulisan seperti dibawah ini:

1. Halaman Judul Berisi judul dari proposal skripsi, logo universitas, dan keterangan fakultas, program studi dan nama universitas beserta tahun penyusunan.

2. Daftar Isi

3. Daftar Tabel Berisi daftar tabel yang digunakan pada proposal skripsi.

4. Daftar Gambar Berisi daftar gambar yang terdapat pada proposal skripsiDaftar Lampiran Berisi daftar data penunjang penelitian.

5. Bab I Pendahuluan Berisi latar belakang, rumusan masalah, maksud dan tujuan, batasan masalah, metodologi penelitian dan sistematika penulisan.

6. Bab II Landasan Teori Berisi pembahasan seluruh buku

– buku, jurnal ilmiah, dan ataupun sumber lain yang menjadi materi pembangun penelitian.

7. Bab III Metode Penelitian Berisi pembahasan metode penelitian yang digunakan pada penelitian yang akan dilakukan, meliputi metode pengumpulan data dan metode analisis data,

8. Daftar Pustaka Berisi seluruh kepustakaan yang digunakan dalam penyusunan proposal.

Dicantumkan dibagian ini kemudian disusun secara alfabet dari A – Z.

2.2 Text Mining

Text Mining merupakan penerapan konsep dan teknik data mining untuk

mencari pola dalam teks, proses penganalisisan teks guna menyarikan informasi

yang bermanfaat untuk tujuan tertentu. Proses data mining untuk data dokumen atau

teks memerlukan lebih banyak tahapan, mengingat data teks memiliki karakteristik

yang lebih kompleks dari pada data biasa. Tujuannya yakni mencari kata

– kata
yang dapat mewakili isi dari dokumen sehingga dapat dilakukan analisa
keterhubungan antar dokumen diproses[7]. Langkah – langkah yang dilakukan pada

text mining pada penelitian ini antara lain text preprocessing, term weighting, dan

klasifikasi.

2.2.1 Text Preprocessing

Pada Tahap text preprocessing dilakukan beberapa proses menyiapkan judul

dan deksripsi proposal skripsi agar menjadi dokumen teks yang siap diolah ditahap

selanjutnya, umumnya pada tahap ini terdapat beberapa proses , diantaranya:

tokenizing, filtering, stemming.

2.2.1.1 Tokenizing Tahap tokenizing adalah tahap pemotongan string input berdasarkan tiap

kata yang menyusunnya. Setiap kalimat yang ada di dokumen akan disusun menjadi

kata per kata, semua tanda baca dan tanda hubung akan dihapuskan. Contoh dari

tahap ini adalah sebagai berikut:

Teks Input: Teknik Informatika adalah sebuah program studi di unikom.

Hasil Token: Teknik Informatika Adalah Sebuah Program Studi Di Unikom

2.2.1.2 Filtering Tahap Filtering adalah tahap mengambil kata

– kata penting dari hasil
token, dalam proses ini bisa menggunakan algoritma stop list (membuang kata yang
kurang penting) atau word list(menyimpan kata penting). stop list adalah daftar kata
yang sering digunakan dan tidak menjelaskan isi dari dokumen atau stopword. Contoh dari tahap ini adalah sebagai berikut: Hasil Token:

Teknik unikom Informatika Adalah Sebuah Program Studi Di Hasil Filter: Teknik Informatika Program Studi Unikom

2.2.1.3 Stemming

Tahap Stemming adalah tahap dimana kata hasil filtering akan dirubah

kedalam bentuk dasarnya(Stem). Untuk kata dalam bahasa inggris, metode

stemming yang paling populer adalah menggunakan alg oritma Martin porter’s

stammer atau biasa disebut porter stemmer. Algoritma ini juga bisa diaplikasikan

untuk bahasa selain inggris, dalam hal ini akan diterapkan pada bahasa indonesia

juga.

Porter stemmer for Bahasa Indonesia dikembangkan oleh Fasillah Z. Tala

pada tahun 2003. Implementasi porter stemmer for Bahasa Indonesia berdasarkan

English Porter Stemmer yang dikembangkan oleh W.B Frake pada tahun 1992[8].

Algoritma Porter Stemmer untuk bahasa indonesia dapat dilihat pada gambar 2.1.

Gambar 2.1 Algoritma Porter Stemmer[8]

Adapun langkah

– langkah pada algortima porter[9] adalah sebagai berikut:

1. Hapus Particle, 2. Hapus Possesive Pronoun.

3. Hapus awalan pertama. Jika tidak ada lanjutkan ke langkah 4a, jika ada cari maka lanjutkan ke langkah 4b. 4. a. Hapus awalan kedua, lanjutkan ke langkah 5a. b.Hapus akhiran, jika tidak ditemukan maka kata tersebut diasumsikan sebagai root word. Jika ditemukan maka lanjutkan ke langkah 5b. 5. a. Hapus akhiran. Kemudian kata akhir diasumsikan sebagai root word b.Hapus awalan kedua. Kemudian kata akhir diasumsikan sebagai root word.

Algoritma poter stemmer untuk bahasa indonesia ini mempunyai 5

kelompok aturan[9]. Aturan tersebut dapat dilihat pada tabel 2.1 sampai Tabel 2.5.

Tabel 2.1 Aturan untuk Inflectional Particel

Akhiran Replacement Measure Condition Additional Condition Contoh

kah NULL

2 NULL Bukukah

lah NULL

2 NULL Pergilah

pun NULL

2 NULL Bukupun

Tabel 2.2 Aturan untuk inflectional possesive pronoun

Akhiran Replacement Measure Condition Additional Condition Contoh

ku NULL

2 NULL Bukuku

mu NULL

2 NULL Bukumu

nya NULL

2 NULL Bukunya

Tabel 2.3 Aturan untuk first order derivational prefix

Awalan Replacement Measure Condition Additional Condition Contoh Meng- NULL

2 NULL Mengukur > ukur Meny- S

2 V... Menyapu > sapu Men- NULL

2 NULL Menduga > duga Mem- P

2 V... Memaksa > Paksa Mem- NULL

2 NULL Membaca > baca Me- NULL

2 NULL Merusak > rusak Peng- NULL

2 NULL Pengukur > ukur Peny- S

2 V... Penyapu > sapu Pen- NULL

2 NULL Penduga > duga Pem- P

2 V... Pemaksa > paksa Pem- NULL

2 NULL Pembaca > baca di- NULL

2 NULL Diukur > ukur Ter- NULL

2 NULL Tersapu > sapu Ke- NULL

2 NULL Kekasih > kasih

Tabel 2.4 Aturan untuk second order derivational prefix

Awalan Replacement Measure Condition Additional Condition Contoh Ber- NULL

2 NULL Berlari > lari Bel- NULL

2 Ajar Belajar > ajar Be- NULL

2 Ker Bekerja > kerja Per- NULL

2 NULL Perjelas > jelas Pel- NULL

2 Ajar Pelajar > ajar Pe- NULL

2 NULL Pekerja > kerja

Tabel 2.5 Aturan untuk derivational suffix

Akhiran Replacement Measure Additional Condition Contoh Condition

kan NULL

2 Prefix bukan anggota {ke, Tarikkan > tarik, peng} Mengambilkan > ambil

an NULL

2 Prefix bukan anggota {di, Makanan > makan, meng, ter} Perjanjian > janji.

i NULL

2 Prefix bukan anggota Tandai > tanda, mendapati {ber, ke, peng} > dapat.

Contoh umum dari tahap ini adalah sebagai berikut: Hasil Filter: Membacakan Membersihkan Dikurangi Pandangan mining text Hasil Stemming: Baca Bersih Kurang Pandang Mine Text

2.3 Term Weighting

Tahap Term weighting adalah tahap pembobotan kata yang dihasilkan dari

proses stemming. Metode yang sering digunakan yaitu menggunakan metode TF-

IDF (Term Frequency - Inverse Document Frequency). Pada metode ini,

perhitungan bobot term(kata) dalam sebuah dokumen dilakukan dengan

mengalikan nilai Term Frequency dengan Inverse Document Frequency.

Term Frequency (TF) adalah faktor yang menentukan bobot term pada suatu

dokumen berdasarkan jumlah kemunculannya dalam dokumen tersebut. Nilai

jumlah kemunculan suatu kata (term frequency) diperhitungkan dalam pemberian

bobot terhadap suatu kata. Semakin besar jumlah kemunculan suatu term dalam

dokumen, semakin besar pula bobotnya dalam dokumen atau akan memberikan

nilai kesesuian yang semakin besar.

Inverse Document Frequency (IDF) adalah pengurangan dominansi term

yang sering muncul di berbagai dokumen. Hal ini diperlukan karena term yang

banyak muncul di berbagai dokumen, dapat dianggap sebagai term umum (common

term) sehingga tidak penting nilainya. Sebaliknya faktor kejarangmunculan kata

(term scarcity) dalam koleksi dokumen harus diperhatikan dalam pemberian bobot.

Kata yang muncul pada sedikit dokumen harus dipandang sebagai kata yang lebih

penting (uncommon term) daripada kata yang muncul pada banyak dokumen.

Pembobotan akan memperhitungkan faktor kebalikan frekuensi dokumen yang

mengandung suatu kata (inverse document frequency). Hal ini merupakan usulan

dari George Zipf. Zipf mengamati bahwa frekuensi dari sesuatu cenderung

kebalikan secara proposional dengan urutannya[2].

Untuk menghitung bobot kata (Wi) dalam dokumen dihitung dengan menggunakan rumus: (2.1) = �� , � × ��

Dimana: = bobot kata (term) dalam dokumen �.

= indeks kata (term).

�� , � = banyaknya kata (term) yang muncul dalam dokumen �.

= inverse document frequency dari kata (term) . �� Untuk menghitung dapat menggunakan rumus:

��

(2.2) �� = log ��

Dimana: = inverse document frequency dari kata (term) �� .

� = jumlah dokumen keseluruhan.

= jumlah dokumen yang memiliki kata (term) . ��

2.4 Logika Fuzzy

Dasar logika fuzzy adalah teori himpunan fuzzy. Pada teori himpunan fuzzy,

peranan derajat keanggotaan sebagai penentu keberadaan elemen dalam suatu

himpunan sangatlah penting. Nilai keanggotaan atau derajat keanggotaan atau

membership function menjadi ciri utama dari penalaran dengan logika fuzzy

tersebut.

Logika fuzzy digunakan untuk menerjemahkan suatu besaran yang

diekspresikan menggunakan bahasa (linguistik). Misalnya besaran kecepatan laju

kendaraan yang diekspresikan dengan pelan , agak cepat, cepat, dan sangat

cepat[10]. Fuzzy logic pertama kali diperkenalkan oleh Jan Lukasiewicz pada tahun

1920-an sebagai teori kemungkinan. Logika kemungkinan ini memperluas

jangkauan dari nilai kebenaran untuk semua bilangan riil pada interval antara 0 dan

1. Pada tahun 1965, profesor dan kepala departemen teknik elektrik di university of

california, Berkeley, yaitu Lotfi Zadeh, menemukan kembali , mengidentifikasi,

mengeksplorasi, mempromosikan, dan berjuang untuk fuzzy logic. Beliau

Implementasi Algoritmaa Fuzzy K-Nearest Neigbour (Fuzzy K-NN) Untuk Klasifikasi Proposal Skripsi Berdasarkan Kelompok Keilmuan Di Teknik Informatika UNIKOM