2. Perancangan Sistem
Pada tahap ini akan di susun perancangan sistem dengan menerapkan algoritma Stemming Potter sebagai algoritma stemmer untuk pendeteksian
kemiripan dokumen. 3.
Implementasi Sistem Tahap ini merupakan tahap pengimplementasian sistem yang telah dibangun
ke dalam bahasa pemrograman. 4.
Pengujian dan Penganalisaan Sistem Dalam tahap ini dilakukan pengujian aplikasi yang sudah dibangun.
5. Pembuatan laporan skripsi bertujuan untuk dijadikan sebagai dokumentasi
hasil penelitian. 6.
Penyusunan Laporan 7.
Menyusun laporan hasil analisis dan perancangan kedalam bentuk format skripsi.
1.7 Sistematika Penulisan
Sistematika penulisan dalam penyusunan tulisan ini adalah sebagai berikut :
Bab 1 : Pendahuluan
Membahas tentang Latar Belakang, Identifikasi Masalah, Rumusan Masalah, Batasan Masalah, Tujuan Penelitian, Manfaat Penelitian, Metodologi Penelitian
dan Sistematika Penulisan.
Bab 2 : Landasan Teori
Universitas Sumatera Utara
Membahas tentang teori-teori yang berkaitan dengan information retrieval, natural language processing, dan sistem penghitung kemiripan file.
Bab 3 : Analisa dan Perancangan
Bab ini mendeskripsikan fase-fase awal dalam pengembangan suatu sistem, sehingga terdapat gambaran yang jelas terhadap sistem yang akan dibangun.
Bab 4 : Implementasi dan Pengujian
Bab ini akan membahas tentang hasil dari pengimplementasian analisa yang sudah dirancang sebelumnya, sehingga pada bab ini akan ditampilkan perancangan antar
muka serta pengujiannya.
Bab 5
: Kesimpulan dan Saran
Bab terakhir akan memuat kesimpulan isi dari keseluruhan uraian bab-bab sebelumnya dan saran-saran dari hasil yang diperoleh dan diharapkan dapat
bermanfaat dalam pengembangan selanjutnya.
Universitas Sumatera Utara
BAB 2
LANDASAN TEORI 2.1 Pengertian Stemming
Stemming merupakan suatu proses atau cara dalam menemukan kata dasar dari suatu kata. Stemming sendiri berfungsi untuk menghilangkan variasi-variasi morfologi yang
melekat pada sebuah kata dengan cara menghilangkan imbuhan-imbuhan pada kata tersebut, sehingga nantinya di dapat suatu kata yang benar sesuai struktur morfologi
bahasa Indonesia yang benar.
Stemming sendiri merupakan bagian dari proses Information Retrieval. Secara umum ada dua proses utama dalam IR, yaitu Indexing dan Searching.
Proses Indexing terdiri dari 4 subproses antara lain : Word Token mengubah dokumen menjadi kumpulan term dengan cara menghapus semua karakter dalam
tanda baca yang terdapat pada dokumen dan mengubah kumpulan term menjadi lowercase, StopWord Removal Proses penghapusan kata-
kata yang sering ditampilkan dalam dokumen seperti:and, or, not dan sebagainya,Stemming Proses mengubah suatu kata bentukan menjadi kata dasar
dan Word Weighting Proses pembobotan setiap term di dalam dokumen. Ada banyak algoritma yang digunakan untuk melakukan proses stemming, khususnya
stemming bahasa indonesia. Algoritma-algoritma tersebut antara lain : Algoritma Nazief dan Andriani, algoritma Arifin dan Setiono, algoritma Idris dan
Mustofa, algoritma Vega, algoritma Ahmad, Yussof dan Sembok, Porter dsb [5].
Universitas Sumatera Utara
2.2 Stemming Porter