Implementasi Algoritma Winnowing Dan Porter Stemmer Mendeteksi Kemiripan Dua Dokumen Berbasis Web

IMPLEMENTASI ALGORITMA WINNOWING DAN PORTER STEMMER
MENDETEKSI KEMIRIPAN DUA DOKUMEN
BERBASIS WEB

ABSTRAK

Skripsi ini membahas tentang perancangan aplikasi penerapan algoritma Stemmer
Porter dan Winnowing. Penelitian yang dilakukan bertujuan untuk mengetahui tingkat
kemiripan antara satu file dengan file yang lain. Stemmer Porter merupakan suatu
algoritma yang pertama kali ditemukan oleh Martin Porter pada tahun 1980
untuk stemming bahasa inggris, kemudian karena proses stemming bahasa inggris
berbeda dengan bahasa indonesia maka, dikembangkan algoritma porter khusus
untuk bahasa indonesia (Porter Stemmer for Bahasa Indonesia) oleh W.B. Frakes pada
tahun 1992. Stemming adalah salah satu cara yang digunakan untuk meningkatkan
performa IR dengan cara mentransformasi kata-kata dalam sebuah dokumen teks ke
kata dasarnya. Sedangkan winnowing sendiri merupakan Algoritma Winnowing
merupakan algoritma yang digunakan untuk deteksi tingkat kemiripan file. Dengan
menggunakan kedua algoritma ini diharapkan mampu mengetahui tingkat kemiripan
satu file dengan yang lain.
Kata kunci: Kemiripan file, Stemmer Porter, Winnowing.


Universitas Sumatera Utara

IMPLEMENTATION WINNOWING ALGORITHM AND PORTER
STEMMER DETECT TWO DOCUMENT SIMILARITY
WEB-BASED
ABSTRACT

This thesis discusses the application design and implementation Winnowing Porter
Stemmer algorithm. Research conducted aimed to determine the degree of similarity
between a file with another file. Porter Stemmer is an algorithm that was first
discovered by Martin Porter in 1980 for stemming English, and because the process is
different from English Stemming Indonesian then, algorithms developed specifically
for Indonesian porter (Porter Stemmer for Indonesian) by WB Frakes in 1992.
Stemming is one of the means used to improve the performance of the IR by
transforming the way the words in a text document to word basically. While
Winnowing Winnowing algorithm itself is an algorithm used for file similarity
detection. By using the two algorithms is expected to determine the level of similarity
of one file to another.

Keyword: Similarities files, Porter Stemmer, Winnowing.


Universitas Sumatera Utara