2.4 Jaccard’s Similarity Coefficient
Jaccard’s Similarity Coefficient Jaccard 1912 merupakan indeks umum untuk variabel biner. Hal ini didefinisikan sebagai hasil bagi antara persimpangan dan
serikat variabel dibandingkan berpasangan antara dua benda. Untuk menghitung kemiripan dari dua dokumen , diperlukan Jaccard’s Similarity
Coefficient, dengan rumus :
│ Aᴖ B│ DA,B = ________________ X 100
│ AᴗB│- │ Aᴖ B│
Keterangan:
DA,B merupakan nilai similarity , │ Aᴖ B│ jumlah dari fingerprints dokumen 1 dan 2 yang sama,
│ AᴗB│ ialah jumlah fingerprints dokumen 1 dan 2 dikurangi jumlah dari fingerprint dokumen 1 dan 2 yang sama.
Universitas Sumatera Utara
BAB 3
ANALISIS DAN PERANCANGAN
3.1 Analisis Sistem
Di dalam merancang suatu sistem diperlukan sebuah analisis sistem untuk membangun sistem tersebut. Analisis sistem ini bertujuan membantu pemodelan
rancang bangun sistem yang akan di implementasikan secara konkret nantinya. Tahap ini mendeskripsikan fase-fase awal dalam pengembangan suatu sistem, sehingga
terdapat gambaran yang jelas terhadap sistem yang akan dibangun.
3.2 Analisis Masalah
Banyak terdapat kasus suatu teks memiliki kesamaan dengan teks yang lain. Hal tersebut memang hal yang lumrah, apalagi jika terdapat banyaj kutipan dalam teks
tersebut sehingga memungkinkan suatu teks memiliki kesamaan dengan teks yang lain. Masalah utama yang akan dibahas adalah menghitung tingkat kemiripan satu
dokumen dengan dokumen yang lain. Sistem ini sendiri memakai bantuan algoritma Stemmer Porter dan Winnowing. Untuk mengidentifikasi masalah secara awal,
diperlukan suatu alat grafis yaitu diagram Ishikawa, sehingga dapat lebih dikembangkan suatu permasalahan tersebut dan di dapat sebab akibat dari
permasalahan tersebut.
Universitas Sumatera Utara
Pemodelan diagram Ishikawa dapat dilihat pada Gambar 3.1 dibawah ini.
keingintahuan stemmer porter untuk tingkat persentase mendapat kata dasar
kemiripan file winnowing untuk nilai fingerprint file berekstensi .pdf
kata dilakukan proses stemm menggunakan sebagai file inputan
algortima stemmer porter penghitungan nilai fingerprint
dengan bantuan winnowing
Gambar 3.1 Diagram Ishikawa
Pada diagram Ishikawa diatas, segi empat paling kanan kepala ikan menunjukkan masalah utama yaitu user atau admin ingin mengetahui tingkat
kesamaan dari suatu file yang akan di cek, sedangkan aspek ditunjukkan oleh segi empat yang dihubungkan oleh sebuah garis ke tulang utama garis horizontal yang
terhubung ke kepala ikan. Selanjutnya, tulang-tulang kecil yang diwakili oleh garis user
Penghitung an tingkat
kemiripan file
procedure machine
method
Universitas Sumatera Utara
panah yang mengarah ke tulang-tulang kategori masalah menunjukkan sebab akibat yang muncul pada permasalahan tersebut.
3.3 Analisis Persyaratan Requirement Analysis