Jaccard’s Similarity Coefficient Analisis Sistem Analisis Masalah

2.4 Jaccard’s Similarity Coefficient

Jaccard’s Similarity Coefficient Jaccard 1912 merupakan indeks umum untuk variabel biner. Hal ini didefinisikan sebagai hasil bagi antara persimpangan dan serikat variabel dibandingkan berpasangan antara dua benda. Untuk menghitung kemiripan dari dua dokumen , diperlukan Jaccard’s Similarity Coefficient, dengan rumus : │ Aᴖ B│ DA,B = ________________ X 100 │ AᴗB│- │ Aᴖ B│ Keterangan: DA,B merupakan nilai similarity , │ Aᴖ B│ jumlah dari fingerprints dokumen 1 dan 2 yang sama, │ AᴗB│ ialah jumlah fingerprints dokumen 1 dan 2 dikurangi jumlah dari fingerprint dokumen 1 dan 2 yang sama. Universitas Sumatera Utara BAB 3 ANALISIS DAN PERANCANGAN

3.1 Analisis Sistem

Di dalam merancang suatu sistem diperlukan sebuah analisis sistem untuk membangun sistem tersebut. Analisis sistem ini bertujuan membantu pemodelan rancang bangun sistem yang akan di implementasikan secara konkret nantinya. Tahap ini mendeskripsikan fase-fase awal dalam pengembangan suatu sistem, sehingga terdapat gambaran yang jelas terhadap sistem yang akan dibangun.

3.2 Analisis Masalah

Banyak terdapat kasus suatu teks memiliki kesamaan dengan teks yang lain. Hal tersebut memang hal yang lumrah, apalagi jika terdapat banyaj kutipan dalam teks tersebut sehingga memungkinkan suatu teks memiliki kesamaan dengan teks yang lain. Masalah utama yang akan dibahas adalah menghitung tingkat kemiripan satu dokumen dengan dokumen yang lain. Sistem ini sendiri memakai bantuan algoritma Stemmer Porter dan Winnowing. Untuk mengidentifikasi masalah secara awal, diperlukan suatu alat grafis yaitu diagram Ishikawa, sehingga dapat lebih dikembangkan suatu permasalahan tersebut dan di dapat sebab akibat dari permasalahan tersebut. Universitas Sumatera Utara Pemodelan diagram Ishikawa dapat dilihat pada Gambar 3.1 dibawah ini. keingintahuan stemmer porter untuk tingkat persentase mendapat kata dasar kemiripan file winnowing untuk nilai fingerprint file berekstensi .pdf kata dilakukan proses stemm menggunakan sebagai file inputan algortima stemmer porter penghitungan nilai fingerprint dengan bantuan winnowing Gambar 3.1 Diagram Ishikawa Pada diagram Ishikawa diatas, segi empat paling kanan kepala ikan menunjukkan masalah utama yaitu user atau admin ingin mengetahui tingkat kesamaan dari suatu file yang akan di cek, sedangkan aspek ditunjukkan oleh segi empat yang dihubungkan oleh sebuah garis ke tulang utama garis horizontal yang terhubung ke kepala ikan. Selanjutnya, tulang-tulang kecil yang diwakili oleh garis user Penghitung an tingkat kemiripan file procedure machine method Universitas Sumatera Utara panah yang mengarah ke tulang-tulang kategori masalah menunjukkan sebab akibat yang muncul pada permasalahan tersebut.

3.3 Analisis Persyaratan Requirement Analysis