Analisis Sistem Sistem Pencarian Kata pada Media Massa Online Menggunakan Algoritma Rabin-Karp

3.3 Analisis Sistem

Analisis sistem bertujuan untuk mngidentifikasi sistem yang akan diteliti. Proses analisis ini diperlukan sebagai dasar perancangan sistem. Pada penelitian ini, sistem dibagi menjadi 2 proses utama, yaitu proses yang dilakukan admin dan proses yang dilakukan user. Algoritma yang dipakai pada penelitian ini adalah Algoritma Rabin- Karp. 3.3.1 Admin Tahapan-tahapan yang dilakukan admin adalah sebagai berikut. 1. Masukkan nama media, kategori dan alamat media massa online ke dalam textbox yang ada pada halaman feed. 2. Kemudian dilakukan penyimpanan nama, kategori dan alamat media massa. 3. Data alamat media massa yang disimpan akan digunakan untuk men-download judul berita dan alamat berita kemudian disimpan ke database. 4. Data alamat berita yang disimpan akan digunakan untuk men-download konten dan disimpan ke database. Selanjutnya judul berita dan konten akan dibentuk menjadi gram dan disimpan ke database. Proses sistem dapat dilihat pada Gambar 3.2. Mulai Masukkan nama, kategori dan alamat media Penyimpanan feed media Penyimpanan judul berita Penyimpanan konten berita Selesai Gambar 3.2 Proses Sistem Universitas Sumatera Utara 3.3.1.1 Penyimpanan Feed Media Massa Proses penyimpanan feed media massa bertujuan untuk menyimpan data tentang media massa online. Tahapan-tahapan yang dilakukan dalam penyimpanan feed diantaranya yaitu: 1. Masukkan nama media, kategori dan alamat media massa ke dalam textbox yang ada pada halaman feed. 2. Kemudian dilakukan penyimpanan nama, kategori dan alamat media massa pada database feed. 3. Semua data yang sudah diproses ditampilkan ke halaman feed. Proses penyimpanan feed media dapat dilihat pada Gambar 3.3. Penyimpanan data Mulai Masukkan media, kategori dan alamat media Data media yang tersimpan Selesai Gambar 3.3 Proses Penyimpanan Feed Media Massa Universitas Sumatera Utara 3.3.1.2 Penyimpanan Judul Berita Proses penyimpanan judul berita bertujuan untuk menyimpan data judul dan alamat berita media massa online dengan cara men-download-nya. Tahapan-tahapan yang dilakukan dalam penyimpanan judul berita diantaranya yaitu: 1. Yang diproses adalah data alamat media massa yang ada di database feed. 2. Judul berita dan alamat berita yang ada akan di download. 3. Cek judul berita apakah sudah ada di database konten atau tidak. 4. Jika judul berita sama dengan yang ada di database konten maka judul dan alamat berita tidak disimpan ke database konten. Sedangkan jika judul dan alamat berita tidak sama maka judul dan alamat berita akan disimpan ke database konten. 5. Menampilkan judul dan alamat berita yang baru tersimpan ke database konten. Proses penyimpanan judul berita dapat dilihat pada Gambar 3.4. Mulai Data alamat media massa Download judul dan alamat berita Sama? Judul berita dan alamat berita Selesai Simpan Cek judul berita Tidak disimpan tidak ya Gambar 3.4 Proses Penyimpanan Judul Berita Universitas Sumatera Utara 3.3.1.3 Penyimpanan Konten Berita Proses konten berita bertujuan untuk menyimpan data isi berita dari judul berita yang telah di-download sebelumnya. Proses penyimpanan konten dilakukan dengan cara men-download. Pada tahapan ini juga, judul berita dan konten berita akan dibentuk gram kemudian disimpan ke database konten. Tahapan-tahapan yang dilakukan dalam konten diantaranya yaitu: 1. Yang diproses adalah data judul berita yang ada di database konten. 2. Jika konten pada judul berita kosong maka lanjut ke proses text preprocessing jika konten pada judul berita tidak kosong maka kembali mengambil data judul berita yang ada di database konten. 3. Proses dilanjutkan dengan tahapan text preprocessing judul. 4. Setelah proses text preprocessing, judul berita dibentuk menjadi gram. 5. Kemudian konten akan di-download dari halaman website media massa online. 6. Proses dilanjutkan dengan tahapan text preprocessing konten. 7. Setelah proses text preprocessing, konten dibentuk menjadi gram. 8. Database konten di-update sehingga gram judul, konten dan gram konten tersimpan ke database konten. 9. Menampilkan judul dan alamat berita dari konten berita yang baru tersimpan ke database konten. Proses penyimpanan konten berita dapat dilihat pada gambar 3.5. Mulai Data judul Proses text preprocessing judul Data gram judul, konten, gram konten Selesai Mengambil data konten Pembentukan gram judul Proses text preprocessing konten Pembentukan gram konten Apakah konten kosong? Ya tidak Update database konten Gambar 3.5 Proses Penyimpanan Konten Berita Universitas Sumatera Utara 3.3.1.4 Text preprocessing Tahapan-tahapan yang dilakukan dalam text preprocessing yaitu sebagai berikut. 1. Data kata judul konten yang akan diproses. 2. Pengubahan semua huruf menjadi huruf kecil. 3. Selanjutnya tanda pemisah, angka dan simbol dihapus. 4. Lalu spasi dihapus. 5. Semua kata yang sudah diproses akan dilanjutkan ke proses berikutnya. Flowchart dapat dilihat pada gambar 3.6. Mulai Data kata judulkonten toLowerCase Penghapusan spasi Data berita yang sudah mengalami proses text preprocessing Selesai Penghapusan tanda pemisah, angka dan simbol Gambar 3.6 Text Preprocessing Universitas Sumatera Utara 3.3.1.5 Algoritma Rabin-Karp Pada penelitian ini, algoritma Rabin-Karp digunakan saat melakukan proses text preprocessing , pembentukan nilai gram dan melakukan pencocok gram. Pada proses admin algoritma Rabin-Karp digunakan sampai proses pembentukan nilai gram. Sedangkan pada proses user algoritma Rabin-Karp digunakan sampai proses pencocokan gram dan jumlah kemiripan. Tahapan proses yang dilakukan user adalah sebagai berikut: 1. Data kata judul konten yang akan diproses. 2. Proses dilanjutkan dengan tahapan text preprocessing. 3. Setelah proses text preprocessing, kata dibentuk menjadi gram. 4. Gram kata yang telah dibentuk dicocokkan kemiripannya dengan gram judul dan gram konten yang tersimpan di database. Pada proses ini juga dilakukan proses perhitungan jumlah kemiripan. Jika gram kata dengan gram judul atau gram konten sama maka jumlah kemiripan akan ditambah 1. Proses algoritma Rabin-Karp dapat dilihat pada Gambar 3.7. Mulai Data kata judul konten yang akan diproses Proses text preprocessing Pembentukan gram Pencocokan antar gram Selesai Gambar 3.7 Algoritma Rabin-Karp Universitas Sumatera Utara 3.3.2 User Pada sistem ini, user akan melakukan pencarian dengan memasukkan keyword berupa kata-kata pada halaman pencarian. Tahapan proses yang dilakukan user adalah sebagai berikut: 1. User memasukkan keyword berupa kata ke textbox pencarian. 2. Ketika user mengklik tombol proses, maka sistem akan melakukan tahapan 2-4 yang dilakukan pada proses algoritma Rabin-Karp. 3. Jika jumlah kemiripan antara gram kata dengan gram judul dan gram konten melebihi 3 gram maka judul berita. Dan jika jumlah kemiripan antara gram kata dengan gram judul dan gram konten kurang atau sama dengan 3 gram maka judul berita tidak ditampilkan. 4. Sistem menampilkan judul berita dari judul berita yang memiliki jumlah kemiripan yang paling tinggi sampai jumlah kemiripan yang paling rendah. Proses user dapat dilihat pada gambar 3.8. Mulai Masukkan keyword Proses text preprocessing Pembentukan gram Pencocokan antar gram Jumlah kemiripan 3 Berita tidak ditemukan Tampilkan judul berita Selesai Ya Tidak Gambar 3.8 Proses User Universitas Sumatera Utara 3.3.2.1 Pembentukan nilai gram dan pencocokan gram Untuk pembentukan nilai gram dan pencocokan gram, penulis menggunakan algoritma Rabin-Karp seperti yang telah dijelaskan pada bab sebelumnya. Setiap kata yang terkandung dalam keyword, judul dan konten diubah terlebih dahulu menjadi sebuah kumpulan gram. Kemudian gram keyword akan dicocokkan dengan gram judul dan gram konten. Selanjutnya, menghitung jumlah kemiripan gram yang sama. Penentuan nilai: Gram : 5 Jumlah kemiripan 3 Untuk pembentukan nilai gram dan pencocokan gram, penulis mengambil contoh kata yng dimasukkan di keyword dan contoh judul berita yang akan dijadikan sample pembanding dan akan dijabarkan dibawah ini. Contoh proses user: Keyword yang dimasukkan user: Jakarta Great Judul berita yang ada di database : Jakarta Great Sale 2015 Targetkan Transaksi Rp 14,3 Triliun Keyword: Jakarta Great Proses text preprocessing: jakartagreat Pembentukan nilai gram: Tabel 3.3 Pembentukan Nilai Gram Keyword jakar akart karta artag rtagr tagre agrea great Judul : Jakarta Great Sale 2015 Targetkan Transaksi Rp 14,3 Triliun Proses text preprocessing: jakartagreatsaletargetkantransaksirptriliun Pembentukan nilai gram: Tabel 3.4 Pembentukan Nilai Gram Judul jakar akart karta artag rtagr tagre agrea great reats eatsa atsal tsale salet aleta letar etarg targe arget rgetk getka etkan tkant kantr antra ntran trans ransa ansak nsaks saksi aksir ksirp sirpt irptr rptri ptril trili riliu iliun Universitas Sumatera Utara Setelah pembentukan gram pada keyword dengan gram pada judul maka proses selanjutnya pencocokan antara gram keyword dengan gram judul. Proses pencocokan gram dapat dilihat pada tabel 3.5. Untuk proses pencocokan gram secara rinci dapat dilihat pada halaman lampiran b. Pencocokan gram keyword “ jakar “ dengan gram judul: Tabel 3.5 Pencocokan Gram Gram keyword Gram Judul Hasil Gram keyword Gram Judul Hasil jakar jakar sama jakar etkan tidak jakar akart tidak jakar tkant tidak jakar karta tidak jakar kantr tidak jakar artag tidak jakar antra tidak jakar rtagr tidak jakar ntran tidak jakar tagre tidak jakar trans tidak jakar agrea tidak jakar ransa tidak jakar great tidak jakar ansak tidak jakar reats tidak jakar nsaks tidak jakar eatsa tidak jakar saksi tidak jakar atsal tidak jakar aksir tidak jakar tsale tidak jakar ksirp tidak jakar salet tidak jakar sirpt tidak jakar aleta tidak jakar irptr tidak jakar letar tidak jakar rptri tidak jakar etarg tidak jakar ptril tidak jakar targe tidak jakar trili tidak jakar arget tidak jakar riliu tidak jakar rgetk tidak jakar iliun tidak jakar getka tidak Pada pencocokan gram diatas dapat disimpulkan bahwa jumlah kemiripan gram keyword dengan gram judul yang sama sebanyak 8 delapan. Karena jumlah kemiripannya melebihi dari 3 tiga maka judul b erita “Jakarta Great Sale 2015 Targetkan Transaksi Rp 14,3 Triliun” dapat ditampilkan. Universitas Sumatera Utara

3.4 Perancangan Sistem