Analisis Prototipe I 1 Perancangan Cepat Prototipe

berlaku pada sistem, dengan cara memberikan sejumlah masukan tertentu kemudian diperiksa apakah keluaran yang dihasilkan sesuai dengan tujuan, jika belum sesuai maka akan dilakukan perbaikan, kembali ke tahapan perancangan. HASIL DAN PEMBAHASAN 1. Pengumpulan Kebutuhan Untuk mendapatkan berita maka sistem aggregator membutuhkan feed yang terlebih dahulu di subscribe sebagai umpan agar isi berita dapat ditampilkan oleh sistem. Tidak semua fakultas dan departemen menyediakan feed RSS. Dari hasil yang didapat ada beberapa yang telah menyediakan feed dan tidak semua digunakan untuk umpan sistem aggregator yang dibuat. Sistem menggunakan tiga buah feed dari situs-situs terkait di IPB yaitu: - http:fema.ipb.ac.id - http:ikk.fema.ipb.ac.id - http:psp.ipb.ac.id - http:ipb.ac.id Dari masing-masing situs tersebut dapat dilihat berita mengenai topik apa saja yang paling banyak diberitakan, antara lain: 1. Beasiswa, yaitu berita mengenai informasi beasiswa yang diberikan dari pihak atau lembaga pendidikan maupun pemerintahan baik dari dalam maupun luar negeri. 2. Kegiatan kampus, yaitu berita mengenai berbagai macam kegiatan baik formal maupun nonformal yang diadakan oleh setiap fakultas dan departemen. 3. Riset, yaitu berita mengenai informasi tentang penelitian yang dilakukan oleh para staff dosen di lingkungan IPB. 2. Prototipe I 2.1 Perancangan Cepat Prototipe Tahap awal yaitu dengan membuat prototipe dari sistem aggregator untuk mendapatkan gambaran tentang sistem yang akan dibuat, bagaimana aggregator dapat menampilkan isi berita dari feed yang berupa file dalam bentuk XML. Prototipe sistem tidak menggunakan data real sehingga xml tidak diambil langsung dari situs terkait, akan tetapi file XML juga dibuat prototipenya menggunakan struktur XML standard. Sistem ini dibuat menggunakan dua kondisi yaitu offline dan online, yang mana untuk kondisi offline, berita dalam format XML diambil dari direktori sistem yang sebelumnya format XML tersebut telah diunduh, dan pada kondisi online, XML berita diambil langsung dari situs yang feed-nya telah didaftarkan sebelumnya dan disimpan ke dalam database sistem. Untuk status offline XML yang dipakai diambil dari Fakultas Ekologi Manusia FEMA http:fema.ipb.ac.id , Fakultas Kehutanan FAHUTAN http:fahutan.ipb.ac.id dan dari Departemen Ilmu Keluarga dan Konsumen IKK Fakultas Ekologi Manusia FEMA http:ikk.fema.ipb.ac.id.

2.2 Analisis

Dari hasil studi yang dilakukan, dapat ditentukan metode pengklasifikasian berita yaitu menggunakan metode klasifikasi KNN k- Nearest Neighbor, berdasarkan metode pengumpulan berita yang digunakan yaitu metode Single Stream Aggregator, dimana cara kerja metode ini menempatkan berita terbaru pada posisi teratas yang mana berita-berita diambil dari beberapa situs dan metode ini juga mengklasifikasikan berita-beritanya. Untuk tahap klasifikasi, berita yang dijadikan sebagai dokumen latih adalah file berita yang di unduh dari mesin pencari Google, dimana file masih berbentuk halaman HTML yang didapat dari situs berita terkait dari situs apa saja, file kemudian disimpan dan diubah ke dalam bentuk file teks. Untuk data latih digunakan 10 dokumen berita untuk masing-masing kategori, sehingga jumlah keseluruhan adalah 30 dokumen. Untuk file berita dapat dilihat pada lampiran 14. Untuk data uji digunakan file berita sebanyak 30 dokumen diambil dari situs fakultas dan departemen, yang mana file XML dari ke-30 dokumen diunduh dan disimpan dalam direktori htdocs karena sistem dijalankan pada keadaan offline. Untuk menentukan kategori dari suatu dokumen uji dilakukan beberapa tahapan, dimana untuk setiap dokumen berita baik dokumen latih maupun uji sistem akan melakukan proses parsing untuk kemudian akan dibuang kata-kata yang tidak penting stopwords. Ada sebanyak 332 kata stopwords yang digunakan yang diambil dari situs http:fpmipa.upi.edustaffyudistop_words_list. txt , semua stopwords dapat dilihat pada Lampiran 13. Setelah dilakukan pembuangan kata-kata yang tidak penting selanjutnya proses pemotongan kata untuk diambil kata dasarnya stemming, stemming yang digunakan mengadopsi algoritme pada stemming yang dibuat oleh Iqbal 2010, mengkonversi stemming ke dalam bahasa pemrograman PHP. Proses ini adalah pembuangan imbuhan baik awalan maupun akhiran, daftar imbuhan- imbuhan disimpan dalam database sistem. Kata-kata yang telah didapatkan kata dasarnya akan dicocokkan dengan kata-kata yang telah tersimpan dalam database sesuai dengan kata- kata dalam KBBI. Kata-kata yang telah didapat dari 30 dokumen latih adalah untuk dijadikan sebagai kata-kata penciri dari setiap kategori berita. Setelah dihitung frekuensinya semua kata dan nilai frekuensinya kemudian disimpan ke dalam database sistem, sehingga jika ada dokumen uji yang akan ditentukan kelasnya maka dari setiap kata dari dokumen uji akan dilakukan perhitungan jarak dari semua kata dokumen latih yang telah tersimpan di database dengan menggunakan persamaan 1. Setelah didapatkan nilai jarak masing-masing kata, diambil k jarak terpendeknya dan dari k jarak tersebut dilihat pola kelas terbanyak sehingga dokumen uji akan dapat diketahui kelasnya.

2.3 Desain Antarmuka Sistem