Class parserHtml Implementasi Proses Pencarian Berita

4.3.2 Class parserHtml

Class ini merupakan sebuah class yang berfungsi sebagai parsing halaman sebuah website situs berita. Terdapat sebuah function yang bertugas mengambil judul, isi dan waktu dari direktori sebuah situs berita. Prosesnya pengambilan dilakukan pertahap. Pertama kali yang dilakukan adalah parsing halaman website sesuai dengan url hasil dari class parserLink. Setelah itu proses filtering sesuai dengan namanya dan filtering menurut atributnya. Misalnya filtering dengan namadiv yang mempunyai class judul_artikel yang berarti data yang terdeteksi adalah data yang terletak dalam div dan mempunyai class judul_artikel. satu div merupakan satu node. Proses parser dan filter untuk judul berita hanya membutuhkan satu node saja. Setiap situs mempunyai struktur yang berbeda – beda. Inti dari codenya tetap sama yang String[] coba = node1.toString.split ; for int x = 0; x coba.length; x++{ Pattern pattern = Pattern.compilethis.caricode; Matcher m = pattern.matchercoba[x]; if m.find{ Link = coba[x].replace;, ; break; } } System.out.printlnLink; } } } } System.out.printlnLink; } catch ParserException ex { Logger.getLoggerparsingLink.class.getName.logLevel.SEVERE, null, ex; } System.out.printlnlink +Link; return Link; membedakan hanya TagNameFilter dan HasAttributFilternya saja. Proses parser dan filter untuk isi berita dan waktu berita intinya sama dengan prose parser dan filter judul berita. Apabila ingin melakukan parsing atau filtering data lagi yang harus dilakukan tetap akan kembali seperti semula yaitu proses parsing dan filtering node selanjutnya . Berikut ini adalah code dari function getParserJudul : Parser parserjudul = new Parserthis.judulcode; NodeList collectionList = new NodeList; TagNameFilter filter = new TagNameFilterdiv; NodeFilter filter = new AndFilter new TagNameFilterdiv, new HasAttributeFilterclass, judul_artikel; for NodeIterator e = parserjudul.elements; e.hasMoreNodes; { e.nextNode.collectIntocollectionList, filter; } if collectionList.size = 0 { for SimpleNodeIterator e = collectionList.elements; e.hasMoreNodes; { Node node = e.nextNode; Judul = node.toPlainTextString.replacenbsp;, ; return Judul; System.out.printlnJudul :+node1.toPlainTextString+\n; } } System.out.printlnJudul; } catch ParserException ex { Logger.getLoggerparsingHtml.class.getName.logLevel.SEVERE, null, ex; } System.out.printlnJudul +Judul; return Judul;

4.4 Implementasi Aplikasi Desain Antarmuka