Kebutuhan Aplikasi Implementasi Perancangan Antarmuka

BAB 4 IMPLEMENTASI DAN PENGUJIAN Pada bab ini akan membahas implementasi dan pengujian aplikasi berdasarkan analisis dan perancangan sistem yang telah dibahas pada bab sebelumnya. Tahapan ini memiliki tujuan untuk menampilkan hasil perancangan sistem dan proses pengujiannya dalam melakukan identifikasi terhadap duplikat data pada data cleaning.

4.1. Kebutuhan Aplikasi

Dalam melakukan perancangan sistem data cleaning menggunakan leveinsthein distance memerlukan perangkat keras dan perangkat lunak sebagai pendukung, diantaranya yaitu: 4.1.1 Perangkat keras Spesifikasi perangkat keras yang digunakan pada aplikasi ini yaitu: Processor : IntelR CoreTM i5-2410M CPU 2.30GHz 2.30 GHz RAM : 3.42 GB Harddisk : 300 GB 4.1.2 Perangkat Lunak Spesifikai perangkat lunak yang digunakan pada aplikasi ini yaitu: 1. Windows 7 Ultimate 32-bit 2. Netbeans Universitas Sumatera Utara 3. Microsoft excel

4.2. Implementasi Perancangan Antarmuka

Tampilan dari perancangan antarmuka yang telah diimplementasikan adalah sebagai berikut: 4.2.1 Halaman Utama Halaman utama merupakan halaman awal yang ditampilkan pada saat sistem dijalankan. Pada halaman utama ini terdapat tombol start yang akan membantu pengguna untuk berpindah ke tampilan halaman proses serta terdapat tombol keluar yang akan menutup sistem pada saat tombol tersebut dipilih. Tampilan halaman utama sistem dapat dilihat pada Gambar 4.1. Gambar 4.1. Tampilan Halaman Utama 4.2.2 Halaman Proses Apabila pengguna memilih tombol start, maka tampilan aplikasi akan berpindah ke halaman proses. Pada halaman proses terdapat informasi lokasi file, tombol pilih data dan tombol proses. Tabel data merupakan tempat untuk menampilkan data yang telah dipilih, tabel proses serta tabel hasil dari data duplikat. Tampilan halaman proses sistem dapat dilihat pada Gambar 4.2. Universitas Sumatera Utara Gambar 4.2. Tampila Halaman Proses Pada halaman proses ini terdapat tombol pilih data dan tombol proses. Tombol pilih data berfungsi untuk memilih data yang akan diproses untuk diketahui duplikat data yang terdapat pada data tersebut. Sedangkan tombol proses digunakan untuk melakukan serangkaian proses dalam mengidentifikasi duplikat data dan dapat dilihat pada Gambar 4.3. Gambar 4.3. Tampilan File Location Pada saat tombol pilih data diklik, maka akan tampil pop-up yang akan menampilkan pilihan untuk memilih data, dapat dilihat pada Gambar 4.4. Gambar 4.4. Pop-up Pada Setelah Tombol Pilih Data Diklik Universitas Sumatera Utara Setelah data yang akan diidentifikasi duplikatnya dipilih dan lokasi file akan ditampilkan pada kolom file location, langkah selanjutnya dilakukan klik pilih tombol proses. Pada saat tombol proses diklik maka serangkaian proses yang dilakukan akan dimulai dari proses lowercase dan regular expression dimana data akan diubah menjadi data yang siap untuk diproses, selanjutnya akan dilanjutkan dengan proses multi-pass neighborhood sebagai proses pembentukkan key dari data yang mana data inilah yang akan digunakan untuk proses yang dilakukan untuk efisiensi pembersihan data. Tampilan halaman proses dapat dilihat pada Gambar 4.5 Gambar 4.5. Tampilan Setelah Tombol Proses Diklik Setelah didapatkan data hasil multipass neighborhood, maka proses berikutnya yaitu pembentukan key menggunakan n-gram. Proses pengecekan kemiripan key akan mengambil data hasil n-gram yang akan digunakan sebagai input untuk proses metode jaccard untuk identifikasi duplikat data. Tampilan proses data cleaning dapat dilihat pada Gambar 4.6. Universitas Sumatera Utara Gambar 4.6. Tampilan Proses Data Cleaning Setelah keseluruhan proses selesai akan ditampilkan hasil dari identifikasi duplikat data. Hasil identifikasi ini akan ditampilkan ke tabel data clean yang berisi tampilan data duplikat yang telah ditemukan dan dapat dilihat pada Gambar 4.7 Gambar 4.7. Tampilan Hasil Output Data Duplikat

4.3. Pengujian Sistem