BAB 4 IMPLEMENTASI DAN PENGUJIAN
Pada bab ini akan membahas implementasi dan pengujian aplikasi berdasarkan analisis dan perancangan sistem yang telah dibahas pada bab sebelumnya. Tahapan ini
memiliki tujuan untuk menampilkan hasil perancangan sistem dan proses pengujiannya dalam melakukan identifikasi terhadap duplikat data pada data cleaning.
4.1. Kebutuhan Aplikasi
Dalam melakukan perancangan sistem data cleaning menggunakan leveinsthein distance memerlukan perangkat keras dan perangkat lunak sebagai pendukung,
diantaranya yaitu: 4.1.1
Perangkat keras Spesifikasi perangkat keras yang digunakan pada aplikasi ini yaitu:
Processor : IntelR CoreTM i5-2410M CPU 2.30GHz 2.30 GHz
RAM : 3.42 GB
Harddisk : 300 GB
4.1.2 Perangkat Lunak
Spesifikai perangkat lunak yang digunakan pada aplikasi ini yaitu: 1.
Windows 7 Ultimate 32-bit 2.
Netbeans
Universitas Sumatera Utara
3. Microsoft excel
4.2. Implementasi Perancangan Antarmuka
Tampilan dari perancangan antarmuka yang telah diimplementasikan adalah sebagai berikut:
4.2.1 Halaman Utama
Halaman utama merupakan halaman awal yang ditampilkan pada saat sistem dijalankan. Pada halaman utama ini terdapat tombol start yang akan membantu
pengguna untuk berpindah ke tampilan halaman proses serta terdapat tombol keluar yang akan menutup sistem pada saat tombol tersebut dipilih. Tampilan halaman utama
sistem dapat dilihat pada Gambar 4.1.
Gambar 4.1. Tampilan Halaman Utama
4.2.2 Halaman Proses
Apabila pengguna memilih tombol start, maka tampilan aplikasi akan berpindah ke halaman proses. Pada halaman proses terdapat informasi lokasi file, tombol pilih data
dan tombol proses. Tabel data merupakan tempat untuk menampilkan data yang telah dipilih, tabel proses serta tabel hasil dari data duplikat. Tampilan halaman proses
sistem dapat dilihat pada Gambar 4.2.
Universitas Sumatera Utara
Gambar 4.2. Tampila Halaman Proses
Pada halaman proses ini terdapat tombol pilih data dan tombol proses. Tombol pilih data berfungsi untuk memilih data yang akan diproses untuk diketahui duplikat
data yang terdapat pada data tersebut. Sedangkan tombol proses digunakan untuk melakukan serangkaian proses dalam mengidentifikasi duplikat data dan dapat dilihat
pada Gambar 4.3.
Gambar 4.3. Tampilan File Location
Pada saat tombol pilih data diklik, maka akan tampil pop-up yang akan menampilkan pilihan untuk memilih data, dapat dilihat pada Gambar 4.4.
Gambar 4.4. Pop-up Pada Setelah Tombol Pilih Data Diklik
Universitas Sumatera Utara
Setelah data yang akan diidentifikasi duplikatnya dipilih dan lokasi file akan ditampilkan pada kolom file location, langkah selanjutnya dilakukan klik pilih
tombol proses. Pada saat tombol proses diklik maka serangkaian proses yang dilakukan akan dimulai dari proses lowercase dan regular expression dimana data
akan diubah menjadi data yang siap untuk diproses, selanjutnya akan dilanjutkan dengan proses multi-pass neighborhood sebagai proses pembentukkan key dari data
yang mana data inilah yang akan digunakan untuk proses yang dilakukan untuk efisiensi pembersihan data. Tampilan halaman proses dapat dilihat pada Gambar 4.5
Gambar 4.5. Tampilan Setelah Tombol Proses Diklik
Setelah didapatkan data hasil multipass neighborhood, maka proses berikutnya yaitu pembentukan key menggunakan n-gram. Proses pengecekan kemiripan key akan
mengambil data hasil n-gram yang akan digunakan sebagai input untuk proses metode jaccard untuk identifikasi duplikat data. Tampilan proses data cleaning dapat dilihat
pada Gambar 4.6.
Universitas Sumatera Utara
Gambar 4.6. Tampilan Proses Data Cleaning
Setelah keseluruhan proses selesai akan ditampilkan hasil dari identifikasi duplikat data. Hasil identifikasi ini akan ditampilkan ke tabel data clean yang berisi
tampilan data duplikat yang telah ditemukan dan dapat dilihat pada Gambar 4.7
Gambar 4.7. Tampilan Hasil Output Data Duplikat
4.3. Pengujian Sistem