Perancangan Sistem Data Cleaning pada Data Duplikat Menggunakan Leveinsthein Distance

3.2.8 Pembacaan Data Duplikat pada Suatu Window Pembacaan data duplikat pada suatu window dilakukan menggunakan metode transitive closure. Transitive closure R+ dari relasi R pada data merupakan relasi terkecil yang mengandung R sebagai subset dan bersifat transitive. Suatu graph dikatakan transitive. Suatu graph dikatakan transitive jika terdapat jalan dari titik A ke titik B dan sebuah jalan dari titik B ke titik C, sehingga ada jalan dari titik A ke titik C.

3.3. Perancangan Sistem

Pada tahap perancangan sistem, dilakukan perencanaan untuk menentukan bagaimana sistem ini dapat mengidentifikasi record dimana duplikat pada penelitian ini berupa data identitas yang memiliki duplikat record. 3.3.1 Analisis Pengguna Sistem data cleaning duplikasi record pada data identitas menggunakan metode leveinsthein distance merupakan sistem yang berfungsi untuk mengidentifikasi duplikat record pada data identitas. Pengguna dapat menginstall sistem ini dalam komputer mereka untuk menggunakannya. 3.3.2 Use Case diagram Use case diagram merupakan model diagram UML yang digunakan untuk menggambarkan requirement fungsional yang diharapkan dari sebuah sistem. Use case dibuat untuk memudahkan pengguna dalam mengerti alur kerja suatu sistem sehingga sistem dapat digunakan sebaik mungkin. Aktor yang berperan dalam sistem yang akan dibangun adalah user aplikasi yang akan menggunakan sistem untuk data cleaning. Rancangan use case sistem dapat dilihat pada Gambar 3.9. Universitas Sumatera Utara Gambar 3.9. Use case sistem 3.3.3 Deskripsi Use Case Adapun penjelasan mengenai kegiatan- kegiatan di dalam diagram use case sistem data cleaning pada gambar 3.9 dapat dilihat pada Table 3.1. Tabel 3.1. Deskripsi Use Case Sistem Data Cleaning No. UseCase Deskripsi 1. Start Use case ini berfungsi untuk memulai sistem data cleaning. 2. Pilih File Use case ini berfungsi untuk menentukan data yang akan digunakan dan dapat melihat data yang dipilih. 3. Clean data Use case ini berfungsi sebagai proses untuk melakukan cleaning data sehingga dapat melihat data duplikat 3.3.4 Activity Diagram Diagram aktifitas activity diagram adalah kumpulan dari aktifitas dan transisi yang menghasilkan sebuah kegiatan. Activity diagram merupakan sebah tipe dari diagram workflow yang megambarkan tentang aktivitas dari pengguna ketika melakukan setiap kegiatan. Berikut ini adalah Activity diagram sistem yang akan dibangun. Universitas Sumatera Utara Gambar 3.10. Activity Diagram Melihat Form Utama Pada Gambar 3.10. dapat dilihat ketika user ingin melihat tampilan utama, user dapat memilih tampilan utama pada sistem pada saat memulai sistem. Sistem akan menampilkan form utama yang ada pada sistem. Untuk activity diagram tampilan form proses yang dapat ditampilkan dengan menggunakan tombol start oleh user pada form utama dapat dilihat pada Gambar 3.11. Gambar 3.11. Activity Diagram Halaman Data Cleaning Universitas Sumatera Utara Pada Gambar 3.11 dapat dilihat bahwa user dapat melakukan mengklik tombol start pada form utama. Sistem akan memproses yang dilakukan oleh user kemudian sistem akan menampilkan form proses kepada user. Untuk activity diagram pada form proses dapat dilihat pada Gambar 3.12. Gambar 3.12. Activity Diagram Proses Data Cleaning Pada Gambar 3.12. dapat dilihat ketika user ingin melihat proses data cleaning pada data duplikat, user dapat melakukan pilih menu proses pada sistem. Sistem akan menampilkan keseluruhan proses yang ada pada sistem. User dapat melakukan cleaning data duplikat pada menu proses, dengan melakukan beberapa tahapan yaitu Universitas Sumatera Utara memilih data, menampilkan data, menampilkan proses sort key, menampilkan proses n-gram, jaccard, leveinsthein distance, dan menampilkan data duplikat sebagai hasil.

3.4. Perancangan Antarmuka Sistem