3.2.8 Pembacaan Data Duplikat pada Suatu Window
Pembacaan data duplikat pada suatu window dilakukan menggunakan metode transitive closure. Transitive closure R+ dari relasi R pada data merupakan relasi
terkecil yang mengandung R sebagai subset dan bersifat transitive. Suatu graph dikatakan transitive. Suatu graph dikatakan transitive jika terdapat jalan dari titik A
ke titik B dan sebuah jalan dari titik B ke titik C, sehingga ada jalan dari titik A ke titik C.
3.3. Perancangan Sistem
Pada tahap perancangan sistem, dilakukan perencanaan untuk menentukan bagaimana sistem ini dapat mengidentifikasi record dimana duplikat pada penelitian ini berupa
data identitas yang memiliki duplikat record.
3.3.1 Analisis Pengguna
Sistem data cleaning duplikasi record pada data identitas menggunakan metode leveinsthein distance merupakan sistem yang berfungsi untuk mengidentifikasi
duplikat record pada data identitas. Pengguna dapat menginstall sistem ini dalam komputer mereka untuk menggunakannya.
3.3.2 Use Case diagram
Use case diagram merupakan model diagram UML yang digunakan untuk menggambarkan requirement fungsional yang diharapkan dari sebuah sistem.
Use case dibuat untuk memudahkan pengguna dalam mengerti alur kerja suatu sistem sehingga sistem dapat digunakan sebaik mungkin. Aktor yang berperan
dalam sistem yang akan dibangun adalah user aplikasi yang akan menggunakan sistem untuk data cleaning. Rancangan use case sistem dapat dilihat pada
Gambar 3.9.
Universitas Sumatera Utara
Gambar 3.9. Use case sistem
3.3.3 Deskripsi Use Case
Adapun penjelasan mengenai kegiatan- kegiatan di dalam diagram use case sistem data cleaning pada gambar 3.9 dapat dilihat pada Table 3.1.
Tabel 3.1. Deskripsi Use Case Sistem Data Cleaning No.
UseCase Deskripsi
1. Start
Use case ini berfungsi untuk memulai sistem data cleaning.
2. Pilih File
Use case ini berfungsi untuk menentukan data yang akan digunakan dan dapat melihat data yang dipilih.
3. Clean data
Use case ini berfungsi sebagai proses untuk melakukan cleaning data sehingga dapat melihat data duplikat
3.3.4 Activity Diagram
Diagram aktifitas activity diagram adalah kumpulan dari aktifitas dan transisi yang menghasilkan sebuah kegiatan. Activity diagram merupakan sebah tipe dari diagram
workflow yang megambarkan tentang aktivitas dari pengguna ketika melakukan setiap kegiatan. Berikut ini adalah Activity diagram sistem yang akan dibangun.
Universitas Sumatera Utara
Gambar 3.10. Activity Diagram Melihat Form Utama
Pada Gambar 3.10. dapat dilihat ketika user ingin melihat tampilan utama, user dapat memilih tampilan utama pada sistem pada saat memulai sistem. Sistem
akan menampilkan form utama yang ada pada sistem. Untuk activity diagram tampilan form proses yang dapat ditampilkan dengan
menggunakan tombol start oleh user pada form utama dapat dilihat pada Gambar 3.11.
Gambar 3.11. Activity Diagram Halaman Data Cleaning
Universitas Sumatera Utara
Pada Gambar 3.11 dapat dilihat bahwa user dapat melakukan mengklik tombol start pada form utama. Sistem akan memproses yang dilakukan oleh user kemudian
sistem akan menampilkan form proses kepada user. Untuk activity diagram pada form proses dapat dilihat pada Gambar 3.12.
Gambar 3.12. Activity Diagram Proses Data Cleaning
Pada Gambar 3.12. dapat dilihat ketika user ingin melihat proses data cleaning pada data duplikat, user dapat melakukan pilih menu proses pada sistem. Sistem akan
menampilkan keseluruhan proses yang ada pada sistem. User dapat melakukan cleaning data duplikat pada menu proses, dengan melakukan beberapa tahapan yaitu
Universitas Sumatera Utara
memilih data, menampilkan data, menampilkan proses sort key, menampilkan proses n-gram, jaccard, leveinsthein distance, dan menampilkan data duplikat sebagai hasil.
3.4. Perancangan Antarmuka Sistem