ANALISIS DUPLICATE FILE FINDER MENGGUNAKAN METODE MD5 HASH SKRIPSI WAHYUNI FARAH JUWITA 111421081
ANALISIS DUPLICATE FILE FINDER MENGGUNAKAN METODE MD5 HASH SKRIPSI Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah
Sarjana Ilmu Komputer WAHYUNI FARAH JUWITA
111421081 PROGRAM STUDI EKSTENSI S1 ILMU KOMPUTER FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA MEDAN
2014
PERSETUJUAN
Judul : ANALISIS DUPLICATE FILE FINDER MENGGUNAK- AN METODE MD5 HASH
Kategori : SKRIPSI Nama : WAHYUNI FARAH JUWITA Nomor Induk Mahasiswa : 111421081 Program Studi : EKSTENSI S1 ILMU KOMPUTER Fakultas : ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA Diluluskan di Medan,
Komisi Pembimbing : Pembimbing 2 Pembimbing 1 Amer Sharif, S.Si, M.Kom Drs. Agus Salim Harahap, M. Sc
NIP. 19540828 198103 1 004 Diketahui/disetujui oleh Program Studi Ekstensi S1 Ilmu Komputer Ketua, Dr. Poltak Sihombing, M.Kom NIP. 19620317 199103 1 001
PERNYATAAN
ANALISIS DUPLICATE FILE FINDER MENGGUNAKAN METODE MD5 HASH SKRIPSI Saya mengakui bahwa skripsi ini adalah hasil karya saya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing telah disebutkan sumbernya.
Medan. Maret 2014 Wahyuni Farah Juwita 111421081
PENGHARGAAN
Alhamdulillah, puji syukur penulis panjatkan kehadirat Allah SWT, yang telah memberikan rahmat dan hidayah-Nya serta segala sesuatunya dalam hidup. Sehingga penulis dapat menyelesaikan penyusunan skripsi ini, sebagai syarat untuk memperoleh gelar Sarjana Komputer, Program Studi S1 Ilmu Komputer Universitas Sumatera Utara.
Ucapan terima kasih penulis sampaikan kepada semua pihak yang telah membantu penulis selama pengerjaan skripsi ini, antara lain kepada:
1. Bapak Prof. DR. Muhammad Zarlis, M.Sc Selaku Dekan Fakultas Ilmu Komputer dan Teknologi Informasi, Universitas Sumatera Utara.
2. Bapak Dr. Poltak Sihombing, M.Kom selaku Ketua Program Studi Ilmu Komputer, Fakultas Ilmu Komputer dan Teknologi Informasi, Universitas Sumatera Utara.
3. Bapak Drs. Agus Salim Harahap, M.Si dan Bapak Amer Sharif, S.Si, M.Kom sebagai Dosen Pembimbing yang telah memberikan bimbingan, saran, masukkan kepada penulis untuk menyempurnakan tulisan ini.
4. Ibu Dian Rachmawati, S.Si, M.Kom dan Ibu Siti Dara Fadilla, S.Si, M.T sebagai Dosen Pembanding yang telah memberikan kritik dan saran.
5. Seluruh dosen dan pegawai Program Studi Ekstensi S1 Ilmu Komputer Universitas Sumatera Utara.
6. Teristimewa kepada orang tua penulis, ayahanda Ir. H. Irwan Hidayat MMA dan Ibunda Hj. Mirna Duma Lubis atas do’a dan kasih sayang yang tidak pernah putus, kepada adinda saya Agoeng Wiyogo dan Triana Bayu Pramudito atas dorongan semangat yang diberikan kepada penulis.
7. Teman-teman seangkatan Ekstensi S1 Ilmu Komputer tahun 2011.
Semoga Allah SWT memberikan limpahan karunia semua pihak yang membantu penulis dalam menyelesaikan skripsi ini. Akhirnya penulis berharap bahwa skripsi ini bermanfaat terutama kepada penulis maupun para pembaca serta semua pihak akademisi yang tertarik mengembangkannya. Penulis menyadari bahwa skripsi ini masih jauh dari kesempurnaan, oleh karena itu penulis menerima saran dan kritik demi kesempurnaan skripsi ini sehingga bermanfaat bagi semua pihak.
Medan, Maret 2014 Penulis
Wahyuni Farah Juwita
ABSTRAK
merupakan salah satu komponen inti dari sebuah komputer dalam berbagai
Harddisk
jenis dan ukuran. Harddisk dengan ukuran besar bisa menjadi penuh, meskipun merasa tidak menyimpan file yang berukuran besar. Kemungkinan terjadi tersimpannya file yang sama pada directory yang berbeda sangat besar, mencari file yang sama tersebut pada masing-masing directory sangat sulit dilakukan dan akan memakan waktu yang lama. Aplikasi Duplicate File Finder mampu menyelesaikan masalah tersebut. Aplikasi Duplicate File Finder mampu mengetahui file yang sama terletak di directory yang berbeda dengan menentukan directory yang terdapat pada
harddisk dan media penyimpanan lain. Aplikasi ini dapat menghitung nilai hash
sehingga dapat menemukan file yang sama. Aplikasi Duplicate File Finder menggunakan metode MD5 hash. MD5 (Message-Digest algorithm 5) digunakan untuk melakukan pemeriksaan integritas file dalam berbagai situasi. Aplikasi Duplicate File Finder ini dirancang menggunakan bahasa pemrograman C#.
Kata Kunci: File, Duplikat File, Pencarian File, MD5 Hash, C#.
ANALYSIS DUPLICATE FILE FINDER USING MD5 HASH
ABSTRACT
Hard drive is one of the core components of computer in various types and sizes. Hard drive with a largest size could be full, even it has not stored any large files. There ’s a lot of possibility to have same files on a different directory, searching for the same file in each directory is very difficult and take a long time. Duplicate File Finder application is able to resolve the problem. Duplicate File Finder application be able to find out the same file that located in a different directory on directory in hard drive.
Duplicate File Finder application be able to computed the hash value that can find the same file. Duplicate File Finder application uses MD5 hash method. MD5 (Message- Digest algorithm 5) is used to reverse current file integrity checks under most circumstances. Duplicate File Finder application was designed using C# programming language. Keywords: File, Duplicate File, File Finder, MD5 Hash, C#.
Halaman Persetujuan ii
Pernyataan iii
Penghargaan iv
Abstrak vi
Abtract vii
Daftar Isi viii
Daftar Tabel x
Daftar Gambar xi
Bab 1 Pendahuluan
1
1.1 Latar Belakang
1
1.2 Rumusan Masalah
2
1.3 Batasan Masalah
2
1.4 Tujuan Penelitian
2
1.5 Manfaat Penelitian
3
1.6 Metode Penelitian
3
1.7 Sistematika Penulisan
4 Bab 2 Landasan Teori
5
2.1 Sistem Berkas
5
2.2 Pengertian File
5
2.2.1 Nama Berkas
6
2.2.2 Atribut Berkas
6
2.2.3 Ekstensi Berkas
6
2.2.4 Manajemen Berkas
7
2.3 Media Penyimpanan File
7
2.3.1 Penyimpanan Primer
7
2.3.2 Penyimpana sekunder
9
2.4 Jenis Media Penyimpanan File
9
2.4.1 Magnetic Tape
9
2.4.2 Magnetic Disk
10
2.4.3 Optical Disk
11
2.4.4 SSD (Solid State Drive)
11
2.5 Organisasi Disk
12
2.5.1 FAT (File Allocation Table)
13
2.5.2 NTFS (New Tecnology File System)
14
2.6 Fungsi Hash
15
2.6.1 Fungsi Hash Satu Arah
16
2.6 Checksum
17
2.7 Message Digest 5 (MD5)
18 Bab 3 Analisis dan Perancangan
19
3.1 Analisis
19
3.1.1 Analisis Masalah
19
3.2 Analisis Kebutuhan Sistem
20
3.2.1 Analisis Fungsional Sistem
20
3.2.2 Analisis Non-fungsional Sistem
21
3.3 Analisis Menghitung Hash dengan Algoritma MD5
21
3.4 Perancangan Sistem
30
3.4.1 Flowchart Umum Sistem
31
3.4.2 Flowchart Pembuatan List-List File dan Hash
32
3.4.3 Flowchart Pencocokan Hash
33
3.4.4 Perancangan Unified Modeling Language (UML)
33
3.4.5 Activity Diagram
36
3.5 Perancangan Tampilan Antarmuka (Interface)
37
3.5.1 Rancangan Jendela Utama
37
3.5.2 Rancangan Jendela Pencarian File Duplikat
38
3.5.3 Rancangan Jendela Tentang
39 Bab 4 Implementasi Dan Pengujian
40
4.1 Implementasi Sistem
40
4.1.1 Tampilan Jendela Utama
40
4.1.2 Tampilan Jendela Pencarian File Duplikat
41
4.1.2 Tampilan Jendela Tentang
41
4.2 Pengujian Sistem
42
4.2.1 Proses Pencarian File
42
4.2.2 Pengujian Pencarian File
46 Bab 5 Kesimpulan Dan Saran
49
5.1 Kesimpulan
49
5.2 Saran
49 Daftar Pustaka Lampiran A: Listing Program Lampiran B: Curriculum Vitae
DAFTAR TABEL
3.7 Rincian operasi pada fungsi G(b,c,d)
4.1 Hasil pengujian pencarian file
35
3.12 Dokumentasi naratif Use Case Pendataan File Duplikat
35
3.11 Dokumentasi naratif Use Case Pencarian File Duplikat
28
3.10 Hasil perhitungan 4 perulangan
28
3.9 Rincian operasi pada fungsi I(b,c,d)
27
3.8 Rincian operasi pada fungsi H(b,c,d)
27
26
Halaman
3.6 Rincian operasi pada fungsi F(b,c,d)
25
3.5 Nilai T[i]
24
3.4 Inisialisasi buffer MD
24
3.3 Hasil pengubahan 64 bit menjadi 16 blok
23
3.2 Hasil panjang string keseluruhan
22
3.1 Hasil pengubahan karakter
14
2.1 Perbandingan FAT, FAT32, dan NTFS
46
DAFTAR GAMBAR
4.3 Tampilan jendela Tentang
36
3.7 Rancangan jendela utama
37
3.8 Rancangan Jendela Pencarian File Duplikat
38
3.9 Rancangan Jendela Tentang
39
4.1 Tampilan jendela utama
40
4.2 Tampilan Jendela Pencarian File Duplikat
41
42
34
4.4 Langkah pencarian file
43
4.5 Jendela lokasi direktori file
43
4.6 Hasil pencarian file yang sama
44
4.7 Hasil pencarian MD5 (1)
44
4.8 Hasil pencarian MD5 (2)
45
4.9 Hasil pencarian MD5 (3)
3.6 Activity Diagram Pencarian File Duplikat
3.5 Use Case Pencarian File Duplikat
Halaman
12
2.1 RAM
7
2.2 ROM
8
2.3 Magnetic Tape
9
2.4 Harddisk
10
2.5 Optical Disk
11
2.6 SSD (Solid State Drive)
2.7 Pembagian Cluster
33
12
2.8 Contoh hashing beberapa buah pesan dengan panjang berbeda-beda
16
2.9 Fungsi hash satu arah
17
3.1 Diagram Ishikawa
20
3.2 Flowchart umum sistem
31
3.3 Flowchart Pembuatan List-List File dan Hash
32
3.4 Flowchart Pencocokan Hash
45