3.2 Perancangan Aplikasi
Pada perancangan aplikasi peringkatan dan pengklasifikasian email ini akan dijelaskan mengenai rancangan aplikasi yang akan dikerjakan serta fitur-fitur yang
akan dipakai pada aplikasi tersebut. Objek dari penelitian ini yaitu inbox email yang ada. Hal ini digunakan untuk pemberian hasil peringkatan email terhadap kata kunci
yang dimasukkan. Kegiatan riset untuk text mining antara lain ekstraksi dan penyimpanan text,
preprocessing akan konten email, pengumpulan data statistic dan analisa konten.
3.2.1 Ekstraksi dokumen
Teks yang akan dilakukan proses text mining, pada umumnya memiliki beberapa karakteristik diantaranya adalah memiliki dimensi yang tinggi, terdapat noise pada
data, dan terdapat struktur teks yang tidak baik. Cara yang digunakan dalam mempelajari suatu data teks, adalah dengan terlebih dahulu menentukan fitur-fitur
yang mewakili setiap kata untuk fitur yang ada pada dokumen. Sebelum menentukan fitur-fitur yang mewakili, diperlukan tahap preprocessing yang akan dilakukan secara
umum dalam text mining pada dokumen, yaitu case folding, tokenizing.
3.2.1.1 Case Folding
Dalam tahap ini dokumen yang masuk akan dirubah menjadi huruf kecil. Hanya huruf „a‟ sampai dengan „z‟ yang hanya diterima. Karakter selain huruf itu, baik angka
maupun simbol-simbol lain akan dihilangkan dan dianggap sebagai delimiter.
3.2.1.2 Tokenizing
Tahap tokenizing disebut juga sebagai parsing, yaitu pemotongan tahap pemotongan string input berdasarkan tiap kata yang menyusunnya. Karena dalam tahap
sebelumnya semua karakter dan symbol telah dihilangkan kecuali huruf „a‟ sampai „z‟ maka tahap parsing ini delimiter yang dipakai sebagai pemotongan adalah spasi.
Diagram alir case folding dan tokenizing dapat dilihat pada Gambar 3.3
Universitas Sumatera Utara
Gambar 3.3 Proses Case folding dan Tokenizing
3.2.2. Analisa
Tahap analyzing merupakan tahap penentuan seberapa jauh keterhubungan antar kata kata antar dokumen yang ada. Dalam tahap ini, dicari bobot tiap tiap dokumen
terhadap kata kunci yang dimasukkan. Tahap analisa ini algoritma yang digunakan adalah Algoritma TFIDF dan Vector Space Model
Start
Input dokumen
Ubah semua karakter dalam huruf kecil
Hapus Karakter dan symbol selain a-z
Potong dokumen menjadi kata berdasarkan spasi
Hasil Kata
Stop
Universitas Sumatera Utara
3.2.2.1. Algoritma TFIDF Term Frequency – Inversed Document Frequency
Metode TFIDF ini merupakan metode pembobotan dalam bentuk sebuah metode yang merupakan integrasi antar term frequency tf, dan inverse document frequency
idf. Dari formula yang dijelaskan bab sebelumnya dapat digambar dalam diagram alir pada Gambar 3.4 dan Gambar 3.5
ya tidak
Gambar 3.4 Diagram Alir Pembobotan TFIDF
START Kata hasil
prepocessing
Hitung term frequency tf Hitung document frequencydf
Cek df==0
df=1 Hitung Ddf = jumlah
dokumen df
A
Universitas Sumatera Utara
ya
tidak
Gambar 3.5 Diagram Alir Pembobotan TFIDF
Selain bobot W masing masing dokumen diketahui, maka dilakukan proses sorting pengurutan dimana semakin besar nilai W, semakin besar tingkat similaritas dokumen
tersebut terhadap kata yang dicari, demikian sebaliknya. Jika hasil pembobotan memiliki bobot yang sama, maka algoritma ini dilanjutkan dengan menggunakan
algoritma vector space model. Berikut diagram analisa algoritma TFIDF dapat dilihat
pada Gambar 3.6
Cek
Ddf=10
Hitung IDF = log Ddf
Hitung bobot = tf idf
Pengurutan bobot secara descending
Bobot terurut
Stop A
Universitas Sumatera Utara
bobot sama
Gambar 3.6 Analisa TFIDF 3.2.2.2 Cosine Similarity
Seperti dijelaskan pada pembahasan sebelumnya bahwa ide dari metode ini adalah dengan menghitung cosinus sudut dari dua vector , yaitu W dari tiap dokumen dan W
dari kata kunci . Dari perhitungan tersebut dapat dibuat diagram alir sebagaimana
Gambar 3.7 Start
Input kata kunci
Analyzing dengan data dokumen yang sudah
Cek hasil bobot
Wi=Wn
Sorting
Stop
Vector Space Model
Universitas Sumatera Utara
For 1=0;ijmlh W;i++
back
Next
Gambar 3.7 Vector Space Model
Start
Input W hasil tfidf
Hitung Sqrt kata kunci
Hitung Sqrt Di
Hitung Sum kk dot Di
Urutkan Cosine secara desc
Wcosine dalam urutan desc
Stop
Universitas Sumatera Utara
3.2.3. Use case diagram
Usecase Diagram merupakan gambaran fungsionalitas yang diharapkan dari sebuah sistem dan digunakan untuk merepresentasikan interaksi antara aktor dengan sistem.
Pembuatan usecase menekankan pada apa yang dibuat sistem, bukan bagaimana yang dibuat sistem.
Berikut ini adalah use diagram untuk aplikasi klasifikasi pada email dalam Gambar 3.8
User
System
Download email
Tampil list email
clasification email
Send email
Gambar 3.8 Usecase diagram Aplikasi klasifikasi email
Universitas Sumatera Utara
Berdasarkan usecase diagram pada gambar tersebut , dokomentasi naratif pada proses klasifikasi email yang terdapat dalam usecase diagram diatas dapat dilihat dalam
Tabel 3.1 berikut ini
Tabel 3.1 Tabel Dokumentasi Naratif Usecase klasifikasi email
Nama Usecase Download email
Aktor Pengguna
Brief Description Usecase ini menggambarkan pengguna dapat melakukan
download terhadap email Pre-condition
Pengguna menginput ID server,account,password,port Basic Flow
Kegiatan Aktor Respon Sistem
1. Membuka menu email pada aplikasi
3. Menginput ID pada kotak
dialog Receive
Email lalu
tekan download
5. Melihat tampilan list email yang ada
2. Mengklik submenu download yang berisi Receive Email berupa
server,account,password,port,total 4.
Sistem akan
melakukan autentifikasi terhadap inputan ID,
jika salah maka akan kembali lagi ke kotak dialog dan jika benar
maka sistem akan mendownload inbox email .
Alternate Flow -
Post-condition Email sudah terdownload dan ditampilkan pada halaman
utamahome
Universitas Sumatera Utara
Dokumen naratif pada klasifikasi email pada download email, untuk usecase pilih view list email terdapat pada tabel 3.2 berikut ini
Tabel 3.2 Tabel Dokumentasi Naratif Usecase View List Email
Nama Usecase View list email full email
Aktor Pengguna
Brief Description
Usecase ini menampikan inbox email No, Form, Subject, Date Time
Pre-condition Pengguna masuk ke menu utama tampilan list email
Basic Flow Kegiatan Aktor
Respon Sistem 1. Mengklik email yang
ingin dilihat 3. Memilih tombol exit jika
ingin kluar dari aplikasi tersebut
2. Menampilkan keseluruhan isi dari email yang ingin dlihat
4. Sistem akan otomatis keluar
Alternate Flow -
Post-condition View list sudah dilhat secara detail dan melakukan penyimpanan
ke database
Universitas Sumatera Utara
Sedangkan untuk dokumentasi naratif pada aplikasi klasifikasi email dengan algoritma vector space model untuk usecase pilih menu filtering terdapat pada tabel
3..3 berikut ini
Tabel 3..3 Tabel Dokumentasi Naratif Usecase Klasifikasi
Nama Usecase Clasification
Aktor Pengguna
Brief Description
Usecase ini akan melakukan klasifikasi dan perangkingan terhadap email yang sudah di save sebelumnya.
Pre-condition Pengguna masuk ke menu utama clasification
Basic Flow Kegiatan Aktor
Respon Sistem 1.
Membuka menu
clasification 3. Memasukkan keyword
dalam pengklasifikasian 5.
Memilih klasifikasi
berdasarkan sender 7.Memilih
klasifikasi berdasarkan subject
9.Memilih klasifikasi
berdasarkan date time 11.Memilih
klasifikasi berdasarkan
full emailbody
13. Menekan tombol exit untuk keluar dari aplikasi
2. Menampilkan Filtering_form berdasarkan sender, subject, date
time, full emailbody 4.
Sistem akan
memberikan pilihan klasifikasi berdasarkan
sender ,subject, date time, body 6. Menampilkan folder klasifikasi
berdasarkan sender 8.Menampilkan folder klasifikasi
berdasarkan subject 10.Menampilkan folder klasifikasi
berdasarkan date time 12.Menampilkan folder klasifikasi
berdasarkan full emailbody 14.sistem akan lansung keluar
otomatis
Alternate Flow -
Post-condition Sistem
Universitas Sumatera Utara
Sedangkan untuk dokumentasi naratif pada aplikasi klasifikasi email untuk mengirim email untuk usecase pilih menu send email terdapat pada tabel 3..4 berikut ini
Tabel 3.4 Tabel Dokumentasi Naratif Usecase send email
Nama Usecase Send email
Aktor Pengguna
Brief Description
Usecase ini akan melakukan pengiriman email send email
Pre-condition Pengguna masuk ke menu utama email
Basic Flow Kegiatan Aktor
Respon Sistem 1. Membuka menu email
3. Mengisi form smtp send email
yakni account,
password, to,
subject, messages, attach file lalu
tekan send 2. Menampilkan smtp send email
berisi server, port,
account, password, to, subject, messages,
attach file, send 4. Sistem akan mengirim email
tersebut
Alternate Flow -
Post-condition Sistem akan menampilkan script success jika email telah
terkirim Email sent
Universitas Sumatera Utara
3.2.4. Activity Diagram
Activity diagram menggambarkan berbagai alir aktivitas dalam sistem yang dirancang, bagaimana masing-masing alir berawal, decision yang mungkin terjadi, dan
bagaimana mereka berakhir. Sebuah aktivitas dapat direalisasikan oleh satu usecase atau lebih. Aktivitas
menggambarkan proses yang berjalan, sementara usecase menggambarkan bagaimana aktor menggunakan sistem untuk melakukan aktivitas. Gambar 3.9 berikut ini akan
mengilustrasikan activity diagram menggunakan menu utama.
sistem Pengguna
Membuka Aplikasi Menampilkan main menu
Email Clasification
Tampilan menu dipilih
Gambar 3.9 Activity diagram menu utama
Universitas Sumatera Utara
Activity diagram untuk pilihan menu dapat dilihat pada Gambar 3.10 berikut.
Sistem Pengguna
Menampilkan menu email Pilih download
Menampilkan form receive mail
Menginput ID server,user,pass,port
Proses download
Menampilkan hasil download
Gambar 3.10 Activity diagram menu pilihan email
Universitas Sumatera Utara
Untuk pilihan filtering, activity diagramnya dapat dilihat pada Gambar 3.11 berikut
Sistem Pengguna
Menampilkan menu klasifikasi Memasukkan kata kunci
Menampilkan klasifikasi berdasarkan sender,subject,body
Memilih pengklasifikasian berdasarkan fieldnya
Proses klasifikasi
Menampilkan hasil klasifikasi
Gambar 3.1.1 Activity diagram menu filter
Universitas Sumatera Utara
Untuk pengiriman email, activity diagramnya dapat dilihat pada Gambar 3.12 berikut
Sistem Pengguna
Menampilkan menu email Menglik send email
Menampilkan form smtp send email
Mengisi form smtp send email
Proses pengiriman send
Menampilkan email sent
Gambar 3.1.2 Activity diagram submenu send email
Universitas Sumatera Utara
3.3. Perancangan antar muka