Functional Decomposition Diagram FDD Data Flow Diagram DFD

merupakan level tertinggi dari DFD yang menggambarkan seluruh input ke sistem atau output dari sistem. Diagram konteks akan memberi gambaran tentang keseluruan sistem. Sistem dibatasi oleh boundary dapat digambarkan dengan garis putus. Dalam diagram konteks hanya ada satu proses. Tidak boleh ada store dalam diagram konteks. Data Flow Diagram DFD adalah suatu diagram yang menggunakan notasi- notasi untuk menggambarkan arus dari data sistem, yang penggunaannya sangat membantu untuk memahami sistem secara logika, tersruktur dan jelas. DFD merupakan alat bantu dalam menggambarkan atau menjelaskan proses kerja suatu sistem. DFD sering digunakan untuk menggambarkan suatu sistem yang telah ada atau sistem baru yang akan dikembangkan secara logika tanpa mempertimbangkan lingkungan fisik di mana data tersebut mengalirmisalnya lewat telepon, surat dan sebagainya atau lingkungan fisik di mana data tersebut akan disimpan misalnya file kartu, microfiche, hard disk, tape, diskette, dll. DFD merupakan alat yang digunakan pada metodologi pengembangan sistem yang terstruktur structured analysis and design Gambar 2.3 Simbol-simbol pada DFD 2.1.9 Evaluasi Cluster Menggunakan Silhoutte Index Silhouette Index SI dapat digunakan untuk melakukan validasi terhadap sebuah data, cluster tunggal satu cluster dari sejumlah cluster, atau bahkan keseluruhan cluster. Metode ini yang paling banyak digunakan untuk memvalidasi cluster yang menggabungkan nilai kohesi dan separasi. Untuk menghitung nilai SI dari sebuah data ke-i, ada 2 komponen yaitu a i dan b i . a i adalah rata-rata jarak data ke-i terhadap semua data lainnya dalam satu cluster, dan b i didapatkan dengan menghitung rata-rata jarak data ke-i terhadap semua data dari cluster yang lain tidak dalam satu cluster dengan data ke-i, kemudian diambil yang terkecil Tan et al, 2006, Petrovic, 2003 pada Prasetyo, 2014: 283-284. Berikut formula untuk mnghitung : = − ∑ , � , = , , … , �= �≠ …………………………..6.7.1 , � adalah jarak data ke-i dengan data ke-r dalam satu cluster j, sedangkan m j adalah jumlah dalam cluster ke-j. Berikut formula untuk meghitung : = = ,…, ≠ { � ∑ , � }, = , , … , � �= �≠ …………….6.7.2 Untuk mendapatkan = − ax { , } ……………………….6.7.3 Nilai a i mengukur seberapa tidak mirip sebuah data dengan cluster yang diikutinya, nilai yang semakin kecil menandakan semakin tepatnya data tersebut berada dalam cluster tersebut. Nilai b i yang besar menandakan bahwa data tersebut semakin tepat berada daam cluster tersebut. Nilai SI negative a i b i menandakan bahwa data tersebut tidak tepat berada dalam cluster tersebut karena lebih dekat dengan cluster yang lain. SI bernilai 0 atau mendekati 0 berarti data tersebut posisinya berada di perbatasan di antara dua cluster. Untuk nilai SI dari sebuah cluster didapatkan dengan menghitung rata-rata nilai SI semua data yang bergabung dalam cluster tersebut, seperti pada persamaan berikut: = j ∑ = ……………………….6.7.4 Seentara nilai SI global didapatkan dengan menghitung rata-rata nilai SI dari semua cluster seperti pada persamaan berikut: = ∑ = ……………………….6.7.5 k adalah jumlah cluster.

2.1.10 Strategi Pengujian Perangkat Lunak

Menurut Everret, G.D. dan McLeod R. strategi pengujian perangkat lunak dapat di bagi menjadi 4 bagian utama yaitu Static Testing, White Box Testing, Black Box Testing, dan Performance Testing.

2.1.10.2 Black Box Testing

Black Box Testing atau dikenal sebagai “Behaviour Testing” merupakan suatu metode pengujian yang digunakan untuk menguji executable code dari suatu perangkat lunak terhadap perilakunya. Pendekatan Black Box Testing dapat dilakukan jika sudah ada executable code. Orang-orang yang terlibat dalam Black Box Testing adalah tester, end-user, dan developer. Tester merencanakan keahlian eksekusi pada negative dan positive black box testing. End-user memiliki pengetahuan bagaimana perilaku bisnis yang tepat dan sesuai dengan ekspektasi, dan developer memiliki pengetahuan tentang perilaku bisnis yang di implementasikan pada perangkat lunak. Tester melakukan black box testing bersama end-user dan developer memvalidasi hasil yang diharapkan dengan hasil pengujian. Jika hasil pengujian tidak sama dengan ekspektasi maka developer harus memperbaiki kesalahan tersebut baik itu pada spesifikasi maupun implementasi.

2.2 Tinjauan Empiris

Pada penelitian ini, peneliti menggunakan beberapa penelitian terkait yang pernah dilakukan oleh peneliti lain sebagai tinjauan studi, yaitu sebagai berikut :

1. Extension to the k-Means Algorithm for Clustering Large Data Sets with

Categorical Values . Huang, Z. 1998. Pada penelitian ini, penulis mengembangkan sebuah algoritma baru dari algoritma k-Means yang digunakan untuk melakukan proses clustering pada data yang memiliki nilai kategorikal yang diberi istilah k-Modes. Hasil yang diperoleh dari penelitian ini membuktikan bahwa algoritma k-Modes mampu melakukan proses clustering pada data set kategorikal yang besar secara efisien.

2. Clustering Categorical Data with k-Modes. Huang, Z. 2009.

Pada penelitian ini, penulis menjabarkan hasil pengembangan algoritma k- Modes untuk melakukan proses clustering pada data dengan nilai kategorikal dengan sedikit perubahan pada proses perhitungan ketidaksamaan dissimilarity menggunakan fungsi yang didefinisikan oleh Ng, Li, Huang He, 2007.

3. Attribute Value Weighting in k-Modes Clustering. Zengyou He, Xiaofei Xu,

Shengchun Deng, 2011. Pada penelitian ini, penulis mengajukan sebuah metode baru dalam proses perhitungan ketidaksamaan pada bagian algoritma k-Modes. Metode yang dikembangan adalah weighted dissimilarity measure menggantikan perhitungan simple matching pada algoritma k-Modes yang asli. Adapun persamaan yang digunakan pada metode weighted dissimilarity measure terdapat pada pemaparan sebagai berikut : , = { − � , = , ≠ …………………………. 2.2.1 Dimana : � = − ∑ � � | � � | − − � ∈ .............….2.2.2