Cluster-isasi Pada John Hopkins University Ionosphere Dataset

3.5. Cluster-isasi Pada John Hopkins University Ionosphere Dataset

John Hopkins University Ionosphere Dataset adalah sebuah dataset yang dikumpulkan oleh Vince Sigillito pada tahun 1989 yang bersumber dari Space Physics Group Applied Physics Laboratory John Hopkins University terdiri dari 35 input features dari rangakaian 16 antenna frekuensi tinggi dengan total energi yang dialirkan pada tingkat 6,4 kilowatts Sigillito, 1989 . Target pada dataset ini adalah elektron bebas pada ionosphere yang menunjukkan kondisi baik jika masih terdapat elektron bebas pada ionosphere dan menunjukkan kondisi buruk jika sebaliknya. Berikut disajikan deskripsi John Hopkins University Ionosphere Dataset: Universitas Sumatera Utara Tabel 3.11 Training Sample John Hopkins University Ionosphere Dataset 35 Good … Good … Bad … Bad 34 -0,4 … … 0,2 … 33 0,1 … 0,7 … -0,1 … 32 -0,5 … … 0,3 … 31 -0,5 … … 0,3 … 30 0,4 … 0,7 … … 29 -0,3 … 0,2 … 0,1 … 28 0,2 … 1 … -0,1 … 27 -0,4 … … 0,2 … 0,2 26 0,4 … 0,8 … … 1 25 -0,5 … -0,1 … 0,2 … 24 0,5 … 0,8 … … 23 -0,4 … 0,1 … 0,2 … -1 22 0,3 … 0,7 … … 1 21 -0,2 … … … 20 0,5 … 0,6 … 0,2 … 19 -0,3 … … 0,2 … -1 18 0,5 … 1 … … -1 17 -0,3 … … 0,3 … 16 0,8 … 0,8 … … 15 -0,3 … … 0,2 … -0,1 Universitas Sumatera Utara 14 0,6 … 0,7 … … -0,1 13 -0,4 … 0,1 … 0,3 … 0,3 12 0,5 … 0,8 … 0,2 … 1 11 -0,1 … … 0,2 … 10 0,8 … 0,9 … 0,1 … 9 … … 0,1 … 1 8 1 … 0,8 … 0,2 … -1 7 -0,3 … 0,2 … 0,2 … 6 0,8 … 0,7 … 0,2 … 5 0,8 … -0,1 … 0,07 … 4 -0,05 … 0,2 … 0,1 … 3 0,9 … 0,9 … 0,3 … 2 … … … 1 1 … 1 … 1 … 1 radar sample 1 … 178 … 237 … 253 Universitas Sumatera Utara Berikut disertakan ringkasan dari masing-masing attribut dalam John Hopkins University Ionosphere Dataset, seperti yang disajikan dalam tabel 3.12 berikut: Tabel 3.12 Deskripsi John Hopkins University Ionosphere Dataset Attribute Name Attribute Type Max Min Mean Standard Deviasi radar 1 real 1 0,8733 0,3112 radar 2 real radar 3 real 1 -1 0,6110 0,4977 radar 4 real 1 -1 0,0258 0,4414 radar 5 real 1 -1 0,5705 0,5199 radar 6 real 1 -1 0,0989 0,4608 radar 7 real 1 -1 0,5332 0,4927 radar 8 real 1 -1 0,0858 0,5207 radar 9 real 1 -1 0,5103 0,5071 radar 10 real 1 -1 0,1592 0,4839 radar 11 real 1 -1 0,4891 0,5635 radar 12 real 1 -1 0,1311 0,4948 radar 13 real 1 -1 0,4165 0,6222 radar 14 real 1 -1 0,0707 0,4949 radar 15 real 1 -1 0,3609 0,6528 radar 16 real 1 -1 0,0617 0,4584 radar 17 real 1 -1 0,4033 0,6180 radar 18 real 1 -1 -0,0045 0,4968 radar 19 real 1 -1 0,3726 0,6263 radar 20 real 1 -1 -0,0154 0,5191 radar 21 real 1 -1 0,3321 0,6098 radar 22 real 1 -1 0,0390 0,5182 radar 23 real 1 -1 0,3511 0,6038 radar 24 real 1 -1 -0,0357 0,5275 radar 25 real 1 -1 0,3779 0,5785 Universitas Sumatera Utara radar 26 real 1 -1 -0,0486 0,5085 radar 27 real 1 -1 0,53524 0,5162 radar 28 real 1 -1 -0,0533 0,5500 radar 29 real 1 -1 0,3360 0,5759 radar 30 real 1 -1 -0,0170 0,5080 radar 31 real 1 -1 0,3049 0,5715 radar 32 real 1 -1 0,0065 0,5136 radar 33 real 1 -1 0,3037 0,5227 radar 34 real 1 -1 0,0175 0,4683 class categorical 1 NA NA Proses cluster pada John Hopkins University Ionosphere Dataset menggunakan Support Vector Machine dengan menggunakan radial basis function sebagai kernel sama seperti proses cluster pada Iris Plants Dataset yang telah dilakukan pada BAB 3, proses cluster pada John Hopkins University Ionosphere Dataset menggunakan 34 features yang akan dihitung nilai similarity nya untuk dapat menentukan apakah sebuah sample dalam kondisi baik atau buruk. Berikut disajikan proses cluster pada John Hopkins University Ionosphere Dataset: Berikut adalah contoh proses cluster pada sebuah training sample pada John Hopkins Ionosphere Dataset: radar1 = 1 radar8 = -0,3 radar15 = 0,6 radar22 = -0,2 radar29 =0,2 radar2 = 0 radar9 = 1 radar16 = -0,3 radar23 =0,3 radar30 =-0,3 radar3 = 0,9 radar10 = 0,03 radar17 = 0,8 radar24 =-0,4 radar31 =0,4 radar4 = -0,05 radar11 = 0,8 radar18 = -0,3 radar25 =0,5 radar32 =-0,5 radar5 = 0,8 radar12 = -0,1 radar19 = 0,5 radar26 =-0,5 radar33 =0,1 radar6 = 0,02 radar13 = 0,5 radar20 = -0,3 radar27 =0,4 radar34 =-0,4 radar7 = 0,8 radar14 = -0,4 radar21 = 0,5 radar28 =-0,4 yang akan di-cluster pada beberapa landmark yang ada: Universitas Sumatera Utara Training sample akan di-cluster terhadap landmark menggunakan standard deviasi = 0,5 pada persamaan 2.10, sehingga akan diperoleh nilai similarity function sebagai berikut: Untuk kemudian diolah dalam komputer menggunakan MATLAB R2010a dalam perhitungan me-minimisasi nilai pada fungsi pada persamaan 2.12 untuk mendapatkan kesimpulan bahwa sample x termasuk dalam class yang dimiliki oleh , , . Berikut akan disajikan dalam tabel hasil dari seluruh perhitungan proses cluster pada training sample dan landmark pada John Hopkins University Ionosphere Dataset: Universitas Sumatera Utara Tabel 3.13 Cluster Pada John Hopkins University Ionosphere Dataset sample 1 4 9 11 … 2 7 22 28 1 1 0,68 1 0,42 … 4 0,68 1 1 0,42 … 9 1 1 1 0,42 … 11 0,42 0,42 0,42 1 … … … … … … … … … … … 2 … 1 0,32 0,98 0,68 7 … 0,32 1 0,22 0,06 22 … 0,98 0,22 1 0,78 28 … 0,68 0,06 0,78 1 keterangan: = instance tidak ada electron bebas pada ionosphere = instance ada electron bebas pada ionosphere = sample dengan nilai similarity function = 1 Hasil cluster-isasi didapat bahwa dalam John Hopkins University Ionosphere Dataset terdapat 174 sample termasuk dalam class kondisi baik, dan 126 sample termasuk dalam class kondisi baik. 3.6. Konfigurasi Support Vector Backpropagation Setelah seluruh dataset di-cluster pada masing-masing class, maka langkah selanjutnya adalah merancang konfigurasi Support Vector Backpropagation yang di- setting secara unik pada masing-masing dataset, berikut disajikan konfigurasi Support Vector Backpropagation yang digunakan dalam penelitian ini: 1. Konfigurasi Support Vector Backpropagation pada Iris Plants Dataset Konfigurasi Support Vector Backpropagation pada Iris Plants Dataset menggunakan jaringan syaraf tiruan dengan 4 buah neuron input dengan 1 buah hidden layer dengan 4 buah neuron dengan 2 buah neuron pada output Universitas Sumatera Utara layer beserta property khusus yang digunakan Support Vector Backpropagation seperti yang dijelaskan dalam tabel berikut: Tabel 3.14 Konfigurasi Support Vector Backpropagation Pada Iris Plants Dataset x 1 1 x 1 2 x 1 3 x 1 4 x 2 1 x 2 2 x 2 3 x 2 4 x 3 1 x 3 2 SVM Ouput Gambar 3.1 Arsitektur Support Vector Backpropagation Pada Iris Plants Dataset Backpropagation Segment Input layer 4 neurons Hidden layer 4 neurons Output layer 2 neurons Bobot layer pertama Matriks 4 baris x 5 kolom Bobot layer kedua Matriks 2 baris x 5 kolom Fungsi aktivasi Sigmoid biner Learning rate 0.02 Tolerance function 1.0e-8 Fungsi minimisasi fmincg Support Vector Machine Segment Fungsi kernel Radial Basis Function Showplot True Universitas Sumatera Utara 2. Konfigurasi Support Vector Backpropagation pada Wisconsin Diagnostic Breast Cancer Dataset Konfigurasi Support Vector Backpropagation pada Wisconsin Diagnostic Breast Cancer Dataset menggunakan jaringan syaraf tiruan dengan 9 buah neuron pada input layer dan 5 buah neuron pada hidden layer dan 2 buah neuron pada output layer beserta property khusus yang digunakan dalam Support Vector Backpropagation seperti yang dijelaskan pada tabel berikut: Tabel 3.15 Konfigurasi Support Vector Backpropagation Pada Wisconsin Diagnostic Breast Cancer Dataset Backpropagation Segment Input layer 9 neurons Hidden layer 5 neurons Output layer 2 neurons Bobot layer pertama Matriks 5 baris x 9 kolom Bobot layer kedua Matriks 2 baris x 6 kolom Fungsi aktivasi Sigmoid biner Learning rate 0.02 Tolerance function 1.0e-8 Fungsi minimisasi fmincg Support Vector Machine Segment Fungsi kernel Radial Basis Function Showplot True Universitas Sumatera Utara x 1 1 x 1 2 x 1 3 x 1 4 x 2 1 x 2 2 x 2 3 x 2 4 x 3 1 x 3 2 SVM Ouput x 1 5 x 1 7 x 1 8 x 1 9 x 2 5 ... Gambar 3.2 Arsitektur Support Vector Backpropagation Pada Wisconsin Diagnostic Breast Cancer Dataset 3. Konfigurasi Support Vector Backpropagation pada Cleveland Heart Disease Dataset Konfigurasi Support Vector Backpropagation pada Cleveland Heart Disease Dataset menggunakan jaringan syaraf tiruan dengan 13 buah neuron pada input layer dan 7 buah neuron pada hidden layer dan 2 buah neuron pada output layer serta beberapa property khusus yang digunakan pada Support Vector Backpropagation seperti yang dijalskan pada tabel berikut: Universitas Sumatera Utara Tabel 3.16 Konfigurasi Support Vector Backpropagation Pada Cleveland Heart Disease Dataset x 1 1 x 1 2 x 1 3 x 1 4 x 2 1 x 2 2 x 2 3 x 2 4 x 3 1 x 3 2 SVM Ouput x 1 5 x 1 11 x 1 12 x 1 13 x 2 5 ... x 2 6 x 2 7 Gambar 3.3 Arsitektur Support Vector Backpropagation Pada Cleveland Heart Disease Dataset Backpropagation Segment Input layer 13 neurons Hidden layer 7 neurons Output layer 2 neurons Bobot layer pertama Matriks 7 baris x 14 kolom Bobot layer kedua Matriks 2 baris x 8 kolom Fungsi aktivasi Sigmoid biner Learning rate 0.02 Tolerance function 1.0e-8 Fungsi minimisasi fmincg Support Vector Machine Segment Fungsi kernel Radial Basis Function Showplot True Universitas Sumatera Utara 4. Konfigurasi Support Vector Backpropagation pada John Hopkins University Ionosphere Dataset Konfigurasi Support Vector Backpropagation pada John Hopkins University Ionosphere Dataset menggunakan jaringan syaraf tiruan dengan 34 buah neuron pada input layer, 17 neuron pada hidden layer, dan 2 buah neuron pada output layer beserta property khusus pada Support Vector Backpropagation seperti yang disajikan dalam tabel berikut: Tabel 3.17 Konfigurasi Support Vector Backpropagation Pada John Hopkins University Ionosphere Dataset Backpropagation Segment Input layer 34 neurons Hidden layer 17 neurons Output layer 2 neurons Bobot layer pertama Matriks 17 baris x 35 kolom Bobot layer kedua Matriks 2 baris x 18 kolom Fungsi aktivasi Sigmoid biner Learning rate 0.02 Tolerance function 1.0e-8 Fungsi minimisasi fmincg Support Vector Machine Segment Fungsi kernel Radial Basis Function Showplot True Universitas Sumatera Utara x 1 1 x 1 2 x 1 3 x 1 4 x 2 1 x 2 2 x 2 3 x 2 4 x 3 1 x 3 2 SVM Ouput x 1 5 x 1 32 x 1 33 x 1 34 x 2 5 ... x 2 17 ... Gambar 3.4 Arsitektur Support Vector Backpropagation Pada John Hopkins University Ionosphere Dataset Universitas Sumatera Utara BAB 4 IMPLEMENTASI DAN PENGUJIAN Pada bab ini akan dibahas hasil proses komputasi Support Vector Backpropagation yang dilakukan menggunakan program MATLAB R2010a. MATLAB R2010a merupakan software yang cocok dipakai sebagai alat komputasi yang melibatkan penggunaan matriks dan vector. Fungsi-fungsi dalam paket perangkat lunak toolbox Matlab R2010a dibuat untuk memudahkan perhitungan tersebut. Banyak model jaringan syaraf tiruan dan machine learning menggunakan manipulasi matriks atau vector dalam iterasinya. Oleh karena itu MATLAB R2010a merupakan perangkat lunak yang cocok dipakai dalam penelitian ini.

4.1. Proses Transformasi Iris Plants Dataset Oleh