Persiapan Data dalam Analisis Data Jaringan Syaraf

17 Pada gambar tersebut, terdapat lapisan masukan input layer X i , lapisan keluaran output layer Y k dan dua lapisan tersembunyi hidden layer Z dan ZZ. Bias untuk suatu unit Y k , diberikan oleh w ok . Bias pada lapisan tersembunyi Z k dinyatakan dengan u ok dan bias pada lapisan tersembunyi ZZ j dinyatakan dengan v oj . Bias ini bertindak seolah sebagai bobot pada koneksi yang berasal dari suatu unit atau neuron yang keluarannya selalu 1. Aliran sinyal pada gambar dinyatakan dengan arah panah. Sedangkan pada fase propagasi balik, sinyal dikirim pada arah berawanan. Algoritma Backpropagation menggunakan error output untuk mengubah nilai bobot-bobotnya dalam arah mundur backward. Untuk mendapatkan error ini, tahap forward propagation harus dikerjakan terlebih dahulu. Pada saat forward propagation, neuron-neuron diaktifkan dengan menggunakan fungsi aktivasi yang dapat dideferensiasikan. Algoritma dasar backpropagation memiliki tiga fase : 1. Fase feedforward pola input pembelajaran atau pelatihan 2. Fase kalkulasi dan backpropagation error yang didapat 3. Fase penyesuaian bobot Seperti halnya jaringan syaraf yang lain, pada jaringan feedforward pelatihan dilakukan dalam rangka melakukan pengaturan bobot, sehingga pada akhir pelatihan akan diperoleh bobot-bobot yang baik. Selama proses pelatihan, bobot-bobot diatur secara iteratif untuk meminimumkan fungsi kinerja jaringan. Fungsi kinerja yang sering digunakan untuk backpropagation adalah Mean Square Error MSE. Fungsi ini akan mengambil rata-rata kuadrat error yang terjadi antara output jaringan dan target.

2.7 Persiapan Data dalam Analisis Data Jaringan Syaraf

Salah satu tahapan yang penting dilakukan sebelum merancang model jaringan syaraf adalah mempersiapkan data. Mempersiapkan data merupakan langkah penting dan kritis dalam melakukan analisis data jaringan syaraf tiruan dan memiliki dampak yang sangat besar terhadap analisis data yang kompleks Hu 2003. Alasan utama perlu dilakukan persiapan data adalah bahwa kualitas data masukan ke dalam model jaringan syaraf sangat mempengaruhi hasil analisis data. Secara umum, data yang disiapkan mudah untuk penanganannya sehingga dapat memudahkan dalam melakukan analisis data menjadi sederhana. Kinerja jaringan syaraf tidak dapat bekerja secara signifikan jika terdapat data yang hilang dan bersifat stabil tidak bergerak terhadap atribut data yang lain. Selain itu, persiapan data dapat mempengaruhi tingkat mutu data yang dimasukkan. Data dikatakan memiliki tingkat mutu data yang baik jika memenuhi lima aspek berikut, yaitu :

1. Up – to – date terbaru

Data yang digunakan sebaiknya merupakan data dalam beberapa tahun terakhir. Terbaru di sini dapat didefinisikan juga sebagai data yang bersifat final dan tidak mengalami revisi di kemudian hari.

2. Relevan

Data yang bersifat relevan dapat didefinisikan sebagai data yang ada hubungan langsung dengan persoalan yang sedang diteliti.

3. Akurasi

Akurasi menyatakan seberapa dekat nilai hasil pengukuran dengan nilai sebenarnya true value atau nilai yang dianggap benar accepted value. Jika tidak ada data bila sebenarnya atau nilai yang dianggap benar tersebut maka tidak mungkin untuk menentukan berapa akurasi pengukuran tersebut. 18

4. Presisi

Presisi menyatakan seberapa dekat nilai hasil dua kali atau lebih pengulangan pengukuran. Semakin dekat nilai ‐nilai hasil pengulangan pengukuran maka semakin presisi pengukuran tersebut.

5. Lengkap

Data yang digunakan untuk keperluan analisis jaringan syaraf tiruan harus memiliki kelengkapan data yang diinginkan. Ketidaklengkapan data dapat mempengaruhi kinerja jaringan syaraf tiruan dalam melakukan peramalan. Gambar 11. Skema persiapan data untuk analisis data jaringan syaraf Yu, Chen dan Wang 2009 Masalah Penting Solusi Masalah Penting Analisis Data Awal Solusi Analisis Kebutuhan Koleksi Data Seleksi Data Integrasi Data Masalah Penting - Seleksi variabel data - Analisis Korelasi Proses Awal Data - Sampling data - Pengumpulan kembali data - Perbaikan data - Menghilangkan data noise - Normalisasi data - Menghilangkan trend - Membedakan - Data yang terlalu banyak - Data yang terlalu sedikit - Data yang hilang - Data yang noise outlier - Data dengan skala yang berbeda - Data trendmusiman - Data bukan stasioner Pemeriksaan Data Pengolahan Data Analisis Data Akhir Pembagian Data Validasi Data Penyesuaian Kembali Data Solusi - Meningkatkan kelompok data - Menurunkan kelompok data - Undefitting - Overfitting 19 Selain membutuhkan data yang baik dalam mempersiapkan data masukan bagi jaringan syaraf tiruan membutuhkan integrasi data dan persiapan data lebih lanjut. Secara umum skema untuk integrasi data persiapan dapat dilihat pada Gambar 11.

2.8 Penelitian Terdahulu