Cleaning Data Transformasi Data

Tabel 3.1 Sampel Data Produksi Kelapa Sawit Lanjutan No Tanggal Hasil Tross 4 2010-01-04 25144 2296 . . . . . . . . . . . . 1459 2013-12-29 1460 2013-12-30 34783 2108 1461 2013-12-31 46812 1550

3.3. Cleaning Data

Pada tahap ini proses yang dilakukan adalah pembersihan data. Data yang dibuang merupakan data-data yang tidak bernilai atau bernilai 0. Data yang bernilai 0 berasal dari data pada hari tidak dilakukan panen. Oleh karena itu data-data tersebut dibuang agar dapat dilakukan prediksi berdasarkan hari kerja. Contoh data yang bernilai 0 dapat dilihat pada Tabel 3.2. Tabel 3.2 Sampel Data Bernilai 0 pada Data Produksi No Tanggal Hasil Tross 1 2010-01-01 3 2010-01-03 10 2010-01-10 . . . . . . . . . . . . 1452 2013-12-22 1459 2013-12-29 Universitas Sumatera Utara Terdapat 252 data yang dibersihkan karena bernilai 0 pada data panen tahun 2000. Data yang tersisa setelah dibersihkan yang siap diproses ada 1195 data. Data setelah dibersihkan dapat dilihat pada Tabel 3.3. Tabel 3.3 Sampel Data yang Telah Dibersihkan No Tanggal Hasil Tross 1 122010 26070 1931 2 142010 25144 2296 3 152010 31808 2272 4 162010 37198 2657 . . . . . . . . . . . . 1190 2013-12-30 34783 2108 1191 2013-12-31 46812 1550

3.4. Transformasi Data

Setelah data dibersihkan tahap selanjutnya adalah transformasi data. Data-data itu dinormalisasikan agar nilai data dapat diproses dengan mudah. Data-data tersebut diubah menjadi nilai dalam rentang 0.1 sampai dengan 0.9 dengan menggunakan persamaan 2.3 Data yang tersimpan dengan ekstensi .csv diproses pada program untuk ditransformasikan. Contoh hitungan nilai data untuk proses normalisasi data dapat dilihat seperti berikut ini. a. Pada kolom hasil tabel tahun 2000: Nilai minimum data d min = 11352 Nilai maksimum data d max = 54792. Universitas Sumatera Utara Nilai datad = 26070. Maka Nilai normalisasi1 = − − = 0.338812. b. Pada kolom tross tabel tahun 2000: Nilai minimum data d min = 514. Nilai maksimum data d max = 3466. Nilai datad = 1931 Maka Nilai normalisasi1 = − − = 0.480014. Hasil keseluruhan normalisasi data dapat dilihat pada Tabel 3.6. Tabel 3.4 Sampel Data yang Telah Ditransformasi No Tanggal Hasil Tross 1 122010 0.33881 0.48001 2 142010 0.3175 0.60366 3 152010 0.4709 0.59553 4 162010 0.59498 0.72595 5 172010 0.51354 0.70325 6 182010 0.40967 0.53286 . . . . . . . . . . . . 1189 12272013 0.25488 0.28625 1190 12282013 0.20967 0.24594 1191 12302013 0.53939 0.53997 Universitas Sumatera Utara

3.5. Pembagian Data