PENGELOMPOKAN PRODUKTIVITAS PADI DI INDONESIA MENGGUNAKAN METRIK LOG-NORMALIZED PERIODOGRAM (LNP)
MENGGUNAKAN METRIK LOG-NORMALIZED PERIODOGRAM (LNP)
oleh UMI MUSLIHAH M0108110
SKRIPSI ditulis dan diajukan untuk memenuhi sebagian persyaratan memperoleh gelar Sarjana Sains Matematika
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SEBELAS MARET SURAKARTA
2013
commit to user
commit to user
Umi Muslihah, 2013. PENGELOMPOKAN PRODUKTIVITAS PADI DI INDONESIA
PERIODOGRAM (LNP). Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Sebelas Maret Surakarta.
Padi merupakan makanan pokok sebagian besar masyarakat Indonesia. Oleh karena itu, produktivitas padi harus selalu ditingkatkan agar kebutuhan masyarakat bisa terpenuhi. Tidak semua provinsi di Indonesia mempunyai produktivitas padi yang sama, sehingga perlu dilakukan pengelompokan untuk mengetahui provinsi mana yang mempunyai produktivitas tinggi. Data produktivitas padi tersebut merupakan data runtun waktu, sehingga pengelompokannya tidak bisa menggunakan jarak Euclid, Mahalanobis dan Manhattan. Jarak yang bisa digunakan adalah jarak berdasar pada metrik log- normalized periodogram (LNP). Metrik LNP merupakan logaritma dari periodogram yang dinormalkan. Penelitian ini bertujuan untuk mengelompokkan produktivitas padi di Indonesia menggunakan metrik LNP.
Data yang digunakan pada penelitian ini adalah produktivitas padi 26 provinsi di Indonesia. Pengelompokannya menggunakan metode complete linkage dengan jarak berdasar metrik LNP. Hasil penelitian menunjukkan bahwa pengelompokan produktivitas padi di Indonesia menggunakan metrik LNP menghasilkan 3 kelompok, yaitu kelompok dengan produktivitas cepat, tetap dan produktivitas yang negatif pada periode tertentu.
Kata Kunci: produktivitas, complete linkage, Log-Normalized Periodogram (LNP).
commit to user
Umi Muslihah, 2013. The Clustering of Paddy Productivity In Indonesia Using Log-Normalized Periodogram (LNP) Metric. Faculty of Mathematics and Natural Sciences, Sebelas Maret University.
Paddy is staple food of most Indonesian people. Therefore, the productivity of paddy must be improved so that people βs needs can be fulfilled. Not all of the
provinces in Indonesia have the same paddy productivity, so it needs to cluster the provinces to know which province has high productivity. The paddy productivity data is time series data, so that clustering can not use Euclid, Mahalanobis and Manhattan distances. The distance that can be used is the distance based on Log- Normalized Periodogram (LNP) metric. Metric LNP is the logarithm of the normalized periodogram. This study aims to cluster the paddy productivity in Indonesia using the LNP metric.
The data used in this study are the paddy productivity of 26 provinces in Indonesia. The method that used to cluster is complete linkage with the distance based on LNP metric. The results showed that the clustering of paddy productivity in Indonesia using LNP metric produce 3 groups, i.e fast productivity, steady productivity, and negative productivity in some periods.
Keyword: productivity, complete linkage, Log-Normalized Periodogram (LNP) metric.
commit to user
Setelah kesulitan pasti ada kemudahan
Yang bertanggung jawab atas diri kita adalah diri kita sendiri
commit to user
Karya ini kupersembahkan untuk
Bapak dan ibuku tercinta yang telah membimbingku dari kecil hingga saat ini
Kakakku yang telah memberi doa dan semangat
commit to user
Segala puji syukur penulis panjatkan kepada Allah SWT yang telah memberikan banyak kenikmatan kepada penulis sehingga penulis dapat menyelesaikan
PRODUKTIVITAS PADI DI INDONESIA MENGGUNAKAN METRIK LOG- NORMALIZED PERIODOGRAM (LNP) β. Sholawat serta salam semoga tercurah limpahkan kepada suriteladan umat manusia yaitu Rasulullah Muhammad SAW, keluarganya,sahabatnya, dan umatnya yang senantiasa istiqomah dijalan-Nya. Pada kesempatan ini penulis juga mengucapkan terima kasih kepada
1. Dra. Etik Zukhronah, M.Si sebagai dosen Pembimbing I yang telah memberikan bimbingan, arahan serta ide kepada penulis dalam menyelesaikan skripsi ini.
2. Supriyadi Wibowo, M.Si sebagai dosen Pembimbing II yang telah memberikan bimbingan dan arahan kepada penulis selama menyelesaikan skripsi ini.
3. Semua pihak yang tidak dapat penulis sebutkan satu persatu yang telah membantu dalam penyelesaian skripsi ini.
Semoga Allah SWT membalas semua kebaikan yang telah mereka berikan selama ini dan semoga skripsi ini dapat memberikan manfaat.
Surakarta, Januari 2013
Penulis
commit to user
2.1.11. Periodogram ........................................................................... 15
2.1.12. Penghalusan Spektrum (Spectrum Smoothing) ........................ 17
2.1.13. Jarak Berdasar pada Metrik Log-Normalized Periodogram ..... 18
2.2. Kerangka Pemikiran ........................................................................... 19 BAB III. METODE PENELITIAN ................................................................. 21 BAB IV. PEMBAHASAN
4.1. Kestasioneran Data ............................................................................. 23
4.1.1. Identifikasi Model untuk Masing-Masing Provinsi ................... 23
4.1.2. Estimasi Parameter Model untuk Masing-Masing Provinsi ....... 25
4.1.3. Uji Diagnostik Model untuk Masing-Masing Provinsi .............. 29
4.2. Hasil Pengelompokan Produktivitas Padi Di Indonesia ....................... 30 BAB V. PENUTUP
5.1. Kesimpulan ........................................................................................ 34
5.2. Saran .................................................................................................. 34 DAFTAR PUSTAKA ..................................................................................... 35 LAMPIRAN ................................................................................................... 37
commit to user
Tabel 2.1 Karakteristik π΄πΆπΉ dan ππ΄πΆπΉ dalam Proses Stasioner untuk Model
π΄π , ππ΄ dan π΄π ππ΄ . .......................................................................... 9 Tabel 4.1 Model sementara produktivitas padi untuk masing-masing provinsi. 26
Tabel 4.2 Hasil Estimasi Model untuk Masing-masing Provinsi. ..................... 27
commit to user
Gambar 4.1. Plot data asli Provinsi Nanggroe Aceh Darussalam. .................... 24 Gambar 4.2. Plot data Provinsi Nanggroe Aceh Darussalam
setelah pembedaan ...................................................................... 25 Gambar 4.3. Dendogram runtun waktu produktivitas padi di Indonesia menggunakan metrik LNP .......................................................... 32
commit to user
π π : Nilai Autocorrelation Function ( π΄πΆπΉ) π π‘ : Observasi pada waktu π‘
π π‘+π
: Observasi pada waktu π‘+π π ππ : Nilai Partial Autocorrelation Function ( ππ΄πΆπΉ)
: Tingkat signifikansi
: Orde model Autoregressive ( π΄π )
: Orde model moving average ( ππ΄) π π‘ : Residu dari model
π π : Koefisien parameter model π΄π (π) π π : Koefisien parameter model ππ΄(π)
: Jumlah pembedaan
π β π, π
: Jumlah kuadrat residu
: Estimasi parameter π
: Estimasi parameter π π β : nilai Ljung-Box-Pierce π₯ π‘ : Observasi pada waktu π‘
π₯ π‘+π : Observasi pada waktu π‘+π πΎ π : Fungsi autokovariansi
: Frekuensi Fourier
ππ
: Spektrum ππ π : Periodogram
: Banyaknya observasi
: Spektrum sampel π π : Jumlah frekuensi yang digunakan dalam penghalusan
: Rangkaian fungsi pembobot spectral window
: Fungsi pembobot lag window
π πΏππ π₯, π¦ : Jarak berdasar pada metrik Log-Normalized Periodogram (LNP) ππ π π : Periodogram yang dinormalkan log ππ π π : Logaritma dari periodogram yang dinormalkan
commit to user
PENDAHULUAN
1.1 Latar Belakang
Indonesia merupakan negara dengan luas wilayah 1.910.931,32 km 2 (BPS,
2011). Wilayah Indonesia terdiri dari 33 provinsi yang tersebar di 6 pulau ( pulau Sumatra, Jawa, Kalimantan, Nusa Tenggara, Kepulauan Maluku dan Papua). Mata pencaharian sebagian besar penduduk Indonesia sebagai petani. Sektor pertanian memiliki peran penting dalam perekonomian nasional, yaitu sebagai sumber pendapatan, membuka lapangan kerja, mengentaskan kemiskinan dan meningkatkan ketahanan pangan nasional. Komoditas padi merupakan salah satu hasil pertanian yang sangat penting dan strategis kedudukannya.
Padi merupakan makanan pokok sebagian besar masyarakat Indonesia. Kebutuhan beras akan bertambah seiring dengan laju pertumbuhan penduduk. Besarnya tingkat konsumsi beras di Indonesia mengharuskan pemerintah untuk mengimpor beras dari negara lain. Hal ini disebabkan produksi padi dalam negeri belum bisa memenuhi kebutuhan masyarakat. Apabila Indonesia terus bergantung pada negara lain tanpa mencari cara untuk memenuhi kebutuhan beras dalam negeri maka suatu saat Indonesia akan dilanda kelaparan. Jika impor beras dihentikan dan produktivitas padi dalam negeri tidak ada peningkatan, maka kemungkinan Indonesia akan mengalami krisis pangan.
Oleh karena itu perlu dilakukan penelitian untuk mengetahui laju produktivitas padi di Indonesia. Hal tersebut dapat dilakukan dengan cara mengelompokkan produktivitas padi dari beberapa provinsi untuk mengetahui kelompok laju produktivitas yang cepat, tetap dan produktivitas yang negatif. Untuk mengetahui laju produktivitas padi diperlukan data dari beberapa periode tertentu atau berupa data runtun waktu. Salah satu cara yang dapat digunakan untuk mengelompokkan produktivitas padi adalah dengan analisis kluster. Analisis kluster adalah suatu teknik pengelompokan obyek berdasarkan pada kemiripannya, sehingga diperlukan suatu metode untuk mengukur kemiripan atau perbedaan antar obyek. Ukuran yang dapat menerangkan kedekatan antar obyek
commit to user
adalah ukuran jarak. Menurut Dillon, et al. (1984), jarak yang bisa digunakan antara lain jarak Euclid, jarak Mahalanobis dan jarak Manhattan (City Block). Menurut Caiado (2006), ketiga jarak tersebut tidak dapat digunakan untuk data runtun waktu. Jarak yang dapat digunakan untuk mengelompokkan data runtun waktu diantaranya jarak berdasar pada metrik autocorrelations (ACF), partial autocorrelations (PACF), inverse autocorrelations (IACF), dan log-normalized periodogram (LNP). Namun metrik LNP lebih baik daripada metrik yang lain dalam mengelompokkan data runtun waktu, hal ini dikarenakan metrik LNP dapat membedakan dengan sempurna antar kelompok data runtun waktu. Karena data produktivitas padi merupakan data runtun waktu maka dalam penelitian ini menggunakan jarak yang berdasar pada metrik LNP.
Berdasarkan uraian di atas penulis tertarik untuk mengelompokkan produktivitas padi di Indonesia menggunakan metrik LNP. Dengan adanya pengelompokan produktivitas padi tersebut akan diketahui kelompok provinsi mana yang mempunyai laju produktivitas padi yang cepat, tetap dan produktivitas yang negatif, sehingga dapat membantu pemerintah dalam menentukan kebijakan untuk memberikan perhatian khusus pada kelompok provinsi yang mempunyai laju produktivitas padi yang negatif.
1.2 Rumusan Masalah
Berdasarkan latar belakang masalah, maka rumusan masalahnya adalah bagaimana pengelompokan produktivitas padi di Indonesia menggunakan metrik LNP.
1.3 Batasan Masalah
Penulis membatasi masalah dalam penelitian ini yaitu pengelompokan produktivitas padi pada 26 provinsi di Indonesia mulai tahun 1970 sampai 2010 dengan menggunakan metrik LNP.
commit to user
Berdasarkan perumusan masalah di atas, maka tujuan dari penelitian ini adalah menentukan pengelompokan produktivitas padi di Indonesia menggunakan metrik LNP.
1.5 Manfaat Penelitian
Dengan penelitian ini diharapkan dapat memberikan pemahaman mengenai analisis kluster pada data runtun waktu. Selain itu dapat menentukan kelompok dan laju pertumbuhan produktivitas padi di Indonesia. Hal ini dapat membantu pemerintah agar dapat meningkatkan produktivitas padi dan memberikan perhatian khusus pada kelompok provinsi yang mempunyai laju produktivitas padi yang negatif. Sehingga pertumbuhan produktivitas padi di Indonesia untuk tahun selanjutnya meningkat dan dapat mencukupi kebutuhan beras yang semakin banyak.
commit to user
LANDASAN TEORI
Landasan teori ini terdiri dari dua sub bagian yaitu tinjauan pustaka dan kerangka pemikiran.
2.1 Tinjauan Pustaka
Pada bagian ini memuat beberapa hasil penelitian terdahulu dan teori yang menjadi dasar dari penelitian penulis. Caiado (2006) memperkenalkan beberapa jarak yang dapat digunakan untuk mengelompokkan data runtun waktu diantaranya jarak yang berdasar pada metrik Autocorrelations (ACF), Partial Autocorrelations (PACF), Inverse Autocorrelations (IACF) dan metrik Log- Normalized Periodogram (LNP). Penelitian tersebut menunjukkan bahwa pengelompokkan menggunakan metrik LNP memberikan hasil yang lebih baik dari pada metrik yang lain. Hal ini dikarenakan metrik LNP dapat membedakan dengan sempurna antara runtun waktu stasioner dan nonstasioner.
Penelitian ini memerlukan beberapa pengertian dasar antara lain pengertian mengenai produktivitas, analisis runtun waktu, fungsi autokorelasi dan fungsi autokorelasi parsial, stasioner, model Autoregressive Moving Average ( π΄π ππ΄) dan Integrated Autoregressive-Moving Average (π΄π πΌππ΄), analisis kluster, analisis spektrum, periodogram, penghalusan spektrum, dan jarak berdasar pada metrik LNP.
2.1.1 Produktivitas
Sejak awal perkembangannya sampai sekarang banyak definisi produktivitas yang telah dikembangkan. Produktivitas merupakan istilah yang seringkali dianggap sama dengan kata produksi. Pada kenyataannya, antara produktivitas dan produksi mempunyai arti yang berbeda. Produksi merupakan pengubahan bahan-bahan dari sumber-sumber daya menjadi barang dan jasa. Menurut Pribadiyono (2006), produktivitas merupakan perubahan dalam suatu produk yang dihasilkan dari penggunaan sumber daya. Tinggi rendahnya suatu produktivitas berkaitan dengan efisiensi dari sumber daya (input) dalam
commit to user
istilah produktivitas menggambarkan perbandingan antara keluaran (output) dan masukan (input). Pada penelitian ini yang dimaksud input adalah luas panen dan output nya adalah produksi padi.
2.1.2 Analisis Runtun Waktu
Menurut Rosadi (2006), data runtun waktu adalah jenis data yang dikumpulkan menurut urutan waktu dalam suatu rentang waktu tertentu. Data dikumpulkan secara periodik misalnya dalam jam, hari, minggu, bulan, kuartal dan tahun. Data runtun waktu dibangun oleh komponen trend, siklis, dan musiman (untuk data bulanan). Berdasarkan konsep tersebut, analisis data runtun waktu dapat dilakukan dalam dua domain, yaitu waktu dan frekuensi. Waktu menentukan signifikansi autokorelasi, kestasioneran data, penaksiran parameter regresi runtun waktu, dan peramalan. Sedangkan dalam frekuensi dapat ditentukan frekuensi tersembunyi, yaitu frekuensi komponen siklis yang sulit diperoleh dalam waktu tersebut, dengan tujuan untuk mengetahui kondisi tertentu pada data.
2.1.3 Fungsi Autokorelasi dan Fungsi Autokorelasi Parsial
Menurut Cryer (1986), fungsi autokorelasi (Autocorrelation Function ( π΄πΆπΉ)) pada selisih waktu (lag π) menyatakan hubungan keeratan antara nilai observasi pada waktu π‘ dan nilai observasi pada waktu π‘ + π. Nilai π΄πΆπΉ untuk sampel antara π π‘ dan π π‘+π adalah
π π = π π‘ βπ (π π‘+π π βπ βπ ) π‘=1 π
π‘ βπ π 2 π‘=1
dengan π π‘ adalah observasi pada waktu π‘ dan π π‘+π adalah observasi pada waktu π‘ + π. Sedangkan fungsi autokorelasi parsial (Partial Autocorrelation Function
( ππ΄πΆπΉ)) digunakan untuk mengukur keeratan antara π π‘ dan π π‘βπ apabila pengaruh dari lag waktu π‘ = 1,2,3, β¦ , π β 1 dianggap terpisah. ππ΄πΆπΉ adalah suatu fungsi yang menunjukkan besarnya korelasi parsial (hubungan linear secara terpisah) antara pengamatan pada waktu sekarang ( π‘) dengan pengamatan pada waktu-waktu sebelumnya ( π‘ β 1, π‘ β 2, β¦ , π‘ β π). Menurut Cryer (1986), nilai ππ΄πΆπΉ dinyatakan sebagai
commit to user
π ππ = ππππ(π π‘ , π π‘βπ | π π‘β1, , π π‘β2 , β¦,π π‘βπ+1 ), π ππ adalah koefisien korelasi dalam distribusi dua variabel (bivariat) π π‘ , π π‘βπ bersyarat π π‘β1, , π π‘β2 , β¦,π π‘βπ+1 . Menurut Mulyana (2004), plot dari π΄πΆπΉ dan ππ΄πΆπΉ dinamakan korelogram (correlogram) dan dapat digunakan untuk menentukan signifikansi autokorelasi dan kestasioneran data. Jika plot π΄πΆπΉ
membangun sebuah histogram yang menurun (pola eksponensial), maka autokorelasi signifikan atau data berautokorelasi. Sedangkan jika plot ππ΄πΆπΉ membangun histogram langsung terpotong pada lag ke-2, maka data tidak stasioner. Ketika plot π΄πΆπΉ dan ππ΄πΆπΉ keduanya membentuk pola alternating (tanda dan nilai autokorelasi berubah secara acak dan sesuai dengan berjalannya nilai lag), hal ini mengindikasikan data tidak stasioner dalam variansi.
2.1.4 Stasioner
Beberapa model runtun waktu membutuhkan asumsi stasioner. Menurut Mulyana (2004), stasioner merupakan kondisi yang diperlukan dalam analisis runtun waktu karena dapat memperkecil kekeliruan model. Runtun waktu stasioner adalah suatu runtun waktu yang mempunyai rata-rata dan variansi yang tidak berubah dengan pergeseran waktu. Sedangkan data yang tidak stasioner diklasifikasikan atas tiga bentuk yaitu
1. tidak stasioner dalam rata-rata hitung, hal ini terjadi jika trend tidak datar (tidak sejajar sumbu waktu),
2. tidak stasioner dalam variansi, hal ini terjadi jika trend datar atau hampir datar tetapi data tersebar membangun pola melebar atau menyempit yang meliput secara seimbang trendnya (pola terompet),
3. tidak stasioner dalam rata-rata hitung dan variansi, hal ini terjadi jika trend tidak datar dan data membangun pola terompet.
Proses stasioneritas dilakukan bergantung pada kondisi ketidakstasioneran data, jika data tidak stasioner dalam
1. rata-rata hitung, maka proses stasioneritas adalah proses pembedaan (differencing),
2. variansi, maka proses stasioneritas adalah transformasi stabilisasi variansi,
commit to user
dilakukan terlebih dahulu, dan proses pembedaan dilakukan pada data hasil transformasi.
Untuk melihat ketidakstasioneran data secara visual, tahap pertama dapat dilakukan pada plot data berdasarkan urutan waktu. Jika belum mendapatkan kejelasan, maka tahap berikutnya dilihat pada plot π΄πΆπΉ dan ππ΄πΆπΉ. Pada plot π΄πΆπΉ, jika data tidak stasioner maka plotnya akan membangun pola,
1. menurun, jika data tidak stasioner dalam rata-rata hitung (trend naik atau turun),
2. alternating, jika data tidak stasioner dalam variansi,
3. gelombang, jika data tidak stasioner dalam rata-rata hitung dan variansi. Selain itu, kestasioneran juga dapat diuji dengan unit root test. Menurut Tsay (1999), hipotesis kestasioneran sebagai berikut,
π» 0 : π 1 = 1 (data runtun waktu mempunyai unit root atau tidak stasioner) π» 1 : π 1 < 1 (data runtun waktu tidak mempunyai unit root atau stasioner).
Statistik uji menggunakan Augmented Dickey-Fuller atau rasio- π‘,
, π π(π 1 ) merupakan standar deviasi dari π 1 , π 0 = 0, π π‘ adalah observasi pada
waktu π‘ dan π adalah ukuran sampel. Hipotesis nol ditolak jika π΄π·πΉ > π‘ πΌ,(πβ1) atau p-value < πΌ (tingkat signifikansi).
2.1.5 Model Autoregressive Moving Average (π¨πΉπ΄π¨) dan Integrated
Autoregressive-Moving Average ( π¨πΉπ°π΄π¨)
Model runtun waktu stasioner meliputi proses Autoregressive untuk orde π ( π΄π (π)), proses Moving Average untuk orde π (ππ΄(π)) dan proses
commit to user
Cryer (1986), bentuk umum model Autoregressive ( π΄π (π)) sebagai berikut π π‘ = π 1 π π‘β1 + π 2 π π‘β2 + β―+π π π π‘βπ + π π‘ , dengan π π‘ diasumsikan sebagai residu model π΄π dan π π adalah koefisien parameter model π΄π (π). Model π΄π (π) dikatakan stasioner jika β1 < π π < 1.
Bentuk umum model Moving Average ( ππ΄(π)) adalah
π π‘ = π π‘ βπ 1 π π‘β1 βπ 2 π π‘β2 ββ―βπ π π π‘βπ , dengan π > 0, π π‘ diasumsikan sebagai residu model ππ΄, π π adalah koefisien parameter model ππ΄(π). Model ππ΄ dikatakan stasioner jika β1 < π π < 1.
Model Autoregressive Moving Average ( π΄π ππ΄(π, π)) adalah gabungan dari model Autoregressive ( π΄π (π)) dan Moving Average (ππ΄(π)). Bentuk umum model π΄π ππ΄ π, π adalah
π π‘ = π 1 π π‘β1 + β―+π π π π‘βπ + π π‘ + π 1 π π‘β1 + β―+π π π π‘βπ . Model tidak stasioner memiliki rata-rata dan variansi yang tidak konstan sepanjang waktu. Hal itu disebabkan oleh variabel runtun waktu terdapat trend yang kuat. Suatu runtun waktu tidak stasioner yang telah dilakukan pembedaan, dimodelkan dengan Integrated Autoregressive ( π΄π πΌ(π, ) Integrated Moving
Average ( πΌππ΄(π, π)) dan Integrated Autoregressive-Moving Average ( π΄π πΌππ΄(π, π, π)). Bentuk umum model π΄π πΌ(π, π) adalah π π‘ = 1+π 1 π π‘β1 + π 1 βπ 2 π π‘β2 + β―+ π π βπ πβ1 π π‘βπ + π π π π‘βπβ1 +π π‘ . dengan π = 1,2, β¦. Model πΌππ΄(1,1) dinyatakan dengan
π π‘ = π π‘β1 + π π‘ βπ 1 π π‘β1 ,
dan model πΌππ΄(2,2) dinyatakan dengan
π π‘ =2 π π‘β1 βπ π‘β2 + π π‘ βπ 1 π π‘β1 βπ 2 π π‘β2 .
(2.1) Sedangkan bentuk umum model π΄π πΌππ΄(π, 1, π) dinyatakan dengan π π‘ = 1+π 1 π π‘β1 + π 2 βπ 1 π π‘β2 + π 3 βπ 2 π π‘β3 + β―+ π π βπ πβ1 π π‘βπ
βπ π π π‘βπβ1 + π π‘ βπ 1 π π‘β1 βπ 2 π π‘β2 ββ―βπ π π π‘βπ ,
(2.2) serta bentuk umum model π΄π πΌππ΄(π, 2, π) sebagai berikut π π‘ = π 2 β2π π‘β1 + π 2 β 2π 1 β1π π‘β2 + π 1 β 2π 2 π π‘β3 + π 2 π π‘β4 + β― + π π π π‘βπ β 2π π π π‘βπβ1 + π π π π‘βπβ2 + π π‘ βπ 1 π π‘β1 βπ 2 π π‘β2 ββ―βπ π π π‘βπ .
commit to user
2.1.6 Identifikasi Model
Dalam membangun model stasioner π΄π πΌππ΄ diperlukan alat untuk mengidentifikasi model tersebut dengan menggunakan π΄πΆπΉ dan ππ΄πΆπΉ. Langkah- langkah yang dilakukan untuk identifikasi model adalah
1. Membuat plot data runtun waktu dan melihat karakter data untuk menentukan perlu atau tidaknya dilakukan transformasi dan/atau proses pembedaan.
2. Menghitung nilai π΄πΆπΉ dan ππ΄πΆπΉ data asli (data sebelum dilakukan proses transformasi) untuk mendapatkan informasi mengenai orde dari proses pembedaan. Jika nilai π΄πΆπΉ membangun sebuah pola yang menurun secara perlahan dan ππ΄πΆπΉ membangun pola yang nilainya terpotong secara signifikan setelah lag-1 (perbedaan nilai antara ππ΄πΆπΉ lag-1 dengan lag-2 dan sesudahnya sangat besar), maka hal ini perlu dilakukan pembedaan.
3. Menghitung nilai π΄πΆπΉ dan ππ΄πΆπΉ data hasil transformasi dan/atau pembedaan (jika ada perlakuan transformasi dan/atau pembedaan), untuk memperkirakan orde π΄π dan ππ΄ yang akan diambil.
Menurut Mulyana (2004), karakter plot π΄πΆπΉ dan ππ΄πΆπΉ dalam proses stasioner untuk model π΄π , ππ΄ dan π΄π ππ΄ dapat dilihat pada Tabel 2.1.
Tabel 2.1 Karakteristik π΄πΆπΉ dan ππ΄πΆπΉ dalam Proses Stasioner untuk Model
Turun secara eksponensial menuju nol sejalan dengan bertambahnya π
Terpotong setelah lag π ππ΄(π)
Terpotong setelah lag π
Turun secara eksponensial menuju nol sejalan dengan bertambahnya π
π΄π ππ΄(π, π) Menuju nol setelah lag π Menuju nol setelah lag π
commit to user
Setelah identifikasi terhadap model, selanjutnya dilakukan estimasi parameter. Menurut Cryer (1986), metode estimasi yang dapat digunakan untuk model π΄π πΌππ΄(π, π, π) adalah metode kuadrat terkecil (least square). Metode kuadrat terkecil dilakukan dengan meminimumkan jumlah kuadrat residu. Jumlah kuadrat residu pada model π΄π πΌππ΄(π, π, π) dinyatakan dalam suatu fungsi
Model π΄π πΌππ΄(π, 1, π) pada persamaan (2.2) dapat dinyatakan sebagai
π π‘ = π π‘ β 1+π 1 π π‘β1 β π 2 βπ 1 π π‘β2 β π 3 βπ 2 π π‘β3 ββ― βπ π βπ πβ1 π π‘βπ + π π π π‘βπβ1 + π 1 π π‘β1 + π 2 π π‘β2 + β―+π π π π‘βπ .
Jumlah kuadrat residu minimum ketika turunan parsial pertama pada persamaan (2.3) sama dengan nol. Sehingga dengan menganggap turunan parsial pertama terhadap π dan π sama dengan nol, diperoleh estimasi parameter π dan π .
Model π΄π πΌππ΄(1,1,1) dinyatakan sebagai
π π‘ = 1+π π π‘β1 + π π‘ βπ 1 π π‘β1 .
(2.4) Persamaan (2.4) dapat ditulis ulang sebagai
π π‘ = π π‘ β 1+π 1 π π‘β1 + π 1 π π‘β1 dengan π π‘ adalah residu model π΄π πΌππ΄(1,1,1). Sehingga jumlah kuadrat terkecil
untuk model π΄π πΌππ΄(1,1,1) adalah π β π, π = π π‘ β 1+π π π‘β1 + π π π‘β1 π 2 π‘=2 .
(2.5)
Langkah awal estimasi parameter π adalah menentukan turunan parsial pertama dari fungsi π β π, π pada persamaan (2.5) terhadap parameter π atau ππ β
ππ
, sehingga didapatkan
ππ β π,π ππ
π π‘ β 1+π π π‘β1 + π π π‘β1 π 2 π‘=2
ππ
2 π π‘ β 1+π π π‘β1 + π π π‘β1 π π‘=2 π π‘β1
2 π π‘ π π‘β1 βπ π‘β1 2 βπ π π‘β1 2 + π π π‘β1 π π‘β1 π π‘=2
ππ β π,π ππ
= β[
2 π π‘ π π‘β1 β
2 π π‘β1 2 β π β π π‘=2 π‘=2 2 π π π‘β1 2 π π‘=2 + 2 π π π‘β1 π π‘β1 π π‘=2 . (2.6)
commit to user
Langkah selanjutnya dengan menganggap
ππ
= 0, didapatkan estimasi parameter π,
Sedangkan langkah awal estimasi parameter π adalah menentukan turunan parsial pertama dari fungsi π β π, π pada persamaan (2.5) terhadap parameter π
2 1+π π π‘β1 π π‘β1 π π‘=2 + 2 π π π‘β1 2 π π‘=2 . (2.7) Langkah selanjutnya dengan menganggap
ππ β π,π ππ
= 0, didapatkan estimasi parameter π,
π π‘ π π‘β1 π π‘=2 + 1+π π π‘β1 π π‘β1 π π‘=2 π π‘β1 2 π π‘=2
π π‘ π π‘=2 + 1+π π π‘β1 π π‘=2 π π‘β1 π π‘=2
Setelah diperoleh model π΄π πΌππ΄ yang cocok, kemudian dilakukan uji diagnostik model.
2.1.8 Uji Diagnostik Model
Uji diagnostik model dilakukan untuk mengecek apakah asumsi model terpenuhi. Dengan kata lain, uji diagnostik model bertujuan untuk mengetahui apakah model layak digunakan atau tidak. Untuk mendapatkan model yang sesuai seharusnya residu bersifat independen dan berdistribusi normal. Oleh karena itu dilakukan uji independensi dan uji kenormalan terhadap residu. Menurut Pankratz (1983), untuk mengetahui apakah residu bersifat independen maka perlu dilakukan uji hipotesis sebagai berikut,
1. hipotesis
π» 0 : π 1 π =π 2 π =β―=π π π =0
π» 1 : tidak semua π π π = 0, π = 1,2, β¦ πΎ,
commit to user
3. statistik uji yang digunakan adalah Ljung-Box Pierce π β = π β² π β² +2
π β² β1 β1 π π 2 πΎ π π=1
dengan
πΎ : lag maksimum π β²
π β π + πΏπ· : π : jumlah observasi dalam runtun berskala asli π : jumlah pembedaan tak musiman π· : jumlah pembedaan musiman πΏ : panjang musiman π π ( π) : autokorelasi residu untuk lag π π : banyaknya parameter yang diestimasi π β berdistribusi Chi-kuadrat dengan derajat bebas ( πΎ β π),
4. daerah kritis
π» 0 ditolak jika π β > π πΎβπ 2 ,
5. kesimpulan jika π» 0 ditolak maka residu tidak bersifat independen. Untuk memeriksa kenormalan residu dapat dilakukan dengan melihat plot antara residu dengan normal-scorenya. Jika plot yang dihasilkan mendekati garis lurus maka dapat dikatakan asumsi kenormalan sudah dipenuhi. Selain itu, dapat dilihat dari nilai π (π-value) pada uji Kolmogorov-Smirnov. Hipotesis nol pada uji Kolmogorov-Smirnov menyatakan data berdistribusi normal. Jika π-value lebih besar dari tingkat signifikansi πΌ% maka tidak menolak hipotesis nol yang berarti bahwa asumsi kenormalan dipenuhi.
2.1.9 Analisis Kluster
Menurut Budhi, et al. (2008), analisis kluster adalah upaya menemukan sekelompok obyek yang mewakili suatu karakter yang sama atau hampir sama (similar) antara satu obyek dengan obyek yang lainnya pada suatu kelompok dan memiliki perbedaan (nonsimilar) dengan obyek-obyek pada kelompok yang lainnya. Pengelompokan data dapat dilakukan dengan dua macam metode yaitu metode hirarki dan metode non hirarki. Pada metode non hirarki, telah ditentukan
commit to user
jumlah kelompok ditentukan dengan melihat gambar dendogram. Pada penelitian ini digunakan metode pengelompokan hirarki. Metode hirarki merupakan metode pengelompokan yang terstruktur dan bertahap berdasarkan pada kemiripan sifat antar obyek. Kemiripan sifat tersebut dapat ditentukan dari kedekatan jarak. Proses pengelompokan pada metode hirarki dengan membentuk matriks jarak untuk masing-masing obyek. Setelah itu menggabungkan masing- masing obyek secara terstruktur berdasarkan kemiripan sifatnya. Metode penggabungan yang biasa digunakan adalah single linkage, complete linkage, dan average linkage . Menurut Rashidah, et al. (2011), metode complete linkage lebih baik daripada metode single linkage, sehingga penelitian ini menggunakan metode complete linkage . Single linkage pengelompokannya didasarkan pada jarak antara anggota-anggota yang paling dekat, complete linkage pengelompokannya didasarkan pada jarak terjauh antar anggota kluster, dan average linkage pengelompokannya didasarkan pada jarak rata-rata antara pasangan-pasangan anggota masing-masing pada himpunannya. Kelompok-kelompok tersebut diidentifikasi pada setiap nilai jarak yang kemudian akan ditunjukkan dalam pohon struktur yang dinamakan dendogram (Kakizawa, et al. 1998). Dendogram menggambarkan penggabungan atau pembagian yang dibuat pada tingkat-tingkat yang berurutan. Cabang-cabang dalam pohon menyajikan kluster. Banyaknya kluster yang terbentuk dapat ditentukan bergantung pada subyektivitas peneliti dengan melihat gambar dendogram. Kelompok yang terbentuk meliputi kelompok cepat, tetap (konstan) dan negatif. Kelompok cepat yaitu kelompok yang mempunyai plot data runtun waktu berfluktuasi secara tidak konstan di sepanjang waktu, konstan yaitu tidak ada perubahan fluktuasi atau cenderung tetap pada plot data di sepanjang waktu dan kelompok yang negatif yaitu mempunyai fluktuasi yang besar pada periode tertentu.
Hal yang mendasar dalam analisis kluster adalah pemilihan metrik yang relevan. Menurut Caiado (2006), jarak Euclid bukan metrik yang baik untuk mengelompokkan runtun waktu karena merupakan invarian untuk perubahan urutan dari koordinatnya, sehingga tidak memperhitungkan informasi tentang
commit to user
berdasar pada metrik Log-Normalized Periodogram (LNP).
2.1.10 Pengertian Analisis Spektrum
Menurut Mulyana (2004), analisis spektrum adalah penaksiran dalam kawasan frekuensi untuk menelaah periodesitas tersembunyi, yaitu periodesitas yang sulit ditemukan dalam kawasan waktu. Analisis spektrum modern didasarkan pada fenomena bahwa data runtun waktu merupakan hasil proses stokastik, sehingga setiap data runtun waktu dapat disajikan dalam deret Fourier. Spektrum dari proses stasioner adalah transformasi Fourier dari proses fungsi autokovariansi. Transformasi Fourier adalah salah satu metode yang digunakan dalam analisis runtun waktu yang merupakan metode nonparametrik berdasarkan kawasan frekuensi. Transformasi Fourier tidak bisa merepresentasikan informasi waktu dan frekuensi secara bersamaan. Hal ini menyebabkan transformasi Fourier tidak dapat digunakan untuk menganalisis data-data yang tidak stasioner. Sehingga jika data tidak stasioner maka distasionerkan melalui proses pembedaan.
Fungsi autokovariansi antara π₯ π‘ , π‘ = 1, β¦ , π dan π₯ π‘+π , π = 1,2,3, β¦ adalah
πΎ π = πππ£ π₯ π‘ , π₯ π‘+π =πΈπ₯ π‘ β π (π₯ π‘+π β π). Misal π₯ π‘ , π‘ = 1, β¦ , π bersifat stasioner dengan fungsi autokovariansi πΎ π =
πππ£(π₯ π‘ , π₯ π‘+π ). Transformasi Fourier πΎ π merupakan spektrum dari π₯ π‘ ,
ππ =
πΎ π π β πππ π=ββ ,
(2.8) dengan πΎ π < β, β π < π < π dan π = β1. Persamaan (2.8) dapat ditulis
sebagai ππ =
πΎ π π β πππ π=ββ = πΎ π β cos ππ + π sin ππ π=ββ = πΎ π cos β ππ π=ββ
= πΎ 0 +2 πΎ π cos β ππ π=1 ,
dengan πΎ π = πΎ βπ yang merupakan fungsi genap, sin 0 = 0, sin π(βπ) = β sin ππ dan cos π(βπ) = cos ππ.
commit to user
Menurut Mulyana (2004), periodogram adalah fungsi spektrum kuasa atas frekuensinya. Jika membangun fungsi spektrum kuasanya maka periodesitas data dapat ditentukan. Misalkan terdapat deret Fourier untuk suatu proses π₯ π‘ yang menunjukkan komponen periodik dengan periode yang telah diketahui ( π) diberikan oleh
π₯ π‘ = π π cos π π π‘ +π π sin π π π‘ π π =0 + π π‘ (2.9)
dengan π adalah bilangan bulat terbesar kurang dari atau sama dengan π/2 ( π = [π/2]), frekuensi π π =2 ππ/π adalah π harmonik dari frekuensi dasar 2π/π
di dalam rentang β π, π , dan π π‘ adalah white noise dengan variansi π π 2 . Menurut
Wei (1994), estimasi dari koefisien π π dan π π adalah dengan menggunakan sifat ortogonal dari fungsi trigonometri sebagai berikut
sin π π π‘ cos π π π π‘ π‘=1 = 0 untuk semua π dan π. (2.12)
Untuk menentukan nilai π π adalah dengan mengalikan cos π π π‘ pada kedua sisi persamaan (2.9),
π₯ π‘ cos π π π‘ = π π cos π π π‘ +π π sin π π π‘ π π =0 cos π π π‘
π₯ π‘ cos π π π π‘ π‘=1 = π π cos π π π‘ cos π π π‘ +π π sin π π π‘ cos π π π π‘ π π=0 π‘=1 .
Berdasarkan persamaan (2.10), (2.11) dan (2.12), untuk π = 0 atau π
dengan π genap diperoleh
Untuk π β 0 diperoleh
commit to user
Sehingga dapat disimpulkan sebagai berikut
(jika π genap)
Sedangkan untuk menentukan nilai π π adalah dengan mengalikan sin π π π‘ pada kedua sisi persamaan (2.9),
π₯ π‘ sin π π π‘ = π π cos π π π‘ +π π sin π π π‘ π π =0 sin π π π‘
π₯ π‘ sin π π π π‘ π‘=1 = π π cos π π π‘ sin π π π‘ +π π sin π π π‘ sin π π π π‘ π π =0 π‘=1 . Berdasarkan persamaan (2.10), (2.11) dan (2.12), untuk π = 0 atau π 2 dengan
π genap diperoleh
π₯ π‘ sin π π π π‘ π‘=1 = 0.
Untuk π β 0 diperoleh
π₯ π‘ sin π π π π‘ π‘=1 =0+ π 2 π π
π π = 2 π π₯ π‘ sin( π π π π‘) π‘=1 , untuk π = 1, β¦ , ( πβ1) 2 . Periodogram didefinisikan sebagai
2 π π 2 + π π 2 , π’ππ‘π’π π = 1, β¦ , (π β 1)/2 ππ π/2 2 π’ππ‘π’π π = π 2 (jika π genap)
. Spektrum π π yang didefinisikan pada persamaan (2.8), dapat diestimasi
dengan cara mengganti autokovariansi πΎ π dengan πΎ π . Oleh karena itu, spektrum sampel diberikan oleh
π π = πΎ π cos( πβ1 ππ) π=β(πβ1) = πΎ 0 +2 πΎ π cos( πβ1 ππ) π=1 , (2.13) dengan πΎ π = 1
π π₯ π‘ βπ₯ π₯ π‘+π πβπ βπ₯ π‘=1 , π = 0,1, β¦ , π β 1.
commit to user
Salah satu estimator spektrum adalah ordinat periodogram ππ π . Anggap bahwa
π adalah frekuensi Fourier dari bentuk π π = 2 ππ π untuk π = 1, β¦ , [π/2]. Sehingga diperoleh ordinat periodogram sebagai berikut ππ π =
π π β ππ π π π + π π
π₯ π‘ cos( π π π‘) β π sin(π π π‘)
π π‘=1
π₯ π‘ cos( π π π‘) + π sin(π π π‘)
dengan π = π‘ β π , diperoleh
ππ π =2
πΎ πβ1 π π=β(πβ1) π βππ π π
=2 πΎ 0 +2 πΎ π cos( πβ1 ππ) π=1 . (2.14) Dari persamaan (2.13) dan persamaan (2.14) diperoleh
ππ π = 2π π π , π = 1, β¦ , π/2 ,
dan jika π genap, maka
ππ π/2 = ππ π/2 2 =2 π π π/2 . Periodogram ππ π sebanding dengan spektrum sampel π π π dan ditetapkan untuk estimasi nonparametrik dari spektrum.
2.1.12 Penghalusan Spektrum (Spectrum Smoothing)
Spektrum sampel dari proses stasioner berfluktuasi selama interval frekuensi kecil. Salah satu cara menurunkan variansi dari spektrum untuk memperoleh estimasi penghalusan spektrum adalah dengan menghaluskan ordinat periodogram π(π π ) dengan pembobotan moving average, yaitu
commit to user
π π π π(π π +π π ) π π=βπ π ,
dengan π π merupakan jumlah frekuensi yang digunakan dalam penghalusan, π π π adalah rangkaian fungsi pembobot yang memiliki sifat
π π π disebut spectral window. Jika π π naik, maka banyak ordinat spektral yang halus (smoothed). Akibatnya, estimator mempunyai variansi yang lebih kecil, tetapi kemungkinan bias besar. Oleh karena itu, harus menyeleksi fungsi
pembobot yang mempertimbangkan variansi yang lebih kecil dan dapat menurunkan bias.
Spektrum π(π) adalah transformasi Fourier dari fungsi autokovariansi πΎ π , sehingga dapat mengestimasi spektrum dengan pembobotan sampel autokovariansi sebagai berikut
π β πβ1 π π=β πβ1 πΎ π π βπππ
= π β 0πΎ 0 +2 π β πβ1 π π=1 πΎ π π βπππ , 0 β€ π β€ π.
Fungsi pembobot π β π disebut lag window dan erat kaitannya dengan spectral window . Spectral window adalah transformasi Fourier dari lag window dan lag window adalah invers transformasi Fourier dari spectral window. Oleh karena itu, lag window dan spectral window merupakan pasangan transformasi Fourier, dengan yang satu ditentukan oleh yang lain. Kedua istilah lag window dan spectral window diperkenalkan oleh Blackman dan Tukey (1958).
2.1.13 Jarak Berdasar pada Metrik Log-Normalized Periodogram (LNP)
Pada analisis data runtun waktu, data yang dianalisis harus merupakan data stasioner, jika tidak stasioner harus distasionerkan dahulu melalui transformasi atau pembedaan. Misalkan π₯ π‘ , π‘ = 1,2, β¦ , π π₯ dan π¦ π‘ , π‘ = 1,2, β¦ , π π¦ merupakan
dua proses stasioner. Ordinat periodogram dari π₯ π‘ dan π¦ π‘ diberikan oleh
π π₯ π‘ π βππ‘π π π π‘=1 2
(2.15)
commit to user
π π¦ π π = 1 π π¦ π‘ π βππ‘π π π π‘=1 2 ,
dengan π π = 2 ππ π
, π = 1,2, β¦ , [π/2], dan frekuensi π berada di dalam rentang 0
sampai π. Karena yang akan dibahas struktur korelasinya maka digunakan periodogram yang dinormalkan. Ketika variansi ordinat periodogram sebanding dengan nilai spektrum pada frekuensi yang bersesuaian, maka dapat digunakan log-normalized periodogram (LNP) dengan jarak sebagai berikut
π πΏππ π₯, π¦ = log ππ π₯ π π β log ππ π¦ π π [ 2 π/2] π =1 (2.16) dengan
ππ π₯ π π = π π₯ ( π π ) πππ (π₯) (2.17)
ππ π¦ π π = π π¦ ( π π ) πππ (π¦) . Sedangkan log ππ π₯ π π dan log ππ π¦ π π adalah logaritma periodogram yang
dinormalkan dari runtun waktu π₯ dan π¦, seperti yang direkomendasikan oleh Caiado, et al. (2006).
2.2 Kerangka Pemikiran
Berdasarkan tinjauan pustaka, dapat disusun suatu kerangka pemikiran untuk mengelompokkan produktivitas padi berdasarkan provinsi di Indonesia. Laju pertumbuhan produktivitas padi dapat diketahui dengan menganalisis data produktivitas padi dari beberapa periode tertentu atau berupa data runtun waktu. Pengelompokan dilakukan menggunakan analisis kluster. Karena penelitian ini menggunakan data runtun waktu maka jarak yang digunakan untuk pengelompokan adalah jarak yang berdasar pada metrik log-normalized periodogram (LNP). Metrik LNP berasal dari logaritma periodogram yang dinormalkan. Periodogram merupakan fungsi spektrum kuasa atas frekuensinya. Jika dilakukan penaksiran pada fungsi spektrum kuasa dan nilai-nilai penaksirnya dipetakan terhadap frekuensinya maka akan diperoleh sebuah garis spektrum. Dengan menentukan titik-titik puncak dari spektrumnya, akan diperoleh periode-
commit to user
untuk menentukan jarak pada pengelompokan data runtun waktu.
commit to user
21
METODE PENELITIAN
Pada penelitian ini menggunakan data sekunder yaitu mengambil data dari Departemen Pertanian Indonesia ( http://aplikasi.deptan.go.id ). Data yang digunakan adalah data produktivitas padi mulai tahun 1970 sampai 2010. Adapun tahap-tahap penelitiannya adalah sebagai berikut,
1. mencari data sekunder yang akan digunakan Data hanya terdiri dari data produktivitas padi pada 26 provinsi. Hal ini disebabkan terdapat 7 provinsi yang memiliki data tidak lengkap.
2. menentukan model ARIMA Dalam menentukan model ARIMA dilakukan melalui beberapa tahap. Adapun tahap-tahapnya adalah
a. Tahap Indentifikasi Model
i. Membuat plot data runtun waktu
ii. Membuat plot fungsi autokorelasi
iii. Memeriksa apakah data telah stasioner terhadap mean dan variansi dengan melihat plot data dan menggunakan uji Augmented Dickey Fuller (ADF). Jika data tidak stasioner terhadap variansinya maka dilakukan transformasi yang sesuai sehingga diperoleh data yang stasioner terhadap variansinya. Jika data tidak stasioner terhadap mean maka dilakukan pembedaan untuk mean yang tidak stasioner.
iv. Membuat plot fungsi autokorelasi parsial, v. Melakukan pendugaan model sementara melalui plot fungsi
autokorelasi dan fungsi autokorelasi parsial.
b. tahap estimasi parameter model Setelah diduga model sementara, selanjutnya dapat diestimasi nilai parameter model.
commit to user
i. Membuat plot fungsi autokorelasi sisa.
ii. Melakukan uji independensi nilai sisa.
iii. Melakukan uji kenormalan nilai sisa.
3. menentukan metrik LNP Setelah diperoleh model yang stasioner, selanjutnya dapat ditentukan metrik log- normalized periodogram (LNP).
4. menentukan jarak yang berdasar pada metrik LNP
5. melakukan analisis kluster dengan metode pengelompokan complete linkage atau pengelompokan berdasarkan jarak terjauh.
6. menginterpretasikan hasil analisis tersebut dan menarik kesimpulan.
commit to user
PEMBAHASAN
Pengelompokan produktivitas padi dilakukan menggunakan analisis kluster. Analisis kluster merupakan suatu teknik pengelompokan yang didasarkan pada kesamaan jarak. Jarak yang digunakan dalam penelitian ini adalah jarak yang berdasar pada metrik log-normalized periodogram (LNP). Periodogram merupakan fungsi spektrum kuasa atas frekuensinya dimana spektrum adalah transformasi Fourier dari proses fungsi autokovariansi. Transformasi Fourier hanya dapat digunakan untuk menganalisis data stasioner. Sehingga langkah pertama yang dilakukan dalam penelitian ini adalah melihat kestasioneran dari data.
4.1 Kestasioneran Data
Pada umumnya data runtun waktu adalah tidak stasioner. Sedangkan aspek-aspek Autoregressive ( π΄π ) dan Moving Average (ππ΄) hanya mengacu pada data stasioner sehingga data asli yang tidak stasioner harus distasionerkan terlebih dahulu terhadap mean dan variansinya. Untuk menstasionerkan data dapat dilakukan dengan transformasi atau pembedaan. Jika data tidak stasioner terhadap rata-rata maka dilakukan pembedaan. Sedangkan jika data tidak stasioner terhadap variansi maka dilakukan transformasi. Untuk memperoleh model pada kasus produktivitas padi di Indonesia dilakukan tahap-tahap sebagai berikut.
4.1.1 Identifikasi Model untuk Masing-Masing Provinsi
Indentifikasi model untuk provinsi yang pertama yaitu Provinsi Nanggroe Aceh Darussalam. Plot data runtun waktu produktivitas padi di Provinsi Nanggroe Aceh Darussalam pada tahun 1970 sampai 2010 terdapat pada Gambar 4.1. Berdasarkan Gambar 4.1 tampak bahwa data tidak stasioner karena data cenderung naik, hal ini menunjukkan bahwa data mengandung trend. Selain itu, dengan menggunakan uji Augmented Dickey-Fuller (ADF) terdapat pada Tabel L2-1 di Lampiran 2 diperoleh nilai probabilitas sebesar 0,8619 yang nilainya lebih besar daripada nilai kritis πΌ = 0,05, sehingga dapat disimpulkan bahwa data tidak stasioner.
commit to user
Time Series Plot of Aceh
Gambar 4.1 Plot data asli Provinsi Nanggroe Aceh Darussalam Karena data tidak stasioner maka perlu menstasionerkan data dengan melakukan pembedaan. Setelah dilakukan pembedaan pertama (first difference) diperoleh hasil yang belum stasioner. Oleh karena itu dilakukan pembedaan kedua pada data. Uji Augmented Dickey-Fuller (ADF) setelah pembedaan kedua terdapat pada Tabel L3-1 di Lampiran 3 diperoleh nilai probabilitas sama dengan 0 yang nilainya lebih kecil daripada nilai kritis πΌ = 0,05. Dengan demikian data telah stasioner pada pembedaan kedua. Plot data setelah pembedaan kedua terdapat pada Gambar 4.2. Berdasarkan Gambar 4.2 terlihat bahwa data sudah tidak mengandung trend dan tersebar di sekitar nol maka dapat dikatakan bahwa data sudah stasioner.
Untuk mengidentifikasi model π΄π dan ππ΄ yang sesuai untuk data yang sudah stasioner tersebut digunakan nilai fungsi autokorelasi ( π΄πΆπΉ) dan fungsi autokorelasi parsial ( ππ΄πΆπΉ). Berdasarkan Lampiran 5 terlihat bahwa plot untuk Provinsi Nanggroe Aceh Darussalam, nilai π΄πΆπΉ terputus setelah lag pertama dan nilai PACF juga terputus setelah lag pertama maka berdasarkan Tabel 2.1 model yang mungkin digunakan adalah model π΄π πΌ(1,2), πΌππ΄(2,1), π΄π πΌππ΄(1,2,1).
Analog untuk provinsi-provinsi lainnya dengan plot data asli ditunjukkan pada Lampiran 1. Berdasarkan Lampiran 1, plot data asli untuk masing-masing provinsi menunjukkan bahwa data tidak stasioner karena data cenderung naik. Hal ini menunjukkan bahwa data mengandung trend.
commit to user
Time Series Plot of Aceh_2
Gambar 4.2 Plot data Provinsi Nanggroe Aceh Darussalam setelah pembedaan kedua Selain itu, dengan menggunakan uji ADF terdapat pada Lampiran 2 diperoleh nilai probabilitas yang nilainya lebih besar daripada nilai kritis πΌ = 0,05, sehingga dapat disimpulkan bahwa data tidak stasioner. Setelah dilakukan pembedaan pada masing-masing provinsi, plot menunjukkan bahwa data sudah tidak mengandung trend seperti yang ditunjukkan pada Lampiran 4. Uji ADF terdapat pada Lampiran
3 juga diperoleh nilai probabilitas sebesar 0,0000 yang nilainya lebih kecil daripada nilai kritis πΌ = 0,05. Hal ini berarti bahwa data sudah stasioner.
4.1.2 Estimasi Parameter Model untuk Masing-Masing Provinsi
Pada tahap identifikasi dipilih satu atau lebih model sementara yang memberikan representasi yang sesuai dengan data. Untuk mendapatkan model sementara, koefisien π΄π dan ππ΄ harus ditentukan terlebih dahulu. Berdasarkan plot π΄πΆπΉ dan ππ΄πΆπΉ yang terdapat pada Lampiran 5 diperoleh model sementara produktivitas padi di Indonesia pada masing-masing provinsi yang disajikan pada Tabel 4.1.
Estimasi parameter model diperoleh dengan bantuan program. Estimasi parameter model untuk provinsi Nanggroe Aceh Darussalam terdapat pada Lampiran 6, diperoleh nilai estimasi IMA(2,1) yaitu π = 1,0099.
commit to user
No.
Provinsi
Model Sementara
1 Nanggroe Aceh Darussalam
ARI(1,2), IMA(2,1) dan ARIMA(1,2,1)
2 Sumatera Utara ARI(1,2), IMA(2,1) dan ARIMA(1,2,1)
3 Sumatera Barat ARI(1,2), IMA(2,1), dan ARIMA(1,2,1)
4 Riau ARI(1,2), IMA(2,1), dan ARIMA(1,2,1)
5 Jambi ARI(1,1), IMA(1,1), dan ARIMA(1,1,1)
6 Sumatera Selatan ARI(1,2), ARI(2,2), IMA(2,1), ARIMA(1,2,1), dan ARIMA(2,2,1)
7 Bengkulu ARI(1,2), ARI(2,2), IMA(2,1), ARIMA(1,2,1), dan ARIMA(2,2,1)
8 Lampung ARI(1,2), IMA(2,1), dan ARIMA(1,2,1)
9 DKI Jakarta ARI(1,2), IMA(2,1), dan ARIMA(1,2,1
10 Jawa Barat ARI(1,2), ARI(2,2), IMA(2,1), ARIMA(1,2,1), dan ARIMA(2,2,1)
11 Jawa Tengah ARI(1,2), IMA(2,1), ARIMA(1,2,1)
12 DI Yogyakarta ARI(1,2), ARI(2,2), IMA(2,1), ARIMA(1,2,1) dan ARIMA(2,2,1)
13 Jawa Timur ARI(1,2), IMA(2,1), dan ARIMA(1,2,1)
14 Bali ARI(1,2), IMA(2,1), ARIMA(1,2,1).
15 Nusa Tenggara Barat ARI(1,1), IMA(1,1), ARIMA(1,1,1)
16 Nusa Tenggara Timur ARI(1,1), IMA(1,1), dan ARIMA(1,1,1).
17 Kalimantan Barat ARI(1,2), ARI(2,2), IMA(2,1), ARIMA(1,2,1), dan ARIMA(2,2,1)
18 Kalimantan Tengah ARI(1,2), IMA(2,1), dan ARIMA(1,2,1)
19 Kalimantan Selatan ARI(1,1), IMA(1,1), ARIMA(1,1,1)
20 Kalimantan Timur ARI(1,1), IMA(1,1), ARIMA(1,1,1)
21 Sulawesi Utara ARI(1,2), IMA(2,1), ARIMA(1,2,1)
22 Sulawesi Tengah ARI(1,1), IMA(1,1), ARIMA(1,1,1)
commit to user
23 Sulawesi Selatan ARI(1,2), IMA(2,1), ARIMA(1,2,1)
24 Sulawesi Tenggara ARI(1,2), ARI(2,2), IMA(2,1), ARIMA(1,2,1), dan ARIMA(2,2,1)
25 Maluku ARI(1,2), ARI(2,2), IMA(2,1), ARIMA(1,2,1), dan ARIMA(2,2,1)
26 Papua ARI(1,2), IMA(2,1), ARIMA(1,2,1)
Berdasarkan persamaan (2.1), estimasi parameter model provinsi Nanggroe Aceh Darussalam dapat ditulis dengan
π π‘ =2 π π‘β1 βπ π‘β2 + 0,017269 β 1,0099 π π‘β1 . Analog untuk provinsi yang lainnya dengan estimasi parameter model terdapat
pada Lampiran 6. Berdasarkan Lampiran 6 diperoleh persamaan estimasi parameter untuk masing-masing provinsi yang ditunjukkan pada Tabel 4.2. Tabel 4.2 Hasil Estimasi Model untuk Masing-masing Provinsi
No. Provinsi
Nilai Estimasi
Parameter
Estimasi Model
1 Nanggroe Aceh Darussalam
2 Sumatera Utara
3 Sumatera Barat
ARIMA(1,2,1)
π = β0,4940
π = 0,7275
π π‘ = 1,506 π π‘β1 β 0,012π π‘β2 β 0,4940π π‘β3 β 0,7275π π‘β1
4 Riau
IMA(2,1)
π = 0.9471
π π‘ =2 π π‘β1 βπ π‘β2 β 0,9471π π‘β1
5 Jambi
ARI(1,1)
π = β0,3870
π π‘ = 0,613 π π‘β1 + 0,3870 π π‘β2 + 0,7499
commit to user
6 Sumatera Selatan
9 DKI Jakarta
10 Jawa Barat
11 Jawa Tengah
12 DI Yogyakarta
13 Jawa Timur
16 Nusa Tenggara Timur
17 Kalimantan Barat
18 Kalimantan Tengah
IMA(1,1)
π = 0,9768
π π‘ = π π‘β1 + 0,36681 β 0,9768π π‘β1
commit to user
19 Kalimantan Selatan
20 Kalimantan Timur ARI(1,1)
π = β0,5210
π π‘ = 0,4790 π π‘β1 + 0,5210 π π‘β2 + 0,8973
21 Sulawesi Utara
22 Sulawesi Tengah
23 Sulawesi Selatan
24 Sulawesi Tenggara IMA(2,1)
4.1.3 Uji Diagnostik Model untuk Masing-Masing Provinsi Setelah dilakukan estimasi parameter untuk model π΄π πΌππ΄, langkah selanjutnya adalah melakukan uji diagnostik dari kecukupan model tersebut. Pada tahap diagnostik model akan diuji apakah residu bersifat independen dan berdistribusi normal. Jika residu dari model tersebut telah bersifat independen dan berdistribusi normal maka model tersebut sesuai dengan data.
Untuk menguji independensi residu dilakukan dengan memeriksa nilai autokorelasi residu. Plot fungsi autokorelasi residu untuk masing-masing provinsi terdapat pada Lampiran 7, dan terlihat bahwa nilai koefisien autokorelasi residu berada di sekitar nol. Hal tersebut berarti residu saling independen. Uji independensi residu dapat juga diketahui melalui uji Ljung-Box-Pierce. Uji Ljung-Box-Pierce pada masing-masing provinsi pada Lampiran 8 menunjukkan bahwa π-value dari setiap lag melebihi tingkat signifikansi 5%. Hal ini
commit to user