1
BAB 1
PENDAHULUAN
1.1 Latar Belakang
Salah satu topik terpenting dalam statistika adalah masalah distribusi. Permasalahan distribusi telah diajarkan namun hanya terbatas untuk beberapa
model distribusi seperti distribusi binomial, poisson, gamma, chi-kuadrat, cauchy, dan normal. Dalam kehidupan nyata, distribusi normal adalah salah satu distribusi
yang popular digunakan. Kenyataannya ada kalanya terdapat data-data yang berfluktuasi tinggi.
Grafik data tersebut berupa grafik heavy-tail dan sering dijumpai dalam permasalahan finansial, pemrosesan signal, telekomunikasi, kimia, fisika, dan
biologi misal dalam Zolotarev 1986. Data dengan karakteristik, grafiknya berupa grafik heavy-tail dengan
puncaknya berada di sekitar pusat dikatakan berdistribusi Leptokurtik. Kelas distribusi yang penting dalam konteks ini adalah distribusi stable, yang
merupakan kelas yang fleksibel untuk memodelkan data. Sekitar tahun 1920 sampai 1930, teori distribusi stable univariat mulai
dikembangkan oleh Paul Levy dan Aleksander Yakovlevich Khinchine, disusul oleh Gnedenko Kolmogorov 1954, Feller 1971, Zolotarev 1986, dan Sato
1999. Banyak aplikasi statistik dari distribusi stable yang digunakan untuk
memodelkan fenomena fat-tail dalam observasi finansial ekonomi maupun dalam
lingkup lain statistika. Lebih lengkapnya dapat dilihat dalam Mandelbrot 1963, Paulson et al., 1975, Nolan 2001, tidak hanya sebatas itu masalah kekinian
tentang penggunaan distribusi stable dapat diperiksa dalam Burnecki et al., 2008 yang berhasil menunjukkan bahwa proses FARIMA dengan
-stable noise dapat menyediakan suatu alat stokastik baru untuk mempelajari fenomena letupan
matahari dalam kerangka kerja dari pemecahan persamaan Langevin, dalam bidang finansial Burnecki et al., 2011 membicarakan tentang logaritma return
dari index Hang Seng mulai 2 Januari 1987 sampai 14 November 2005, secara statistik menyerupai suatu barisan independen yang identik dengan variabel
random berdistribusi Levy stable. Pengembangan secara teoritis dari distribusi stable dapat dilihat dalam
Magdziarz 2009, Taqqu Levy 2008 yang melakukan pengujian terhadap proses log-fractional stable motion log-FSM, yang merupakan suatu proses
- stable dengan
. Rosadi Deistler 2009 fokus pada kodifferen dan fungsi kodifferen yang dinormalisasi sebagai ukuran ketergantungan untuk proses
stasioner. Selain itu Rosadi 2009 mempertimbangkan suatu tes tipe Portmanteau dari keacakan untuk variabel random
-stable dengan eksponen , menggunakan suatu tes statistik yang berbeda namun memiliki bentuk umum
yang sama dengan Box-Pierce Q-statistik, yang didefinisikan menggunakan fungsi Kodifferen. Dalam Wylomanska 2011 menyelidiki struktur dependen
untuk proses Ornstein-Uhlenbeck dengan sifat distribusi stable, yang biasanya perluasan dari proses Ornstein-Uhlenbeck klasik dengan Gaussian dan perilaku
- stable.
Penelitian aplikasi distribusi stable dalam permasalah finansial dibahas dalam Frain 2009. Kegagalan distribusi normal dalam menangani salah satu
masalah yaitu kerugian ekstrim pada indeks saham yang terjadi menyebabkan konsekuensi yang cukup besar dalam menjalankan bisnis dalam dunia finansial
dan khususnya untuk penilaian resiko. Solusi untuk menangani masalah tersebut adalah dengan mengganti distribusi normal dengan keluarga distribusi
-stable. Dalam penelitiannya diungkapkan bahwa distribusi
-stable memiliki beberapa keistimewaan yang mengakibatkan distribusi
-stable menjadi model yang menarik untuk permasalahan keuntungan, yaitu:
1. memungkinkan seseorang untuk memperhitungkan frekuensi garis besar nilai-nilai ekstrim,
2. memungkinkan seseorang untuk memodelkan kemiringan dalam data. Apakah nilai-nilai negatif yang ekstrim lebih mungkin dibandingkan positif
ekstrim?, 3. jika kita bisa menjelaskan kemungkinan waktu dalam sehari, sehari dalam
seminggu, efek musiman dan ketidakstasioneran lainnya yang melekat dalam proses menghasilkan keuntungan, kita mungkin mengasumsikan bahwa
kumpulan keuntungan dari waktu ke waktu memiliki distribusi yang sama, hingga faktor skala dan faktor lokasi, sebagai data frekuensi tinggi asli. Data
tersebut kemudian harus memiliki suatu distribusi -stable. Distribusi normal
adalah salah satu anggota dari distribusi -stable. Distribusi -stable
memungkinkan seseorang untuk mempertahankan sifat ini ketika data dimodelkan dengan cara yang lebih fleksibel,
4. distribusi -stable menggantikan distribusi normal seperti yang diketahui
sebagai generalisasi teorema limit pusat, dan 5. dalam beberapa kasus seseorang bisa memodelkan keuntungan sebagai suatu
distribusi -stable dengan memeriksa nilai ekstrim atau mengurai nilai
ekstrim melalui beberapa proses. Wang et al., 2008 membahas pengembangan Constant False Alarm Rate
CFAR algoritma deteksi kapal pada citra radar apertur sintetik pesawat ruang angkasa SAR berdasarkan model distribusi
-stabel. Algoritma CFAR menggunakan model distribusi normal untuk menggambarkan karakteristik
statistik dari suatu gejolak citra SAR. Seperti gelombang air laut dalam citra SAR menunjukkan karakteristik runcing atau heavy-tail, distribusi normal sering gagal
untuk menggambarkan gelombang air laut. Distribusi -stable digunakan untuk
menggantikan distribusi normal yang banyak digunakan dalam pemrosesan sinyal impulsif untuk menggambarkan gelombang air laut dalam pencitraan SAR.
Model distribusi stable merupakan generalisasi dari beberapa model distribusi yang telah dikenal, selain distribusi normal, distribusi cauchy juga
merupakan anggota dari distribusi stable. Distribusi normal yang merupakan salah satu kasus khusus dalam distribusi stable terjadi ketika nilai parameter
dan sehingga dapat dituliskan
. Sedangkan untuk distribusi cauchy terjadi ketika nilai parameter
dan , dapat dituliskan . Selain distribusi normal dan cauchy, ada dua model distribusi lain
yang merupakan kejadian khusus dalam distribusi stable yaitu distribusi levy yang
terjadi ketika nilai parameter dan
, kemudian distribusi menurun yang berbentuk
untuk suatu . Distribusi suatu variabel random biasanya digambarkan dengan
menggunakan bentuk fungsi kepadatan peluang, fungsi distribusi kumulatif dan fungsi pembangkit momennya. Namun dalam distribusi stable bentuk fungsi
kepadatan peluang, fungsi distribusi kumulatif dan momen ke-2 nya tidak diketahui dengan pasti. Jadi untuk dapat mengenali distribusi stable diberikan
suatu fungsi yang disebut fungsi karakteristik. Oleh sebab itu fungsi karakteristik dapat dijadikan jalan untuk menggambarkan suatu variabel random karena
eksistensi dari fungsi karakteristik selalu ada. Meskipun bentuk fungsi kepadatan peluang dari distribusi stable tidak
diketahui secara pasti kecuali untuk kasus khusus, Zolotarev 1964 berusaha menyajikan perhitungan tentang distribusi stable dan fungsi kepadatannya dengan
menggunakan gambaran integral yang baik. Kemudian DuMouchel 1971 menyajikan tabulasi fungsi distribusi untuk
dengan . Sebelumnya Fama and Roll 1968 telah mampu
menyajikan tabulasi untuk dengan . Tabulasi dan
grafik dari fungsi kepadatan untuk dan
disajikan oleh Holt dan Crow 1973. Distribusi stable memiliki empat parameter yaitu indeks stabilitas index of
stability yang menyatakan ketebalan ekor dari distribusi dimana nilai
yang lebih kecil menerangkan ekor yang lebih tebal pada distribusi, parameter kemiringan skewness parameter
menyatakan ukuran dari asimetri,
parameter skala scale parameter , dan parameter lokasi location
parameter .
Paolella 2001 dalam penelitiannya menyebutkan bahwa dengan mengetahui nilai indeks stabilitas
dari sekumpulan data, dapat memberikan keuntungan yaitu dapat menjadi suatu alasan penting untuk mengasumsikan
bahwa sekumpulan data tersebut merupakan wujud dari salah satu keluarga distribusi yang memiliki domain of attraction dalam ekor yang sama. Seperti
dalam data finansial, Stable Paretian, Pareto, dan, untuk tingkat kebebasan yang cukup kecil, Student’t dan generalisasi t dalam McDonald Newey 1988,
Bollerslev et al., 1994 yang menunjukkan tipe ekor Pareto. Selain untuk mengetahui ketebalan suatu ekor, dapat digunakan untuk mengindikasikan
kemungkinan dari kenjadian-kejadian ekstrem, menunjukkan keberadaan momen yang paling maksimal dari suatu data dan membantu memilih pengujian statistik
yang tepat untuk sekumpulan data tersebut. Jadi, untuk dapat melakukan hal tersebut dibutuhkan suatu estimator ekor.
Beberapa metode estimasi untuk parameter kunci distribusi stable telah diusulkan. Penyelidikan penggunaan metode maksimum likelihood untuk
mengestimasi parameter telah dilakukan oleh DuMouchel 1971 dan Nolan 1997 telah memperluas algoritma numerik dari penaksiran likelihood. Fama dan
Roll 1968, 1971 mengusulkan metode lain yaitu metode estimasi praktis berdasarkan distribusi empiris persentil dan kemudian metode tersebut
dikembangkan oleh McCulloch 1986. Kemudian Press 1972 mengusulkan metode estimasi fungsi karakteristik empiris, studi lain yang berhubungan
dilakukan oleh Paulson et al., 1975, Koutrouvelis 1980, Kogon Williams 1998, Feuerverger McDunnough 1981. Ada pula yang mengusulkan metode
likelihood empiris. Metode ini awalnya diperkenalkan oleh Owen 1988, 1990 untuk membangun konstruksi interval kepercayaan nonparametrik dan kemudian
dikembangkan untuk estimasi masalah persamaan dilakukan oleh Qin Lawless 1994. Hill 1975 mengusulkan estimator grafik untuk indeks
yang dikenal sebagai estimator Hill
̂
. Mittnik dan Paolella 1999 memperbaiki kekurangan-kekurangan yang ada dalam estimator Hill
̂
dan estimator McCulloch
̂
sehingga tercipta estimator baru yang disebut estimator Hint
̂
. Nilai estimasi dari suatu parameter untuk setiap estimator berbeda-beda,
namun untuk menentukan nilai estimasi parameter terbaik dari beberapa estimator dapat menggunakan beberapa kriteria yang telah diperkenalkan misal Unbias,
Efisiensi, Mean Squared Error, dan Best Linear Unbiased Estimator. Mittnik dan Paolella 1999, menunjukkan bahwa untuk
dengan ukuran sampel dan pada kasus distribusi
Stable yang simetris yaitu dan ,
̂
hampir sempurna simetris bias untuk seluruh rentang
yang dipertimbangkan, dengan pengecualian . Dibandingkan
̂
,
̂
unggul dalam hal bias dan varian. Dalam penelitian kali ini, dipusatkan untuk mencari estimator terbaik
untuk parameter dalam distribusi Stable dengan banyaknya sampel optimum
menggunakan data random hasil bangkitan dengan dengan
variasi menggunakan kriteria Mean Squared
Error MSE. Estimator yang digunakan adalah estimator McCulloch, estimator Hill, dan estimator Hint.
1.2 Rumusan Masalah