Suatu Survei Tentang Regresi Berbasis Kopula.

fl lrs Jrl zo."']7-

KNMru

Koffierems0 Nosnomd

Mdernffio

n-1,4Juni20L4
Graha Sepuluh Nopember

ITS

Konferensi Nosional Matemotika (KNM) XVll

- ITS Suraboyo

DAFTAR ISI

lnformasi
1.1 Susunan Panitia Konferensi Nasional Matematika XV11,2Ot4.....................1


.......7
)(Vll...
.................9
1.3 Sambutan Presiden lndoMS 2OL2-20L4
.......13
1.4 Sambutan Rektor lnstitut Teknologi Sepuluh Nopember.
1.2 Laporan Ketua Panitia KNM

1.5 Sambutan Dekan FMIPA lnstitut Teknologi Sepuluh Nopember................15

Acara.........
Abstrak lnvited Speaker.....
1.6 Susunan

2.

........L7
..........-...o.... 23


3. Jadwat Presentasi Sesi Paralel

1.................
3.2 Jnowar PEnsErurlsr Mnrlus Sesr Pmalrr 2................

3.1Jaowm Prnserurnsr Maxnum

Sesr PRRRUI-

.................33
....-.............47

3.3 Jnowm PeRsEurns Mernux Srsr PRmrE13................ ..................60

4. Denah Lokasi Ruangan
5. lnformasiSingkat Ekskursi
5. lklan dan Sponsor.....
7. Ucapqn Terima Kasih..........

.........75

........-....-........77

............81
.....................83

Konferensi Nosional Motemotiko (KNM)XVll-

ITS

Suraboya

MENGG UNAKAN PEN DE KATAN

BAYESIAN

2

Tanggat
Wahu
Ruang

Hari/

/ 12 Juni 2osTATlsTlKA
:13.'15s.d.17.00 -,-

r Kamis

:SemeruB/

Waktu

No

ID

1

S1

13.15


- 13.30

Achmad Fahrurozi

KLASIFIKASI KAYU DENGAN
MENGGUNAKAN NAiVE BAYES.
CLASS/F/ER

Universitas
Gunadarma

2

S2

1

3.30


- 13.45

Adhitya Ronnie Effendie

KqLKULATOR SURVIVAL DAN
LIFE TABEL MENGGUNAKAN
SOFTWARE R

Universitas Gadjah

Judul

Nama

lnstansi

Mada

3


S3

13.45

-

14.00

Affiati Oktaviarina

MODEL REGRESI COX
PROPORTIONAL HAZARD PADA
DAYA TAHAN PASIEN PENDERITA
TBC DI SURABAYA

UNESA

4

S5


14.00

- 14.15

Andi Kresna Jaya

BEBEMPA SIFAT HASIL KALI
KRONECKER MNTAI MARKOV
BERDIMENSI HINGGA

Universitas
Hasanuddin

5

s12

14.15


-

14.30

caturiyati

FUNGSI BARRIER PADA MASALAH
SECOND ORDER CONE
PROGRAMMING NORMA INFINIT

UNY

o

s13

14.45

-


'l

Danardono

STUDI SIMULASI PENGGABUNGAN
TABEL MORTALITAS
MENGGUNAKAN METODE.
LIKELIHOOD

Jurusan Matematika

Hendro Permadi

PENGEMBANGAN GRAFIK
PENGENDALI DISTRIBUSI BETA
BINOMIAL SEBAGAI PENGANTI pCHART MELALUI MARKOV CHAIN
MONTE CARLO

Jurusan Matematika
FMIPA UM


lGustiAyu Made

Pengaruh Outliers Terhadap Estimator
Parameter Regresi dan Metode
Reqresi Robust
A Survey of Copula-based Regression

Matematika,
Universitas
Udavana

Analisis Gerombol Berbasis Model
(Studi Kasus Standar Pelayanan
Minimal SMP di Kabupaten Manokwari)

Universitas Negeri

5.00

7

s41

15.00

-

8

s44

15.15

- 15.30

15.15

Srinadi

(9

s45

15.30

-

10

s46

1s.45

- 16.00

11

s47

16.00

15.45

- 16.15

12

s96

16.1 5

-

13

s52

16.30

- 16,45

16.30

lWayan Sumarjaya
lndah Ratih Anggriyani

lndah Ratih Anggriyani

Kajian Analisis Diskriminan Berbasis
Model (Model Based Discriminant
Analvsis Studv)

UGM

Universitas
Udayana
Papua

Universitas Negeri
Papua

Dian Handayani

Aplikasi Metode Empirical Bayes untuk
Pendugaan lndikator Kemiskinan pada
Level Kecamatan

Universitas Negeri
Jakarta

Komang Dharmawan

PEMODELAN KEBERGANTUNGAN
INDEKS SAHAM MENGGUNAKAN
FUNGSI COPULA

Universitas
Udayana

53

KNM

XVII

11-14 Juni

2014

ITS, Surabaya

SUATU SURVEI TENTANG
REGRESI BERBASIS KOPUL

I WAYAN SUMARJAYA'
'

Jurusan Matematika Universitas Udayana, sumarj aya@unud.ac. id

Extended abstract

Analisis regresi merupakan salah satu metode statistika yang paling sering
digunakan. Pengembangan analisis regresi dalam bentuk model linear rampat
(generalized linear model) telah sukses dalam memodelkan datayang melibatkan
peubah respons kontinu ataupun disket. Model linear rampat ini mengasumsikan
bahwa peubah respons termasuk dalam keluarga eksponensial. Namun, dalam
banyak aplikasi seperti dalam bidang asuransi dan manajemen risiko struktur
kebergantungan yang diberikan keluarga eksponensial menjadi tidak fleksibel.
Klugman et al. |5) memperluas konsep model linear rampat untuk distribusi
selain anggota keluarga eksponensial. Perluasan lebih lanjut dilakukan oleh
Venter [30] dengan aplikasi pada /oss reserve.

Mengingat analisis regresi melibatkan hubungan antara dua peubah atau lebih,
konsep kebergantungan (dependence) memegang peranan penting. Pada analisis
regresi linear hubungan kebergantungan antarpeubah dinyatakan oleh korelasi.
Namun, Embrechts et al. ll2l dan [13] mengatakan bahwa pada dunia nonnormal, korelasi bukanlah merupakan ukuran kebergantungan yang berguna.
Kelemahan lain adalah korelasi tidaklah invarian dalam transformasi, yang mana
hal ini tidak terjadi pada kebergantungan berbasis kopula. Dalam konteks analisis
regresi peranan penting kopula antara lain dalam memodelkan kebergantungan
nonlinear dan memisahkan pengaruh margin univariat.

[9]

Kolev and Paiva
telah mensurvei beberapa model regresi berbasis kopula.
Namun, setelah tahun 2009 terdapat beberapa model atau ide baru tentang regresi
berbasis kopula yang layak dibahas. Beberapa hasil tersebut antara lain regresi
kuantil-kopula, model berbasis kopula bersama, regresi kuadrat terkecil biasa
rampat dengan kopula normal, analisis regresi marginal kopula Gauss, dan regresi
berbasis kopula untuk data cacah. Mengingat regresi berbasis kopula termasuk
area riset yang aktif dan masih belum banyak diketahui dan diaplikasikan, maka
survei ini dititikberatkan pada model-model tersebut dan aplikasinya.
Kata kunci: kopula, kebergantungan, regresi kopula

1. Latar Belakang
Analisis regresi melibatkan hubungan antara dua peubah atau lebih. Hal ini berarti
konsep kebergantungan (dependence) memegang peranan penting. Pada analisis
regresi linear hubungan antarpeubah dinyatakan oleh korelasi. Namun, Embrechts
et al. [12] dan [13] mengatakan bahwa pada dunia/aplikasi nonnormal
(noneliptik), korelasi bukanlah ukuran kebergantungan yang berguna. Lebih lanjut
dalam [12] dan [13] setidaknya ada enam masalah penggunaan korelasi sebagai
ukuran kebergantungan.
Ada tiga masalah penyalahgunaan korelasi yang sering ditemukan lihat [12],
[13]. Pertama, distribusi marginal dan korelasi menentukan distribusi bersama.
Hal ini tentu saja hanya berlaku untuk distribusi eliptik. Distribusi eliptik adalah
distribusi yang densitasnya konstan pada ellipsoid dan pada dimensi dua gari
kontur permukaan densitas adalah elips [12]. Penyalahgunaan selanjutnya adalah
sebagai berikut: diberikan distribusi marginal F1 dan F2 untuk X dan Y , semua
korelasi linear antara − 1 dan 1 dapat diperoleh dengan spesifikasi yang sesuai
dari distribusi bersama. Hal ini juga tidaklah benar. Embrechts et al. [12]
mencontohkan jika X ~ LOGN(0,1) dan Y ~ LOGN (0, σ 2 ) dengan σ 2 > 0 , maka
nilai
exp(−σ ) − 1
ρ min =
(exp(1) − 1)(exp(σ 2 ) − 1)
dan
exp(σ ) − 1
ρ max =
(exp(1) − 1)(exp(σ 2 ) − 1)
yang tidak berada pada selang [−1,1] . Penyalahgunaan ketiga adalah pada saat
kuantil untuk portofolio linear X + Y terjadi pada saat ρ ( X + Y ) maksimal.
Embrechts [12] menegaskan bahwa ini juga hanya terjadi pada dunia eliptik.
Berdasarkan kelemahan-kelemahan tersebut di atas diperlukan ukuran
kebergantungan lain yang mampu memodelkan hubungan nonlinear. Salah satu
cara untuk memodelkan struktur kebergantungan ini adalah dengan kopula.
Kopula merupakan fungsi yang menggabungkan atau memasangkan fungsi
distribusi multivariat dengan fungsi distribusi marginal satu dimensi.
Artikel ini diatur sebagai berikut. Bagian pertama berisi motivasi kelemahan
korelasi dalam memodelkan hubungan antarpeubah. Selanjutnya, bagian kedua
berisi pengantar kopula dan ukuran Kendall τ dan Spearman ρ . Model-model
regresi berbasis kopula dibahas pada bagian ketiga. Bagian keempat membahas
teknik umum pendugaan parameter model. Bagian terakhir dari artikel adalah
diskusi.
2. Pengantar Kopula
Pada bagian ini akan dibicarakan konsep kopula. Pembahasan diawali dengan
konsep kopula bivariat, kemudian dilanjutkan dengan kasus multivariat. Literatur
standar tentang kopula dapat dibaca pada monograf [23] dan [5].
Pembahasan konsep kopula pada bagian berikut diambil dari [23] dan [5].
Misalkan X dan Y adalah peubah acak dengan fungsi distribusi

2

KNM XVII

11-14 Juni 2014

ITS, Surabaya

F ( x) = Pr( X ≤ x)
dan
G ( y ) = Pr(Y ≤ y )
serta
distribusi
bersama
H ( x, y ) = Pr( X ≤ x, Y ≤ y ) . Untuk masing-masing bilangan real ( x, y ) dapat
diasosiasikan tiga bilangan F ( x) , G ( y ) , dan H ( x, y ) . Sebagai catatan ketiga
bilangan tersebut berada pada selang [0,1] . Hubungan antara F ( x) , G ( y ) , dan
H ( x, y ) dapat dijelaskan oleh Teorema Sklar untuk kasus bivariat berikut (lihat
misalnya [23] dan [5]).

Teorema Sklar [23] Misalkan H ( x, y ) adalah fungsi distribusi bersama dengan
margin F ( x) dan G ( y ) , maka terdapat suatu kopula C , sedemikian hingga untuk
semua x , y di dalam garis real diperluas R = [−∞, ∞]
H ( x, y ) = C ( F ( x), G ( y )) .
(1)
Jika F ( x) dan G ( y ) kontinu, maka C tunggal (unique); jika tidak, C secara
tunggal ditentukan pada ran F dan ran G . Sebaliknya, jika C adalah kopula dan
F ( x) serta G ( y ) adalah fungsi distribusi, maka fungsi H ( x, y ) adalah distribusi
bersama dengan margin F ( x) dan G ( y ) .
Berdasarkan Teorema Sklar di atas dapat dilihat bahwa fungsi densitas
peluang bersama dipisahkan menjadi marginal dan kopula, sehingga dalam hal ini
kopula hanya menyatakan ”asosiasi” antara X dan Y [5]. Dengan demikian
kopula memisahkan tingkah laku marginal yang diwakili oleh F dan G dari
asosiasi. Hal inilah yang menyebabkan kopula juga dikatakan fungsi
kebergantungan (dependence function).
Contoh 1. Kopula Gauss C (u , v) didefinisikan oleh

C (u, v) = N ρ (Φ −1 (u ), Φ −1 (v))
=

Φ −1 ( u ) Φ −1 ( v )

1

∫ ∫

2π 1 − ρ 2 −∞
dengan ρ adalah koefisien korelasi.

−∞

 − 2 ρst − s 2 − t 2 
exp 
 ds dt ,
2
 2(1 − ρ ) 

Contoh 2. Kelas kopula Archimedes (Archimedean copula) yang didefinisikan
oleh
C (u , v) = ϕ [ −1] (ϕ (u ) + ϕ (v))
dengan ϕ [−1] adalah pseudo-invers dari pembangkit (generator) ϕ . Contoh
anggota kopula Archimedes adalah kopula Gumbel
C (u , v) = exp − [(− ln u )θ + (− ln v)θ ]1/ θ , θ ∈ [1, ∞)
dan kopula Frank
C (u , v) = 1 − [(1 − u )θ + (1 − v)θ − (1 − u )θ (1 − v)θ ]1/θ , θ ∈ [1, ∞) .
Kopula Gumbel merupakan salah satu kopula yang mampu menangkap
kebergantungan ekor atas [11].
Selanjutnya akan didefinisikan densitas kopula dan representasi kanonik.

(

)

3

Definisi [5]. Densitas c(u , v) yang berasosiasi dengan kopula C (u , v) adalah
∂ 2C (u , v)
.
∂u ∂v

c(u , v) =

Contoh 3. Fungsi densitas kopula Gauss adalah
ν 2 + ν 22 2 ρν 1ν 2 − ν 12 −ν 22 
1
+
exp  1
c(u , v) =

2
2(1 − ρ 2 )
1− ρ2



dengan ν 1 = Φ −1 (u ) dan ν 2 = Φ −1 (v).
Pada vektor acak kontinu, densitas kopula c berhubungan dengan densitas f
dan fungsi distribusi F ; lebih jelasnya hal ini sama dengan rasio densitas bersama
f yang merupakan produk dari densitas marginal fi , i = 1, 2 , yakni
f ( x, y )
.
c( F1 ( x), F2 ( y )) =
f1 ( x) f 2 ( y )
Berdasarkan Teorema Sklar pada persamaan (1), hubungan di atas memunculkan
representasi kanonik berikut
f ( x, y ) = c( F1 ( x), F2 ( y )) f1 ( x) f 2 ( y ).
Selanjutnya perluasan Teorema Sklar untuk dimensi d dapat dilihat pada [23] dan
[5]. Misalkan H adalah fungsi distribusi berdimensi d dengan margin
F1 ( x), F2 ( x), K , Fd ( x) , maka terdapat kopula C berdimensi d sedemikian hingga
untuk semua x = ( x1 , x2 , K , xd ) ∈ R d
H ( x1 , x2 ,K, xd ) = C ( F1 ( x1 ), F2 ( x1 ),K, Fd ( xd )).
Jika F1 ( x1 ), F2 ( x1 ), K , Fd ( xd ) semuanya kontinu, maka C tunggal. Jika tidak C
secara tunggal ditentukan pada ran F1 × ran F2 × L ran Fd . Sebaliknya, jika C
adalah kopula berdimensi d dan F1 ( x1 ), F2 ( x1 ), K , Fd ( xd ) adalah fungsi
distribusi, maka H adalah fungsi distribusi berdimensi d dengan margin
F1 ( x1 ), F2 ( x1 ), K , Fd ( xd ) .
Contoh 4. Kopula Gauss C (u) multivariat didefinisikan oleh
C (u) =
1/ 2

dengan | R |

Φ −1 ( u1 )

1
(2π )

d /2

1/ 2

|R|



Φ −1 ( u d )



L

−∞

−∞

 1

exp − xT R −1x  dx1 L dxd
 2


adalah determinan.

Seperti halnya pada kasus bivariat densitas kopula dan representasi kanonik dapat
dikembangkan sebagai berikut.
Definisi

[5].

Densitas

c(u1, K , ud )

yang

C (u1, u2 , K , ud ) adalah

4

berasosiasi

dengan

kopula

KNM XVII

11-14 Juni 2014

ITS, Surabaya

∂ d C (u1, u2 , K , ud )
.
∂u1∂u2 L ∂ d
Demikian pula fungsi densitas f yang bersesuaian dengan densitas kopula
diberikan oleh representasi kanonik
c(u1 , K , ud ) =

d

f ( x1, x2 , K , xd ) = c( F1 ( x1 ), F2 ( x2 ), K , Fd ( xd ))∏ fi ( xi )

(2)

i =1

dengan
c( F1 ( x1 ), F2 ( x2 ), K , Fd ( xd )) =

∂ d C ( F1 ( x1 ), F2 ( x2 ), K , Fd ( xd ))
.
∂F1 ( x1 )∂F2 ( x2 ) K ∂Fd ( xd )

Contoh 5. Representasi densitas kopula Gauss C Ga (u) multivariat dapat
dinyatakan sebagai
1

 1
cRGa (u) =
exp − ξ T ( R −1 − I )ξ 
1/ 2
|R|

 2
−1
−1
−1
dengan ξ = (Φ (u1 ), Φ (u2 ), L , Φ (ud )) .
Pada bagian sebelumnya salah satu kelemahan korelasi adalah tidak invarian
dalam transformasi, sehingga diperlukan ukuran kebergantungan lain yang
invarian seperti Kendall τ dan Spearman ρ .
Definisi [5] Kendall τ untuk peubah acak X dan Y dengan kopula C
didefinisikan sebagai
τ = 4∫∫
C (u , v) dC (u , v) − 1.
[ 0 ,1]×[ 0 ,1]

Versi sampel Kendall τ dapat dihitung sebagai berikut (lihat [5])
n
2
∑∑ sgn( X i − X j )(Yi − Y j ).
n(n − 1) i =1 j >i
Definisi [5] Spearman ρ untuk peubah acak X dan Y dengan kopula C
didefinisikan sebagai
ρ = 12 ∫∫
uv dC (u , v) − 3.
[ 0 ,1]×[ 0 ,1]

Untuk Spearman ρ versi sampel dihitung sebagai berikut (lihat [5])




n
i =1

n

i =1

( Ri − R )( Si − S )

( Ri − R ) 2 ( Si − S ) 2

dengan Ri = rank ( X i ) dan S i = rank (Yi ) .

3. Model-model Regresi Berbasis Kopula
Pada bagian sebelumnya telah dijelaskan bahwa model regresi berdasarkan
kuadrat terkecil (ordinary least square) tidak sesuai untuk aplikasi aktuaria karena
seringkali hubungan antarpeubah tidak linear (nonlinear) dan distribusi peluang
tidak normal [26]. Sebagai contoh pada bidang asuransi, model untuk usia pada
saat meninggal biasanya pencong ke kiri (skewed to the left), sementara model
kerugian casualty (casualty loss) biasanya pencong ke kanan. Salah satu upaya
untuk mengatasi masalah ini adalah dengan model linear rampat (generalized

5

linear model, disingkat GLM). Namun, GLM memiliki keterbatasan yakni peubah
takbebas harus berasal dari keluarga eksponensial. Pengembangan lebih lanjut
GLM untuk distribusi selain keluarga eksponensial telah diusulkan oleh [15] dan
dikembangkan lebih lanjut oleh [30]. Pada subbagian ini akan dibahas beberapa
model regresi berbasis kopula. Dalam konteks analisis regresi peranan penting
kopula antara lain dalam memodelkan kebergantungan nonlinear [26] dan
memisahkan pengaruh margin univariat [28]. Selain itu, kopula invarian dalam
transformasi [7].
Pembahasan model regresi pada subbagian berikut meliputi model regresi
kuadrat terkecil biasa rampat dengan kopula Gauss [26], model regresi marginal
kopula Gauss [22], Regresi berbasis kopula bersama [20], regresi kopula data
cacah [24], dan regresi kuantil kopula [2].
3.1 Model Regresi Kuadrat Terkecil Biasa Rampat dengan Kopula Gauss
Parsa dan Klugman [26] mengusulkan perluasan regresi kuadrat terkecil dengan
kopula. Proses perluasan ini meliputi tiga langkah. Pertama, asumsikan suatu
model untuk distribusi bersama untuk semua peubah, baik respons maupun
kovariat. Kemudian, estimasi parameter model baik parameter pada distribusi
marginal ataupun parameter kopula. Langkah terakhir, hitung nilai prediksi Y
bersyarat suatu himpunan kovariat dengan menggunakan nilai tengah bersyarat Y
diketahui kovariat yakni E (Y | X 1 = x1 , K , X k = xk ).
Parsa dan Klugman [26] menggunakan fungsi kopula Gauss dengan
mengasumsikan distribusi normal multivariat dengan nilai tengah nol, varians
satu, dan matriks korelasi R . Menggunakan representasi kanonik kopula pada
persamaan (2) diperoleh
1
 1

f ( x1 , x2 ,K, xd ) = f1 ( x1 )L f d ( xd ) 1 / 2 exp − ξT ( R −1 − I )ξ .
|R|
 2

Selanjutnya dihitung distribusi bersyarat xd diketahui x1, x2 , K , xd −1 yakni

(

 1 Φ −1 ( F ( x ) − r T R −1 )ξ *
d
d
n −1
f ( xd | x1 , x2 ,K, xd −1 ) = f d ( xd ) exp −
T −1
1 − r Rn −1r
 2

)

2


− (Φ −1 ( Fd ( xd )) 2 


× (1 − r T Rn−−11r ) −1 / 2 ,
r
R
dengan ξ = (Φ −1 (u1 ), Φ −1 (u2 ), K , Φ −1 (u d −1 )) , R =  dT−1  , dan r adalah vektor
1
r
(d − 1) × 1 adalah kolom paling kanan dari R dengan elemen terakhir dari elemen
terakhir dihilangkan. Selanjutnya, dalam konteks regresi apabila xd diganti
dengan y akan diperoleh

(

 1 Φ −1 ( F ( y ) − r T R −1 )ξ *
n −1
f ( y | x1 , x2 ,K, xd −1 ) = f ( y ) exp−
T −1
1 − r Rn−1r
 2

)

2


− (Φ −1 ( F ( y )) 2 


× (1 − r T Rn−−11r ) −1/ 2 .
Pada regresi kuadrat terkecil biasa dan GLM distribusi kovariat biasanya tidak
ditentukan, namun dalam model regresi yang diusulkan [26] distribusi kovariat
harus ditentukan.

6

KNM XVII

11-14 Juni 2014

ITS, Surabaya

3.2 Regresi Marginal Kopula Gauss
Masarotto dan Varin [22] mengusulkan kelas model kopula Gauss untuk analisis
regresi marginal untuk data nonnormal berkorelasi. Kelas model ini memberikan
perluasan alamiah dari model regresi linear tradisional dengan galat berkorelasi
normal dengan respons kontinu, diskret, dan kategorik diperbolehkan. Misalkan
Y = (Y1 , K , Yn )T adalah vektor peubah respons kontinu, diskret, ataupun kovariat
dan y = ( y1 , K , yn )T adalah realisasinya serta x i = ( xi1 ,K, xip )T adalah vektor p
kovariat. Masarotto dan Varin [22] mengusulkan model regresi berbentuk
Yi = g (x i , ε i , λ ), i = 1, K , n,
dengan g (.) adalah fungsi yang sesuai dari peubah bebas x i dan peubah stokastik
yang tidak teramati ε i . Diasumsikan bahwa model regresi di atas diketahui sampai
dengan vektor parameter λ . Selanjutnya, salah satu spesifikasi yang mungkin
untuk fungsi g (.) adalah
−1

Yi = Fi (Φ (ε i ); λ ), i = 1,K, n,
(3)
dengan Fi (, ; λ ) = F (. | x i ; λ ) adalah fungsi distribusi kumulatif normal Yi | xi , dan
Φ(.) adalah fungsi distribusi normal. Dalam memodelkan kebergantungan
diasumsikan ε = (ε 1 , K , ε n )T adalah normal multivariat dengan nilai tengah nol
dan matriks korelasi Ω yakni
ε ~ MVN(0, Ω) .
(4)
Persamaan (3) di atas menspesifikasikan komponen marginal dan komponen
kebergantungan dinyatakan oleh persamaan (4). Keluarga model yang melibatkan
persamaan (3) dan (4) disebut regresi marginal kopula Gauss. Pada kasus kontinu
pemetaan antara ε i dan Yi pada (3) adalah satu-satu. Sebagai contoh pada kasus
bivariat
f ij ( yi , y j ; θ) = f i ( yi ; λ ) f j ( y j ; λ )h(ε i , ε j ; θ),
dengan f i ( yi ; λ ) = f ( yi | x i ; λ ) , f j ( y j ; λ ) = f j ( y j | x j ; λ ) , dan

h(ε i , ε j ; θ) =

f (ε i , ε j ; θ)
f (ε i , λ ) f (ε j , λ )

adalah densitas kopula Gauss bivariat, f (ε i , λ ) adalah densitas normal baku
bivariat, f (ε i , ε j ; θ) adalah densitas normal bivariat dengan nilai tengah nol,
varians satu, dan korelasi yang diberikan oleh elemen pada posisi (i, j ) dalam
matriks Ω . Untuk kasus diskret dan kategorik, pemetaan (3) tidaklah satu-satu
melainkan banyak-satu (many-to-one) sehingga
f ij ( yi , y j ; θ) = ∫
∫ f (ε i , ε j ) dε i dε j ,
Di ( yi , λ ) D j ( y j , λ )

dengan domain hasil kali Cartesius Di ( yi , λ ) = [Φ −1 ( Fi ( yi− ; λ )), Φ −1 ( Fi ( yi ; λ ))] ,
Fi ( yi− ; λ ) adalah limit dari Fi (.; λ ) pada yi dan yi− = yi − 1 apabila support Yi
pada N .

7

3.3 Regresi Berbasis Kopula Bersama
Kramer et al. [20] mengusulkan model regresi berbasis kopula bersama dalam
memodelkan kebergantungan antara ukuran klaim dan jumlah klaim dengan
mengombinasikan distribusi marginal dari frekuensi klaim dan keparahan
(severity) dengan kopula bivariat. Model yang diusulkan [20] merupakan
pengembangan dari model [21] dan [8].
Konsep pemodelan kopula berdasarkan distribusi bersama adalah sebagai
berikut. Misalkan X menyatakan peubah acak kontinu dan Y adalah peubah acak
diskret. Diasumsikan Y bernilai 1,2, K . Distribusi bersama X dan Y
didefinisikan oleh kopula parametrik C (⋅,⋅ | θ ) yang tergantung pada parameter θ ,
yakni
FX ,Y |θ ( x | y ) = C ( FX ( x), FY ( y ) | θ ).
Selanjutnya didefinisikan turunan parsial kopula terhadap peubah pertama yakni

D1 (u , v | θ ) =
C (u , v | θ ).
∂u
Kemudian fungsi densitas peluang bersama f X ,Y |θ ( x, y | θ ) dari peubah acak
kontinu X dan diskret Y diberikan oleh
f X ,Y |θ ( x, y | θ ) = f X ( x)[ D1 ( FX ( x), FY ( y ) | θ ) − D1 ( FX ( x), FY ( y − 1) | θ )].
Distribusi bersyarat Y | X = x dapat diperoleh dari model di atas dengan
menerapkan aturan peluang bersyarat.
Dalam pemodelan polis kerugian (policy loss) didefinisikan kerugian L
sebagai perkalian antara rata-rata ukuran klaim X dan jumlah klaim Y sebagai
L = XY dan fungsi densitas distribusi kerugian ini diberikan oleh

1
f L (l ) = ∑ [ D1 ( FX ( ly ), FY ( y ) | θ ) − D1 ( FX ( yl ), FY ( y − 1) | θ )] f X ( ly | θ )
y
y =1
untuk l > 0. Persamaan ini diperoleh dengan memarginalkan sepanjang vektor
peubah acak diskret l > 0.
Dalam formulasi model, [20] menggunakan GLM untuk model regresi
marginal dan mengombinasikannya dengan keluarga kopula bivariat.

3.4 Regresi Kopula Data Cacah
Nikoloulopoulos dan Karlis [24] mengusulkan model regresi berbasis kopula
dengan kovariat yang digunakan tidak saja untuk marginal tetapi juga parameter
kopula. Biasanya kopula digunakan untuk analisis data kontinu karena
kemampuannya memisahkan marginal dari sifat kebergantungan. Namun, hal ini
tidaklah berlaku untuk data cacah karena terdapat perancu (confounding) antara
margin univariat dan ukuran asosiasi [24]. Lebih lanjut, menurut [24] informasi
kovariat yang berhubungan dengan kebergantungan ada tiga yaitu dengan
menempatkan kovariat pada parameter-parameter marginal, pada parameter
kopula, dan pada keduanya (marginal maupun kopula).
Misalkan model parametrik berbasis kopula bivariat untuk respons cacah Y1
dan Y2 dengan fungsi distribusi H yang diberikan oleh representasi
H ( y1 , y2 , α1 , α 2 ;θ ) = C ( F1 ( y1 , α1 ); F2 ( y2 , α 2 );θ )

8

KNM XVII

11-14 Juni 2014

ITS, Surabaya

dengan F1 dan F2 adalah distribusi marginal dengan vektor parameter α1 dan α 2
serta θ adalah parameter kopula. Misalkan akan diselidiki efek informasi kovariat
pada struktur kebergantungan. Misalkan pula data ( yij , xij ), i = 1, K , n; j = 1,2 ,
dengan i adalah indeks untuk individu, j adalah indeks untuk respons cacah, dan
xij adalah vektor kovariat untuk individu ke-i yang berasosiasi dengan respons
cacah ke-j. Kovariat xij dimasukkan pada model parametrik berbasis kopula
dengan mengasumsikan model marginal univariat
yij ~ F j (.; α ij )
dengan

α ij = ( µij = g ( β Tj xij , γ j )) ,

µij menyatakan

nilai

tengah

yang

diparameterisasi oleh fungsi tautan (link function) yang sesuai g (.) untuk
mengakomodasi kovariat, β j adalah vektor koefisien regresi, dan γ j adalah
vektor parameter marginal yang tidak tergantung pada kovariat. Selanjutnya
bagian regresi untuk parameter kopula θ menggunakan fungsi kovariat s (.) pada

θ , yakni s (θ ) = bT xi .
3.5 Regresi Kuantil Kopula
Regresi klasik menitikberatkan pada nilai harapan peubah takbebas Y bersyarat
pada nilai peubah X yang disebut fungsi regresi. Regresi kuantil tidak membatasi
perhatian pada harapan bersyarat sehingga memungkinkan untuk mendekati
distribusi bersyarat secara keseluruhan dari peubah respons [9]. Regresi kuantil
muncul sebagai solusi dari peminimuman (minimization)
n

minp ∑ ρτ ( yi − xiT β )
β ∈R

i =1

(lihat [17],[16], dan [18]).
Bouyé dan Salmon [2] mengusulkan pendekatan untuk memodelkan regresi
kuantil nonlinear berdasarkan fungsi kopula yang mendefinisikan struktur
kebergantungan antarpeubah yang diteliti. Lebih lanjut Bouyé dan Salmon [2]
memperluas konsep regresi kuantil yang diusulkan oleh [17]. Perluasan ini
dilakukan dengan menentukan distribusi untuk peubah acak respons Y bersyarat
pada peubah bebas X dengan demikian menspesifikasikan fungsi regresi kuantil.
Sebelum membahas model regresi kuantil terlebih dahulu didefinisikan kurva
kuantil kopula ke-p.
Definisi [2]. Untuk suatu kopula parametrik C (⋅,⋅;θ ) kurva kuantil kopula ke-p
dari y bersyarat pada x didefinisikan oleh persamaan berikut
p = C1 ( FX ( x), FY ( y ); δ ),
(5)
dengan θ ∈ Ω himpunan parameter dan C (u , v;θ ) = ∂C (u , v;θ ) / ∂u . Pada
beberapa kondisi tertentu, seperti C1 harus terbalikkan sebagian (partially
invertible), maka persamaan di atas dapat dinyatakan sebagai
y = q(x, p; δ ),
dengan q(x, p; δ ) = FY[ −1] ( D( FX ( x), p; δ )) .
Contoh 6. Kopula Clayton dengan parameter positif tegas

9

θ

yakni

C (u , v;θ ) = (u −θ + v −θ − 1) −1/ θ memiliki kuantil kopula bersyarat Y | X (lihat [4])
y = FY−1 (( p −θ /(1+θ ) − 1) FX ( x) −θ + 1) −1/θ .

(

)

Selanjutnya regresi kuantil kopula didefinisikan sebagai berikut.
Definisi [2]. Regresi kuantil kopula ke-p q(x t , p; δ ) adalah solusi dari masalah
berikut:


min ∑ p | yt − q(x t , p; δ ) | + ∑ (1 − p ) | yt − q(x t , p; δ ) | 

δ 
t∈Τ1− p
 t∈Τp

dengan Τp = {t : yt ≥ q(x t , p; δ } dan Τ1− p adalah komplemennya. Bentuk ini juga
dapat dinyatakan sebagai
 T

min ∑ ( p − 1{ yt ≤q ( xt , p;δ )} )( yt − q(x t , p; δ )  .
δ
 t =1

Allen et al. [1] melakukan studi empiris terhadap enam pasangan data volatilitasreturn dan menyimpulkan bahwa regresi kuantil berbasis kopula memberikan hasil
yang lebih baik dibandingkan regresi kuantil biasa dalam hal menangkap
ketidaklinearan hubungan volatilitas-return.

4. Estimasi Parameter
Secara umum metode pendugaan parameter dapat dilakukan secara parametrik,
nonparametrik, dan semiparametrik.
4.1 Metode Parametrik
Pada pendugaan parameter secara parametrik dapat dilakukan dengan
menggunakan metode kemungkinan maksimum penuh (full maximum likelihood,
disingkat FML), metode kemungkinan maksimum dua-tahap (two-step maximum
likelihood, disingkat TSML), dan metode momen rampat (generalized method of
moments, disingkat GMM). Subbagian hanya membahas metode FML dan TSML.
Lihat kembali representasi kanonik pada persamaan (2) yakni
d

f ( x1, x2 , K , xd ) = c( F1 ( x1 ), F2 ( x2 ), K , Fd ( xd ))∏ fi ( xi )

(6)

i =1

dengan
∂ d C ( F1 ( x1 ), F2 ( x2 ), K , Fd ( xd ))
.
∂F1 ( x1 )∂F2 ( x2 ) K ∂Fd ( xd )
Apabila diambil sampel acak berdistribusi saling bebas dan identik dari vektor
x ( j ) = ( x1( j ) , x2( j ) , K , xd( j ) ) , j = 1,2, K , n , maka likelihood dari bentuk kanonik di
pada (6) adalah
n
n
d


f ( x1( j ) , x2( j ) , K , xd( j ) ) = ∏  c( F1 ( x1 ), F2 ( x2 ), K , Fd ( xd ))∏ f i ( xi ) 

j =1
j =1 
i =1

dan log likelihood yang bersesuaian adalah
c( F1 ( x1 ), F2 ( x2 ), K , Fd ( xd )) =

10

KNM XVII

11-14 Juni 2014

n

∑ log f ( x

( j)
1

j =1

ITS, Surabaya

n

, x2( j ) , K , xd( j ) ) = ∑ log c( F1 ( x1( j ) ), F2 ( x1( j ) ), K , Fd ( xd( j ) ))
j =1
d

(7)

n

+ ∑∑ log f i ( x ).
( j)
i

i =1 j =1

Kemudian tuliskan likelihood L = ∑ j =1 log f ( x1( j ) , x2( j ) , K , xd( j ) ) , likelihood dari
n

struktur

kebergantungan

LC = ∑ j =1 log c( F1 ( x1( j ) ), F2 ( x1( j ) ), K , Fd ( xd( j ) )) ,
n

dan

likelihood dari masing-masing margin Li = ∑ j =1 log f i ( xi( j ) ) . Dengan demikian
n

representasi bentuk kanonik di atas dapat dituliskan sebagai
d

L = LC + ∑ Li .
i =1

Misalkan kopula C adalah anggota dari keluarga kopula yang diindeks oleh
parameter θ yakni C (u1 , u 2 , K , u d ;θ ) dan margin Fi serta densitas univariat f i
diindeks oleh parameter β i yakni Fi = Fi ( xi ; β i ) dan f i = f i ( xi ; β i ) . Penduga
kemungkinan maksimum parameter model ( β1 , K , β d ) adalah
( βˆ MLE , βˆ MLE , K , βˆ MLE ;θˆ MLE ) = arg max L( β , K , β ;θ )
1

2

d

d

1

β1 ,K, β d

n

= arg max ∑ log c( F1 ( x1( j ) , β1 ), K , Fd ( xd( j ) , β d );θ )
β1 ,K, β d
d

j =1

n

+ ∑∑ log f i ( xi( j ) , β i ).
i =1 j =1

Metode alternatif untuk mengestimasi likelihood (7) adalah metode inference
function for margin (IFM) (lihat [29] atau [6]). IFM meliputi dua tahap. Pada
tahap pertama, penduga βˆiIFM diestimasi dari log-likelihood Li pada masingmasing margin
βˆiIFM = arg max Li ( β i )
βi

dengan demikian βˆ1IFM , βˆ2IFM ,K , βˆdIFM didefinisikan sebagai MLE dari parameter
model dalam asumsi kebebasan. Pada tahap kedua penduga θˆ IFM dari persamaan
kopula θ IFM dihitung dengan memaksimumkan kontribusi likelihood LC dengan
parameter marginal β i diganti dengan penduga tahap pertama
βˆ IFM = arg max L ( βˆ IFM , βˆ IFM ,K , βˆ IFM ;θ ).
i

θi

C

1

2

d

Pada kondisi regularitas tertentu penduga MLE βˆ1MLE , βˆ2MLE ,K, βˆdMLE ,θˆ MLE adalah
solusi dari
 ∂L ∂L
∂L ∂L 

,
, K,
,  = 0.
∂β d ∂θ 
 ∂β1 ∂β 2
Selanjutnya

penduga

tahap

kedua

11

( βˆ1IFM , βˆ2IFM , K, βˆdIFM ,θˆ IFM )

mencari

penyelesaian

 ∂L1 ∂L2
∂L ∂L 

,
, L, d ,  = 0.
∂β d ∂θ 
 ∂β1 ∂β 2
Strategi alternatif penghitungan likelihood adalah algoritma maximation by parts
(MBP) yang diusulkan Song [27] (lihat juga [29]). Langkah pertama adalah
d
mendapatkan estimasi awal ( β1 , K , β d ) dengan memaksimumkan ∑i =1 Li dengan
kata lain mengabaikan kebergantungan. Langkah selanjutnya adalah mencari
solusi untuk θ . Estimasi awal mengabaikan kebergantungan jadi tidak efisien.
Solusi iteratif ( β1MBP , β 2MBP , K , β dMBP ) memberikan suatu estimasi θ . Kemudian θ
diberikan estimasi ( β1 , K , β d ) menghasilkan estimasi efisien karena prosedur ini
mempertimbangkan kebergantungan. Lebih lanjut jika tidak terdapat
kebergantungan, langkah pertama penduga adalah efisien.
4.2 Metode Semiparametrik
Metode pendugaan semiparametrik meliputi dua tahap. Pada tahap pertama
margin univariat Fi diestimasi secara nonparametrik, yakni dengan distribusi
empiris F̂i atau versi skalanya. Pada tahap kedua, parameter kopula diestimasi
dari fungsi likelihood LC yakni
θˆ = arg max L (θ )
θ

C

n

= arg max ∑ log c( F1 ( x1( j ) ), F2 ( x1( j ) ), K , Fd ( xd( j ) );θ )
θ

j =1

dengan F̂i adalah penduga nonparametrik margin univariat F̂i .
Noh et al. [25] mengusulkan pendekatan semiparametrik dalam menduga
regresi berbasis kopula; kopula dimodelkan secara parametrik tetapi distribusi
marginal dimodelkan secara parametrik. Kelebihan metode ini adalah
keluwesannya dan juga tidak terlalu dipengaruhi oleh curse of dimensionality.
Dette et al.[10] memperingatkan pentingnya spesifikasi model. Lebih lanjut, jika
salah dalam menspesifikasikan struktur kopula sebenarnya, seringkali pendekatan
ini tidak menghasilkan estimasi yang dapat dipercaya.
4.3 Metode Nonparametrik
Prosedur estimasi nonparametrik untuk kopula berdasarkan formula invers dari
kopula empiris
Cˆ (u1 , u2 ,K, ud ) = Fˆ ( Fˆ1−1 (u1 ), Fˆ2−1 (u2 ),K, Fˆd−1 (ud ))
dengan F̂ adalah penduga nonparametric dari fungsi distribusi F berdimensi d
dan Fˆ1−1 (u1 ), Fˆ2−1 (u2 ),K, Fˆd−1 (ud ) adalah penduga nonparametrik dari pseudoinvers Fi −1 ( s ) = {t : Fi (t ) ≥ s} dari margin univariat F1 , F2 , K , Fd . Biasanya fungsi
distribusi empiris berdimensi d

12

KNM XVII

11-14 Juni 2014

ITS, Surabaya

1 T
Fˆ ( x1 , x2 , K , xd ) = ∑ I ( X 1 ≤ x1 , X 2 ≤ x2 , K , X d ≤ xd )
T t =1

1
estimasi pseudo-invers Fˆi ( s ) = {t : Fˆi (t ) ≥ s} dan distribusi univariat empiris
T
Fˆ = 1 ∑ I ( X ≤ x ) . Pendugaan kopula dengan metode nonparametrik dapat
T

t =1

i

i

dilihat pada [3].
5. Diskusi
Pada bagian ini dibahas hal-hal yang layak menjadi bahan diskusi. Hal pertama
adalah penerapan kopula pada kasus diskret. Genest dan Nešlehová [14]
menegaskan bahwa bahaya dan keterbatasan dalam memodelkan dan inferensi
dari kasus kontinu ke kasus diskret.
Hal berikutnya, meskipun konsep kopula dipahami dengan baik, estimasi
empirisnya lebih susah dan banyak perangkap dan kesulitan teknis dan biasanya
hal ini diabaikan atau dianggap remeh oleh praktisi (lihat [3]).
Daftar Pustaka
[1] Allen, D. E., Singh, A. K., Powell, R. J., McAleer, M., Taylor, J. and Thomas,
L.The Volatility-Return Relationship: Insights from Linear and Non-linear Quantile
Regression, Working Paper 1201, School of Accounting, Finance and Economics &
FEMARC Working Paper Series, Edith Cowan University, 2012.
[2] Bouyé, E. and Salmon, M. Dynamic Copula Quantile Regressions and Tail Area
Dynamic Dependence in Forex Markets, The European Journal of Finance, 15,
721—750, 2009.
[3] Charpentier, A., Fermanian, J-D. and Scaillet. The Estimation of Copulas: Theory
and Practice. In Copulas: From Theory to Application in Finance, Jörn Rank (eds),
Wiley, 2006.
[4] Cherubini, U., Gobbi, F., Mulinacci, S. and Romagnoli, S. Dynamic Copula
Methods in Finance, John Wiley & Sons, 2012.
[5] Cherubini, U., Luciano, E., and Vecchiato, W. Copula Methods in Finance, John
Wiley and Sons, 2004.
[6] Choroś, B., Ibragimov, R. and Permiakova, E. Copula Estimation.
in: Workshop on Copula Theory and its Applications, Durante, F., Härdle, W.,
Jaworski, P. , Rychlik, T., (eds.), Springer, Dortrecht (NL), 2010.
[7] Crane, G. J. and van der Hoek, J., Conditional Expectation Formulae for Copulas,
Aust. N. Z. J. Stat., 50, 53—67, 2008.
[8] Czado, C., Kastenmeier, R., Brechmann, E., Min, A. A Mixed Copula Model for
Insurance Claims and Claim Sizes, Scandinavian Actuarial Journal, 4, 278—305,
2012.
[9] Davino, C., Furno, M., and Vistocco, D. Quantile Regression: Theory and
Applications, John Wiley and Sons, 2014.
[10] Dette, H., Van Hecke, R. and Volgushev, S. Misspecification in Copula-based
Regression, arXiv: 1310.8037v1[stat.ME], 30 October, 2013.
[11] Embrechts, P. and Hofert, M., Statistics and Quantitative Risk Management for
Banking and Insurance, Annual Review of Statistics and Its Application, 1, 493—
513, 2014.
[12] Embrechts, P., McNeil, A. and Straumann, D. Correlation: Pitfalls and Alternatives,
Dependence in Risk Management: Properties and Pitfalls, Risk Management: Value

13

at Risk and Beyond, ed. M. Dempster, 176—223, New York, Cambridge University
Press, 1999.
[13] Embrechts, P., McNeil, A. and Straumann, D. Correlation and Dependence in Risk
Management: Properties and Pitfalls, Risk Management: Value at Risk and Beyond,
ed. M. Dempster, 176—223, New York, Cambridge University Press, 2002.
[14] Genest, C. and Nešlehová, A Primer on Copulas for Count, Astin Bulletin, 37,
475—515, 2007.
[15] Klugman, S., Panjer, H. and Willmot, G. Loss Models: From Data to Decisions,
Second Edition, New York, Wiley, 2004.
[16] Koenker, R. Quantile Regression, Cambridge, Cambridge University Press, 2005.
[17] Koenker, R. and Bassett, G., Regression Quantiles, Econometrica, 46, 33—50,
1979.
[18] Koenker, R. and Hallock, K. F., Quantile Regression, EJournal of Economic
Perspectives, 15, 143—156, 2001.
[19] Kolev, N. and Paiva, D., Copula-based Regression Models: a Survey, Journal of
Statistical Planning and Inference, 139, 3847—3856, 2009.
[20] Krämer, N., Brechmann, E. C., Silvestrini, D. and Czado, C.,Total Loss Estimation
Using Copula-based Regression Models, Insurance: Mathematics and Economics,
53, 829—839, 2013.
[21] de Leon, A. R. and Wu, B., Copula-based Regression Models for a Bivariate Mixed
Discrete and Continuous Outcome, Statistics in Medicine, 30, 175—185, 2010.
[22] Masarotto, G. and Varin, C., Gaussian Copula Marginal Regression. Electronic
Journal of Statistics, 6, 1517—1549, 2012.
[23] Nelsen, R. B., An Introduction to Copulas, Second Edition, New York, Springer,
2006.
[24] Nikoloulopoulos, A. K. and Karlis, D., Regression in a Copula Model for Bivariate
Count Data. Journal of Applied Statistics, 37, 1555—1568, 2010.
[25] Noh, H., El Ghouch, A. and Bouezmarni, T., Copula-based Regression Estimation
and Inference, Journal of the American Statistical Association, 108, 676—688,
2013.
[26] Parsa, R. A., and Klugman, S. A., Copula Regression, Variance: Advancing the
Science of Risk, 5, 45—54, 2011.
[27] Song, P. X. K., Fan, Y. and Kalbfleisch, J. D, Maximation by Parts in Likelihood
Inference, Journal of the American Statistical Association, 100, 1145—1158, 2005.
[28] Sungur, E. A., Some Observations on Copula Regression Functions,
Communication in Statistics—Theory and Methods, 34, 1967—1978, 2006.
[29] Trivedi, P. K. and Zimmer, D. M. Copula Modelling: An Introduction for
Practitioners, Foundation and Trends in Econometrics, 1, 1—111, 2005.
[30] Venter, G. G., Generalized Linear Models Beyond the Exponential Family with
Loss Reserve Applications, Astin Bulletin, 37, 345—364, 2007.

14

Sertfut
I Wayan Sumariaya
Sebagai

:

PENYAJI MAKAIAH
Dengan Judul

Suatu Survei Tentang Regresi Berhasis Kopula

#"'
** ils

l3Juni?{J.14

lr

.o.
L

L*. .M.Sa

L4L99LO22m1

IrrY'
tr.Eftdi

NuraniR.
1223 198803 2 001