Latar Belakang Analysis and Solving Outliers to Longitdinal Data

4

2.2 Pencilan

Wu 2010 mendefinisikan pencilan sebagai suatu pengamatan yang jelas berbeda jauh dari keseluruhan data atau tidak konsisten terhadap mayoritas data. Pengaruh spesifik subyek dan galat intra-subyek dalam model linier campuran 2.1 diasumsikan memiliki sebaran normal, karena inferensia menggunakan fungsi kemungkinan yang berdasarkan pada sebaran yang diasumsikan. Suatu pengamatan dengan ragam yang besar secara otomatis merupakan pencilan ketika diketahui ragam prior pengamatan tersebut kecil Weiss 1994. Pada praktiknya, asumsi sebaran parametrik mungkin tidak terpenuhi jika ada pencilan. Inferensia yang menggunakan fungsi kemungkinan pada model pengaruh acak sangat sensitif terhadap pencilan, yaitu dapat berpengaruh besar terhadap hasil dan kesimpulan. Pada data longitudinal ada dua jenis pencilan, yaitu: 1 Pencilan diantara pengamatan berulang dalam suatu subyek atau biasanya dinamakan e-outlier, walaupun individu tersebut bukan sebagai pencilan. 2 Pencilan individu yang jelas berbeda dari keseluruhan individu dalam contoh, pencilan ini sering disebut b-outlier. Kedua jenis pencilan ini terkadang sulit untuk dibedakan jika data memiliki banyak dimensi, misalnya data longitudinal. Statistik kedua pencilan tersebut berbeda untuk setiap subyek, yaitu statistik untuk pengamatan dan pengaruh acak Weiss 1994. Metode pendugaan kekar biasanya digunakan untuk mengatasi hal ini, karena metode kekar kurang sensitif terhadap pencilan. Metode pendugaan kekar dapat digunakan ketika asumsi terpenuhi ataupun tidak terpenuhi.

2.3 Model Linier Campuran

Model linier campuran secara umum dapat dimodelkan dengan formula sebagai berikut Kooler 2013: 2.2 dengan y merupakan vektor pengamatan berukuran mx1. X merupakan matriks rancangan mxp untuk pengaruh tetap dan Z berukuran mxq adalah matriks rancangan bagi pengaruh acak b. Pengaruh acak b qx1 dan galat ε menyebar normal dan saling bebas satu sama lain, yaitu ~N0,σ 2 V e , b~ N0, σ 2 V b , dan cov ,b = 0. 2.3 Jumlah total pengamatan dinotasikan dengan m = ∑ =1 , dengan n banyaknya subyek yang diamati, sedangkan banyaknya pengaruh acak adalah q. Matriks peragam bagi pengaruh acak, σ 2 V b memiliki r parameter = θ 1 , θ 2 , ..., θ r yang merupakan matriks blok diagonal berukuran qxq dengan K blok, sedangkan σ 2 V e diasumsikan merupakan matriks diagonal berukuran mxm dan diketahui nilainya. 5

2.4 Metode Pendugaan Parameter

Kooler 2013 menotasikan komponen ragam dengan faktor skala σ, yakni dan , , serta mendefinisikan model linier campuran dengan pengaruh acak spherical sebagai berikut: , 2.4 Dalam hal ini y~N ,σ 2 V y dengan U b merupakan faktor Cholesky segitiga bawah dari V b , sedemikian sehingga V b = U b U b ׳ dan V e = U e U e ׳ , sedangkan b = U b b dan ε = U e ε. Komponen b bersesuaian dengan komponen ragam yang diasumsikan bernilai nol. V y = ZV b Z ׳ + Ve. Berdasarkan persamaan 2.3, maka fungsi log kemungkinannya adalah: l , l , 2.5 = 2 log 1 2 l 1 2 y 1 - merupakan gabungan antara galat intra-subyek dengan pengaruh acak. Searle et al. 1992 mendefinisikan kembali fungsi log kemungkinan 2.5 dengan memisahkan pengaruh galat intra subyek dengan pengaruh acak = 2 log 1 2 l 1 2 2.6 dengan ε = U e -1 y- -ZU b

b. Berdasarkan persamaan 2.6 yang

diturunkan terhadap dan b diperoleh persamaan model campuran Henderson, yaitu: e e b b b e b q ̂ ̂ = [ e e ] 2.7 ̂ dan ̂ merupakan penduga kemungkinan maksimum bagi dan Best Linear Unbiased Predictor BLUP bagi b. Untuk dan diketahui pendugaan dapat dilakukan dengan mengoptimisasi fungsi log kemungkinan kemudian memprediksi b dengan menggunakan persamaan 2.7. Penduga bagi dan b dapat juga dihitung dengan menggunakan persamaan 2.7 secara bersamaan. Turunan pertama dari persamaan 2.6 terhadap dan b dapat ditulis juga ke dalam bentuk persamaan berikut, yaitu: e 1 ̂ ̂ 2.8 ̂ ̂ ̂ =0 dengan ̂ ̂ ̂ ̂ . Persamaan pendugaan bagi dan b pada persamaan 2.7 atau 2.8 selanjutnya disebut persamaan pendugaan pertama dan kedua.