Analisis dengan Subset
3.8.4. Analisis dengan Subset
Untuk data yang terdiri atas beberapa kelompok (mengandung peu- bah kualitatif), analisis dapat dilakukan pada seluruh atau sebagian
231 dari 490
data tersebut melalui pemanfaatan parameter subset, dengan subset=nama.var.kualitatif=="simbol.sub.kelompok"
Cari Halaman
Pada Contoh 3.5 , kita dapat juga menganalisis secara terpisah
data untuk masing-masing kelompok L dan P .
Kembali
lm(formula = y ~ x, data = DataSimReg, subset = g == "P")
Layar Penuh
Residuals: Residuals:
Signif.codes:0 Judul ✬***✬ 0.001 ✬**✬ 0.01 ✬*✬ 0.05 ✬.✬ 0.1 ✬✬1 Residual standard error: 1.931 on 28 degrees of freedom
◭◭ ◭ ◮ ◮◮ Multiple R-squared: 0.8656,Adjusted R-squared: 0.8608
F-statistic: 180.4 on 1 and 28 DF, p-value: 9.99e-14
232 dari 490
Ternyata hasilnya identik dengan hasil sebelumnya yaitu: 1. Intersept (konstanta) = koefisien gP = - 31,43; Cari Halaman
2. Koefisien X = koefisien gP:x= 0,53
Kembali
Dengan cara yang sama kita dapatmelakukan analisis untuk subkelompok L dengan membuat subset = g == "L". Hasilnya identik dengan konstanta
Layar Penuh
dan koefisien untuk g.L.
titatif bersifat tetap,diukur tanpa sebaran. 3. Estimasi parameter regresi dapat dilakukan dengan metode kuadtar
terkecil dan metode likelihood maksimum, dan untuk regresi klasik,
Judul
keduanya identik. ◭◭ ◭ ◮ 4. sebelum melakukan analisis sebaiknya dilakukan eksplorasi data se- ◮◮
cara grafis, terutama jika mengandung peubah kualitatif/faktor.
233 dari 490
5. Untuk mengakomodasi peubah kualitatif, R memiliki beberapa al- ternatif formula sesuai kondisi data (misalnya apakah regresi paralel
ataukah regresi terpisah). Cari Halaman 6. R dapat menganalisis sebagian data dengan memanfaatkan parame-
ter subset sesuai kebutuhan. Kembali 7. Dalam mengeksplorasi model-model regresi, selain memeriksa sig-
Layar Penuh
nifikan tidaknya koefisien regresi,perlu diperhatikan nilai koefisien
Cari Halaman
Kembali
Layar Penuh
Cari Halaman
Kembali
Layar Penuh
2. Tuliskan bentuk akhir (dalam bentuk vektor), persamaan iterasi Sko- ring Fisher untuk mengestimasi parameter regresi pada model linier sederhana dengan metode likelihood maksimum
Judul
3. Jelaskan distribusi penduga likelihood, baik untuk sampel besar ma- upun untuk sampel kecil.
◭◭ ◭ ◮ ◮◮ 4. Eksplorasi beberapa data pada R, lakukan beberapa alternatif ana-
lisis regresi, selanjutnya tentukan model terbaik menurut anda. de-
236 dari 490
ngan 5. Diketahui keluaran hasil analsis regresi dengan dua peubah kuanti- Cari Halaman
tatif X, Y dan satu peubah faktor g = (L, P ) sebagai berikut. Selidiki apakah masih mungkin dilakukan perbaikan model dan model mana
Kembali
yang dianjurkan? Jelaskan jawaban anda. Coefficients:
Layar Penuh
Estimate Std. Error t value Pr(>|t|)
Residual standard error: 1.986 on 56 degrees of freedom Multiple R-squared: 0.9948,Adjusted R-squared: 0.9945 Judul
F-statistic: 3575 on 3 and 56 DF, p-value: < 2.2e-16 ◭◭ ◭ ◮ ◮◮
6. Diketahui keluaran hasil analsis regresi dengan dua peubah kuanti- tatif X, Y dan satu peubah faktor g = (L, P ) sebagai berikut. Selidiki
237 dari apakah masih mungkin dilakukan perbaikan model dan model mana 490 yang dianjurkan? Jelaskan jawaban anda.
Cari Halaman
Coefficients: Estimate Std. Error t value Pr(>|t|)
(Intercept) Kembali 52.84661 2.33328 22.649 <2e-16 *** x
2.94982 0.04557 64.737 <2e-16 *** g[T.P] -67.23481 3.27086 -20.556 <2e-16 ***
Layar Penuh
x:g[T.P] 0.03452 0.06347 0.544 0.589
Cari Halaman
Kembali
Layar Penuh
DIAGNOSTIK DAN TRANSFORMASI Judul
239 dari 490
Dalam analisis regresi, sebagaimana telah dibahas padaawal buku ini, se-
Cari Halaman
lain perlu mengestimasi dan menguji koefisien regresi, perlu juga dilakukan uji kecocokan model serta prosedur untuk memilih model yang lebih baik.
Kembali
Dalam bab ini akan dibahas beberapa hal dan prosedur terkait dengan pemeriksaan dan pemilihan model.
Layar Penuh
Cari Halaman
Kembali
Layar Penuh
4. Beberapa uji terkait asumsi 5. Memeriksa model melalui AIC Judul
6. Transformasi data ◭◭ ◭ ◮ ◮◮
241 dari 490
Cari Halaman
Kembali
Layar Penuh
(ii) nilai-tengah dari kesalahan ǫ i yaitu E(ǫ i ) adalah 0 (iii) ragam kesalahan adalah konstan, yaitu σ 2
dan Judul (iv) distribusi kesalahan adalah normal.
◭◭ ◭ ◮ ◮◮ Pemeriksaan terhadap asumsi di atas dapat dilakukan baik melalui uji sta-
tistika maupun secara intuitif menggunakan grafik. Dalam buku ini hanya
242 dari 490
dibahas pemeriksaan asumsi secara intuitif menggunakan grafik/ diagram. Pada prinsipnya kegiatan ini hampir sama dengan eksplorasi data. Be-
danya adalah eksplorasi data dilakukan sebeum melakukan analisis, sedang- Cari Halaman kan diagnostik dilakukan setelah melakukan analisis. Dengan demikian,
jika sebelum melakukan analisis telah dilakukan eksplorasi data pekerjaan
Kembali
mendiagnostik model menjadi lebih sederhana. Berikut adalah beberapa tampilan grafik yang dapat dimanfaatkan untuk memeriksa asumsi yang
Layar Penuh
diperlukan dan memperoleh gambaran kasar secera intuitif.
impangan yang sangat mencolok pada ujung-ujung grafik menunjukkan
datanya menyimpang dari distribusi normal. Pada Gambar 4.1 diberikan
Judul
grafik QQNorm dari data yang berdistribusi normal dan yang tidak berdis- tribusi normal. Pada grafik untuk data ke dua, selain terlihat menyimpang
◭◭ ◭ ◮ ◮◮ dari garis lurus di bagian ujung atas, yang berarti datanya cenderung tidak simetris ke kanan. Penafsiran yang lebih rinci dari bentuk-bentuk grafik
243 dari QQ-Norm dapat dilihat pada Tirta [ 490 43 ]. Simetris tidaknya sebaran data juga dapat dilihat melalui plot densi-
tas. Gambar Cari Halaman 4.2 menunjukkan grafik sebaran peluang dari masing-masing data yang sebelumnya digambar dengan QQNorm. Dari grafik ini juga
terlihat data ke dua cenderung lebih tidak simetris.
Kembali
Grafik Boxplot dapat digunakan untuk memperoleh gambaran se- baran data terutama kesimetrisannya.Selain itu dengan boxlot dapat juga
Layar Penuh
dilacak adanya pencilan (outlier ). Deskripsi komponen grafik boxplot
Cari Halaman
Gambar 4.1: Grafik Quantile dari Data Berdistribusi Normal (kiri) dan Data Cenderung Tidak Berdistribusi Normal
Kembali
(Kanan)
Layar Penuh
Cari Halaman
Gambar 4.2: Grafik Sebaran Peluang dari Data Berdistribusi Normal (lebih simetris, warna biru) dan Data Tidak Berdistribusi
Kembali
Normal (tidak siumetris, warna merah)
Layar Penuh
Cari Halaman
Kembali
Layar Penuh
Cari Halaman 50
Kembali
Layar Penuh
Gambar 4.3: Boxplot respon dengan kelompok. Terindikasi salah satu
Pemeriksaan terhadap asumsi kelineran dalam fungsi f dapat dilakukan secara kasar dengan menggambar diagram percar dari data maupun residu/ sisa. Dari pencaran data akan dapat diperoleh gambaran se-
Judul
cara kasar apakah hubungan antara X dan Y mengikuti hubungan linear atau hubungan kuadratik atau yang lainnya.
Diagram pencar data, khususnya untuk satu peubah penjelas, dengan berbagai jenis fungsi dan distribusi dapat dilihat pada berba-
248 dari gai gambar berikut: 490
1. Gambar 4.4 dan Gambar 4.5 adalah grafik dari data dengan hu-
Cari Halaman
bungan Y = f (X, β) = β 0 +β 1 X yang berupa fungsi linier. Dari
gambar-gamber tersebut terlihat bahwa pencaran data terletak
Kembali
pada suatu garis lurus. Dekat tidaknya pencaran data dengan suatu garis sangat bergantung pada besarnya ragam semakin be-
Layar Penuh
sar ragamnya semakin jauh datanya dari garis sehingga semakin
Cari Halaman
Gambar 4.4: Grafik Pencar Data dengan Hubungan Linear dan Ragam
Kembali
Relatif Konstan
Layar Penuh
2. Gambar 4.6 adalah grafik dari data dengan hubungan Y =
Cari Halaman
Gambar 4.5: Grafik Pencar Data dengan hubungan Linear tetapi Ra- gam Relatif tidak Konstan
Kembali
Layar Penuh
Cari Halaman
Gambar 4.6: Grafik Pencar Data dengan hubungan lebih cenderung nonlinear
Kembali
3. Gambar 4.7 adalah grafik dari data dengan hubungan Y =
Layar Penuh
(β 1 f (X, β) = β X)
0 e . Dari diagram pencar terlihat sebaran data
Gambar 4.7: Grafik Pencar Data dengan Hubungan Eksponensial
Cari Halaman