Pemilihan prediktor Langkah-langkah dalam proses estimasi

Estimasi Jumlah Populasi Kunci Terdampak HIV Tahun 2012 9 Proyeksi jumlah populasi 2012 untuk setiap kabupatenkota total, perempuan usia 15-49 tahun, laki-laki 15-49 tahun dimasukkan sebagai variabel prediktor, sebagai daerah perkotaan yang lebih besar sering dikaitkan dengan konsentrasi yang lebih besar dari PKT. Proyeksi populasi didasarkan pada Sensus Penduduk tahun 2010 dengan memperhitungkan angka pertumbuhan populasi tahunan.

2.3.4. Mengembangkan model regresi untuk setiap kelompok PKT

Regresi linear digunakan sebagai model awal dalam analisis. Regresi linier merupakan suatu pendekatan terhadap pemodelan hubungan antar variabel terikat kontinyu y dan satu atau lebih variabel penjelas yang dinamakan x. Dalam regresi linier, data dimodelkan dengan menggunakan fungsi-fungsi prediktor linier. Dari data-data yang tersedia akan menghasilkan model parameter yang dapat memprediksi data di kabupatenkota yang belum ada datanya. Regresi linier paling sering mengacu pada suatu model dimana rerata kondisional y untuk nilai x tertentu merupakan fungsi paralel dari x. Model regresi linier mengambil bentuk: Y i = a + b 1 x 1i + b 2 x 2i + b 3 x 3i + … + b n x ni + e i Dimana: Y i = jumlah populasi yang diprediksi untuk kotakabupateni a = perpotongan regresi b 1 , b 2 , b 3 , …., b n = koeisien regresi yang tidak terstandardisasi estimasi x1 i , x 2i , x 3i , …, x ni = nilai variabel atau prediktor bebas terkait untuk kota kabupaten tersebut i e 1 = kesalahan residual untuk kotakabupaten i. Beberapa asumsi harus dipenuhi sebelum menjalankan model regresi. Pertama, skala pengukuran untuk variabel terikat dan prediktor merupakan interval atau rasio. Oleh karena itu, sebagian besar variabel prediktor yang digunakan ditransformasi menjadi bentuk proporsi lihat Tabel 3. Kedua, asumsi normalitas, untuk setiap nilai prediktor, nilai variabel terikat didistribusi secara normal dengan rerata sama dengan μyx dan varian konstanta, σyx2. Ketiga, asumsi linearitas, nilai variabel terikat merupakan fungsi linier dari nilai Estimasi Jumlah Populasi Kunci Terdampak HIV Tahun 2012 10 prediktor. Asumsi ini dikonirmasi dengan membuat plot nilai prediksi yang tidak terstandardisasi pada prediktor. Keempat, asumsi homosedastisitas, untuk setiap nilai prediktor, nilai variabel terikat didistribusi secara normal dan varian konstan untuk semua nilai variabel prediktor. Asumsi ini dikonirmasi dengan membuat plot residual terstandardisasi pada prediktor. Diagnostik regresi diperiksa untuk setiap prediktor untuk mengkonirmasi bahwa asumsi regresi tidak dilanggar. Kelompok kerja estimasi menemukan bahwa model regresi linier merupakan metode analisis paling sesuai untuk populasi WPSL, WPSTL, Waria dan LSL. Meskipun demikian, regresi binomial negatif menghasilkan kecocokan paling baik untuk populasi Penasun karena reratanya lebih kecil dari variannya μ σ2 dan data tersebar tidak merata. Model regresi binomial negatif mengambil bentuk: Y i =e bo+b 1 x 1i +b 2 x 2i +...….+ b n x ni Where: Yi = ukuran populasi yang diprediksi untuk kabupatenkotai e = fungsi eksponensial b = perpotongan b 1 , b 2 , b 3 , …., b n = koeisien regresi estimasi x 1i , x 2i , x 3i , …, x ni = nilai variabel atau prediktor bebas terkait untuk kabupatenkota i. Semua prediktor diuji secara univariat. Variabel yang bermakna secara statistik dalam analisis univariat dimasukkan ke dalam regresi multivariabel. Pendekatan forward and backward regressions dijajagi untuk menemukan model yang paling sesuai. Plot sebaran regresi scatter plot digunakan untuk memeriksa pencilan outlier data secara visual. Outlier ekstrim kemudian disisihkan dari analisis untuk memperbaiki kecocokan model model itness. Model yang paling cocok untuk setiap PKT dimasukkan ke dalam datar pada Tabel 4 di bawah. Estimasi Jumlah Populasi Kunci Terdampak HIV Tahun 2012 11 Catatan: Prop_urban : proporsi desa dengan status urban Prop_bioskop : proporsi desa dengan bioskop beroperasi di suatu kabupatenkota Prop_diskotik : proporsi desa dengan diskotik di sebuah kabupatenkota Prop_billiard : proporsi desa dengan tempat bilyar di sebuah kabupatenkota Prop_narkotik : proporsi desa dengan laporan kasus narkoba di sebuah kabupatenkota Prop_anak_jalanan : proporsi desa dengan laporan kegiatan anak jalanan di sebuah kabupatenkota Prop_industri : proporsi desa dengan industri manufaktur di sebuah kabupatenkota Prop_hotel : proporsi desa dengan hotel beroperasi di sebuah kabupatenkota Prop_jasa : proporsi desa dengan kegiatan industri jasa di sebuah kabupatenkota Prop_warnet : proporsi desa dengan warnet beroperasi di suatu kabupatenkota _laki-laki_usia_subur : Jumlah laki-laki usia 15-49 tahun di sebuah kabupatenkota Anak_jalanan : jumlah desa dengan laporan kegiatan anak jalanan Perdagangan : jumlah desa dengan kegiatan industry perdagangan Pergudangan : jumlah desa dengan kegiatan industri pergudangan Jasa : jumlah desa with kegiatan industri jasa Ukuran-ukuran kesesuaian goodness of it, R 2 , dipaparkan dalam tabel 5 berdasarkan PKT. Ukuran-ukuran kesesuaian goodness of it mengukur seberapa baik variabel- variabel prediktor dalam menjelaskan memprediksi hasil akhir yang teramati. PKT Model Regresi WPSL Y = 8.6 - 290.1Prop_urban + 4845.2Prop_bioskop + 802.7Prop_diskotik + 364.9Prop_billiard + 953.8Prop_narkotik + 476.9Prop_anak_jalanan + 1035.3Prop_industri + 0.001_laki-laki_usia_subur WPSTL Y = 26.6 + 4676.1Prop_bioskop + 648.4Prop_diskotik + 410.7Prop_billiard + 0.0004_laki-laki_usia_subur Waria Y = 20.4 - 63.7Prop_urban + 853.3Prop_bioskop + 194.6Prop_billiard + 114.5Prop_anak_jalanan + 58.9Prop_hotel + 157.7Prop_industri + 157.8Prop_jasa + 0.0002_laki-laki_usia_subur LSL Y = -24.1 + 4603.6Prop_bioskop + 410.7Prop_warnet - 187.4Prop_industri + 0.001_laki-laki_usia_subur PWID Y = e3.8 + 0.03Anak_jalanan + 0.1Perdagangan + 0.4Pergudangan + 0.04Jasa Tabel 4. Model regresi untuk setiap PKT PKT R-kuadrat WPSL 0.659 WPSTL 0.521 Waria 0.735 LSL 0.435 Penasun 0.706 Tabel 5. Ukuran kesesuaian goodness of it