Pemilihan dan pembersihan data

Estimasi Jumlah Populasi Kunci Terdampak HIV Tahun 2012 7 Pada akhir proses ini, kabupatenkota yang memiliki data PKT bervariasi berdasarkan sub populasinya, mulai dari 24 kabupatenkota yang memiliki data Penasun sampai 52 kabupatenkota yang memiliki data WPSTL dan Waria, seperti yang dipaparkan dalam tabel 2.

2.3.3. Pemilihan prediktor

Variabel prediktor dipilih dari survei PODES 2011 6 dan sensus populasi 2010, yang diidentiikasi melalui konsultasi dengan panel ahli. 7 Variabel prediktor terpilih diyakini berkorelasi atau mempengaruhi jumlah kelompok PKT tertentu. Sebagai contoh, kabupatenkota dengan kegiatan pertambangan yang tinggi akan menarik kehadiran WPS tetapi tidak akan menarik kehadiran LSL, atau warnet berkorelasi dengan LSL karena banyak LSL menggunakan chat room di internet sebagai media komunikasi di antara mereka, tetapi warnet tidak akan berkorelasi dengan WPS. Tabel 3 menunjukkan datar prediktor terpilih untuk setiap PKT. PKT Jumlah Kabupatenkota Persentase KabupatenKota WPSL 251 51 WPSTL 260 52 Waria 259 52 LSL 144 29 Penasun 119 24 Tabel 2. Jumlah dan persentase kabupatenkota yang memiliki data pemetaan yang dapat digunakan, berdasarkan PKT 6 Survei Podes dilakukan setiap tiga tahun diantara kepala desa, mereka diminta untuk mengkarakterisasi desa mereka berdasarkan dimensi sosial-ekonomi-budaya. Data ini kemudian digabungkan di tingkat kabupatenkota sehingga dapat menunjukkan proporsi desa di daerah itu yang memiliki karakteristik tertentu. Desa adalah tingkat terendah pemerintahan di Indonesia. Data Podes dikumpulkan dari sekitar 68.000 desa di Indonesia. 7 Kedua dataset dikumpulkan dan dikelola oleh Badan Pusat Statistik BPS. Estimasi Jumlah Populasi Kunci Terdampak HIV Tahun 2012 8 Prediktor berdasarkan kabupatenkota WPSL WPSTL Waria LSL Penasun Jumlah desa dengan lokalisasi beroperasi di daerah tersebut √ Jumlah desa dengan status urban perkotaan √ √ √ √ √ Jumlah desa dengan bioskop beroperasi di daerah tersebut √ √ √ √ Jumlah desa dengan diskotik beroperasi di daerah tersebut √ √ √ √ Jumlah desa dengan tempat bilyar beroperasi di daerah tersebut √ √ √ √ Jumlah desa dengan warnet beroperasi di daerah tersebut √ √ √ √ Jumlah desa yang menerima laporan perkosaan √ √ Jumlah desa yang menerima laporan kasus penyalahgunaan napza √ √ Jumlah desa yang menerima laporan kegiatan anak jalanan √ √ √ √ √ Jumlah desa dengan hotel beroperasi di daerah tersebut √ √ √ √ Jumlah desa dengan motel beroperasi di daerah tersebut √ √ √ √ Jumlah desa dengan kegiatan industri pertambahangan √ √ √ √ √ Jumlah desa dengan kegiatan industri manufaktur √ √ √ √ √ Jumlah desa dengan kegiatan industri perdagangan √ √ √ √ √ Jumlah desa dengan kegiatan industri pergudangan √ √ √ √ √ Jumlah desa dengan kegiatan industri jasa √ √ √ √ √ Jumlah pria usia subur 15 – 49 tahun √ √ √ √ Jumlah perempuan usia subur 15 – 49 tahun √ √ √ √ Tabel 3. Datar prediktor untuk setiap PKT Catatan: Kotak yang diwarnai menggambarkan prediktor yang termasuk dalam model regresi inal dari setiap PKT. Estimasi Jumlah Populasi Kunci Terdampak HIV Tahun 2012 9 Proyeksi jumlah populasi 2012 untuk setiap kabupatenkota total, perempuan usia 15-49 tahun, laki-laki 15-49 tahun dimasukkan sebagai variabel prediktor, sebagai daerah perkotaan yang lebih besar sering dikaitkan dengan konsentrasi yang lebih besar dari PKT. Proyeksi populasi didasarkan pada Sensus Penduduk tahun 2010 dengan memperhitungkan angka pertumbuhan populasi tahunan.

2.3.4. Mengembangkan model regresi untuk setiap kelompok PKT

Regresi linear digunakan sebagai model awal dalam analisis. Regresi linier merupakan suatu pendekatan terhadap pemodelan hubungan antar variabel terikat kontinyu y dan satu atau lebih variabel penjelas yang dinamakan x. Dalam regresi linier, data dimodelkan dengan menggunakan fungsi-fungsi prediktor linier. Dari data-data yang tersedia akan menghasilkan model parameter yang dapat memprediksi data di kabupatenkota yang belum ada datanya. Regresi linier paling sering mengacu pada suatu model dimana rerata kondisional y untuk nilai x tertentu merupakan fungsi paralel dari x. Model regresi linier mengambil bentuk: Y i = a + b 1 x 1i + b 2 x 2i + b 3 x 3i + … + b n x ni + e i Dimana: Y i = jumlah populasi yang diprediksi untuk kotakabupateni a = perpotongan regresi b 1 , b 2 , b 3 , …., b n = koeisien regresi yang tidak terstandardisasi estimasi x1 i , x 2i , x 3i , …, x ni = nilai variabel atau prediktor bebas terkait untuk kota kabupaten tersebut i e 1 = kesalahan residual untuk kotakabupaten i. Beberapa asumsi harus dipenuhi sebelum menjalankan model regresi. Pertama, skala pengukuran untuk variabel terikat dan prediktor merupakan interval atau rasio. Oleh karena itu, sebagian besar variabel prediktor yang digunakan ditransformasi menjadi bentuk proporsi lihat Tabel 3. Kedua, asumsi normalitas, untuk setiap nilai prediktor, nilai variabel terikat didistribusi secara normal dengan rerata sama dengan μyx dan varian konstanta, σyx2. Ketiga, asumsi linearitas, nilai variabel terikat merupakan fungsi linier dari nilai