Analisis klasifikasi silang atau analisis kategori
4.3 Analisis klasifikasi silang atau analisis kategori
4.3.1 Model klasik
Metode analisis kategori dikembangkan pertama sekali pada The Puget Sound Transportation Study pada tahun 1964. Model ini telah diperbaiki dan sering digunakan untuk mendapatkan bangkitan pergerakan untuk daerah permukiman, juga untuk penerapan lainnya.
4.3.1.1 Pendahuluan
Sampai dengan akhir tahun 1960-an, hampir semua kajian perencanaan transportasi di Amerika Serikat mengembangkan persamaan bangkitan pergerakan dengan menggunakan analisis regresi linear, khususnya dalam pemodelan bangkitan pergerakan untuk orang. Model regresi diusulkan oleh Federal Highway Administration (FHA) sebagai model standar dalam menganalisis bangkitan pergerakan.
Di akhir tahun 1960-an, metode alternatif lain didapatkan dan sangat cepat berkembang menjadi model yang populer di Inggris. Metode tersebut disebut metode analisis kategori di Inggris (Wootton and Pick, 1967) atau metode klasifikasi silang di Amerika Serikat. Pada saat yang sama, pengembangan model regresi linear juga berkembang dengan pesat, dimulai dari analisis pada tingkat zona dan dilanjutkan pada tingkat individu atau rumah tangga (lihat subbab 4.2).
Metode analisis kategori ini didasarkan pada adanya keterkaitan antara terjadinya pergerakan dengan atribut rumah tangga. Asumsi dasarnya adalah tingkat bangkitan pergerakan dapat dikatakan stabil dalam waktu untuk setiap stratifikasi rumah tangga tertentu. Metode ini menemukan secara empiris bahwa besarnya tingkat bangkitan pergerakan sangat banyak membutuhkan data (misalnya jumlah rumah tangga untuk setiap kelas). Walaupun pada awalnya metode ini dirancang agar dapat menggunakan data sensus di Inggris, permasalahan serius timbul pada saat harus meramalkan jumlah rumah tangga untuk setiap strata pada masa mendatang.
4.3.1.2 Definisi peubah dan spesifikasi model p Misalkan t (h) adalah rata-rata jumlah pergerakan dengan tujuan p (pada periode waktu tertentu), yang dilakukan
oleh setiap anggota rumah tangga dari jenis h. Jenis rumah tangga ditentukan berdasarkan stratifikasi. Contohnya, klasifikasi silang yang didasarkan pada m ukuran rumah tangga dengan n pemilikan kendaraan akan menghasilkan mn rumah tangga berjenis h.
Metode baku untuk menghitung tingkat pertumbuhan untuk setiap sel didapatkan dengan mengalokasikan rumah tangga ke setiap kelompok sel dan
menjumlahkannya satu per satu sehingga menghasilkan jumlah pergerakan T p (h), untuk setiap tujuan pergerakan. Jadi, tingkat pertumbuhan t p (h) didapatkan dengan membagi T p (h) dengan jumlah rumah tangga H(h). Dalam bentuk matematis dapat
dinyatakan sebagai:
Model bangkitan pergerakan 143 Model bangkitan pergerakan 143
kategori agar sebaran frekuensi dari simpangan baku dapat diminimumkan (lihat gambar 4.10).
Gambar 4.10
Sebaran tingkat pergerakan untuk setiap rumah tangga
Metode ini pada dasarnya memiliki beberapa keuntungan, yaitu:
1 pengelompokan klasifikasi silang tidak tergantung pada sistem zona di daerah kajian;
2 tidak ada asumsi awal yang harus diambil mengenai bentuk hubungan;
3 hubungan tersebut berbeda-beda untuk setiap kelompok (misalnya efek perubahan ukuran rumah tangga bagi yang mempunyai satu kendaraan dengan yang mempunyai dua kendaraan akan berbeda).
Akan tetapi, metode klasifikasi silang ini juga mempunyai kelemahan, yaitu:
1 tidak memperbolehkan ekstrapolasi;
2 tidak adanya uji statistik yang dapat mendukungnya sehingga yang menjadi patokan adalah besarnya simpangan antara hasil taksiran dengan hasil pengamatan. Semakin kecil simpangan tersebut, semakin baik;
3 data yang dibutuhkan sangat banyak agar nilai masing-masing tidak terlalu bervariasi secara tidak logis karena adanya perbedaan jumlah rumah tangga. Contohnya, pada kajian Monmouthshire Land Use − Transportation (lihat
Douglas and Lewis, 1971), sebaran dari 108 kategori (6 tingkat pendapatan, 3
tingkat dan 6 ukuran rumah tangga) hanya membutuhkan sampel sebanyak 4.000 rumah tangga (lihat tabel 4.16).
Tabel 4.16 Sebaran frekuensi rumah tangga
Jumlah kategori 21 69 9 7 2
Jumlah rumah tangga yang disurvei 0 1 − 49 50 − 99 100 − 199 200+
Sekurang-kurangnya 50 pengamatan dibutuhkan untuk setiap sel agar hasilnya dapat dipertanggungjawabkan. Kriteria ini hanya akan dipenuhi oleh 18 kategori dari 108 kategori yang ada yang mempunyai jumlah sampel sebanyak
144 Ofyar Z Tamin, Perencanaan dan pemodelan transportasi
4.000 rumah tangga. Jadi, diperlukan lagi data tambahan lain agar dapat dihasilkan sebaran frekuensi yang lebih merata − biayanya menjadi lebih mahal.
4 tidak ada cara yang efektif dalam memilih peubah tersebut. Proses minimasi simpangan baku seperti yang terlihat pada gambar 4.11 hanya dapat dilakukan dengan cara coba-coba yang sudah jelas sangat sulit dipraktekan.
Tetapkan n adalah jenis orang (dengan atau tanpa kendaraan), a i (h) adalah jumlah rumah tangga dengan jenis h di zona i dan H n (h) adalah rumah tangga dengan jenis h yang berisikan orang berjenis n. Dengan ini, kita dapat menuliskan besarnya bangkitan pergerakan
4.3.1.3 Penerapan model pada tingkat agregat
dengan tujuan p yang dilakukan oleh orang berjenis n di zona i ( np O
i ) sebagai berikut:
np
Untuk melihat cara kerja model, dapat diperbandingkan nilai hasil pemodelan dengan nilai hasil pengamatan sampel. Galat yang terjadi adalah karena penggunaan rata-rata nilai t p (h). Diperkirakan stratifikasi yang baik dapat meminimumkan
simpangan baku seperti pada gambar 4.10 dan juga menghasilkan galat yang lebih kecil.
Terdapat beberapa cara menentukan kategori rumah tangga. Untuk pertama kalinya di Inggris, Wootton and Pick (1971) menyarankan 108 kategori yang dihasilkan dari 6 tingkat pendapatan, 3 tingkat pemilikan kendaraan, dan 6 tingkat struktur rumah tangga seperti pada tabel 4.17.
Tabel 4.17 Contoh pengelompokan struktur rumah tangga
Kelompok
Jumlah yang bekerja
Orang dewasa lainnya
1 0 1 2 0 2 atau lebih 3 1 1 atau kurang 4 1 2 atau lebih
5 2 atau lebih
1 atau kurang
6 2 atau lebih
2 atau lebih
Permasalahannya adalah bagaimana meramalkan jumlah rumah tangga pada masa mendatang untuk setiap kategori. Metode yang umum digunakan (lihat Wilson, 1977) adalah: pertama, menetapkan dan mencocokkan sebaran peluang untuk pendapatan (I), pemilikan kendaraan (C), dan struktur rumah tangga (S) dengan data hasil kalibrasi; kedua: menggunakan hasil tersebut untuk membuat sebaran peluang gabungan untuk rumah tangga jenis h = (I,C,S).
Model bangkitan pergerakan 145
Jadi, jika sebaran peluang gabungan dinyatakan dengan φ (h) = φ (I,C,S), maka jumlah rumah tangga di zona i yang tergolong dalam kelompok h, atau a i (h), dapat dinyatakan secara sederhana dengan:
a i (h) = H i φ (h) (4.16)
H i adalah jumlah rumah tangga di zona i. Model taksiran rumah tangga dapat diuji secara parsial dengan menggunakan data pada tahun dasar. Jumlah pergerakan yang dihasilkan oleh persamaan (4.16), tetapi dengan nilai simulasi a i (h), kemudian dapat dicek dengan hasil pengamatan. Dengan demikian, kelemahan metode ini bertambah satu lagi sebagai berikut.
5 Jika disyaratkan untuk menambah jumlah stratifikasi, dibutuhkan penambahan jumlah sampel yang sangat banyak. Sebagai contoh, jika satu peubah lain ditambahkan dan kemudian dipecahkan menjadi 3 tingkat, jumlah kategori akan meningkat dari 108 menjadi 324.
Konsep dasarnya sederhana, dan peubah yang biasa digunakan dalam analisis kategori adalah ukuran rumah tangga (jumlah orang), pemilikan kendaraan, dan pendapatan rumah tangga.
4.3.1.4 Tahapan perhitungan
Kategori ditetapkan menjadi tiga dan kemudian rata-rata tingkat bangkitan pergerakan (dari data empiris) dibebankan untuk setiap kategori. Data untuk mengilustrasikan bagaimana keragaman tingkat bangkitan pergerakan di antara ketiga peubah tersebut diperlihatkan pada tabel 4.18 (Marler, 1985). Hal ini menunjukkan pentingnya peubah tersebut dalam menghitung bangkitan pergerakan.
Tabel 4.18 Tingkat bangkitan pergerakan kerja per rumah tangga Kategori Rendah Menengah Tinggi
Total pendapatan rumah tangga *
Kendaraan per rumah tangga **
1,63 Keterangan: * rendah : sampai dengan Rp 75,000/bulan
Ukuran rumah tangga ***
menengah : Rp 76.000 − 150,000/bulan tinggi : lebih besar dari Rp.150,000/bulan ** rendah : tidak mempunyai kendaraan bermotor menengah : 1 kendaraan tinggi : lebih dari 2
*** rendah : 1 − 3 orang
menengah : 4 − 6 orang tinggi : lebih dari 6 orang.
Sumber: Marler (1985) Tahap 1 Tiga buah peubah harus distratifikasi. Beberapa kajian di Inggris
menggunakan 6 kategori pendapatan, 6 kategori ukuran rumah tangga, dan 3 kategori pemilikan kendaraan. Perlu diperhatikan bahwa penggunaan kategori pendapatan dan pemilikan kendaraan dalam analisis kategori sering dikritik karena keduanya saling berkorelasi. Disarankan agar 108 kategori tersebut dikurangi sehingga kebutuhan akan data dan biaya juga berkurang. Kategori tersebut
146 Ofyar Z Tamin, Perencanaan dan pemodelan transportasi 146 Ofyar Z Tamin, Perencanaan dan pemodelan transportasi
Untuk kasus pada tabel 4.18, terdapat 27 kategori yang menggabungkan pemilikan kendaraan, pendapatan, dan ukuran rumah tangga. Perhatikan bahwa jumlah peubah dan cara stratifikasinya beragam, tergantung dari data yang tersedia dan tujuan kajian. Konsep ini diilustrasikan dengan gambar 4.11.
n a ta Rp 2.500.000 + g g p n
Rp 2.000.000 – 2.500.000 + a a t
Rp 1.500.000 – 2.000.000 +
a d n h Rp 1.000.000 – 1.500.000 + Rp 500.000 – 1.000.000 + Pe ma ru
Struktur kategori dalam metode analisis kategori
Struktur rumah tangga
Tahap 2 Setiap rumah tangga yang didapat dari survei wawancara di rumah harus dicocokkan untuk setiap kategori, tergantung dari data rumah tangga tersebut (pemilikan kendaraan, ukuran rumah tangga, dan pendapatan).
Tahap 3 Rata-rata tingkat bangkitan pergerakan dihitung untuk setiap kategori dengan menggunakan data dari rumah tangga. Hal ini bisa didapat dengan jalan membagi jumlah pergerakan yang dihasilkan untuk setiap kategori dengan jumlah rumah tangga yang ada dalam kategori tersebut.
Tahap 4 Sejauh ini, rata-rata bangkitan pergerakan dilakukan untuk setiap kategori, tetapi sudah cukup untuk digunakan dalam menaksir bangkitan pergerakan per zona. Ini dilakukan dengan mengalikan jumlah rumah tangga pada zona tersebut untuk setiap kategori, dan hasilnya dijumlahkan untuk semua 27 kategori yang akhirnya akan menghasilkan total bangkitan pergerakan untuk zona tersebut. Dengan kata lain:
Pˆ = perkiraan jumlah pergerakan yang dihasilkan oleh zona i; i
T c = rata-rata bangkitan pergerakan per rumah tangga dalam kategori c;
H c (i) = jumlah rumah tangga dengan kategori c yang berlokasi di zona i
Model bangkitan pergerakan 147
Pada contoh ini (Black, 1981) diasumsikan tiga peubah yang diperkirakan mempengaruhi besarnya pergerakan:
4.3.1.5 Contoh sederhana
3 kategori pemilikan kendaraan (0, 1, 2+); •
3 kategori pendapatan (rendah [0 − 100.000 rupiah/bulan]; menengah [100.000 − 200.000 rupiah/bulan]; tinggi [lebih dari 200.000 rupiah/bulan])
2 kategori ukuran rumah tangga (1 − 3 orang; 4+ orang) Secara keseluruhan ketiga peubah dengan stratifikasinya menghasilkan 3 x 3 x 2 =
18 kategori. Masalahnya sekarang adalah bagaimana mendapatkan total bangkitan pergerakan. Data untuk analisis kategori diberikan pada tabel 4.19, sedangkan jumlah rumah tangga dengan kategorinya masing-masing diberikan pada tabel 4.20.
Tabel 4.19 Analisis kategori tingkat pergerakan untuk 18 kategori
Tingkat pendapatan Tingkat pemilikan kendaraan Rendah Menengah
Tinggi
Tidak ada kendaraan (0)
3,4a
3,7a 3,8a
4,9b
5,0b 5,1b
Satu kendaraan (1)
5,2a
7,3a 8,0a
Dua atau lebih kendaraan (2+)
8,1a 10,0a
12,9b Catatan:
7,2b
1,8b
a Tingkat bangkitan pergerakan untuk setiap rumah tangga dengan 1 − 3 orang b Tingkat bangkitan pergerakan untuk setiap rumah tangga dengan 4 atau lebih orang
Tabel 4.20 Kategori rumah tangga dengan 3 peubah
Jumlah rumah tangga
Pemilikan
Ukuran rumah
Dengan menggunakan data tabel 4.13 dan 4.14, perkiraan total bangkitan pergerakan untuk zona tersebut adalah: (50x3,4) + (20x3,7) + (10x4,9) + (50x5,2) + (50x6,9) + (100x8,3) + (40x10,0) + (100x11,8) + (150x12,9) = 5.243 pergerakan.
148 Ofyar Z Tamin, Perencanaan dan pemodelan transportasi
Analisis kategori mempunyai lebih sedikit batasan dibandingkan dengan analisis regresi; misalnya, analisis kategori tidak mengasumsikan adanya hubungan linear. Kerugiannya secara teknik adalah data yang diperlukan sangat banyak untuk setiap kategori, dan rata- rata bangkitan pergerakan untuk setiap kategori secara statistik harus dapat diterima. Masalah lain adalah tidak terdapatnya uji statistik untuk menguji keabsahan model. Prosedur dapat disederhanakan dengan menggunakan 2 peubah saja. Contohnya, pemilikan kendaraan atau pendapatan dapat dihilangkan karena kedua peubah itu sebenarnya mungkin berkorelasi.
4.3.1.6 Komentar tentang pendekatan analisis kategori
4.3.2 Perbaikan model dasar
4.3.2.1 Analisis klasifikasi ganda (Multiple Classification Analysis/MCA)
MCA adalah metode yang dapat digunakan untuk menguji pengelompokkan hasil klasifikasi silang menjadi prosedur statistik yang baik untuk memilih peubah dan klasifikasi. Metode ini dapat mengatasi kelemahan yang ada pada metode terdahulu. Para pembaca yang tertarik untuk membahasnya secara lebih rinci dapat membaca Stopher and McDonald (1983). Rangkumannya diberikan berikut ini.
Pertimbangkan model yang mempunyai satu peubah tidak bebas yang menerus dan dua peubah bebas yang diskret, misalnya ukuran rumah tangga dan pemilikan kendaraan. Nilai rata-rata total bisa didapat untuk peubah tidak bebas dari sampel rumah tangga. Juga, rata-rata kelompok bisa ditaksir untuk setiap baris dan kolom dari matriks klasifikasi silang yang dapat dianggap sebagai simpangan dari rata-rata
total. Dengan melihat tanda simpangan (+ atau − ), nilai sel dapat ditaksir dengan menambahkan simpangan baris dan kolom pada rata-rata total sesuai dengan selnya. Dalam hal ini, beberapa permasalahan yang timbul akibat terbatasnya data dapat dipecahkan.
Contoh 4.5 Tabel 4.21 memperlihatkan data yang dikumpulkan dalam suatu daerah kajian yang dikelompokkan menjadi 3 tingkat pemilikan kendaraan dan 4 tingkat ukuran rumah tangga.
Tabel 4.21 Jumlah rumah tangga per sel dan rata-rata tingkat pergerakan
Ukuran rumah Rata-rata tingkat tangga
2 atau 3 orang
Rata-rata tingkat pergerakan
Model bangkitan pergerakan 149
Tabel 4.21 juga memperlihatkan jumlah rumah tangga pada setiap sel (kategori) dan rata-rata jumlah pergerakan yang dihitung untuk setiap baris, sel, dan juga rata-rata totalnya. Terlihat bahwa nilainya berkisar dari 0 (sangat sulit mendapatkan rumah tangga yang terdiri dari 1 orang dan mempunyai mobil lebih dari 2) sampai dengan 269. Walaupun, klasifikasi silang hanya dilakukan dengan hanya dua peubah saja, sudah terdapat sekitar 4 sel yang mempunyai nilai dibawah 50 pengamatan yang disyaratkan sebagai jumlah minimum pengamatan untuk mendapatkan rata-rata dan variansi yang bisa dipertanggungjawabkan.
Kemudian, kita menggunakan rata-rata nilai baris dan kolom untuk menaksir rata- rata tingkat bangkitan pergerakan dari setiap sel, termasuk sel yang tidak mempunyai pengamatan pada sampel ini. Kita dapat menghitung simpangan (dari
rata-rata total) untuk yang tidak memilik kendaraan (0 mobil) sebesar 0,73 − 1,54 =
− 0,81; untuk 1 mobil sebesar 1,53 − 1,54 = − 0,01; dan untuk 2+ kendaraan sebesar 2,44 − 1,54 = 0,90. Juga dapat dihitung simpangan untuk setiap tingkat ukuran rumah tangga, yaitu sebesar: − 51,07; − 0,26; 0,32 dan 0,36.
Jika peubah tidak mempunyai korelasi dengan semua nilai tersebut, kita menghitung semua tingkat bangkitan pergerakan; misalnya: tingkat bangkitan pergerakan untuk
rumah tangga (1 orang) dan mempunyai 1 mobil adalah 1,54 − 1,07 − 0,01 = 0,46
pergerakan. Untuk rumah tangga (1 orang) dan tidak mempunyai mobil, tingkat pergerakannya adalah 1,54 − 1,06 − 0,82 = − 0,34 (nilai negatif). Nilai negatif tidak mempunyai arti apa-apa sehingga tingkat pergerakannya dapat dibuat menjadi nol.
Tabel 4.22 memperlihatkan semua tingkat pergerakan beserta simpangannya. Tabel 4.22 Tingkat pergerakan yang dihasilkan oleh MCA
Tingkat pemilikan kendaraan Ukuran rumah tangga
0 mobil
1 mobil
2+ mobil Simpangan
1 orang
− 1.07 2 atau 3 orang
Selain keuntungan statistik, perlu diperhatikan bahwa nilai sel tidak lagi didasarkan pada hanya ukuran sampel data saja, tetapi juga pada rata-rata total yang didapatkan dari semua set data, dan dua atau lebih rata-rata kelas yang didapatkan dari semua data untuk setiap kelas yang relevan dengan nilai selnya.
Gabungan antara anali- sis klasifikasi silang dengan analisis regresi dapat merupakan pendekatan yang terbaik untuk kasus tertentu. Contohnya, pada suatu daerah yang mempunyai sebaran pendapatan yang tidak seragam perlu dikaji adanya perbedaan pengaruh kebijakan pada kelompok pendapatan yang berbeda. Oleh karena itu, dirasakan perlu memodel kebutuhan akan transportasi untuk setiap kelompok pendapatan secara terpisah.
4.3.2.2 Analisis regresi untuk tingkat rumah tangga
150 Ofyar Z Tamin, Perencanaan dan pemodelan transportasi
4.3.3 Pendekatan kategori-orang
Pendekatan kategori-orang merupakan salah satu alter- natif yang menarik untuk model berbasis rumah tangga, yang diusulkan pertama kali oleh Supernak (1979). Metode ini mempunyai beberapa keuntungan:
4.3.3.1 Pendahuluan
1 model bangkitan pergerakan berbasis individu cocok dengan komponen lainnya dalam sistem pemodelan kebutuhan transportasi klasik yang berbasiskan individu, bukan rumah tangga;
2 memungkinkan proses klasifikasi silang yang menggunakan semua peubah penting yang menghasilkan jumlah kelas yang sesuai sehingga dapat diramalkan dengan mudah;
3 ukuran sampel yang dibutuhkan untuk model berbasis individu jauh lebih kecil daripada untuk model berbasis rumah tangga;
4 perubahan status demografi dapat dengan mudah diperkirakan pada model berbasis individu, misalnya peubah umur sangat sulit ditentukan pada model berbasis rumah tangga;
5 model berbasis individu lebih mudah diramalkan dibandingkan dengan model berbasis rumah tangga karena membutuhkan informasi rumah tangga serta ukuran rumah tangga − keduanya tidak digunakan pada model berbasis individu.
Batasan utamanya adalah model berbasis individu berkaitan dengan alasan pemilihan model berbasis rumah tangga, bukan dengan yang berbasis zona. Hal ini akan sulit jika diperlukan melihat adanya efek interaksi antarrumah tangga, keuangan dalam model berbasis individu.
Tentukan t j adalah tingkat bangkitan pergerakan, yaitu jumlah pergerakan yang dilakukan selama periode waktu tertentu oleh rata-rata jumlah orang berkategori j; t jp adalah tingkat bangkitan pergerakan dengan tujuan p. T i adalah total pergerakan yang dilakukan oleh penduduk di zona i (semua kategori). N i adalah jumlah penduduk di zona i dan α ji adalah persentase penduduk di zona i yang mempunyai kategori j. Oleh karena itu, hubungan dasar yang terjadi adalah:
4.3.3.2 Definisi peubah dan spesifikasi model
T i = N i ∑ α ji t jp
Seperti dengan model lain, pergerakan dibagi menjadi pergerakan berbasis rumah dan berbasis bukan rumah, serta juga dapat dibagi berdasarkan tujuan (p) yang digunakan untuk kedua jenis pergerakan tersebut.