Metode penaksiran kemiripan-maksimum (KM)
8.11 Metode penaksiran kemiripan-maksimum (KM)
8.11.1 Pendahuluan
Sudah lama diketahui bahwa peluang untuk menghasilkan keluaran tertentu dalam suatu percobaan adalah ukuran rasional mengenai kepercayaan, yang dinyatakan sebelum melakukan percobaan, bahwa keluaran tertentu akan terjadi. Ini juga merupakan ukuran rasional mengenai kepercayaan yang dinyatakan sesudah percobaan, bagi seseorang yang tidak memperhatikan keluaran yang terjadi. Secara khusus, ini bukan merupakan ukuran rasional mengenai kejutan bahwa keluaran tertentu telah terjadi karena kejutan juga tergantung pada peluang dari keluaran lain yang mungkin telah terjadi.
Konsep klasik ‘peluang’ memungkinkan kita mengembangkan suatu kegiatan menjadi realisasi ketidakpastian; terlihat bahwa dari kejadian yang paling acak sekalipun, misalnya percobaan pelemparan uang logam atau dadu, tampak ada keteraturan tertentu. Semakin besar keteraturan atau pola urutan kejadian tersebut, semakin penting pula adanya penjelasan dalam bentuk hukum. Perlunya ukuran mengenai kepercayaan telah dikenal sejak pertengahan abad ke-18 yang telah mendorong Laplace mengembangkan teori mengenai peluang-inversi: peluang hipotesis tertentu dapat dikurangi dari besarnya frekuensi terjadinya kejadian.
Edwards (1972) menerangkan dalam bukunya bahwa kesalahan yang dilakukan oleh Laplace dan peneliti sebelumnya adalah menganggap hipotesis dapat dianggap
Model transportasi berdasarkan data arus lalulintas
.... konsep peluang matematis tidaklah cukup untuk menyatakan keyakinan atau ketidakyakinan dalam melakukan inferensi, dan kuantitas matematis yang cocok untuk menyatakan preferensi di antara populasi jawaban yang mungkin tidak pula mengabaikan hukum peluang. Untuk membedakannya dari peluang, maka digunakan ‘kemiripan’ untuk menyatakan kuantitas tersebut ...
Untuk melihat apakah kemiripan dapat menghasilkan dasar yang baik untuk digunakan dalam suatu hipotesis, dirasakan perlu mendefinisikannya dan mempelajari perilakunya secara rinci sebagai berikut.
8.11.2 Definisi
Anggaplah kita mempunyai suatu model peluang, suatu set hipotesis statistik, dan suatu set data yang membentuk dasar inferensi statistik. Misalkan P(R
H) adalah peluang dihasilkannya R dengan hipotesis H serta tergantung pada model peluang yang digunakan. Peluang ini didefinisikan untuk setiap anggota keluaran yang mungkin terjadi bagi setiap hipotesis yang digunakan.
Peluang ini dapat dianggap sebagai fungsi dari R dan H, tetapi biasanya berupa fungsi dari R saja untuk H tertentu. Jadi, perilaku matematisnya sangat dikenal dan meliputi setiap hal yang mendasar mengenai peluang. Suatu aksioma dasar adalah
jika R 1 dan R 2 adalah dua buah keluaran yang mungkin terjadi, maka:
P ( R 1 atau R 2 H )( = P R 1 H )( + P R 2 H )
8.11.2.1 Kemiripan Kemiripan L(H R) suatu hipotesis H dengan data R serta model tertentu sebanding dengan peluang P(R
H) dan konstanta c. Dalam hal peluang, R adalah peubah dan H adalah konstanta, tetapi dalam hal kemiripan, H adalah peubah, sedangkan R adalah konstanta. Perbedaan ini sangat mendasar.
L () H R = c . P () R H (8.74)
Konstanta c memungkinkan kita menggunakan definisi kemiripan yang sama bagi setiap peubah diskret atau kontinu. Walaupun merupakan konstanta untuk setiap penerapan yang menggunakan hipotesis yang berbeda dengan data dan model peluang yang sama, tentu bukan merupakan konstanta yang selalu sama dalam penggunaan lain.
Nisbah kemiripan dari dua hipotesis pada bebe- rapa data merupakan nisbah kemiripan dari setiap data tersebut. Sering juga hal ini dinyatakan dalam bentuk fraksi atau L(H 1 ,H 2 R). Nisbah kemiripan dari dua hipotesis pada beberapa data yang tidak saling berhubungan bisa dikalikan bersama untuk membentuk nisbah kemiripan dari kombinasi data tersebut. Jadi, untuk dua
8.11.2.2 Nisbah kemiripan
data set R 1 dan R 2 :
L ( H 1 , H 2 R 1 & R 2 )( = L H 1 , H 2 R 1 )( . L H 1 , H 2 R 2 )
406 Ofyar Z Tamin, Perencanaan dan pemodelan transportasi
Kadang-kadang kemiripan lebih mudah diterangkan da- lam bentuk logaritma kemiripan atau nisbah kemiripan yang secara prinsip mengubah bentuk perkalian menjadi bentuk penjumlahan. Bentuk logaritma- kemiripan didefinisikan sebagai bentuk logaritma dari nisbah kemiripan. Dengan menggunakan bentuk logaritma, konstanta perkalian menjadi konstanta penjumlahan.
8.11.2.3 Dukungan
8.11.3 Aksioma kemiripan
8.11.3.1 Hukum kemiripan
Dalam kerangka model statistika, satu set data tertentu mendukung suatu hipotesis statistika dengan lebih baik daripada hipotesis lainnya jika kemiripan hipotesis pertama melebihi kemiripan hipotesis yang kedua.
Hukum ini menerangkan cara menafsirkan kemiripan. Meningkatnya nilai nisbah kemiripan menunjukkan meningkatnya dukungan bagi hipotesis pertama. Hukum ini sangat dibutuhkan agar kita dapat menafsirkan kemiripan dengan benar. Tetapi, kemiripan tidak bisa berdiri sendiri karena ada aspek lain yang mempengaruhi yang mungkin tidak tercakup oleh kemiripan.
8.11.3.2 Prinsip kemiripan
Dalam kerangka model statistika, semua informasi yang dimiliki data yang berkaitan dengan kedua hipotesis terkandung dalam nisbah kemiripan dari kedua hipotesis terhadap data tersebut.
Prinsip ini menyatakan bahwa fungsi kemiripan mengandung semua informasi yang dibutuhkan. Tetapi, sangat penting digarisbawahi bahwa prinsip ini bukanlah alasan untuk membuang semua data yang ada setelah kemiripan didapatkan. Dalam suatu kerangka model, akan kita pelajari hipotesis baru atau bisa saja model baru. Karena prinsip ini menyatakan hanya nisbah kemiripan yang penting, maka konsistensi tafsirnya menjadi tidak begitu penting.
Jika pengalaman menyebutkan bahwa kemiripan menyediakan penafsiran yang tidak konsisten, maka prinsip kemiripanlah yang harus dipertanyakan. Tidak alasan logis untuk memisahkan hukum dan prinsip tersebut. Mungkin ada baiknya kalau keduanya digabung menjadi satu aksioma baru seperti:
8.11.3.3 Aksioma kemiripan
Dalam kerangka model statistika, semua informasi yang dimiliki data yang berkaitan dengan kedua hipotesis terkandung dalam nisbah kemiripan dari kedua hipotesis terhadap data tersebut, dan nisbah kemiripan dapat ditafsirkan sebagai tingkat sejauh mana data mendukung satu hipotesis dibandingkan dengan hipotesis lain.
Model transportasi berdasarkan data arus lalulintas
8.11.4 Tafsiran kemiripan
Perbedaan antara ‘peluang’ dan ‘kemiripan’ harus benar-benar dipahami, khususnya yang menyangkut peranan masing-masing dalam hal inferensi-induktif. P(R H)
adalah peluang atau kepadatan peluang keluaran R dengan hipotesis H. Jika dianggap sebagai fungsi R, dapat dinyatakan sebagai sebaran statistik, baik dalam bentuk diskret maupun kontinu. Dalam hal tersebut, jika kita jumlahkan atau integrasikan semua keluaran R, kita dapatkan suatu satuan, sebagai hasil salah satu aksioma peluang.
Dengan kata lain, kemiripan diperkirakan didasari data R tertentu, dan untuk beberapa hipotesis bisa dianggap sebagai fungsi hipotesis atau fungsi parameter. Tetapi, fungsi ini bukan sebaran statistik dan tidak tersirat sedikit pun dalam definisinya bahwa jika kita jumlahkan seluruh hipotesis yang mungkin atau kita integrasikan semua nilai peubah yang mungkin, maka hasilnya tidak mempunyai arti yang menentukan.
Seperti telah diterangkan, kata dukungan digunakan untuk menggantikan bentuk logaritma kemiripan dan nisbah kemiripan. Dukungan untuk hipotesis pertama dibandingkan dengan hipotesis lainnya berkisar antara nol sampai dengan suatu angka yang tidak terhingga (skala negatif menyatakan kasus dukungan yang lebih mendukung hipotesis lain dibandingkan dengan hipotesis yang ada).
Dengan menyatakan dukungan dengan huruf D, nilai D = 2 menyatakan bahwa kemiripan pada hipotesis pertama adalah 7,4 kali kemiripan pada hipotesis lainnya, dan untuk D = 3, faktor tersebut sekitar 20; pada D = 5, sekitar 150. Sangatlah jelas, semakin besar nilai D, semakin besar pula kemiripan yang mendukung hipotesis tertentu dibandingkan dengan hipotesis lainnya.
Kadang-kadang terdapat sanggahan yang menyebutkan bahwa dukungan tidak mempunyai arti apa pun. Hal ini sangat beralasan karena pernyataan dukungan, meskipun didapatkan dari peluang, tidak berarti bahwa peluang hipotesis itu benar. Tetapi, terdapat tafsiran operasi sederhana tentang nisbah kemiripan antara dua hipotesis untuk data tertentu. Tentu saja, nisbah frekuensi dari dua hipotesis pada jangka waktu yang lama akan menghasilkan data hasil pengamatan.
8.11.5 Kemiripan sampel multinomial
Pada penerapan untuk data yang mempunyai frekuensi, misalnya data arus lalulintas untuk ruas jalan tertentu, sudah sangat pasti bahwa frekuensi kejadiannya lebih dari dua. Karena itu, untuk jenis pengamatan ini, sebaran yang sesuai adalah sebaran multinomial, bukan sebaran binomial.
Diasumsikan bahwa pengamatan mengikuti sebaran multinomial dan terdapat sejumlah s kelas pengamatan. Jika peluang suatu percobaan untuk masuk ke dalam
kelas ke-i adalah sebesar p i , maka peluang untuk mendapatkan a 1 dari sampel N pada ruas ke-1, a 2 pada ruas ke-2, dan secara umum, a i pada ruas ke-i, dapat dinyatakan sebagai:
408 Ofyar Z Tamin, Perencanaan dan pemodelan transportasi
1 p ... p s 2 s
a 1 !. a 2 !. a 3 !... a s !
p i dapat dinyatakan sebagai fungsi dari satu atau lebih parameter yang diberi lambang θ . Jadi, kemiripan θ dari sampel tertentu sebaran multinomial dapat dinyatakan sebagai:
L a 1 a 2 a () s θ =
k . [ p 1 () θ ] . [ p 2 () θ ] ... [ p s () θ ]
1 . p 2 ... p s digantikan oleh konstanta k.
a Di sini komponen a . p 1 2 a s
a 1 !. a 2 !. a 3 !... a s !
8.11.6 Kerangka metode penaksiran kemiripan-maksimum jenis I (KM1)
Pada bagian ini, rumus kemiripan-maksimum digunakan untuk menghasilkan metode penaksiran MAT dari data arus lalulintas. Anggaplah kita mempunyai hasil survei data arus lalulintas yang terdiri dari arus lalulintas sejumlah ˆ T V kendaraan
yang tercatat dalam L ruas jalan. Jika Vˆ l menyatakan arus lalulintas hasil pengamatan yang didapatkan pada setiap ruas jalan l, didapat:
Sekarang, asumsikan bahwa p l adalah peluang untuk mendapatkan data arus lalulintas untuk setiap ruas l. Dalam Tamin (1988abcd), peluang p l untuk setiap ruas jalan l dinyatakan sebagai:
Asumsikan bahwa peluang untuk mendapatkan arus lalulintas pengamatan untuk setiap ruas l tertentu pada suatu survei mengikuti pola sebaran multinomial. Karena itu, dengan mengikuti jenis sebaran seperti ini dan mengasumsikan bahwa terdapat L ruas yang diambil dan peluang untuk mendapatkan volume arus ruas ke-l adalah
p l , maka peluang untuk mendapatkan ˆ 1 V dari total jumlah ˆ T V di ruas pertama, V ˆ 2 pada ruas kedua, dan secara umum, Vˆ pada ruas ke-l adalah: l
V 1 !. V ˆ 2 !. V ˆ 3 !... V ˆ L l
Dengan memasukkan persamaan (8.80) ke persamaan (8.74), maka fungsi kemiripan untuk metode penaksiran kemiripan-maksimum jenis I (KM1) dapat
dinyatakan dalam bentuk persamaan (8.81) dengan komponen
V ˆ 1 !. V ˆ 2 !. V ˆ 3 !... V ˆ L
dinyatakan sebagai konstanta c:
Model transportasi berdasarkan data arus lalulintas
Akhirnya, kerangka kerja metode penaksiran KM1 berupa pemilihan hipotesis H yang memaksimumkan persamaan (8.81) dengan batasan tertentu, yang nantinya
menghasilkan sebaran V l yang paling sesuai dengan data hasil survei ( Vˆ ). Fungsi l
tujuan kerangka kerja ini adalah:
V memaksimumkan ˆ L l = c . ∏ p
dengan batasan total arus:
∑ V l − V ˆ T = 0 l (8.83)
Tujuan persamaan (8.83) adalah membatasi agar total arus ruas jalan hasil penaksiran sama dengan total hasil pengamatan survei. Dengan mengubah persamaan (8.82) menjadi bentuk logaritma dan dengan menggunakan metode pengali Lagrange, persamaan (8.82) dan (8.83) dapat ditulis menjadi bentuk persamaan tunggal:
memaksimumkan
∑ ˆ V l . log e p l + log e c − θ . ∑ V l − V ˆ T
Dengan memasukkan persamaan (8.79) ke persamaan (8.84), maka persamaan
(8.84) tersebut dapat ditulis sebagai persamaan (8.85) berikut.
memaksimum kan L 1 = V ˆ
l . log e
+ log e c − θ . ∑ V l + θ . V ˆ T
Dengan memasukkan persamaan (8.52) ke persamaan (8.85), akhirnya fungsi tujuan metode penaksiran KM1 dapat dinyatakan menjadi persamaan (8.86) dengan parameter yang tidak diketahui adalah b k , α k , β k , dan θ (untuk k = 1,...,K):
memaksimum kan L 1 =
∑ ˆ V l . log e ∑∑ T id . p id − θ . ∑∑ T id . p id
i d (8.86)
+ θ . V ˆ T − V ˆ T . log e V ˆ T + log e c
Tujuan parameter tambahan θ pada persamaan (8.86) adalah untuk menjamin agar persamaan pembatas (8.83) selalu dipenuhi. Untuk mendapatkan nilai parameter
model GO b k , α k , β k , dan parameter tambahan θ yang memaksimumkan persamaan (8.86), empat set persamaan (8.87) berikut dibutuhkan, yaitu untuk k = 1,...,K.
410 Ofyar Z Tamin, Perencanaan dan pemodelan transportasi
∂ T id
( T id . p id ) i d ∂ b k
∑∑ id
∂ T id
= f α k = ∑ V
∑∑ ( T id . p id ) i d ∂ α k i d
∂ T id
∑∑ ( T id . p id
i d ∂ β k
= f θ = − θ . ∑∑ T id . p id − V ˆ T = 0 untuk k = 1,...., K
Persamaan (8.87) sebenarnya sistem 3K+1 persamaan simultan dengan 3K+1 parameter tidak diketahui b k , α k , β k , dan θ yang perlu ditaksir. Semua parameter model GO serta parameter tambahan θ dapat dipecahkan dengan syarat L ≥ 3K+1. Sekali lagi, metode Newton − Raphson yang dikombinasikan dengan teknik eliminasi matriks Gauss − Jordan digunakan untuk memecahkan persamaan (8.87).
8.11.7 Kerangka metode penaksiran kemiripan-maksimum jenis II (KM2)
Data arus lalulintas biasanya dikumpulkan setiap hari sehingga mudah didapatkan (jika dibandingkan dengan data asal − tujuan). Karena itu, dapat diasumsikan bahwa nilai rata-ratanya biasanya selalu dapat diketahui atau paling kurang dapat diperkirakan dengan baik.
Pertimbangkan suatu kasus yang data arus lalulintasnya untuk setiap ruas jalan didapat dengan mengambil sampel yang berpola sebaran acak poisson dengan rata- rata φ l Vˆ yang tidak diketahui. Konstanta positif l φ l untuk l ∈ L dipakai sebagai
faktor sampel yang digunakan dalam pengamatan informasi lalulintas. Metode penaksiran yang dikembangkan memungkinkan digunakannya faktor
sampel φ l untuk setiap ruas l tertentu. Oleh karena itu, memungkinkan kita, baik secara langsung maupun pendekatan, menggunakan teknik pengambilan sampel yang berbeda. Hal ini bisa berupa teknik pengumpulan data yang berbeda, faktor sampel yang berbeda, atau waktu survei yang berbeda. Kasus yang paling sederhana dan yang paling sering terjadi, dalam masalah pengamatan arus lalulintas adalah
penggunaan nilai tunggal φ bagi setiap ruas l yang biasa disebut faktor sampel seragam.
Model transportasi berdasarkan data arus lalulintas
Asumsikan arus lalulintas pengamatan Vˆ merupakan sampel acak dari sebaran l poisson dengan rata-rata φ l Vˆ yang tidak diketahui. Oleh karena itu, dengan jenis l
hopitesis ini, peluang mendapatkan data V l untuk setiap ruas l tertentu dapat dinyatakan sebagai:
()( l
untuk l ∈ L (8.88)
Jadi, peluang mendapatkan sampel [V l ] untuk semua ruas jalan yang diambil datanya (l ∈ L) dapat dinyatakan sebagai:
[] l ∏
untuk l ∈ L (8.89)
Dengan memasukkan persamaan (8.89) ke persamaan (8.74), fungsi kemiripan dari metode penaksiran KM2 dapat dinyatakan sebagai:
Dengan mengambil bentuk logaritma dari L 2 dan menggunakan metode penaksiran kemiripan-maksimum KM1 seperti yang dijelaskan dalam subbab 8.11.6, dapat dirumuskan hal berikut ini:
( V l . log e . ( φ l . V l ) − φ l . V l − log e V
memaksimum kan
Persamaan (8.91) dapat ditulis kembali sebagai:
L 4 = ∑ ( V ˆ l . log e φ l + V ˆ l . log e V l − φ l . V l − log e V ˆ l ! ) (8.92)
memaksimum kan
Akhirnya, dengan mengabaikan komponen konstanta dalam persamaan (8.92), permasalahan kalibrasi menjadi:
( V l . log e V l − φ l . V l )
memaksimum kan
Dalam kasus pengamatan arus lalulintas, faktor sampel φ l dapat diasumsikan mempunyai nilai tunggal yang biasa disebut faktor sampel seragam bagi setiap ruas jalan l (l ∈ L). Asumsi yang terpenting dalam Tamin (1988abcd) adalah nilai φ l untuk setiap ruas jalan l selalu sama dengan satu, yang berarti semua data arus lalulintas (untuk l ∈ L) mempunyai faktor sampel sama dengan satu.
φ l = 1 untuk l ∈ L (8.94) Dengan memasukkan persamaan (8.94) ke persamaan (8.93), maka persamaan
(8.93) dapat dituliskan sebagai:
412 Ofyar Z Tamin, Perencanaan dan pemodelan transportasi
( l V log e V l − V l l )
(8.95) Dengan memasukkan persamaan (8.52) ke persamaan (8.95), akhirnya fungsi tujuan
memaksimum kan
untuk metode penaksiran KM2 dapat dinyatakan sebagai persamaan (8.96) dengan parameter yang tidak diketahui b k , α k , dan β k (untuk k = 1,...,K):
memaksimum kan L 7 =
∑ ˆ V l . log e ∑∑ T id . p id − ∑∑ T id . p id
i d i d Untuk mendapatkan satu set parameter b k , α k , dan β k dari model GO yang
memaksimumkan persamaan (8.96), tiga set persamaan (8.97) berikut dibutuhkan, yaitu untuk k = 1,...,K.
∂ T id
= fb k = ∑
b ∑∑
l i d ∂ b k ∑∑ ( T id . p id )
. p id .
∂ T id
= f α k = ∑ ∑∑
α k
. p id .
∑∑ ( T id p id )
= f β k = ∑ ∑∑
i d ∂ β k
p id .
∑∑ ( T id . p id )
i d Persamaan (8.97) adalah sistem 3K persamaan simultan dengan 3K parameter yang
tidak diketahui b k , α k , dan β k untuk ditaksir dengan syarat L ≥ 3K. Metode Newton − Raphson dengan teknik eliminasi matriks Gauss − Jordan digunakan untuk memecahkan persamaan (8.97).
Kegunaan metode KM1 dan KM2 tampak setelah kita melakukan beberapa pengabsahan. Kita dapat menyimpulkan bahwa suatu pendekatan, katakan KM1, akan lebih baik jika asumsi yang mendasarinya lebih cocok untuk kondisi tersebut dibandingkan dengan pendekatan lain (KM2).
Harus diketahui bahwa sebaran statistik dari data arus lalulintas yang ada belum tentu secara praktis merupakan sebaran multinomial atau poisson dengan berbagai alasan. Dalam hal tertentu, kita mengasumsikan bahwa setiap pengamatan adalah saling tidak terkait dan tidak selalu benar bahwa persyaratan hubungan kesinambungan arus akan selalu terpenuhi.