Variabel yang Digunakan dalam Analisis

1.2 Batasan Masalah

1. Database yang digunakan merupakan hasil Survei Dasar Pendidikan Nasional 2003, sedangkan data spasial merupakan koordinat kecamatan-kecamatan di kabupatenkota di provinsi Jawa Timur. 2. Unit analisis terkecil merupakan mutu pendidikan pada jenjang sekolah dasar SD di kecamatan-kecamatan pada kabupatenkota di provinsi Jawa Timur. 2. TINJAUAN LITERATUR DAN METODE 2.1 Proses Data Mining Tiga fase metodologi visualisasi data mining, terdiri dari, fase perencanaan projek, fase penyiapan data dan fase analisis data. Ketiga fase dirinci menjadi delapan langkah metodologi visualisasi data mining, meliputi: penilaian dan perencanaan projek, identifikasi permasalahan bisnis, pemilihan kumpulan data, transformasi kumpulan data, verifikasi kumpulan data, pemilihan alat visualisasi atau alat penambangan, analisis model visualisasi dan model penambangan, serta verifikasi dan presentasi visualisasi dan model penambangan Tom Soukup dan Davidson Ian, 2002, diperlihatkan gambar 2.1 Gambar 2.1 Delapan Langkah Metodologi Visualisasi Data Mining

2.2 Variabel yang Digunakan dalam Analisis

Variabel yang digunakan, yaitu variabel dasar dan variabel indikator. Variabel dasar adalah semua variabel yang terdapat didalam “raw data individual sekolah”. Sedangkan variabel indikator adalah variabel yang diperoleh berdasarkan variabel -variabel dasar Balitbang Depdiknas, 2003 . Variabel dasar dan variabel indikator yang digunakan dalam analisis berhubungan dengan; identitas sekolah, siswa, guru, saranaprasarana dan UAN. Dari variabel dan indikator di atas, kemudian dibangun model input output pendidikan. Dalam model input output pendidikan, input terdiri dari indikator siswa, proses terdiri indikator saranaprasarana dan indikator guru, sedangkan output terdiri dari indikator jumlah nilai UAN dan rata-rata tingkat kelulusan siswa. Seleksi indikator dilakukan menggunakan analisis faktor dan analisis Struktural Equation Model SEM. Model Spasial Autoregressive SAR Model spasial autoregressive secara umum dirumus kan LeSage, 1999 sebagai berikut: 1 2 ρ β λ = + + = + y W y X u u W u ε 2.1 y vektor 1 n × dari variabel dependen, X matriks variabel bebas n k × . W matriks bobot spasial n n × , berisi relasi contiguity atau fungsi jarak. Jika X = 0 dan 2 W = 0 untuk model spasial autoregressive, disebut model spasial autoregressive order pertama dinyatakan: ρ = + y Wy ε 2.2 Matriks W perlu dibakukan sehingga jumlah unsur setiap baris dari matriks satu dan vektor y unsurnya merupakan penyimpangan dari rata-ratanya. Untuk keperluan pengujian hipotesis perlu diasumsikan bahwa 2 , n N ε σ I  . Taksiran kuadrat terkecil ols ρ diberikan Anselin, 1988 LeSage, 1999: 1 ˆ ρ − = yWWy yWy 2.3 Model Ekspansi SAR E-SAR Model ekspansi SAR diperkenalkan Casetti 1972 dalam Anselin 1988 dan LeSage 1999 sebagai perluasan dari model SAR, dengan tujuan agar dapat digambarkan heterogenitas spasial. Heterogenitas dalam model ekspansi SAR digunakan untuk menggambarkan nilai-nilai parameter yang berbeda untuk setiap observasi spasial melalui jarak dari titik pusat ke lokasi-lokasi lain di sekitarnya, Jarak antara dua lokasi diukur dengan jarak Euclidean yang melibatkan koordinat lokasi, disingkat koordinat. Secara umum model ekspansi SAR dari Casetti dalam LeSage 1999 dirumuskan dengan pendekatan model regresi linier sebagai berikut: ε Xβ y + = ZJβ β = 2.4 dengan y vektor variabel dependen bersesuaian dengan observasi spasial ukuran nx1 X matriks ukuran nxnk berisi bentuk xs i sebagai vektor variabel independen kx1 β matriks parameter ukuran nkx1 berisi taksiran parameter untuk k variabel independen pada setiap observasi β vektor parameter ukuran 2x1 berisi 2k parameter yang akan ditaksir Z matriks informasi lokasi yang mempunyai elemen perluasan Z xi dan Z yi menyatakan koordinat latitude garis lintang dan longitude garis bujur untuk setiap lokasi i asumsi yang digunakan adalah , N ~ n iid I ε 2 σ . Model ekspansi SAR di atas menyatakan bahwa parameter x β dan y β .berubah-ubah, karena merupakan fungsi dari koordinat latitude dan longitude. Parameter model sebanyak 2k ditaksir dengan menggunakan metode kuadrat terkecil. Berdasarkan taksiran-taksiran parameter tersebut, taksiran- taksiran lainnya untuk titik-titik dalam ruang ditaksir menggunakan persamaan kedua dari 3.33. Proses ini merupakan proses ekspansi. Untuk menggambarkan proses ekspansi tersebut, substitusikan persamaan kedua pada 3.33 ke persamaan pertama: ε XZJβ y + = 2.5 Dari persamaan di atas tampak jelas bahwa matriks X, Z, dan J diperoleh sebagai data observasi dan hanya vektor β merupakan parameter yang perlu ditaksir. Alternatif lain dalam mengimplementasikan model ekspansi SAR didasarkan kepada vektor jarak. Jarak dari koordinat observasi misal kabkota dirumuskan sebagai : 2 2 yc yi xc xi i Z Z Z Z s d − + − = 2.6 di mana, yi xi Z , Z menyatakan koordinat observasi ke-i dalam posisi latitude dan longitude dari pusat lokasi misal ibukota provinsi yang diwakili oleh pusat pemerintahan serta yc xc Z , Z merupakan koordinat latitude dan longitude untuk observasi lokasi i dari data sampel. Pendekatan ini memberikan bobot spasial yang berbeda untuk observasi didasarkan pada jarak dari lokasi observasi ke pusat lokasi. Persamaan 3.33 dalam ekspansi jarak dapat dituliskan: ε Xβ y + = DJβ β = 2.7 dengan D=diagds 1 , ds 2 ,..., ds n , menyatakan jarak dari setiap lokasi observasi s i ke pusat lokasi dan β merupakan vektor parameter ukuran kx1 dari pusat lokasi dan J= I k ,I k , …,I k ’ matriks ukuran nxk. Anselin 1988 menyatakan bahwa Persamaan 3.36 dapat diimple-mentasikan pada MATLAB dengan fungsi casetti, secara matematis ditulis sebagai berikut: ε X X Xβ α y + β + β + + = y y x x Z Z 2.8 Dengan menggunakan matriks jarak D model pada Persamaan 2.8 dapat dinyatakan: ε XDβ Xβ α y + + + = 2.9 Pada model ekspansi SAR dengan melibatkan jarak, dapat dipilah pengaruh non spasial dan pengaruh spasial: ε XDβ Xβ α y + + + = − 3 2 1 3 2 1 spasial spasial non Taksiran parameter β dan β dapat digunakan untuk mendeskripsikan analisis pengaruh marjinal yang didekomposisikan ke dalam pengaruh non spasial dan pengaruh spasial. Untuk menggambarkan pengaruh variabel independen terhadap variabel dependen secara individu dapat digunakan grafik melalui persamaan berikut: i i di yi y i yi xi x i xi D Z Z β + β = δ β + β = δ β + β = δ 2.10 Persamaan 3.39 menunjukkan koefisien dari variabel individual, yang menggambarkan pengaruh total terhadap variabel dependen. δ x dan δ y di-plot untuk ekspansi x-y, dan δ d diplot untuk perluasan jarak. Grafik tersebut memberikan informasi pengaruh total pengaruh non spasial dan spasial variabel independen ke-i terhadap variabel dependen. Jika grafik tersebut menunjukkan kecenderungan turun, maka dapat diinterpretasikan semakin jauh dari koordinat pusat, semakin kecil pengaruh suatu variabel independen terhadap variabel dependen. Sebaliknya, Jika grafik tersebut menunjukkan kecenderungan naik, maka dapat diinterpretasikan semakin jauh dari koordinat pusat, semakin besar pengaruh suatu variabel independen terhadap variabel dependen.

3. HASIL DAN PEMBAHASAN