Data referensi. Merupakan rujukan format data, mutlak Data pokok. Merupakan entitas utama pendidikan yang Perancangan Infrastruktur

96 ROADMAP PENGEMBANGAN SISTEM DAPODIKMEN TAHUN 2014 - 2019 90 pusat ini. Pada kenyataannya, penyatuan seluruh basisdata tersebut tidaklah mungkin, mengingat: 1. Volume data pendidikan sangatlah besar. 2. Setiap aplikasi merupakan perwujudan dari kebutuhan informasi yang spesifik purpose-driven. Aplikasi akan selalu berubah, karena kebutuhan informasi selalu berkembang. 3. Perubahan struktur data bagi aplikasi merupakan perubahan besar major, penyatuan semua data hanya akan memperluas dampak perubahan struktur data. Oleh karena itu, perlu pendekatan yang realistis untuk menerapkan prinsip Single Source Of Data, yaitu dengan melakukan: 1. Membagi area data menjadi lapisan-lapisan diantaranya :

a. Data referensi. Merupakan rujukan format data, mutlak

harus ditentukan dari satu titik saja.

b. Data pokok. Merupakan entitas utama pendidikan yang

menerima intervensi pembangunan, sehingga entitas ini merupakan unit sasaran manajemen terkecil. Data pokok dapat berasal dari banyak titik misalnya sekolah, tetapi dikumpulkan dalam satu tempat, dan semua proses yang mempengaruhi perubahan data pokok serta status keberadaannya dilakukan di tempat tersebut.

c. Data Transaksional. Data transaksional meliputi catatan

segala aktivitas yang terkait dengan entitas utama pendidikan; baik entitas utama tersebut sebagai subjek maupun objek. 2. Menetapkan lapisan data referensi dan lapisan data pokok untuk menerapkan prinsip Single Source Of Data secara ideal, yaitu diletakkan dalam satu basisdata terpusat. 3. Mengharuskan lapisan data transaksional agar mengacu pada lapisan data referensi dan lapisan data pokok. Data transaksional cukup disimpan di dalam basisdata lokal sistem transaksional 97 91 masing-masing. Apabila ada hasil transaksi yang penting untuk menjadi input bagi aplikasi-aplikasi lainnya, hasil transaksi tersebut sebaiknya disalin dalam basisdata terpusat tersebut. Dengan demikian, jelaslah bahwa basisdata terpusat untuk data pendidikan adalah Data Pokok Pendidikan, yang didalamnya terdapat dua lapis data, yaitu: 1. Data referensi 2. Data pokok

4.1.5. Dapodik Sebagai Backbone Integrasi Vertikal

Pada konsep “Single Source Of Data”, semua kebutuhan dan pemanfaatan data akan dilakukan atau dilayani oleh basisdata pusat. Dalam hal ini basisdata pusat tersebut adalah basisdata Dapodik. Dapodik sebagai basisdata pusat merupkan backbone dari integrasi. Sistem-sistem yang berada di dalam lingkungan Kemdikbud mengacu pada basisdata Dapodik sebagai backbone integrasi. Skema hubungan antara sistem-sistem yang berada di lingkungan Kemdikbud dengan basisdata Dapodik. Komunikasi antara basisdata Dapodik dengan basisdata yang berada pada sistem-sistem di lingkungan Kemdikbud sistem 1 sampai sistem n bersifat dua arah. Sistem-sistem di lingkungan Kemdikbud tersebut secara berkala melakukan sinkronisasi dengan basisdata Dapodik sehingga data yang ada di dalam sistem adalah data yang sudah terbaharui dan data yang berada di dalam Dapodik adalah data yang lengkap. 98 ROADMAP PENGEMBANGAN SISTEM DAPODIKMEN TAHUN 2014 - 2019 92 Gambar 33Hubungan Antara Data Dapodik dengan Sistem-Sistem diLingkungan Kemdikbud.

4.1.6. Integrasi Antar Jenjang Pendidikan Horizontal

Sebelum basisdata Dapodik ada, data antar jenjang pendidikan terpisah, misal: data seorang siswa A ketika di SD terpisah dengan ketika siswa tersebut di SMP. Sehingga tidak terlihat adanya keterkaitan antar jenjang pendidikan. Padahal kenyataannya jenjang pendidikan yang lebih rendah menjadi prasyarat untuk jenjang pendidikan di atasnya. Misal, jenjang pendidikan SD menjadi prasyarat untuk menempuh jenjang pendidikan SMP, jenjang pendidikan SMP menjadi prasyarat untuk menempuh jenjang pendidikan SMA, dan seterusnya. Agar hal tersebut tidak terjadi maka basisdata Dapodik harus bisa berperan sebagai sarana integrasi antar jenjang pendidikan. Untuk itu di dalam struktur basisdata Dapodik data seorang siswa hanya 99 93 disimpan sebagai satu data. Jika seorang siswa tersebut mengalami perubahan jenjang maka datanya akan dirubah melalui sistem transaksi. Di dalam Dapodik, seorang siswa hanya akan memiliki satu identifier ID. Identifier ini tidak akan berubah walaupun siswa tersebut pindah sekolah, naik jenjang ataupun yang lainnya. Dengan demikian histori dari seorang siswa akan selalu terekam walaupun sudah terjadi perubahan sekolah ataupun perubahan jenjang pendidikan. 1: bila ada penambahan data -- simple append, tidak ETL tambahan atribut 3: struktur basisdata harus bisa dipakai untuk mengevaluasi kelengkapan data, meski terbatas 4: struktur terbuka untuk melakukan validasi dengan partisipasi luas

4.1.7. Desain Terdistribusi

Seperti yang telah dijelaskan sebelumnya, Kemdikbud tidaklah mungkin dengan teknologi yang ada saat ini memusatkan basisdata pendidikan, dimana semua data tentang pelaku, penerima dan proses pendidikan ada di dalam basisdata tersebut. Selalu ada keterbatasan; mulai dari keterbatasan teknis, misalnya kapasitas penyimpanan, sampai pada keterbatasan kemampuan unit organisasi dalam menggalang, memvalidasi, memverifikasi dan memelihara data. Karena itu perlu ada pembagian atau partisi basisdata, agar didapatkan kinerja aplikasi yang tinggi. Dengan teknologi basisdata yang modern, upaya untuk menjaga integritas data dalam satu basisdata adalah mudah. Akan tetapi, 100 ROADMAP PENGEMBANGAN SISTEM DAPODIKMEN TAHUN 2014 - 2019 94 Gambar 34 Prinsip “single source of data” diterapkan secara logis untuk merangkai kelima repository yang ada di unit utama dan PDSP. Basisdata terdistribusi adalah basisdata yang secara logical adalah satu namun secara fisik tersimpan dalam piranti yang terpisah-pisah. Beberapa alasan dipilihnya desain terdistribusi dalam basisdata ini adalah sebagai berikut: 94 pengumpulan data telah dinyatakan Inmen nomor 2 tahun 2011 sebagai tanggungjawab unit utama. Artinya, basisdatanya tidak satu lagi.Padahal, prinsip “single source of data” mutlak diperlukan untuk mendasari platform pemanfaatan data secara bersama shareable. Oleh karena itu, prinsip “Single Source Of Data” ditarik ke atas menjadi “Level Logis”, bukan “Level Fisik” lagi. Kelima repository di keempat unit utama dan data warehouse di PDSP harus dapat dilihat sebagai satu “Single Source Of Data”. Gambar 34 menunjukkan skema penyelenggaraan basisdata terdistribusi untuk secara bersama-sama mengimplementasikan prinsip “Single Source Of Data” secara logis. Prinsip “ ” diterapkan secara logis untuk merangkai s, 94 Prinsip “ ” diterapkan secara logis untuk merangkai Secara fisik ada repositori terpisah terdistribusi Secara logis, semuanya konsisten dan sinkron membentuk satu basisdata. 101 95 1 Performanya tinggi: pemrosesan query lebih cepat. 2 Kehandalan: karena data disimpan diberbagai piranti atau node, jika satu node mengalami crash maka tidak menyebabkan node yang lain tidak bisa diakses. 3 Ekspansi mudah: dapat disesuaikan dengan mudah sesuai dengan berkembangnya ukuran basisdata.

4.1.8. Sinkronisasi Sebagai Metode Distribusi

Instruksi Menteri Pendidikan Nasional Nomor 2 Tahun 2011 telah memerintahkan masing-masing sekretariat direktorat jenderal untuk melaksanakan pendataan. Hal ini tidak lain karena direktorat jenderal mempunyai legitimasi yang sangat baik untuk meminta data yang benar ke satuan pendidikan-satuan pendidikan di bawah binaannya. Masing-masing ditjen mempunyai basisdata pendataannya sendiri. Untuk memenuhi presyaratan kondisi “Single Source” tersebut, mutlak diperlukan adanya satu mekanisme sinkronisasi. Gambar 35 menunjukkan basisdata tunggal yang “berevolusi” menjadi lima basisdata, tetapi secara logis harus dapat dianggap sebagai satu basisdata. Sinkronisasi dilakukan dalam skema terpusat dengan PDSP sebagai pusatnya. Tanpa menentukan pusat, sangatlah tidak efisien apabila direktorat jenderal melakukan sinkronisasi secara bilateral, karena akan butuh 6 kanal sinkronisasi antar Direktorat Jenderal. 102 ROADMAP PENGEMBANGAN SISTEM DAPODIKMEN TAHUN 2014 - 2019 96 Gambar 35 Evolusi dari basisdata ideal, menjadi 5 basisdata yang tersinkronisasi melalui basisdata PDSP.

4.1.9. Kodifikasi pada Primary Key

Nilai dari primary key pada basisdata Dapodik dibuat sesuai dengan aturan kodifikasi. Dimana kodifikasi primary key tersebut dibuat berdasarkan tingkat ketergantugan data dan laju perubahan data. Berdasarkan tingkat ketergantungan data dengan data lain serta laju perubahan data, data dibagi menjadi 4 kuadran. 1 Kuadran I: Data yang independen dan jarang berubah. Contoh: Agama, Jenjang Pendidikan, Jenis Kelamin. 2 Kuadran II: Data yang dependen dan jarang berubah. Contoh: Mata Pelajaran, Jenis Sarana, Kemampuan Ekonomi. 3 Kuadran III: Data yang independen dan laju perubahannya cepat. Contoh: Program Studi. 4 Kuadran IV: Data yang dependen dan laju perubahannya cepat. Contoh: Peserta Didik, PTK. 103 97 Untuk data yang jarang berubah, data yang berada pada kuadran I dan II, pembuatan primary key dengan menggunakan aturan sebagai berikut: 1 Kode sependek mungkin tetapi masih dapat menampung penambahan di kemudian hari. 2 Meaningful, agar memudahkan verifikasi semua perangkat lunak yang dibangun dengan mengacu data referensi. 3 Tertib urutan, agar memudahkan pencetakan atau pelaporan. Contoh: primary key untuk Agama adalah berupa angka. “1” untuk agama Islam, ”2” untuk agama Kristen, ”3” untuk agama Katolik, dan seterusnya. Untuk data yang laju perubahannya cepat, data yang berada pada kuadran III dan IV, pembuatan primary key dengan menggunakan aturan sebagai berikut: 1 Kode meaningless. 2 Verifikasi duplikasi menggunakan atribut-atribut selain kode. Jenis primary key yang sesuai adalah dengan menggunakan GUID Globally Unique Identifier. GUID adalah sebuah susunan angka yang bersifat pseudo-random acak-semu yang bisa digunakan untuk primary key. GUID biasanya ditulis dalam bilangan heksadesimal dengan panjang hingga 128 bit 16-byte. Sehingga jumlah maksimum dari GUID yang dapat dibuat adalah 2 128 . Jumlah tersebut cukup banyak untuk dijadikan sebagai primary key. Contoh: primary key dari 104 ROADMAP PENGEMBANGAN SISTEM DAPODIKMEN TAHUN 2014 - 2019 98 peserta didik adalah “ID peserta didik” dengan tipe data GUID, maka contoh nilainya “3F2504E0-4F89-11D3-9A0C-0305E82C3301”.

4.1.10. Topologi Relasional

Topologi basisdata yang digunakan dalam struktur basisdata Dapodik adalah topologi relasional. Topologi relasional ini menyimpan informasi mengenai data dan relasinya dalam tabel-tabel dua dimensi. Beberapa alasan penggunaan topologi relasional pada struktur basisdata Dapodik adalah: 1 Menghindari adanya redundansi karena struktur data sudah dinormalisasi sebelumnya. 2 Bisa mengeksekusi query yang sangat kompleks. Dengan basisdata relasional query yang melibatkan banyak tabel dapat dibuat dan dijalankan dengan mudah. 3 Tingkat kemanan meningkat. Dengan topologi relasional, data dapat disimpan ke dalam tabel yang terpisah. Tabel tertentu bisa diakses dan tabel tertentu tidak bisa diakses. Contoh: tabel “PTK” dengan tabel “Tunjangan” dipisah. Tabel “Tunjangan” tidak bisa diakses oleh sembarang orang. 4 Memudahkan untuk melakukan manipulasi data, karena data disimpan di dalam tabel yang terpisah-pisah. 5 Hubungan antar data mudah untuk dipahami. Contoh hubungan relasional pada Dapodik ditunjukkan pada Gambar 36. Pada gambar tersebut tampak bahwa entitas PTK mempunyai relasi dengan Satuan Pendidikan dan Proses Belajar Mengajar. Entitas Satuan Pendidikan berelasi dengan PTK, Substansi Pembelajaran, dan Rombel. 105 99 Gambar 36Hubungan relasional Data Pokok Pendidikan.

4.1.11. Strong Reference

Hubungan antara data pokok dan data transaksi dengan data referensi di dalam struktur basisdata Dapodik bersifat kuat strong. Tujuannya adalah untuk meningkatkan konsistensi data dan kevalidan data. Cara untuk membuat hubungan yang kuat tersebut adalah dengan melakukan standarisasi atribut dengan data referensi. Dengan kata lain, atribut-atribut pada suatu entitas yang nilainya bersifat konsisten dibuat melalui relasi entitas dengan data referensi dari pada berdiri sendiri sebagai atribut baru. Sebagai contoh, Agama merupakan atribut dari Peserta Didik. Namun informasi dari Agama ini bersifat konsisten Islam, Kristen, Katolik, Hindu, Budha, dan Konghucu. Oleh karena itu Agama tidak dijadikan sebagai atribut dari Peserta Didik melainkan dijadikan sebagai data referensi yang direlasikan dengan entitas Peserta Didik. Dengan demikian isi dari informasi Agama harus berada pada data referensi Agama. Struktur dari basisdata Dapodik yang bersifat strong reference ditunjukkan pada Gambar 37. 106 ROADMAP PENGEMBANGAN SISTEM DAPODIKMEN TAHUN 2014 - 2019 100 Gambar 37Contoh Struktur Basisdata Dapodik yang Bersifat Strong Reference. 100 Gambar 37Contoh Struktur Basisdata Dapodik yang Bersifat Strong Reference.

4.1.12. Skala Nasional

Salah satu tujuan dibuatnya sistem basisdata Dapodik adalah terkumpulnya data pokok pendidikan dalam skala nasional dan lengkap sesuai dengan entitasnya. Selain itu, data Dapodik ini juga bisa dimanfaatkan oleh seluruh organisasi di lingkunagn Kemdikbud dalam skala nasional. Oleh karena itu, struktur dalam basisdata Dapodik dibuat supaya memenuhi berbagai kriteria berikut: 1 Scalable Struktur basisdata dari Dapodik harus bisa menampung data yang laju pertumbuhannya besar karena data Dapodik ini menampung 107 101 data skala nasional. Mengenai kisaran laju pertumbuhan ukuran data Dapodik sudah dijelaskan pada bab sebelumnya. 2 Simetris Struktur basisdata yang berada di kementerian sama dengan struktur basisdata yang ada di satuan pendidikan-satuan pendidikan. Hal ini bertujuan untuk mempermudah proses sinkronisasi data antara data yang ada di satuan pendidikan dengan data di Kemdikbud. 3 Object approach Primary key merupakan object id suatu entitas. Oleh karena itu sedapat mungkin suatu entitas menggunakan single primary key dari pada composite primary key. Hal ini akan memudahkan pengembang dalam mengembangkan suatu aplikasi. Selain itu untuk mengefisiensikan penyimpanan data, relasi dependen antar atribut diminimalkan.

4.1.13. Longitudinal

Struktur basisdata Dapodik dibuat untuk dapat menyimpan data longitudinal. Data longitudinal adalah data yang mempunyai banyak nilai karena berjalannya waktu. Data ini bersifat dinamis namun data yang lampau tidak hilang. Adapun tujuan penyimpanan data dalam bentuk longitudinal adalah data dapat digunakan untuk menelusuri riwayat objek yang diamati. Selain itu, data longitudinal juga bisa digunakan untuk membaca trend yang terjadi pada suatu objek. Pada skema yang ada pada Gambar 38 selain terdapat Entitas Prasarana juga terdapat Entitas Prasarana Longitudinal. Entitas Prasarana Longitudinal tersebut berelasi dependen terhadap entitas Tahun Ajaran. Pada kenyataanya tingkat kerusakan suatu prasarana pada suatu sekolah untuk tahun ajaran yang berbeda terus berubah. 108 ROADMAP PENGEMBANGAN SISTEM DAPODIKMEN TAHUN 2014 - 2019 102 Gambar 38Contoh struktur basisdata Dapodik untuk menyimpan data longitudinal. 102 Dalam desain tersebut, tingkat kerusakan suatu prasarana disimpan dalam entitas Prasarana Longitudinal. Dimana data kerusakan prasarana ditambahkan ke dalam entitas Prasarana Longitudinal tanpa menghapus data kerusakan prasarana pada tahun ajaran sebelumnya. Data ini akan terus bertambah seiring dengan bertambahnya tahun ajaran. Dengan mekanisme penyimpan tersebut maka organisasi dapat melihat trend kerusakan prasarana suatu sekolah dari tahun ke tahun. 102 109 103

4.1.14. Rujukan Persisten

Data yang berada pada basisdata Dapodik adalah data referensi dan data pokok. Data referensi dijadikan sebagai acuan data pokok dan data pokok dijadikan sebagai acuan data transaksi. Data referensi ini sangat jarang sekali berubah namun bukan berarti data referensi tidak pernah berubah. Jika suatu saat terjadi perubahan data referensi misal data referensi sudah tidak berlaku maka data referensi tidak boleh dihapus. Data referensi yang sudah tidak dipakai di-expired-kan soft delete. Oleh karena itu dibuatlah skema expiration control seperti yang ditunjukkan pada Gambar 39. Adapun tujuan diberlakukannya soft delete terhadap data referensi adalah untuk menyimpan histori dari data referensi serta menjaga integritas dari data-data pokok yang mengacu pada data referensi tersebut. Misal: data referensi yang ada pada tabel Sumber Dana awalnya berisi “Biro PKLN”, “Pustekkom”, “Puskurbuk”. Karena adanya peraturan baru maka “Puskurbuk” harus dihapus karena tidak bisa menjadi sumber dana. Jika secara fisik data “Puskurbuk” dihapus maka data-data pokok yang merefer ke “Puskurbuk” akan berubah dan akibatnya data pokok tersebut tidak valid. Oleh karena itulah, diperlakukan soft delete pada data referensi yang artinya ketika data referensi dihapus maka data tersebut secara logika akan terhapus menggunakan expiration control namun secara fisik data tersebut masih tersimpan di dalam basisdata. Transaksi lama yang mengacu pada Puskurbuk masih bisa menampilkan field sumber dananya secara benar otentik, sesuai dengan datanya dulu saat dimasukkan, tidak mengalami mutasi. 110 ROADMAP PENGEMBANGAN SISTEM DAPODIKMEN TAHUN 2014 - 2019 104 104 Gambar 39Penggunaan Expiration Control pada Data Referensi.

4.2. Perancangan Infrastruktur

Data yang akan ditampung oleh sistem Dapodikmen berjumlah sangat besar mengingat data yang disimpan tidak pernah dihapus selama bertahun-tahun longitudinal. Dengan berjalannya waktu, tentu data ini akan semakin membesar dan memerlukan penanganan yang hati- hati. Salah satu masalah yang sering muncul ketika berhadapan dengan data besar adalah lamanya proses query data untuk menampilkan rekapitulasi. Oleh karena itu perlu didukungan rancangan 111 05 infrastruktur yang tepat untuk mengatasi ini. Perangkat yang digunakan harus mampu mengatasi data besar. Selain masalah data besar, sistem Dapodikmen akan berhadapan dengan banyaknya user yang akan mengakses data, banyaknya orang yang akan berusaha membongkar keamanan sistem, banyaknya layanan yang harus diberikan ketika terjadi kegagalan sistem. Untuk menjawab permasalahan tersebut, dirancanglah model infrastruktur yang akan dikembangkan di sistem Dapodikmen. Terdapat tiga blok infrastruktur yaitu Server Farm Switch, EnterpriseEdge, dan DRC. Model infrastruktur tersebut dapat dilihat pada gambar di bawah ini. Blok Server Farm Switchberfungsi sebagai jembatan server dengan perangkat jaringan utama. Dimana server farm switch menerima beban data dari semua server yang terdapat di dalam data center, menerapkan aturan dan kebijakan routing, kemudian meneruskannya ke perangkat yang dituju. Dengan adanya server farm, beban yang ada pada core switch akan berkurang. Sebagai server farm switch, diperlukan switch yang memiliki kemampuan routing.

BAB IV T AHAP

AN PENGEMBANG AN SISTEM D APODIKMEN 112 RO ADMAP PENGEMBANG AN SISTEM D APODIKMEN T AHUN 2014 - 2019 ROADMAP PENGEMBANGAN SISTEM DAPODIKMEN TAHUN 2014-2019 HALAMAN : | 105 Gambar 40 Topologi Pengembangan sistem Dapodikmen