69 2.
Seleksi data Dari data yang ada dilakukan seleksi data karena tidak semua data
digunakan. Pada kasus ini SP2TP tidak digunakan dan diganti dengan kolom nama penyakit. Karena SP2TP juga bukan merupakan data yang
dirasa penting karena hanya berisi nomor urut dari nama penyakit yang digunakan untuk pelaporan. Untuk tahap selanjutnya setelah melakukan
tahap preprocessing kemudian melakukan tahap menggabungkan data dari berbagai sumber terpisah.
4.2.2. Menggabungkan Data dari Berbagai Sumber Terpisah
Seperti yang telah diilustrasikan pada bab 3, penggabungan data perlu dilakukan karena data yang ada tidak seluruhnya berbentuk file Excel.
4.2.3. Memindahkan Data ke Server Gudang Data
Sebelum membuat dimensi dan tabel fakta, maka terlebih dahulu membuat tabel master yang nantinya akan menjadi sumber untuk membuat
dimensi dalam gudang data. Tabel master yang dibuat meliputi ms_penyakit dan ms_kelompok_umur.
1. Master penyakit
Gambar 4. 1 Proses pembuatan tabel ms_penyakit di Oracle .ktr
Gambar 4.1 merupakan proses pembuatan tabel ms_penyakit di Oracle, dengan inputan berupa file excel. Sort rows berfungsi untuk
mengurutkan data, karena untuk menghilangkan redundancy data dengan menggunakan unique rows data harus diurutkan terlebih dahulu. Pada
id_penyakit menggunakan bantuan add sequence untuk membuat id penyakitnya mengingat data penyakit yang ada dalam jumlah besar. Select
values untuk mengkonversi data dari file ke dalam format database yang
diinginkan atau mengubah nama kolom atau menghapus kolom yang tidak digunakan. Table output digunakan untuk membuat tabel pada database.
Tabel 4. 4 ms_penyakit
Tabel 4.4 adalah hasil dari tabel ms_penyakit pada database, terdiri dari kolom id penyakit, SP2TP, ICD_X dan jenis penyakit.
2. Master kelompok umur
Gambar 4. 2 Proses pembuatan tabel ms_kelompok_umur di Oracle .ktr
Gambar 4.2
merupakan proses
pembuatan tabel
ms_kelompok_umur, untuk membuat tabel master ini menggunakan inputan berupa file excel. Select values untuk mengkonversi data dari file
ke dalam format database yang diinginkan atau mengubah nama kolom atau menghapus kolom yang tidak digunakan. Table output digunakan
untuk membuat tabel pada database.
Tabel 4. 5 ms_kelompok_umur
Tabel 4.5 adalah hasil dari tabel ms_kelompok_umur pada database,
terdiri dari kolom id kelompok umur dan nama kelompok umur.
4.2.4. Memecah Gudang Data dalam Tabel Fakta dan Tabel Dimensi
1. Tr penyakit
Gambar 4. 3 Proses pembuatan tr_penyakit di Oracle .ktr
Sumber data dari tr_penyakit berupa data penyakit tahun 2010 sampai 2012 .xls, sumber lainnya berasal dari tabel ms_penyakit dan
ms_kelompok_umur. Terdapat stream lookup pada ms kelompok umur yang digunakan untuk membaca id kelompok umur dari ms kelompok umur dan
tr penyakit, demikian juga stream lookup pada ms penyakit berfungsi untuk membaca id penyakit dari tr penyakit dan ms penyakit. Add sequence
digunakan untuk menambah kolom id tr pada tabel tr penyakit, id tr merupakan primary key dari tabel ini. Select values berfungsi untuk
mengkonversi data ke dalam format database, kemudian tabel tr penyakit dibuat pada database dengan menggunakan tabel output.
Tabel 4. 6 tr penyakit
Tabel 4.6 merupakan hasil pembuatan tr penyakit pada database.
2. Dimensi nama penyakit
Gambar 4. 4 Proses pembuatan dimensi nama penyakit di Oracle .ktr
Sumber data dari dimensi ini berasal dari tabel master ms_penyakit. Terdapat add sequence yang berfungsi untuk menambah
kolom sk nama penyakit yang merupakan surrogate key dari dimensi ini. Select values
digunakan untuk mengkonversi data ke dalam format database
yang diinginkan atau mengubah nama kolom atau menghapus
kolom yang tidak digunakan. Table output digunakan untuk create table pada database.
Tabel 4. 7 dim nama penyakit
Tabel 4.7 merupakan hasil pembuatan dim nama penyakit di Oracle.
3. Dimensi kelompok umur
Gambar 4. 5 Proses pembuatan dimensi kelompok umur di Oracle .ktr
Tabel master kelompok umur merupakan sumber data yang digunakan untuk membuat dimensi kelompok umur. Terdapat add sequence
yang digunakan untuk menambah surrogate key yakni sk kelompok umur yang bertipe integer. Select values digunakan untuk mengkonversi data ke
dalam format database, serta digunakan untuk memilih atau menghapus kolom. Table output digunakan untuk membuat tabel dim kelompok umur
pada basis data.
Tabel 4. 8 dim kelompok umur
Hasil pembuatan tabel ini di Oracle dapat dilihat pada Tabel 4.8
4. Dimensi waktu
Gambar 4. 6 Proses pembuatan dimensi waktu di Oracle .ktr
Sumber data dari dimensi waktu berasal dari tr penyakit, data dari tr penyakit diurutkan terlebih dahulu menggunakan sort rows, sebelum
menghilangkan redundancy data menggunakan unique rows. Sk waktu merupakan surrogate key yang ditambahkan pada dimensi waktu, sk waktu
dibuat menggunakan add sequence. Untuk membuat kolom id tahun dan nama bulan menggunakan modified java script value. Select values
digunakan untuk mengkonversi data ke dalam format database. Untuk membuat tabel dim waktu pada database menggunakan table output. Tabel
4.9 merupakan hasil pembuatan dimensi waktu di Oracle.
Tabel 4. 9 dim waktu
5. Tabel fakta
Gambar 4. 7 Proses pembuatan tabel fakta di Oracle .ktr
Tabel fakta berisi measures yakni B,L dan K serta berisi semua sk dari masing-masing dimensi. Tabel ini sumber datanya berasal dari tr
penyakit. Stream lookup pada dim kelompok umur digunakan untuk membaca id kelompok umur milik dim kelompok umur dan tr penyakit, id
dari masing-masing tabel tersebut digunakan untuk mengambil sk kelompok umur. Demikian juga stream lookup yang terdapat pada dim
nama penyakit dan dim waktu fungsinya sama dengan stream lookup pada dim kelompok umur. Select values digunakan untuk mengkonversi data ke
dalam format database. Table output digunakan untuk membuat tabel fakta pada database. Tabel 4.10 merupakan hasil pembuatan tabel fakta.
Tabel 4. 10 tabel fakta
4.3. OLAP