69 2.
Seleksi data Dari data yang ada dilakukan seleksi data karena tidak semua data
digunakan. Pada kasus ini SP2TP tidak digunakan dan diganti dengan kolom nama penyakit. Karena SP2TP juga bukan merupakan data yang
dirasa penting karena hanya berisi nomor urut dari nama penyakit yang digunakan untuk pelaporan. Untuk tahap selanjutnya setelah melakukan
tahap
preprocessing
kemudian melakukan tahap menggabungkan data dari berbagai sumber terpisah.
4.2.2. Menggabungkan Data dari Berbagai Sumber Terpisah
Seperti yang telah diilustrasikan pada bab 3, penggabungan data perlu dilakukan karena data yang ada tidak seluruhnya berbentuk file Excel.
4.2.3. Memindahkan Data ke Server Gudang Data
Sebelum membuat dimensi dan tabel fakta, maka terlebih dahulu membuat tabel master yang nantinya akan menjadi sumber untuk membuat
dimensi dalam gudang data. Tabel master yang dibuat meliputi ms_penyakit dan ms_kelompok_umur.
1. Master penyakit
Gambar 4. 1 Proses pembuatan tabel ms_penyakit di Oracle .ktr
Gambar 4.1 merupakan proses pembuatan tabel ms_penyakit di Oracle, dengan inputan berupa
file excel. Sort rows
berfungsi untuk mengurutkan data, karena untuk menghilangkan
redundancy
data dengan menggunakan
unique rows
data harus diurutkan terlebih dahulu
.
Pada id_penyakit menggunakan bantuan
add sequence
untuk membuat id penyakitnya mengingat data penyakit yang ada dalam jumlah besar.
Select values
untuk mengkonversi data dari
file
ke dalam format
database
yang diinginkan atau mengubah nama kolom atau menghapus kolom yang tidak
digunakan.
Table output
digunakan untuk membuat tabel pada
database.
Tabel 4. 4 ms_penyakit
Tabel 4.4 adalah hasil dari tabel ms_penyakit pada
database,
terdiri dari kolom id penyakit, SP2TP, ICD_X dan jenis penyakit.
2. Master kelompok umur
Gambar 4. 2 Proses pembuatan tabel ms_kelompok_umur di Oracle .ktr
Gambar 4.2
merupakan proses
pembuatan tabel
ms_kelompok_umur, untuk membuat tabel master ini menggunakan inputan berupa
file excel. Select values
untuk mengkonversi data dari
file
ke dalam format
database
yang diinginkan atau mengubah nama kolom atau menghapus kolom yang tidak digunakan.
Table output
digunakan untuk membuat tabel pada
database.
Tabel 4. 5 ms_kelompok_umur
Tabel 4.5 adalah hasil dari tabel ms_kelompok_umur pada
database,
terdiri dari kolom id kelompok umur dan nama kelompok umur.
4.2.4. Memecah Gudang Data dalam Tabel Fakta dan Tabel Dimensi
1. Tr penyakit
Gambar 4. 3 Proses pembuatan tr_penyakit di Oracle .ktr
Sumber data dari tr_penyakit berupa data penyakit tahun 2010 sampai 2012
.xls
, sumber lainnya berasal dari tabel ms_penyakit dan ms_kelompok_umur. Terdapat
stream lookup
pada ms kelompok umur yang digunakan untuk membaca id kelompok umur dari ms kelompok umur dan
tr penyakit, demikian juga
stream lookup
pada ms penyakit berfungsi untuk membaca id penyakit dari tr penyakit dan ms penyakit.
Add sequence
digunakan untuk menambah kolom id tr pada tabel tr penyakit, id tr merupakan
primary key
dari tabel ini.
Select values
berfungsi untuk mengkonversi data ke dalam format
database
, kemudian tabel tr penyakit dibuat pada
database
dengan menggunakan
tabel output.
Tabel 4. 6 tr penyakit
Tabel 4.6 merupakan hasil pembuatan tr penyakit pada
database.
2. Dimensi nama penyakit
Gambar 4. 4 Proses pembuatan dimensi nama penyakit di Oracle .ktr
Sumber data dari dimensi ini berasal dari tabel master ms_penyakit. Terdapat
add sequence
yang berfungsi untuk menambah kolom sk nama penyakit yang merupakan
surrogate key
dari dimensi ini.
Select values
digunakan untuk mengkonversi data ke dalam format
database
yang diinginkan atau mengubah nama kolom atau menghapus
kolom yang tidak digunakan.
Table output
digunakan untuk
create table
pada
database.
Tabel 4. 7 dim nama penyakit
Tabel 4.7 merupakan hasil pembuatan dim nama penyakit di Oracle.
3. Dimensi kelompok umur
Gambar 4. 5 Proses pembuatan dimensi kelompok umur di Oracle .ktr
Tabel master kelompok umur merupakan sumber data yang digunakan untuk membuat dimensi kelompok umur. Terdapat
add sequence
yang digunakan untuk menambah
surrogate key
yakni sk kelompok umur yang bertipe integer.
Select values
digunakan untuk mengkonversi data ke dalam format
database
, serta digunakan untuk memilih atau menghapus kolom.
Table output
digunakan untuk membuat tabel dim kelompok umur pada basis data.
Tabel 4. 8 dim kelompok umur
Hasil pembuatan tabel ini di Oracle dapat dilihat pada Tabel 4.8
4. Dimensi waktu
Gambar 4. 6 Proses pembuatan dimensi waktu di Oracle .ktr
Sumber data dari dimensi waktu berasal dari tr penyakit, data dari tr penyakit diurutkan terlebih dahulu menggunakan
sort rows,
sebelum menghilangkan
redundancy
data menggunakan
unique rows.
Sk waktu merupakan
surrogate key
yang ditambahkan pada dimensi waktu, sk waktu dibuat menggunakan
add sequence.
Untuk membuat kolom id tahun dan nama bulan menggunakan
modified java script value. Select values
digunakan untuk mengkonversi data ke dalam format
database.
Untuk membuat tabel dim waktu pada
database
menggunakan
table output.
Tabel 4.9 merupakan hasil pembuatan dimensi waktu di Oracle.
Tabel 4. 9 dim waktu
5. Tabel fakta
Gambar 4. 7 Proses pembuatan tabel fakta di Oracle .ktr
Tabel fakta berisi
measures
yakni B,L dan K serta berisi semua sk dari masing-masing dimensi. Tabel ini sumber datanya berasal dari tr
penyakit
. Stream lookup
pada dim kelompok umur digunakan untuk membaca id kelompok umur milik dim kelompok umur dan tr penyakit, id
dari masing-masing tabel tersebut digunakan untuk mengambil sk kelompok umur. Demikian juga
stream lookup
yang terdapat pada dim nama penyakit dan dim waktu fungsinya sama dengan
stream lookup
pada dim kelompok umur.
Select values
digunakan untuk mengkonversi data ke dalam format
database. Table output
digunakan untuk membuat tabel fakta pada
database.
Tabel 4.10 merupakan hasil pembuatan tabel fakta.
Tabel 4. 10 tabel fakta
4.3. OLAP