Atribut Nilai Kontinyu
Nilai Diskrit
Kelembaban kelembaban90
Kelembaban sangat tinggi Kec Angin
kec.angin=2 Kec angin sangat rendah
Kec Angin 2 kec.angin =4
Kec angin rendah Kec Angin
4 kec.angin =6 Kec angin sedang
Kec Angin 6 kec.angin =8
Kec angin agak tinggi Kec Angin
8 kec.angin =10 Kec angin tinggi
Kec Angin kec.angin 10
Kec angin sangat tinggi Curah Hujan
Curah hujan=0 Tidak hujan
Curah Hujan 0Curah hujan=5
Curah hujan sangat rendah Curah Hujan
5Curah hujan=20 Curah hujan rendah
Curah Hujan 20Curah hujan=50
Curah hujan sedang Curah Hujan
50Curah hujan=100 Curah hujan tinggi
Curah Hujan Curah hujan100
Curah hujan sangat tinggi
c. Identifikasi terhadap nilai isi atribut angin ke dalam bentuk yang diinginkan agar bisa dipahami. Pada tabel angin untuk atribut arah
perubahannya dapat dilihat pada tabel :
Tabel 3.15 Tabel Perubahan Atribut Angin Atribut Angin
Hasil Conditioning
E Timur
C Tenggara
S Selatan
W Barat
N Utara
WS Barat Daya
WN Barat Laut
NE Timur Laut
d. Kolom tanggal pada tabel kondisi akan dijadikan tabel dim_waktu dengan field berupa kode_waktu, bulan, tahun karena ketika proses
analisis, data yang dibutuhkan bisa dianalisis lebih dalam berdasarkan range waktu yang diinginkan. Untuk lebih jelasnya mengenai tanggal
dari tabel kondisi yang dijadikan dim_waktu dapat dilihat pada tabel
berikut : Tabel 3.16 Perubahan Kolom Tanggal Menjadi Tabel dim_waktu
Tanggal 2005-01-01
2005-01-02 2005-01-03
2005-01-04 2005-01-05
kode_waktu Bulan
Tahun 1
1 2005
2 1
2005 3
1 2005
4 1
2005 5
1 2005
e. Tabel kondisi akan menjadi tabel fakta pada data mart yaitu fakta kondisi.
f. Identifikasi tabel dim_cuaca, yaitu tabel dimensi yang berisi kode_cuaca dan unsur_cuaca, unsur_cuaca berasal dari nilai diskrit pada
transformasi. Proses pembentukan dimensi cuaca adalah sebagai berikut:
temperatur PK
KodeTemperatur RataRata
kelembaban PK
KodeKelembaban
angin PK
KodeAngin KecRataRata
Arah dim_cuaca
PK kode_cuaca
unsur_cuaca Transformasi data
RataRata
Gambar 3.4 Pembentukan Dimensi Cuaca
g. Perubahan tipe data untuk setiap kolomnya adalah sebagai berikut : - Pada kolom temperatur yang awalnya float diubah menjadi string
- Pada kolom kelembaban yang awalnya integer diubah menjadi string - Pada kolom kec_angin yang awalnya integer diubah menjadi string
Berikut adalah gambaran proses transformasi pada data mart:
Mulai Baca Data
Hasil Ekstrak
Data hasil transform
ditampilkan Selesai
Update data staging
hasil transform
Conditioining Perubahan nama kolom, tipe data, kolom tanggal
menjadi tabel dim_waktu Apakah sudah
sesuai? ya
tidak Ubah format data
Cleaning Pemilihan kolom
Gambar 3.5 Flowchart Proses Transform
c. Loading
Fase load merupakan tahapan yang berfungsi untuk memasukkan data ke dalam target akhir, yang biasanya ke dalam suatu data mart. Pada proses ini data
yang sudah dibaca, dibersihkan, dan diubah formatnya akan disimpan pada data mart. Teknik yang akan digunakan adalah insert-update. Data yang sudah ada
tidak akan dihapus atau diubah karena data akan diupdate secara berkala. Nantinya semua data yang sudah melalui proses extraction, cleansing, dan
transformation akan langsung dimasukkan ke dalam data mart tanpa merubah data yang telah ada. Proses loading dapat dilihat pada gambar berikut :
Mulai Baca Data
Hasil Transform
Salin Data
Selesai Data Mart
Gambar 3.6 Flowchart Proses Loading
3.1.3.3 Pemodelan Data Dimensional
Skema yang digunakan untuk pemodelan data adalah skema bintang star schema yang merupakan stuktur logical yang memilih tabel fakta yang terdiri
atas data faktual ditengahnya dan dikelilingi oleh tabel-tabel dimensi yang berisi referensi data. Penggunaan star schema memungkinkan proses query yang lebih
ringan dan memudahkan penjelajahan terhadap data dimensinya. Dimensi model merupakan pemodelan data yang terdiri dari tabel dimensi
dan tabel fact. Tabel fact merupakan tabel utama dalam dimensional model yang berisi pengukuran nilai angka dari bisnis yang disimpan. Tabel dimensi
merupakan tabel pelengkap dari tabel fact yang berisi penjelasan teraktual dari bisnis.
3.1.3.3.1 Menentukan Fact Tabel dan Measure
Fact tabel dapat diartikan sebagai hasil evakuasi setiap parameter dari setiap dimensi yang ada. Measure adalah parameter yang digunakan dalam fact
table yang berupa data nominal. Pada data mart ini terdapat 1 tabel fakta yaitu fact_kondisi. Untuk lebih jelasnya dapat dilihat pada tabel berikut :
Tabel 3.17 Struktur Tabel Fakta Kondisi
Nama Kolom Tipe Data
Keterangan kode_kondisi
Int Primary key
kode_waktu Int
Foreign key dari tabel dim_waktu curah_hujan
varchar50 Data curah hujan harian
Jumlah Int
Jumlah cuaca
Measure yang dibuat adalah total proses data curah_hujan yang diambil dari tabel fakta_kondisi keluar dengan field jumlah. Untuk lebih jelasnya dapat
dilihat pada tabel berikut ini :
Tabel 3.18 Measure
Measure Keterangan
Agregasi
Jumlah Barang Atribut count_
curah_hujan SUM
3.1.3.3.2 Menentukan Dimensi
Tabel dimensi merupakan tabel yang berisi data yang menunjukan tinjauan dari berbagai perspektif adanya dimensi memungkinkan peninjauan dinamis dari
berbagai perspektif sekaligus mengatur tingkat perinciannya. Tabel dimensi yang ada dalam rancangan Data marthanya ada satu yaitu dimensi waktu:
1. Tabel dim_cuaca Tabel dimensi cuaca berisi kode_cuaca dan nama_cuaca. Struktur
tabelnya dapat dilihat pada tabel berikut ini:
Tabel 3.19 Struktur Tabel Dimensi Temperatur
Nama Kolom Tipe Data
Keterangan kode_cuaca
Int Primary key autoincrement
unsur_cuaca varchar50
Menyimpan data cuaca.
2. Tabel dim_waktu Tabel ini berisi data waktu yang terdiri dari Kode waktu, tanggal,
bulan dan tahun. Struktur tabelnya dapat dilihat pada tabel berikut ini:
Tabel 3.20 Tabel Dimensi Waktu
Nama Kolom Tipe Data
Keterangan kode_waktu
Int Primary key autoincrement
Bulan Int
Menyimpan bulan data Tahun
Int Menyimpan tahun data
3.1.3.4 Skema Data Mart
Berdasarkan model data dimensional yang dibuat dalam bentuk star schema untuk membangun data mart skemanya bisa dilihat pada gambar 3.7
berikut :
dim_cuaca PK
kode_cuaca unsur_cuaca
fact_kondisi PK
kode_kondisi kode_cuaca
FK1 jumlah
curah_hujan dim_waktu
PK kode_waktu
bulan tahun
kode_waktu FK2
Gambar 3.7 Star Schema Data Mart
Berikut isi data pada masing- masing tabel berdasarkan skema data mart diatas :
1. Dimensi waktu
Tabel 3.21 Dimensi Waktu
2. Dimensi cuaca
Tabel 3.22 Dimensi Cuaca
3. Fakta kondisi
Tabel 3.23 Fakta Kondisi