Mengubah data penyakit ke dalam gudang data data warehouse

penambahan data yang digunakan di dalam sistem maka admin dapat menambahkannya. 2. Dinas Puskesmas Jebed Pemalang Aktor yang berperan dalam memilih pemantauan jumlah penyakit. Dinas Puskesmas Jebed Pemalang dapat melihat hasil data penyakit yang telah diolah oleh sistem.

3.3 Mengubah data penyakit ke dalam gudang data data warehouse

3.3.1 Membaca Data Legacy

Data yang digunakan dalam tugas akhir ini berupa Laporan Bulanan Data Kesakitan Kunjungan Total di Puskesmas Jebed, Kabupaten Pemalang periode tahun 2010 hingga 2012. Bahan data tersebut berupa dokumen excel yang berisi : 1. Jenis Penyakit 2. Jumlah Kasus Baru 3. Jumlah Kasus Lama 4. Jumlah Kunjungan 5. Kelompok Umur 6. Jumlah Total 7. Bulan Pada studi kasus ini, sumber data dari gudang data berbentuk dalam dokumen excel. Sebelum data dipindahkan dalam gudang data, harus dilakukan tahap preprocessing. Untuk tahap-tahap pre-processing yang dilakukan adalah :  Mengubah spasi pada header dengan garis bawah _  Menghilangkan data yang bukan merupakan penyakit  Menambahkan kolom bulan dan tahun 1. Mengubah spasi pada header dengan garis bawah _ karena pada database untuk penamaan kolom tidak bisa menggunakan spasi, sedangkan header pada excel digunakan untuk penamaan kolom. Gambar 3.3 Langkah preprocessing mengubah header JENIS_PENYAKIT Typus Perut Infeksi Bakteri Lain Amoebiasis Diare dan Gastroenteritis non spesifik TB paru BTA + TB Klinis Termasuk Rongent + BTA - Varicella Herpes Zoster Campak Hepatitis A Akuta JENIS PENYAKIT Typus Perut Infeksi Bakteri Lain Amoebiasis Diare dan Gastroenteritis non spesifik TB paru BTA + TB Klinis Termasuk Rongent + BTA - Kusta MB Varicella Herpes Zoster Campak 2. Menghilangkan data yang bukan merupakan penyakit, misalkan kecelakaan. Gambar 3.4 Langkah preprocessing menghapus data bukan penyakit 3. Menambah kolom bulan dan tahun, agar laporan dapat didapatkan informasi laporan dalam periode bulan ataupun tahun. SP2TP ICD- X JENIS PENYAKIT 0101 A00 Kolera 0102 A01 Typus Perut 0103 A04 Infeksi Bakteri Lain 0106 A06 Amoebiasis 3805 L08 Penyakit kulit infeksi lain 3808 L23 Penyakit Kontak Alergi 3809 L29 Pruritus 3812 L50 Urticaria 4001 M06 Rhumatoid Arthritis lain 4002 M10 Goot 4008 M13 Arthritis tidak spesifik 4701 V89 Kecelakaan lalu lintas 4702 W19 Jatuh 4708 Y07 Kecelakaan kerja 4804 Z48 Follow up tindakan operasi misal bk jhitn, bk pmbalut 3805 L08 Penyakit kulit infeksi lain 3808 L23 Penyakit Kontak Alergi 3809 L29 Pruritus 3812 L50 Urticaria 4001 M06 Rhumatoid Arthritis lain 4002 M10 Goot 4008 M13 Arthritis tidak spesifik 0105 A09 Diare dan Gastroenteritis non spesifik 0201 A15 TB paru BTA + 0204 A16 TB Klinis Termasuk Rongent + BTA - 0209 A16 TB Anak 0304 A30 Kusta PB 0305 A30A Kusta MB Gambar 3.5 Langkah preprocessing menambah kolom bulan dan tahun Kemudian data laporan tersebut dipisah-pisah sesuai dengan kebutuhan pengguna untuk melihat laporan. Data yang terpisah ini nantinya juga akan SP2TP ICD-X BULAN TAHUN JENIS_PENYAKIT 0102 A01 1 2011 Typus perut 0103 A04 1 2011 Infeksi Bakteri Lain 0106 A06 1 2011 Amoebiasis 0105 A09 1 2011 Diare dan Gastroenteritis non spesifik 0201 A15 1 2011 TB Paru BTA + 0204 A16 1 2011 TB Klinis Termasuk Rongent + BTA - 0305 A30A 1 2011 Kusta MB 0404 A90 1 2011 Dengue Fever 0407 B01 1 2011 Varicella 0408 B02 1 2011 Herpes Zoster digunakan dalam tugas akhir ini sebagai tabel dimensi dan tabel fakta. Data laporan tersebut dipisahkan sebagai berikut : 1. Nama penyakit, meliputi SP2TP, ICD-X, dan Jenis_Penyakit 2. Waktu, meliputi id_bulan, id_tahun, nama_bulan, tahun 3. Kelompok Umur, meliputi id_klpk_umur, nama_kelompok_umur 4. Penyakit, meliputi SP2TP, ICD-X, Bulan, Tahun, Jenis_Penyakit, 0- 28hr_B, 0-28hr_L, 0-28hr_K, 28hr-1th_B, 28hr-1th_L, 28hr- 1th_K, 1-4th_B, 1-4th_L, 1-4th_K, 5-14th_B, 5-14th_L, 5-14th_K, 15-44th_B, 15-44th_L, 15-44th_K, 45-54th_B, 45-54th_L, 45- 54th_K, 55-60th_B, 55-60th_L, 55-60th_K, diatas_60th_B, diatas_60th_L, diatas_60th_K, B, L, K, B+L+K.

3.3.2 Menggabungkan data dari berbagai sumber terpisah

Data yang digunakan dalam tugas akhir ini dibuat dalam satu dokumen excel dari tahun 2010 hingga 2012. Data yang digunakan ini merupakan data yang sudah melalui proses pembersihan. Berikut ini akan ditampilkan gambar data yang telah disatukan dalam satu dokumen excel dari tahun 2010 hingga 2012 yang akan ditampilkan dalam gambar 3.6-3.8. Gambar 3.6 Contoh Data I Pada gambar 3.6 merupakan contoh data bersih dari tahun 2010, data tersebut terdiri dari SP2TP, ICD-X, Bulan, Tahun, Jenis Penyakit, Kelompok Umur disetiap kunjungan penyakitnya, kunjungan penyakit terdiri dari baru, lama, kunjungan. Gambar 3.7 Contoh Data II Pada gambar 3.7 merupakan contoh data bersih dari tahun 2011, data tersebut terdiri dari SP2TP, ICD-X, Bulan, Tahun, Jenis Penyakit, Kelompok Umur disetiap kunjungan penyakitnya, kunjungan penyakit terdiri dari baru, lama, kunjungan Gambar 3.8 Contoh Data III Pada gambar 3.8 merupakan contoh data bersih dari tahun 2012, data tersebut terdiri dari SP2TP, ICD-X, Bulan, Tahun, Jenis Penyakit, Kelompok Umur disetiap kunjungan penyakitnya, kunjungan penyakit terdiri dari baru, lama, kunjungan

3.3.3 Memindahkan data dari sumber ke server gudang data

Setelah melakukan tahap preprocessing kemudian memulai membuat gudang data dengan memasukkan data excel yang telah dipisah-pisah ke dalam database . Data-data excel itu dimasukkan dalam tabel-tabel yang digunakan sebagai dimensi dalam OLAP. Tabel-tabel tersebut disimpan dalam database penyakit. Untuk memasukkan data ke dalam database digunakan aplikasi kettle Pentaho Data Integration. Database untuk menyimpan tabel-tabel tersebut diberi nama penyakit. Gambar 3.9 Database Penyakit 3.3.3.1 Nama penyakit, meliputi SP2TP, ICD-X, dan Jenis_Penyakit File excel nama_penyakit Merupakan pembentukan tabel nama_penyakit dari file excel nama_penyakit. Berisi atribut SP2TP, ICD-X, dan Jenis_Penyakit, serta ditambah dengan surrogate key yaitu sk_nama_penyakit. Nama Penyakit PK sk_nama_penyakit SP2TP ICD-X Jenis_Penyakit Tabel nama_penyakit 3.3.3.2 Waktu, meliputi id_bulan, id_tahun, nama_bulan, tahun, sk_waktu File excel waktu Merupakan pembentukan tabel waktu dari file excel waktu. Berisi atribut id_bulan, id_tahun, nama_bulan, tahun, serta ditambah dengan surrogate key yaitu sk_waktu. Waktu PK sk_waktu id_bulan id_tahun nama_bulan tahun Tabel waktu 3.3.3.3 Kelompok Umur, meliputi id_klpk_umur, nama_kelompok_umur File excel kelompok_umur Merupakan pembentukan tabel kelompok umur dari file excel kelompok umur. Berisi atribut id_klpk_umur, nama_kelompok_umur, serta ditambah dengan surrogate key yaitu sk_kelompok_umur. 3.3.3.4 Penyakit, meliputi SP2TP, ICD-X, Bulan, Tahun, Jenis_Penyakit, 0- 28hr_B, 0-28hr_L, 0-28hr_K, 28hr-1th_B, 28hr-1th_L, 28hr-1th_K, 1- 4th_B, 1-4th_L, 1-4th_K, 5-14th_B, 5-14th_L, 5-14th_K, 15-44th_B, 15-44th_L, 15-44th_K, 45-54th_B, 45-54th_L, 45-54th_K, 55-60th_B, 55-60th_L, 55-60th_K, diatas_60th_B, diatas_60th_L, diatas_60th_K, B, L, K, B+L+K Kelompok Umur PK sk_kelompok_umur id_klpk_umur nama_kelompok_umur Tabel kelompok umur File excel penyakit Merupakan pembentukan tabel penyakit dari file excel penyakit. Berisi atribut SP2TP, id_bulan, id_tahun, id_klpk_umur, B, L, K. penyakit PK SP2TP id_bulan id_tahun id_klpk_umur B L K Tabel penyakit

3.3.4 Memecah gudang data dalam tabel fakta dan tabel dimensi

Berikut ini akan dijelaskan pembuatan tabel-tabel yang akan disimpan dalam database penyakit yang kemudian akan dipakai untuk dimensi dalam OLAP: 1. Nama Penyakit Gambar 3.10 nama penyakit.ktr Gambar 3.10 merupakan rangkaian pembentukan tabel Tabel Fakta_Penyakit B L K sk_bulan sk_tahun sk_kelompok_umur sk_nama_penyakit dim_kelompok_umur id_klpk_umur nama sk_kelompok_umur dim_nama_penyakit sk_nama_penyakit SP2TP ICD-X jenis_penyakit dim_waktu id_bulan nama_bulan id_tahun tahun sk_waktu dim_nama_penyakit yang bertujuan untuk mengambil data excel nama penyakit untuk kemudian diletakkan dalam database dengan langkah sebagai berikut : a. Ambil data dari excel b. Menambahkan surrogate key dengan menggunakan step “add sequence” c. Merubah metadata dengan menggunakan step “select values” d. Memasukkan data yang telah diolah ke dalam tabel dim_nama_penyakit pada database penyakit Gambar 3.11 Tabel dim_nama_penyakit Gambar 3.11 merupakan tabel dim_nama_penyakit. Terdapat kolom sk_nama_penyakit yang merupakan surrogate key , SP2TP, ICD-X, jenis_penyakit. Jumlah data record pada tabel ini adalah 109. 2. Waktu Gambar 3.12 waktu.ktr Gambar 3.12 merupakan rangkaian pembentukan tabel dim_waktu yang bertujuan untuk mengambil data excel waktu untuk kemudian diletakkan dalam database dengan langkah sebagai berikut : a. Ambil data dari excel b. Menambahkan surrogate key dengan menggunakan step “add sequence” c. Merubah metadata dengan menggunakan step “select values” d. Memasukkan data yang telah diolah ke dalam tabel dim_waktu pada database penyakit Gambar 3.13 Tabel dim_waktu Gambar 3.13 merupakan tabel dim_waktu. Terdapat kolom sk_waktu yang merupakan surrogate key, id_bulan, id_tahun, nama_bulan, tahun. 3. Kelompok Umur Gambar 3.14 Kelompok Umur.ktr Gambar 3.14 merupakan rangkaian pembentukan tabel dim_kelompok_umur yang bertujuan untuk mengambil data excel kelompok_umur untuk kemudian diletakkan dalam database dengan langkah sebagai berikut : a. Ambil data dari excel b. Menambahkan surrogate key dengan menggunakan step “add sequence” c. Merubah metadata dengan menggunakan step “select values” d. Memasukkan data yang telah diolah ke dalam tabel dim_kelompok_umur pada database penyakit Gambar 3.15 Tabel dim_kelompok_umur Gambar 3.15 merupakan tabel dim_kelompok_umur. Terdapat kolom sk_kelompok_umur yang merupakan surrogate key, id_klpk_umur, nama_kelompok_umur. 4. Penyakit Gambar 3.16 Penyakit.ktr Gambar 3.16 merupakan rangkaian pembentukan tabel penyakit dimana dalam tabel ini terdapat transaksi penyakit dalam arti jumlah kunjungan penyakit, diawali dengan mengambil data excel penyakit untuk kemudian dilakukan perubaham metadata selanjutnya dinormalisasikan setelah itu dirubah kembali metadanya dan kemudian disimpan dalam tabel fact_penyakit untuk diletakkan dalam database penyakit. Gambar 3.17 Tabel penyakit Gambar 3.17 merupakan tabel penyakit. Terdapat kolom SP2TP, id_bulan, B, L, K, id_klpk_umur, id_tahun. Jumlah recordnya adalah 5224. Setelah pembentukan tabel-tabel dimensi dilakukan, langkah berikutnya adalah membentuk tabel fakta. Gambar 3.18 fact_penyakit.ktr Gambar 3.18 merupakan rangkaian pembentukan tabel fact_penyakit dimana tabel ini digunakan dalam proses OLAP, diawali dengan memasukkan data dari tabel penyakit_tr kemudian menyamakan dengan dimensi-dimensi, merubah metadata atau memilih data, dan selanjutnya dinormalisasikan setelah itu dirubah kembali metadanya dan kemudian memasukkan data ke dalam tabel fact_peyakit untuk diletakkan dalam database penyakit. Gambar 3.19 Tabel fact_penyakit Gambar 3.19 merupakan tabel fakta yang terdiri dari B merupakan pasien baru, L merupakan pasien lama, K merupakan psien kunjungan atau pasien dari luar daerah. Didalam tabel ini juga berisi semua sk dari semua dimensi yang ada yakni sk_bulan, sk_tahun, sk_kelompok_umur, sk_nama_penyakit.

3.4 Membuat skema bintang