I. Pendahuluan - BAB 1 PENGANTAR BASIS DATA

  

PENGANTAR BASIS DATA I

  I. Pendahuluan

  Sebuah sistem database tidak lain adalah sistem penyimpanan catatan secara terkomputerisasi. Database itu sendiri dapat dipandang sebagai suatu jenis filling cabinet elektronik. Database merupakan sebuah tempat penyimpanan untuk file-file data yang terkomputerisasi. Seorang user dari sistem dapat melakukan operasi-operasi terhadap file-file tersebut. Operasi yang dapat dilakukan antara lain :

  1. Menambah file baru ke dalam database

  2. Menambah data ke dalam file yang sudah ada

  3. Mengambil (retrieve) dari file yang sudah ada

  4. Merubah data dari file yang sudah ada

  5. Menghapus data dari file yang sudah ada

  6. Menghapus file dari database Basis data meneyediakan fasilitas atau mempermudah dalam menghasilkan informasi yang digun akan pemakai untuk mendukung pengambilan keputusan. Hal inilah yang menjadikan alas an dari penggunaan teknologi basis data pada saat sekarang (dunia bisnis). Berikut contoh penggunaan aplikasi basis data dalam dunia bisnis :

   Bank : Pengelolaan data nasabah, akunting, semua transaksi perbankan  Bandara : Pengelolaan data reservasi, penjadualan  Universitas : Pengelolaan pendaftaran, alumni  Pabrik : Pengelolaan data produksi, persediaan barang, pemesanan, agen  Penjualan : Pengelolaan data customer, produk, penjualan  Kepegawaian : Pengelolaan data karyawan, gaji, pajak  Telekomunikasi : Pengelolaan data tagihan, jumlah pulsa

  II. Sistem Pemrosesan File / Sistem Pengorganisasian Tradisional

  Sebelumnya sistem yang digunakan untuk mengatasi semua permasalahan bisnis, menggunakan pengelolaan data secara tradisional dengan cara menyimpan record-record pada file-file yang terpisah, yang disebut juga sistem pemrosesan file. Dimana masing- masing file diperuntukan hanya untuk satu program aplikasi saja

  

Gambar 1. Ilustrasi Sistem Pemrosesan File

Kelemahan dari sistem pemrosesan file antara lain :

  1. Timbulnya data rangkap (redundancy data) dan ketidakkonsistenan data (inconsistency data) Karena file-file dan program aplikasi disusun oleh programmer yang berbeda, sejumlah informasi mungkin memiliki duplikasi dalam beberapa file. Sebagai contoh nama mata kuliah dan sks dari mahasiswa dapat muncul pada suatu file yang memiliki record-record mahasiswa dan juga pada suatu file yang terdiri dari record-record matakuliah. Kerangkapan data seperti ini dapat menyebabkan pemborosan tempat penyimpanan data.Ketidakkonsistenan data misalnya apabila terjadi perubahan jumlah sks mata kuliah, sedangkan perubahan hanya diperbaiki pada file mata kuliah dan tidak diikuti perbaikan pada file mahasiswa. Hal ini mengakibatkan kesalahan dalam laporan nilai mahasiswa.

  2. Kesukaran dalam mengakses data Munculnya permintaan-permintaan baru yang tidak diantisipasi sewaktu membuat program aplikasi, sehingga tidak memungkinkan untuk pengambilan data. Misalnya pada file mahasiswa tdak tersimpan data nilai sedangkan ada permintaan yang membutuhkan laporan data mahasiswa beserta nilainya, hal ini menimbulkan kesulitan untuk mengakses data nilai.

  3. Data terisolir (Isolation Data) Karena data tersebar dalam berbagai file, dan file-file mungkin dalam format-format yang berbeda, akan sulit menuliskan program aplikasi baru untuk mengambil data yang sesuai.

  Tidak semua pemakai diperbolehkan mengakses seluruh data. Bagian Mahasiswa hanya boleh mengakses file mahasiswa. Bagian Mata kuliah hanya boleh mengakses file mata kuliah, tidak boleh mengakses file mahasiswa.Tetapi sejak program-program aplikasi ditambahkan secara ad-hoc maka sulit melaksanakan pengamanan seperti yang diharapkan.

  5. Data Dependence Terjadi ketergantungan pada satu program aplikasi. Apabila terjadi perubahan atau kesalahan pada program aplikasi maka pemakai tidak dapat mengakses data.

III. Sistem Pemrosesan Database / Sistem Pengorganisasian Database Kontemporer

  Databse adalah susunan record data operasional lengkap dari suatu organisasi/perusahaan yang diorganisir dan disimpan secara terintegrasi dengan menggunakana metode tertentu dalam komputer sehingga mampu memenuhi informasi optimal diperlukan oleh user. Sistem database adalah sistem penyusunan database.

  

Gambar 2. Ilustrasi Sistem Pemrosesan Database

Tujuan database adalah :

  1. Kontrol data agar tidak terjadi kerangkapan data

  2. Standarisasi dalam format data dan program aplikasi yang digunakan

  3. Meningkatkan kerja sistem

  Konsep Dasar Basis Data

  Data adalah representasi fakta dunia nyata yang mewakili suatu objek seperti manusia

  (pegawai, mahasiswa, pembeli dll), barang, hewan, peristiwa, konsep, keadaan dsb yang direkam dalam bentuk angka, huruf, symbol, teks, gambar, bunyi atau kombinasinya.

  

Basis Data adalah sekumpulan data yang terintegrasi yang diorganisasikan untuk memenuhi

kebutuhan para pemakai dalam suatu organisasi.

  DBMS (Database Management Sytem) adalah perangkat lunak yang menangani semua

  pengaksesan ke basis data

  Tujuan DBMS adalah :

  Efisiensi dan kenyamanan dalam memperoleh dan menyimpan informasi dalam database

  Sistem Basis Data terdiri dari basis data dan DBMS Database Database

  Manageme Databas Applicatio nt System e n

  (DBMS) Konsep Database adalah integrasi logis dari record-record dalam banyak file

  Tujuan utamanya meminimalkan pengulangan dan mencapai independensi data  Data redundancy

  Duplikasi data, data yang sama disimpan dalam beberapa file  Data inconsistency

  Duplikasi data akan mengakibatkan data menjadi tidak konsisten  Data independence

  Kemampuan untuk membuat perubahan dalam struktur data tanpa membuat perubahan pada program yang memproses data

  Komponen Sistem Database

  1. Data

  Didalam database, data : Disimpan secara terintegrasi (integrated), artinya database merupakan gabungan dari - berbagai macam file aplikasi yang berbeda yang disusun dengan menghilangkan bagian-bagian yang rangkap (redundant). Sebagai alat penghubung digunakan key. Dipakai secara bersama-sama (shared), artinya masing-masing bagian dari suatu data - dapat digunakan atau diakses bersama-sama dalam waktu yang bersamaan oleh user untuk aplikasi yang berbeda.

  2. Perangkat keras (Hardware) Mencakup peralatan atau peramgkat computer yang digunakan untuk pengelolaan sistem database. Contoh : alat I/O, komunikasi data dsb

  3. Perangkat lunak (Software) Sebagai penghubung antara pemakai (user) dan database, Contoh : DBMS

  4. Pemakai (User) Dibagi menjadi 4 kategori :

  a. Sytem Engineer

  Tenaga ahli yang bertanggung jawab atas pemasangan Sistem database, dan juga mengadakan peningkatan dan melaporkan kesalahan dari sistem tsb kepada pihak penjual.

  b. Databse Administrator DBA)

  Tenaga ahli yang mempunyai tugas untuk mengontrol sistem database secara keseluruhan, meramalkan kebutuhan akan sistem database, merencanakannya dan mengaturnya.

  c. Programmer

  Membuat program aplikasi yang diperlukan oleh pemakai akhir dengan menggunakan database dan bahasa pemrograman

  d. Pemakai akhir (End-user)

  Tenaga yang menggunakan atau mengakses (retrieve, create, delete, modify) database dari terminal sesuai dengan haknya dengan menggunakan query language atau program aplikasi yang disediakan oleh programmer. Pemakai akhir (End-User) dapat dibagi menjadi 2 :

  • pengguna aplikasi : adalah orang yang mengoperasikan program aplikasi yang dibuat oleh pemrogram aplikasi.
  • pengguna interaktif : adalah orang yg dpt memberikan perintah-

  perintah pada antar muka basisdata, misalnya SELECT, INSERT dsb

  Hierarki Data Dalam Database

  1. Database, kumpulan file yg saling terkait satu sama lain

  3. Record, kumpulan field

  4. Field, atribut dari record yg menunjukkan item dari data seperti nama,alamat dsb

  5. Byte, atribut dari field yg berupa huruf yg membentuk nilai dari sebuah field

  6. Bit, bagian terkecil dari data scr keseluruhan, berupa karakter ASCII 0 atau 1 komponen pembentuk byte

  Level Abstraksi Data

  1. Level penyajian penampakan, representasi hasil pengolahan database menggunakan SI dlm format yg mudah dipahami pemakai

  2. Level konseptual, memperlihatkan file-file data yg dibuat & hubungannya satu sama lain dlm lingkungan database

  3. Level fisik, absraksi data yg memperlihatkan struktur & jenis data serta bagaimana data tsb disimpan & diorganisasikan dlm media penyimpanan

  Ilustrasi Hierarki & Abstraksi Data Keuntungan Pemakaian Database

  1. Terkontrolnya kerangkapan data (Mengurangi redundancy)

  • Pada non database

  Setiap program aplikasi mempunyai file tersendiri sehingga banyak field yang terulang kembali pada file lain. Hal ini akan membuang ruang storage.

  • Database Hanya mencantumkan satu kali saja field yang sama yang dapat dipakai oleh semua aplikasi yang memerlukannya.

  2. Terpeliharanya keselarasan (ke-konsistenan) data Apabila ada perubahan data pada aplikasi yang berbeda maka secara otomatis perubahan itu berlaku untuk keseluruhan

  3. Data dapat dipakai secara bersama (shared) Data dapat dipakai secara bersama-sama oleh beberapa program aplikasi (secara batch maupun on-line) pada saat bersamaan.

  4. Dapat diterapkan standarisasi Dengan adanya pengontrolan yang terpusat maka DBA dapat menerapkan standarisasi data yang disimpan sehingga memudahkan pemakaian, pengiriman maupun pertukaran data.

  5. Keamanan data terjamin DBA dapat memberikan batasan-batasan pengaksesan data, misalnya dengan memberikan password dan pemberian hak akses bagi user (mis : modify, delete, insert, retrieve)

  6. Terpeliharanya integritas data Jika kerangkapan data dapat dikontrol dan ke-konsistenan data dapat dijaga maka data menjadi akurat.

  7. Terpeliharanya keseimbangan (keselarasan) antara kebutuhan data yang berbeda dalam setiap aplikasi. Struktur database diatur sedimikian rupa sehingga dapat melayani pengaksesan data dengan cepat

  8. Data independence (kemandirian data) Dapat digunakan untuk bermacam-macam program aplikasi tanpa harus merubah format data yang sudah ada.

  Kerugian dari Sistem Database

  1. Storage yang digunakan besar

  2. Dibutuhkan tenaga yang trampil dalam mengelola data

  3. Software (perangkat lunaknya) mahal

  Perbedaan antara fle manajemen tradisional dan fle manajemen database File Manajemen Tradisional File Manajemen Database

  1. Sifat : program oriented

  1. Sifat : data oriented Suatu susunan data dalam file dirancang Database dapat diubah struktur penyimpanan untuk satu program aplikasi. Terjadi saling maupun cara pengaksesan tanpa merubah ketergantungan yang tinggi program aplikasi yang ada

  2. Kaku

  2. Luwes Apabila format fisik file berubah maka Database dapat digunakan secara umum oleh program aplikasi harus berubah juga program aplikasi apa saja tanpa memperhatikan struktur datanya.

  3. Kerangkapan data

  3. Terkontrolnya kerangkapan data Setiap program aplikasi mempunyai file data Dengan adanya satu sistem file dengan sendiri sehingga mengakibatkan kerangkapan pengontrolan terpusat maka kerangkapan data data antara yang satu dengan yang lain tidak dapat terkontrol sehingga penjamin selaras. keselarasan data.

  Beberapa istilah yang digunakan pada Database

  1. Enterprise Suatu bentuk organisasi seperti : bank, universitas, rumah sakit, pabrik dsb. Data yang disimpan dalam basis data merupakan data operasional dari suatu enterprise. Contoh data operasional :

  • Data keuangan

  Data mahasiswa - Data pasien -

  2. Entitas Suatu obyek yang dapat dibedakan dari lainnya yang dapat diwujudkan dalam basis data Contoh entitas dalam lingkungan Bank terdiri dari : nasabah, simpanan, hipotik Contoh entitas dalam lingkungan pabrik terdiri dari : supplier, part, shipment Kumpulan dari entitas disebut Himpunan Entitas, contoh semua nasabah, semua supplier

  3. Atribut (Elemen data) Karakteristik dari entitas tsb. Contoh entitas nasabah, atributnya terdiri dari : kode nasabah, nama nasabah, alamat nasabah

  4. Nilai Data (Data Value)

  Isi data/ informasi yang tercakup dalam setiap elemen data Contoh atribut nama nasabah dapat berisi nilai data : Nina, Rika, Titin dsb.

  5. Kunci elemen Data (Key Data Elemen) Tanda pengenal yang secara unik mengidentifikasikan entitas dari suatu kumpulan entitas. Contoh entitas nasabah yang mempunyai atribut-atribut Kode Nasabah, Nama Nasabah, Alamat Nasabah dsb menggunakan kunci elemen data kode nasabah.

  6. Record Data Kumpulan isi elemen data (atribut) yang saling berhubungan Contoh : kumpulan Atribut Kode Nasabah, Nama Nasabah, Alamat Nasabah berisikan “931109”, “Nina”, “J. Sudirman 63A”

  Contoh informasi dari suatu enterprise

  ENTITAS ATRIBUT NILAI DATA Pelanggan Kode Pelanggan 123H

  Nama Pelanggan PT. Maju Terus Alamat Jl. Salemba 53

  Rekening Kode Rekening

  63H250 Jenis Rekening Cek Jumlah Rekening 1.000.000

  Penyalur Kode Penyalur

  3H20 Nama Penyalur PT. Jaya Elektronik Alamat JL. Margonda Raya 100

  Penemuan Pengetahuan Dalam Database

I.Data Ware Housing/Gudang data

  Merupakan kumpulan data dari berbagai sumber yang disimpan dalam suatu gudang • data (repository) dalam kapasitas besar dan digunakan untuk proses pengambilan keputusan Perkembangan dari konsep database yang menyediakan sumber daya data yang lebih • baik Sangat besar, berkualitas tinggi dan mudah di ambil •

  KARAKTERISTIK DATA WAREHOUSE

1.Subject Oriented

  Pada sistem operasional, data disimpan berdasarkan aplikasi. Set data hanya terdiri dari data yang dibutuhkan oleh fungsi yang terkait dan aplikasinya. Sedangkan pada data perusahaan manufaktur subjek bisnis yang penting, yaitu penjualan, pengangkutan, dan penyimpanan barang.

  2. Integrated

  Data yang tersimpan dalam data warehouse berasal dari sumber-sumber terpisah ke format konsisten dan saling terintegrasi

  3.Time variant

  Pada data warehouse, data yang tersimpan adalah data historis dalam kurun waktu tertentu, bukan data terkini. Oleh karena itu data yang tersimpan mengandung keterangan waktu, misalnya tanggal, minggu, bulan, catur wulan, dan sebagainya. Karakteristik time variant pada data warehouse memiliki karakteristik sebagai berikut :

  Melakukan analisa terhadap hal di masa lalu. • Mencari hubungan antara informasi dengan keadaan saat ini. • Melakukan prediksi hal yang akan datang. • 4. Non-volatile.

  Data tidak diupdate secara real time tapi di refresh dari sistem operasional.Secara reguler dan kotinyu meresap data baru secara incremental disatukan dengan data sebelumnya

  II.Data Mart

  • Suatu bagian pada data warehouse yang medukung pembuatan laporan dan analisa data pada satu unit,bagian atau operasi pada suatu perusahaan. Miniature data warehouse • Memberikan informasi kepada segmen fungsional organisasi •

  III.Data Mining

  Data mining adalah serangkaian proses untuk menggali suatu basis data menjadi • informasi yang lebih berharga. Data mining biasa juga dikenal nama lain seperti Knowledge discovery (mining) in • database (KDD), ekstaksi pengetahuan (knowledge extraction), Analisa data/pola dan kecerdasan bisnis (business intelligence) dan merupakan alat yang penting untuk memanipulasi data untuk penyajian informasi sesuai kebutuhan user dengan tujuan untuk membantu dalam analisis koleksi pengamatan perilaku , secara umum definisi data mining dapat diartikan sebagai berikut :

   Proses penemuan pola yang menarik dari data yang tersimpan dalam jumlah besar  Ekstraksi dari suatu informasi yang berguna atau menarik (non-trivial), implicit, sebelumnya belum diketahui potensial kegunaannya) pola atau pengetahuan dari data yang disimpan dalam jumlah besar.

   Ekplorasi dari analisa secara otomatis atau semiotomatis terhadap data dalam jumlah besar untuk mencari pola atau aturan yang berarti.

  Solusi yang diberikan Datamining Menebak target pasar, megelompokkan model-model pembeli dan melakukan •

  klasifikasi dengan karakteristik yang diinginkan

  Melihat pola beli dari waktu ke waktu, melihat pola beli pembeli dari waktu ke •

  waktu

  • Cross market analysis, melihat hubungan antara 1 produk dengan produk lainnya

  Profil pelanggan, Data mining bisa membantu pengguna untuk melihat profil •

  pembeli sehingga dapat diketahui kelompok pembeli tertentu cenderung kepada suatu produk apa saja.

  Informasi summary, Data mining dapat membuat laporan summary yang bersifat • multi dimensi dan dilengkapi dengan informasi statistik lainnya. Konsep Data Mining

  Data mining sangat perlu dilakukan terutama dalam mengelola data yang sangat besar untuk memudahkan aktifitas recording suatu transaksi dan untuk proses data warehousing agar dapat memberikan informasi yang akurat bagi penggunanya.

  

Alasan utama mengapa data mining sangat menarik perhatian industri informasi

dalam beberapa tahun belakangan ini adalah : Tersedianya data dalam jumlah yang besar • Semakin besarnya kebutuhan untuk mengubah data tersebut menjadi

  • informasi dan pengetahuan yang berguna karena sesuai fokus bidang ilmu ini yaitu melakukan kegiatan mengekstraksi atau menambang pengetahuan dari data yang berukuran/berjumlah besar, informasi ini yang nantinya sangat berguna untuk pengembangan, berikut langkah- langkahnya :

  1. Data cleaning (untuk menghilangkan noise data yang tidak konsisten) Data integration (di mana sumber data yang terpecah dapat disatukan)

  2. Data selection (dimana data yang relevan dengan tugas analisis dikembalikan ke dalam database)

  

3. Data transformation (dimana data berubah atau bersatu menjadi bentuk

yang tepat untuk menambang dengan ringkasan performa atau operasi agresi)

  

4. Knowledge Discovery (proses esensial dimana metode yang intelejen

digunakan untuk mengekstrak pola data)

  

5. Pattern evolution (untuk mengidentifkasi pola yang benar-benar menarik

yang mewakili pengetahuan berdasarkan atas beberapa tindakan yang menarik)

  

6. Knowledge presentation (dimana gambaran teknik visualisasi dan

pengetahuan digunakan untuk memberikan pengetahuan yang telah ditambangkan kepada user)