SISTEM BERKAS

Silabus
1. Pendahuluan
2. Manajemen Data dan Konsep Database

3. Media Penyimpanan Berkas
4. Parameter Media Penyimpanan Sekunder dan
5. Metode Blocking

6. Organisasi File
* File Pile
* File Sequensial
* File Indeks Sequensial

* File Indeks Majemuk
* File Hash
* File Multiring

7. Collision

2


Daftar Pustaka
1.
2.

3.
4.

5.

Gio Wiederhold, File Organization for Database Design, Mc
Graw Hill Int. Editions, 1987
Alan L. Tharp, File Organization and Processing, John Wiley
& Sons, 1988
C. J. Date. An Introduction to Database Systems. (6th ed).
Addison Wesley 1994
Bambang H, Pengarsipan dan Akses pada Sistem Berkas,
Informatika - Bandung, 2000
Dewi Handayani, Sistem Berkas, J & J Learning – Yogyakarta,
2001
3


Tujuan Mempelajari Sisber
1. Dapat memahami organisasi berkas serta manipulasinya.

2. Dapat menjelaskan organisasi berkas dan manajemen.
3. Dapat menjelaskan file storage.
4. Dapat menjelaskan macam-macam device

5. Manipulasi file : sorting dan merging.
6. Mampu bekerja dengan berbagai jenis organisasi berkas.

4

Pendahuluan
Konsep Sistem Berkas
Representasi Data
Klasifikasi Data

Definisi Umum
Macam – Macam File

Model Akses File

Organisasi File & Teknik Pengaksesan
Model penggunaan
Model Operasi File

5

Konsep Sistem Berkas (1)
1. Tujuan proses komputasi : menghasilkan informasi yang

dibutuhkan (sesuai dengan requirement user) dalam waktu
yang masih dapat diterima oleh user.
2. Waktu komputasi pada volume data yang diproses/diolah.
3. Pengelolaan data dalam jumlah besar membutuhkan effort
lebih, baik dalam hal storage device dan pengelolaannya (cara
penyimpanan dan pengaksesannya). Data tsb harus :
– dapat diakses oleh multi user
– selalu tersedia setiap saat dibutuhkan untuk pemrosesan
– waktu pengaksesan relatif cepat

– tersimpan dalam media penyimpanan sekunder

6

Konsep Sistem Berkas (2)
Secara Umum :
Sistem Berkas : sistem penyimpanan, pengorganisasian,
pengelolaan data pada alat penyimpan eksternal, dengan
menggunakan teknik organisasi data tertentu
Lebih spesisfik :
Sistem Berkas dan Akses berkaitan dengan bagaimana cara
melakukan insert data, update serta reorganisasi data

7

Representasi Data
Ada dua jenis yaitu :
Secara Lojik
Penggambaran data di level konseptual, misal
penggambaran data dengan metode E-R, model objek,

model semantik, dan lain-lain.
Secara Fisik
Penggambaran data di level fisik, bagaimana data
direpresentasikan dalam media penyimpanan

8

Klasifikasi Data
1. Data Tetap

– Kelompok data yang tidak mengalami perubahan, paling
tidak dalam kurun waktu yang lama.
– Contoh : Data pribadi mahasiswa.
2. Data Tidak Tetap
– Kelompok data yang secara rutin mengalami perubahan.
– Contoh : Data rencana studi mahasiswa.
3. Data Yang bertambah menurut waktu
– Kelompok data ini biasanya merupakan data akumulasi
dari
kelompok data tetap dan data tak tetap.

– Contoh : Data transkrip.
9

Definisi Umum (1)
1. Basis data (Database)
Sekumpulan data yang saling berhubungan. Data yang tersimpan
dalam data base merupakan kumpulan dari beberapa file. Data
base dapat didefinisikan dalam sejumlah sudut pandang seperti :
 Himpunan kelompok data yang saling berhubungan yang
diorganisasikan sedemikian rupa agar kelak dapat dimanfaatkan
kembali dengan cepat dan mudah;
 Kumpulan data yang saling berhubungan yang disimpan secara
bersama sedemikian rupa dan tanpa pengulangan (redudansi)
yang tidak perlu, untuk memenuhi berbagai kebutuhan;
 Kumpulan file yang saling berhubungan yang tersimpan dalam
media penyimpanan elektronis.

10

Definisi Umum (2)

2. File
Sekumpulan record yang menyatakan kumpulan entitas yang
terogranisir dan tersimpan pada media penyimpanan elektronis
Karakteristik File
 Persistance (Bertahan Lama)
Suatu kemampuan untuk dapat diakses pada masa yang akan datang;
 Sharability (Multi User)
Dapat digunakan secara bersama-sama oleh banyak pemakai dan program
komputer;
 Size (Ukuran)
Memiliki ukuran yang relatif cukup besar dibandingkan memory utama

11

Definisi Umum (3)
3. Record
Sekumpulan field yang saling berhubungan dan terorganisir
dengan baik didalam File.
Klasifikasi Record
 Fixed Length

Semua field didalam record yang mempunyai panjang yang tetap
 Variable Length
Field – field yang terdapat didalam record memiliki panjang yang
berbeda-beda

12

Definisi Umum (4)
4. Field
 Berisi nilai dasar (basic values) yang membentuk suatu record
 Atribut yang berisi suatu item data tertentu
 Terdiri dari komponen tipe data dan nilai (value).

Klasifikasi Field
 Fixed Length Field
Field dengan ukuran tetap;
 Variable Length Field
Field dengan ukuran yang berbeda-beda.

13


Macam – Macam File (1)
Ada beberapa macam file, diantaranya adalah :
- Master File (File Induk)
- Transaction File (File Transaksi)
- Report File (File Laporan)
- Work File (File Kerja)
- Program File (File Program)
- Text File (File Teks)
- Dump File (File Tampung)
- Library File (File Pustaka)
14

Macam – Macam File (2)
Master File (File Induk ), File induk yang menjadi acuan utama
suatu proses; Contoh Master File dalam organisasi sebuah pabrik :
* Payroll Master File
* Customer Master File
* Personnel Master File
* Inventory Master File

Ada 2 jenis Master File :
1. Reference Master File;
– File yang berisi record yang tak berubah / jarang berubah.
– Contoh : Berkas pelanggan yang berisi field nomor rekening,
nama dan alamat.
2. Dynamic Master File;
– File yang berisi record yang terus menerus berubah dalam kurun
waktu tertentu atau berdasarkan suatu peristiwa transaksi.
– Contoh : * Berkas stock barang * Berkas pemesanan tempat
duduk
1.

15

Macam – Macam File (3)
2. Transaction File (File Transaksi)
 File yang berisi informasi yang digunakan untuk
memperbaharui file induk.
 Dalam suatu periode tertentu dilakukan reorganisasi file
induk yang melibatkan file transaksi dan menghasilkan file

induk yang baru.
3. Report File (File Laporan)
 Adalah file yang berisi data untuk keperluan pembuatan
laporan
 File tersebut dapat dicetak pada kertas atau hanya
ditampilkan di layar.
16

Macam – Macam File (4)
4. Work File (File Kerja)
 Merupakan file sementara dalam sistem.
 Suatu work file merupakan alat untuk melewatkan data yang
dibuat oleh sebuah program ke program lain. Biasanya file ini
dibuat pada waktu proses sortir.
5. Program File (File Program)
 Adalah file yang berisi instruksi untuk memproses data yang
akan disimpan pada file lain / pada memori utama.
 Instruksi tersebut dapat ditulis dalam bahasa tingkat tinggi
(COBOL, FORTRAN, BASIC, dan lain-lain), bahasa assembler
dan bahasa mesin.
17

Macam – Macam File (5)
6. Text File (File Teks)
 Adalah file yang berisi input data alphanumeric dan grafik
yang
digunakan oleh sebuah text editor program.
 Text file hanya dapat diproses dengan text editor
7. Dump File (File Tampung)
 Adalah file yang digunakan untuk tujuan pengamanan
(security), mencatat tentang kegiatan peng-update-an,
sekumpulan transaksi yang telah diproses atau sebuah
program yang mengalami kekeliruan..
18

Macam – Macam File (6)
8. Library File (File Pustaka)
 Adalah file yang digunakan untuk penyimpanan program
aplikasi, program utilitas atau program lainnya
9. File Histori
 Merupakan file yang menyimpan data dalam suatu periode
waktu tertentu yang telah lampau, biasanya digunakan
untuk menyusun laporan statistik atau rekapitulasi

19

Model Akses File (1)
Ada 3 model akses yang dilakukan oleh sebuah program
terhadap file, yaitu :
 Input, file yang hanya dapat dibaca dengan program.
Contoh :
– Transaction file merupakan input file untuk meng-update
program
– Program file dari source code merupakan input file untuk
program compiler

20

Model Akses File (2)
 Output, adalah file yang hanya dapat ditulis oleh sebuah

program / file yang dibuat dengan program.
Contoh :
– Report file merupakan output dari program yang mengupdate
master file.
 Input / Output File, adalah file yang dapat dibaca dari dan
ditulis selama eksekusi program.
Contoh :
– Master File (Berkas Induk)
– Work File (Berkas Kerja)

21

Organisasi File & Teknik Pengaksesan (1)
1. Organisasi File
 Adalah suatu teknik atau cara yang digunakan untuk

menyatakan dan menyimpan record-record dalam sebuah file.
 Ada beberapa teknik dasar organisasi file, yaitu :
* File Pile
* File Sequensial
* File Indeks Sequensial
* File Indeks Majemuk
* File Hash
* File Multiring

22

Organisasi File & Teknik Pengaksesan (2)
2. Teknik Pengaksesan

Ada 2 jenis teknik pengaksesan, yaitu :


Direct Access
Adalah suatu cara pengaksesan record yang langsung, tanpa
mengakses seluruh record yang ada. Contoh : Magnetic Disk
 Sequential Access
Adalah suatu cara pengaksesan record, yang didahului dengan
pengaksesan record-record di depannya. Contoh : Magnetic
Tape

23

Organisasi File & Teknik Pengaksesan (3)
Faktor-faktor yang mempengaruhi dalam proses pemilihan
organisasi file adalah :
1. Karakteristik dari media penyimpanan yang digunakan
2. Volume dan frekuensi dari transaksi yang diproses
3. Respontime yang diperlukan
Cara memilih organisasi file tidak terlepas dari 2 aspek utama,
yaitu :
1. Model Penggunaannya
2. Model Operasi File

24

Model Penggunaannya
Ada 2 cara, yaitu :
a. Batch;
Suatu proses yang dilakukan secara group atau kelompok.
b. Interactive;
Suatu proses yang dilakukan secara satu persatu, yaitu
record demi record

25

Model Operasi File (1)
Model operasi file ada 4 cara :
1. Creation;
 Membuat struktur file lebih dahulu menentukan banyak
record baru, kemudian record-record dimuat ke dalam file
tersebut.
 Membuat file dengan cara merekam record demi record
2. Update;
 Untuk menjaga agar file tetap up to date.
 Update yang dilakukan antaranya Insert / Add, Modification,
Deletion

26

Model Operasi File (2)
3. Retrieval;
 Pengaksesan sebuah file dengan tujuan untuk
mendapatkan informasi.
– Inquiry;
• Volume data rendah, model proses interactive.

– Report Generation;
• Volume data tinggi, model proses batch

27

Model Operasi File (3)
File Retrieval terbagi 2, yaitu :
a. Comprehensive Retrieval;
– Mendapatkan informasi dari semua record dalam sebuah
file. Contoh : * Display all
* List nama, alamat
b. Selective Retrieval;
– Mendapatkan informasi dari record-record tertentu
berdasarkan persyaratan tertentu.
– Contoh : * List for gaji = 100000
* List nama, npm, for angkatan = 93

28

Model Operasi File (4)
4. Maintenance

Perubahan yang dibuat terhadap file dengan tujuan memperbaiki
penampilan program dalam mengakses file tersebut.
 Restructuring
• Perubahan struktur file.
• Misalnya : Panjang field diubah, penambahan field baru,
panjang record dirubah.
 Reorganization
• Perubahan organisasi file dari organisasi yang satu menjadi
organisasi file yang lain.
• Misalnya :– Dari organisasi file sequential menjadi indeks
sequential.

29

MANAJEMEN DATA
DAN
KONSEP DATABASE

MANAJEMEN DATA
 Pengertian

dan Tujuan Manajemen

Data
 Kegiatan Manajemen Data

2

PENGERTIAN DAN TUJUAN MANAJEMEN
DATA


Manajemen Data adalah bagian dari manajemen
sumber daya informasi yang mencakup semua
kegiatan yang memastikan bahwa data :





Data Akurat
Up to Date (mutakhir)
Aman
Tersedia bagi pemakai (user)

3

KEGIATAN MANAJEMEN DATA (1)


Kegiatan manajemen data mencakup :
• Pengumpulan Data
• Integritas dan pengujian
• Penyimpanan
• Pemeliharaan
• Keamanan
• Organisasi
• Pengambilan

4

KEGIATAN MANAJEMEN DATA (2)
KETERANGAN :
 Pengumpulan Data
Data yang diperlukan dikumpulkan dan dicatat dalam suatu formulir yang disebut
dokumen sumber yang berfungsi sebagai input bagi sistem.
 Integritas dan pengujian
Data tersebut diperiksa untuk meyakinkan konsistensi dan akurasinya berdasarkan
suatu peraturan dan kendala yang telah ditentukan sebelumnya.
 Penyimpanan
Data disimpan pada suatu medium, seperti pita magnetik atau piringan magnetik.
 Pemeliharaan
Data baru ditambahkan, data yang ada diubah, dan data yang tiak lagi diperlukan
dihapus agar sumberdaya data (berkas) tetap mutakhir.
 Keamanan
Data dijaga untuk mencegah penghancuran, kerusakan, atau penyalahgunaan.
 Organisasi
Data disusun sedemikian rupa untuk memenuhi kebutuhan informasi pemakai.
 Pengambilan
Data tersedia bagi pemakai.

5

KONSEP DATABASE





Pengertian Database
Perangkat Lunak Database
Menciptakan Database
Menggunakan Database

6

PENGERTIAN DATABASE





Database adalah Sekumpulan data yang saling berhubungan
atau berelasi merepresentasikan suatu organisasi dan
tersimpan dalam media penyimpanan eksternal.
Tujuan utama dari database adalah :
Menghindari pengulangan data (redudansi)
Mencapai independensi data (kemampuan untuk membuat
perubahan dalam struktur data tanpa membuat perubahan
pada program yang memproses data ). Independensi data
dicapai dengan menempatkan spesifikasi dalam tabel dan
kamus yang terpisah secara fisik dari program.

7

PERANGKAT LUNAK DATABASE






Perangkat Lunak yang menetapkan dan memelihara
integritas logis antar file , baik eksplisit maupun
implisit, disebut sistem manajemen database (DBMS)
Inovasi DBMS menampilkan perangkat lunak
relasional, dan sejumlah paket awal ditujukan bagi
pemakai mainframe.
SQL/DS (Structure Query Language/ Data Systems)
dan QBE (Query by Example) dari IBM dan Oracle dari
Relational Software Inc.

8

MENCIPTAKAN DATABASE
Proses menciptakan database mencakup tiga langkah utama, yaitu :
 Menentukan Kebutuhan Data
Pada langkah ini dilakukan pendefinisian masalah, pemecahan
masalah, dan pemrosesan untuk menetapkan data.
 Menjelaskan data
Setelah elemen – elemen data yang diperlukan ditentukan, mereka
dijelaskan dalam bentuk kamus data. Kamus data adalah suatu
ensiklopedi dari informasi mengenai tiap elemen data. Sistem kamus
data dapat berupa kertas dan file komputer. Jika berupa file,
perangkat lunak khusus diperlukan untuk menciptakan dan
memeliharanya, serta mempersiapkannya untuk digunakan.
Perangkat lunak tersebut disebut sistem kamus data.
 Memasukan data
Setelah skema dan sub skema diciptakan, data dapat dimasukan
kedalam database. Hal ini dapat dilaksanakan dengan mengetik
data langsung kedalam DBMS, membaca data dari pita atau piringan,
atau men-scan data secara optis. Data siap digunakan setelah berada
dalam database.

9

MENGGUNAKAN DATABASE




Pemakai database dapat berupa orang / program aplikasi.
Orang biasanya menggunakan database dari terminal dan
mengambil data dan informasi dengan menggunakan query
laguage. Query adalah permintaan informasi dari database,
dan query laguage adalah bahasa khusus yang user friendly
yang memungkinkan komputer dapat menjawab query.
Program aplikasi menggunakan/mengambil database atau
menyimpan data kedalamnya, data manipulation language
(DML) khusus digunakan. Pernyataan – pernyataan DML
ditanamkan dalam program aplikasi di titik-titik yang perlu.

10

MEDIA PENYIMPANAN BERKAS

Media Penyimpanan Berkas
2

 Pendahuluan
 Internal Memory
a.
b.

ROM
RAM

 Eksternal Memory
a.

Magnetic Tape

b.

Magnetic Disk

Pendahuluan (1)
3

 Media penyimpanan berkas dalam komputer disebut memori
atau storage atau gudang
 Media penyimpanan menentukan kemampuan komputer dalam
hal penyimpanan data
 Media penyimpanan berkas ada 2 macam yaitu Internal memori
dan Eksternal memori
 Internal memori merupakan memori yang terletak didalam CPU
(Main memory)
 Eksternal memori merupakan memori yang terletak diluar CPU
(Secondary storage)

Pendahuluan (2)
4

Berdasarkan hilang atau tidaknya berkas data atau file
program di dalam storage, yaitu :
1. Volatile Storage

Berkas data atau program akan hilang, bila listrik
dipadamkan.
2. Non Volatile Storage
Berkas data atau program tidak akan hilang, sekalipun
listrik dipadamkan.

Internal Memory
5

 Komponen elektronik yang digunakan untuk

menyimpan instruksi, data dan hasil pengolahannya
 Kecepatan akses tinggi, kapasitas lebih kecil dan
berharga mahal
 Setiap data yang disimpan akan ditempatkan dalam
suatu alamat (address) tertentu yang bersifat unik
untuk mempercepat dalam pencarian data
 Satuan data memori adalah Byte, KB, MB, GB, TB
 Ada 2 macam internal memori yaitu ROM (Read Only
Memory) dan RAM (Random Access Memory)

ROM (Read Only Memory) (1)
6

 Untuk menyimpan berbagai program yang berasal dari

pabrik pembuat komputer
 Sifatnya hanya bisa dibaca oleh pemakai
 Berisi instruksi / program khusus untuk memaksimalkan
kerja komputer
 Berupa program BIOS (Basic Input Output System) yang
berfungsi :
1. Untuk mengendalikan perpindahan data antara
microprocessor dengan komponen lain seperti keyboard,
monitor, dsb.
2. Mempunyai sifat self-diagnotik yaitu kemampuan untuk
memeriksa kondisi yang ada didalam dirinya
 Program Lingkage/Bootstrap bertugas untuk memindahkan
sistem operasi yang tersimpan didisk kedalam RAM

ROM (Read Only Memory) (2)
7

Tipe-tipe dari ROM adalah :
1. PROM (Programmable Read Only Memory)

Jenis dari memori yang hanya dapat diprogram. PROM
dapat diprogram oleh user / pemakai, data yang
diprogram akan disimpan secara permanen.
2. EPROM (Erasable Programmable Read Only
Memory)
Jenis memori yang dapat diprogram oleh user. EPROM
dapat dihapus dan diprogram ulang.
3. EEPROM (Electrically Erasable Programmable Read
Only Memory)
Memori yang dapat diprogram ileh user. EEPROM
dapat dihapus dan diprogram ulangs ecara elektrik
tanpa memindahkan chip dari circuit board.

RAM (Random Access Memory)
8

 Adalah bagian dari memori yang bisa digunakan oleh pemakai untuk

menyimpan program dan data (dalam bentuk sinyal-sinyal listrik)
 Sifatnya bisa dihapus/diedit dan berbentuk sebuah chip
 Terbagi menjadi 4 area yaitu :
1. Input Area : untuk menampung data input yang akan diolah

2. Program Area : untuk menampung program untuk pengolahan data
3. Working Area : untuk menampung kegiatan pengolahan data dan hasil

pengolahannya
4. Output Area : untuk menampung hasil pengolahan data yang akan

ditampilkan ke alat output

Eksternal Memory (1)
9

 Merupakan media penyimpanan yang digunakan

untukmenyimpan data, program dan hasil
pengolahan yang dapat digunakan dimasa yang akan
datang
 Disebut juga secondary storage
 Memiliki kecepatan akses rendah, memiliki
kapasitas besar dan berharga lebih murah
 Data – data yang disimpan sifatnya permanen
 Media yang digunakan biasanya media magnetik
untuk menyimpan datanya (guratan-guratan
magnetik)

Eksternal Memory (2)
10

Jenis Secondary Storage :
1. Serial/Sequential Access Storage Device
(SASD)
Contoh : Magnetic tape, punched card,
punched paper tape.
2. Direct Access Storage Device (DASD)
Contoh : Magnetic disk, Optical disk

Serial/Sequential Access Storage Device
(SASD)
11

Ada beberapa jenis yaitu :
 Punch card
 Paper tape
 Magnetic tape

Punch Card
12

 Dikembangkan tahun 1887 oleh Prof. Dr. Herman Hollerith

 Pertama kali digunakan untuk memproses data sensus di









Amerika tahun 1890
Terdiri dari 80 kolom, tiap kolom untuk merekam 1 karakter
satu kartu menampung 80 karakter
Tiap kolom terdiri dari 12 baris horizontal
Karakter yang direkam tiap kolom dilakukan dengan
melubangi baris-baris tertentu sesuai kode yang
digunakanHollerinth code
Kumpulan kartu plong disebut deck
Deck dari kartu plong sejenis akan membentuk file
Kartu plong disebut sebagai sebuah unit record

Paper Tape
13

 Merupakan lembaran kertas kontinous yang

umumnya berukuran lebar 2.5 cm (1 inch) atau 7/8
inch
 Karakter direkam dengan cara melubanginya,
dengan menggunakan paper tape punch
 Posisi pelubangan menggunakan kombinasi dari 5
baris lubang atau 8 baris lubang channel

Magnetic Tape (1)
14

 Merupakan model pertama dari pada secondary memory
 Merupakan media rekaman yang terbuat dari pita tape








tipis yang dilapisi partikel besi oksida/chrom
Oxide atau partikel lain yang bersifat magnetis
Data disimpan dalam frame yang membentang sepanjang
lebar tape. Frame-frame dikelompokkan dalam blok atau
record yang dipisahkan dengan gap.
Perekaman pada tape dilakukan dengan mengalirkan
sinyal listrik melalui head, menghasilkan jejak magnetik
pada tape.
Informasi pada tape dapat dihapus dan diisi kembali.

Magnetic Tape (2)
15

 Lebar pita 0.5 inch, tebal 0.15 inch
 Panjang pita : 300, 600, 1200, 2400 feet setiap reel
 Kapasitas dinyatakan dalam bit per inch, yang diukur







pada tiap track
Macamnya : reel to reel tape, cassette tape,
microcassette tape
Jumlah data yang ditampung tergantung pada model
tape yang digunakan.
Untuk tape yang panjangnya 2400 feet, dapat
menampung kira-kira 23.000.000 karakter.
Penyimpanan data pada tape adalah dengan cara
sequential

Magnetic Tape (3)
16

 Salah satu karakteristik yang penting dari tape adalah

Density (kepadatan) dimana data disimpan.
 Density adalah fungsi dari media tape dan drive yang
digunakan untuk merekam data ke media tape.
 Satuan yang digunakan density adalah bytes per-inch (bpi).
 Umumnya density dari tape adalah 1600 bpi dan 6250 bpi.
Bpi (bytes per-inch) ekivalen dengan characters per-inch.

Magnetic Tape (4)
17

 Data yang dibaca dari atau ditulis ke tape dalam suatu group

karakter disebut block.
 Suatu block adalah jumlah terkecil dari data yang dapat
ditransfer antara secondary memory dan primary memory
pada saat akses. Sebuah block dapat terdiri dari satu atau
lebih record.
 Diantara 2 block terdapat ruang yang kita sebut sebagai Gap
(interblock gap). Bagian dari tape yang menunjukkan data
block dan interblock gap.
 Panjang masing-masing gap adalah 0.6 inch. Ukuran block
dapat mempengaruhi jumlah data/record yang dapat
disimpan dalam tape.

Magnetic Tape (5)
18

Keuntungan penggunaan magnetic tape :
 Panjang record tidak terbatas
 Density data tinggi
 Volume penyimpanan datanya besar dan harganya murah
 Kecepatan transfer data tinggi
 Sangat efisien bila semua/kebanyakan record dari sebuah
tape file memerlukan pemrosesan seluruhnya (bersifat serial
/ sequential)
Keterbatasan penggunaan magnetic tape :
 Akses langsung terhadap record lambat
 Masalah lingkungan
 Proses harus sequential (bersifat SASD)

Direct Access Storage Device (DASD)
19

Ada beberapa jenis yaitu :
 Floppy Disk
 Hardisk
 Compact Disk

Floppy disk
20

 Lempengan plastik bundar dimana permukaannya dilapisi magnet











sebagai tempat untuk menyimpan guratan-guratan data
Untuk pembacaan dan penulisan membutuhkan suatu drive yang
disebut disk drive (shaft dan drive motor dengan kecepatan 360500 rpm)
Signal elektronik yang datang dari sistem kontrol menyebabkan
read/write bergerak
Tempat penyimpanan data didisket terbagi menjadi beberapa
track
Setiap track terdiri dari beberapa sector
Sector adalah bagian terkecil dimana data disimpan (1 sector
dapat menampung 256 karakter)
Secara fisik ukuran disket adalah 8 inci, 5,2 inci dan 3,5 inci
Kapasitas menampung data tergantung pada density (kerapatan
penyimpanan data)

Hard Disk
21

 Media penyimpanan yang memiliki kapasitas tinggi
 Bentuk umum terpasang dan menyatu dalam CPU (fixed

disk)
 Terdapat lempengen – lempengan logam bundar yang
disusun berlapis - lapis serta terdapat motor penggerak
lempengan logam dan read/write head - nya
 Jenis hard disk ada yang menggunakan piringan tunggal,
tetapi ada pula yang menggunakan beberapa disk yang
dikemas dalam satu bentuk (disk - pack)
 Kelebihan dari hard disk adalah kemampuan
menampung data yang sangat besar dan kecepatan akses
data yang tinggi

Compact Disk
22





Bentuk berupa lempengan cakra
Dapat menyimpan data dengan kecepatan dan kapasitas tinggi
Harga relatif lebih murah
Membutuhkan CD-ROM drive

Representasi data & Pengalamatan
23

 Data pada disk juga di block seperti data pada

magnetic tape.
 Pemanggilan sebuah block adalah banyaknya data
yang diakses pada sebuah storage device.
 Data dari disk dipindahkan ke sebuah buffer pada
main storage komputer untuk diakses oleh sebuah
program.
 Kemampuan mengakses secara direct pada disk
menunjukkan bahwa record tidak selalu diakses
secara sequential

Keuntungan & Kerugian
24

Keuntungan :
 Keuntungan PenggunaanMagnetic Disk
 Akses terhadap suatu record dapat dilakukan
secara sequential atau direct.
 Waktu yang dibutuhkan untuk mengakses suatu
record lebih cepat.
 Respon time cepat.
Kerugian :
 Harga lebih mahal.

1.
2.
3.
4.

5.

Jelaskan dan beri contoh apa yang dimaksud tentang file, record, field
dan juga karakter !!!
Apakah perbedaan dari direct access dan sequential access dan berilah
contohnya !!!
Kegiatan menejemen data mencakup apa saja sebutkan dan jelaskan
dengan singkat !!!
Jelaskan dan bandingkan apa yang dimaksud dengan :
a. Master file dan transaction file
b. File Sequential dan file random
c. Dump file dan library file
Apa yang anda ketahui tentang:
a. sistem berkas
b. Data
c. Perangkat Lunak
d. Query
e. sistem Kamus Data
f. Database

File Sequensial

File Sequensial
 Pendahuluan
 Performansi File Sequensial
 Latihan Soal

2

Pendahuluan
• Adanya keberurutan rekord-rekord di file menurut kriteria

tertentu  ordered file
• Karakteristik :
– Rekord berisi semua nilai data atribut dengan posisi
yang sama
– Adanya aturan/kriteria tertentu yang menjadi kunci
pengurutan data. Kunci bersifat unik
• Pengaksesan Record
– Sequential search until record is found
– Binary search can speed up access
3

PENDAHULUAN (2)
• Nama atribut tidak perlu ditulis di tiap rekord, tapi muncul






4

pada file header.
Dengan adanya konstrain sekuens dan rekord tetap maka
terjadi peningkatan effesiensi , tapi ada penurunan
fleksibilitas.
Rekord-rekord harus dijaga berdasar atribut kunci
Penyisipan dilakukan di akhir file atau di slot kosong
akibat penghapusan record
Penyisipan dilakukan dengan menggunakan file
transaction log. Jika ukuran file log sudah cukup besar,
maka dilakukan reorganisasi.

Pendahuluan (3)
 Secara periodik dilakukan merge antara file log dan

file utama/master file
 Komponen :
– File Utama
– File Transaction Log

5

Performansi File Sequensial
• R=aV

a
: jumlah atribut pada satu rekord
V
: Panjang rata-rata nilai atribut (byte)
• Fetch Rekord (TF)
– Pencarian menggunakan atribut bukan kunci (Sequensial)
*Belum ada File Log rata-rata, ½ file akan ditelusuri
TF = ½ waktu pencarian seluruh blok
= ½ b. B/t’ = ½. n R/t’
*Sudah ada file Log
o’ = ½ o
TFo= oI + (R/t’)
= ½ o (R/t’)
TF file sequensial dengan file log transaksi sebesar o adalah :
TF = ½ (n + o) R/t’
6

Performansi File Sequensial (2)
 Pencarian menggunakan atribut kunci (pencarian biner)

*Belum terbentuk log
TF = 2log (b) (s + r + btt + c)
= 2log (n/Bfr) (s + r + btt+ c)
*Sudah terbentuk log
TF = 2log (n/Bfr) (s + r + btt+ c) + ½ o (R/t’)

7

Performansi File Sequensial (3)
• TN = waktu transfer 1 blok x peluang ditemukannya

rekord dalam blok yang sama
= btt . 1/Bfr = R/t
• TI (Waktu Penyisipan rekord baru)
– Cari, geser, sisip
TI = TF + ½ (n/Bfr) (btt + TRW)
– Memakai log file
TI = s + r + TRW + (T Y/o)

8

Performansi File Sequensial (4)
• Waktu Update

– Bukan kunci
TU = TF + TRW
– Terhadap Kunci : find rekord, hapus rekord, sisipkan rekord
TU = TF(main) + TI (file log)
• Waktu Pembacaan Seluruh Rekord (Tx)
Tx = Tsort(o) + (n+o) R/t’
• Waktu Reorganisasi File (Ty)
Ty = Tsort (o) + nold(R/t’) + o(R/t’) + nnew(R/t’)
= Tsort (o) + 2(n+o)(R/t’)
• Waktu untuk pengurutan dengan metoda merge sort
TSORT(o)
= 2b * btt + 2b(2log b) btt
= 2 [1 + 2log (n/Bfr)] R/t’
9

Tugas
Diketahui File sequensial :
Parameter Hardisk
- Putaran disk = 8000 rpm
- Seek time = 5 ms
- Transfer rate = 2048 byte/ms
- TRW = 2r
Parameter Penyimpanan
- Ukuran blok = 4096 byte
- Ukuran Pointer blok = 8 byte
- IBG = 1024 byte
Parameter File
- Jumlah rekord di file = 100000
rekord
- Jumlah field = 8 field
10 - Panjang nilai = 25 byte

Parameter Reorganisasi
- Jumlah rekord file log = 5000
rekord
Parameter Pemrosesan
- Waktu pemrosesan = 2 ms
Hitung :
R, TF, TN, TI, TU, Tx, Ty jika metode
bloking :
1. Fixed
2. Variable length Spanned
3. Variable length Unspanned



Pendahuluan



Struktur dan Manipulasi



Parameter Performansi File

2






Struktur File yang sangat dasar dan
sederhana
Jarang digunakan tapi merupakan dasar
analisis untuk struktur file lain
Panjang record dapat saja tidak seragam dan
elemen datanya tidak perlu sama
Struktur file Pile biasanya data ditumpuk dan
tak ada keterkaitan antara ukuran record dan
blok
3








Salah satu organisasi file yang tidak
terstruktur
Tiap elemen data di pile berbentuk pasangan
nama atribut – nilai atribut (attribute name –
value pair)
Record baru akan ditambahkan diakhir file
Record dapat memiliki field yang berbeda
Pencarian secara linier keseluruh record akan
dilakukan ketika akan mencari sebuah record
4

5

R : Ukuran record yang akan disimpan dalam file
Pile
2. TF : Waktu yang dibutuhkan untuk mengambil
(fetch) satu rekord
3. TN : Waktu untuk mendapatkan satu rekord
berikutnya
4. TI : Waktu insert satu rekord
5. TU : Waktu update satu rekord
6. Tx : Waktu pembacaan seluruh rekord
7. TY : Waktu reorganisasi file
1.

6

• Record Size R , rekord size rata-rata
- R = a’ A+V+ ,
- dimana :
a’ = rata-rata jumlah atribut
A = ukuran rata-rata atribut (field)
V = ukuran rata-rata nilai
2 = nilai separator/ konstanta untuk pemisah antar field dan antar record

• Fetch Record TF
- Data tidak tersusun baik, maka TF relatif tinggi
- Rekord dicari secara serial, blok per blok atau record per record (jumlah
record yang ada)
- TF = / b B/t’ atau TF= / n R/t’
- Dimana :
TF = waktu pengambilan record tertentu
b= jumlah blok di pile
B = ukuran blok
n= jumlah record
R = ukuran record
t’= bulk transfer time

7

• Get next Record (TN)

Tidak ada pengurutan dalam pile, TN = TF
• )nsert Time T)
- Record baru disimpan di akhir file
- TI = s + r + btt + Trw
• Update Time TU
- Bila ukuran rekord tetap  TU = TF + Trw
- Bila berubah  TU = TF + Trw + TI
• Baca seluruh File Tx = n TF
• Reorganization Time (Ty)
- Ty = n+o R/t’ + n+o-d R/t’
- file akan bertambah dari n ke n+o-d
o : jumlah rekord yang ditambahkan ,o =ninsert+ v
ninsert : jumlah rekord yang diinsert
V : jumlah rekord yang diupdate dengan menandai yang didelete dan
menambah rekord baru.
d : jumlah rekord yang ditandai untuk didelete

8

Diketahui data suatu sistem dikelola menggunakan struktur Pile dengan
- Jumlah rekord di file = 10.600 rekord
- Jumlah field rata-rata = 5 field
- Panjang nama field rata-rata = 7 byte
- Panjang nilai rata-rata = 15 byte
Data tersebut akan disimpan pada harddisk dengan karakteristik
- Putaran disk = 6000 rpm
- Seek time = 5 ms
- Transfer rate = 2048 byte/s
- Waktu untuk pembacaan dan penulisan (TRW) = 2r
- Ukuran Blok = 1024 byte
- Ukuran pointer blok = ukuran record mark = 8 byte
- Ukuran IBG = 512 byte
- Jumlah record yang ditambah = 600 record
- Jumlah record yang ditandai dihapus =120 record
- Metode blocking yang digunakan adalah variable length spanned
blocking
9

Hitunglah :
a. Panjang rekord
b. Waktu Fetch sebuah rekord
c. Waktu mendapatkan next record
d. Waktu Insert sebuah rekord
e. Waktu Update
f. Waktu baca seluruh file
g. Waktu Reorganisasi
10

PARAMETER MEDIA
PENYIMPANAN SEKUNDER

PARAMETER MEDIA PENYIMPANAN SEKUNDER
2

Tujuannya digunakan untuk menganalisis
performansi struktur file berkas
 Secara umum ada 2 jenis parameter yaitu :
1. Waktu Pengaksesan Acak
2. Kecepatan Transfer Data


Waktu Pengaksesan Acak (1)
3

Ada 2 parameter utama yaitu :
1.
Access Delay Time
Adalah waktu yang diperlukan untuk mencari lokasi penyimpanan data pada
media penyimpanan sekunder. Access Delay Time ditentukan dua parameter
yaitu :
a.
Seek Time (s)
s  s  i
Adalah waktu cpergerakan head untuk mencapai track/jalur lokasi data pada
media penyimpanan sekunder.

b.

dimana : sc : Waktu pengkondisian Awal
i : Jarak yang ditempuh
δ : Waktu pergerakan antar track
Rotational Latency (r)
Adalah waktu pergerakan head untuk mencapai blok data pada media
penyimpanan sekunder.
r = ½ * ((60 * 1000)/RPM), dimana RPM : Jumlah putaran per menit

Waktu Pengaksesan Acak (2)
4

Data Transfer Time
Adalah waktu yang dibutuhkan untuk mentransfer data. Proses transfer data
dapat diukur dengansatuan byte/detik, kbyte/detik atau mbyte/detik.
Terdapat dua parameter utama yang bergantung kepada transfer rate
yaitu
a. Record Transfer Time
Adalah waktu transfer record dengan panjang record adalah R yaitu :
2.

TR = R/t
dimana : R= Ukuran Record
t = Transfer Rate
b.

Block Transfer Time
Adalah waktu transfer satu blok data.
Btt = B/t
dimana : B = Ukuran Blok
t = Transfer Rate

* Bulk Transfer Time

t’ = (t/2) * {R/(R+W)}

Waktu Pengaksesan Acak (3)
5









Nilai transfer rate (t) diinformasikan oleh pembuat media penyimpanan
sekunder.
Pembacaan dan penulisan berurut sederetan blok pada data besar maka
operasi pemindahan data harus melewati gap dan daerah-daerah bukan data.
Kemudian diakhir tiap track harus dilakukan seek. Selama seek time tidak ada
data yang ditransfer.
Untuk pembacaan data yang cukup besar didefinisikan bulk transfer time (t’).
t’ = (t/2) * {R/(R+W)}
dimana : R = Ukuran rekord
W = ukuran pemborosan tergantung metoda bloking
t = transfer rate

Kecepatan Transfer Data (1)
6

Waktu Pembacaan atau penulisan data pada media penyimpanan sekunder
bergantung kepada :
1. Ukuran blok
Ukuran blok yang sama pada media penyimpanan dapat menyebabkan
pemborosan ruang penyimpanan. Ukuran blok harus dipilih secara hati-hati
agar meminimumkan pemborosan. Ada beberapa metode blocking yaitu :
a. Fixed Blocking
Adalah satu blok terdiri dari sejumlah record dengan panjang record
tetap. Sehingga nilai blocking factornya : Bfr = B/R
dimana : B = Ukuran Blok
Record
R1R = Ukuran
R2
R3
R4
R5
R6

IBG

Block Size

Block terbuang

n

Kecepatan Transfer Data (2)
7

b. Variable Length Spanned Blocking
Blok berisi record-record dengan panjang yang tidak tetap, apabila satu record
tidak dapat dimuat di satu blok, sebagian record disimpan di blok lain. Sehingga
nilai blocking factornya : Bfr = (B-P)/(R+P)
dimana : B = Ukuran Blok
R = Ukuran Record
R2
R3
R3
R4
R5
R6

P R1
= Pointer
IBG

Block Size

n

Keuntungan :
• Dapat menampung record-record dengan ukuran yang lebih besar dari blok size
• Tidak ada pemborosan ruang karena blocking
Kerugian :
• Sulit dalam implementasi
• Record yang berada pada 2 blok membutuhkan waktu yang lama dlm pencarian
• File sulit diup-date

Kecepatan Transfer Data (3)
8

c. Variable Length Unspanned Blocking
Blok berisi record-record dengan panjang yang tidak tetap. Setiap record
harus dimuat disatu disatu blok ( tidak dipotong - potong atau direntangkan ke
blok lain). Sehingga nilai blocking factornya :
Bfr = (B - 1/2 R)/(R+P)
dimana : B = Ukuran Blok
R = Ukuran Record
R1
R2
R3
R4
R5
R6

P = Pointer
IBG






Block Size

Block terbuang

Block
terbuang

Keuntungan :
Implementasi lebih mudah dibandingkan dengan spanned blocking
Jumlah record perblock bervariasi
Kerugian :
Banyak ruang terbuang karena proses blocking
Ada kemungkinan recordnya panjang dan ada ruang kosong

n

Kecepatan Transfer Data (4)
9

2.

Track dan kapasitas



Penggunaan track apabila satu track sebagai satu blok maka panjang track
sama dengan blok terbesar yang dimungkinkan; sedangkan jika tidak maka
panjang track sama dengan jumlah blok dikalikan ukuran blok per track.



Interblock gap untuk mekanisme persiapan pengaksesan berikutnya dan
dapat mengurangi kapasitas penyimpanan yang sebenarnya. Blok berukuran
kecil meningkatkan jumlah gap yang berarti pemborosan.



Block pointer untuk mengidentifikasi posisi blok pada media penyimpanan
sekunder dan biasanya penamaannya harus unik. Block pointer biasanya
menempati lokasi khusus di disk untuk menyimpan nama blok. Ukuran blok
pointer adalah P

Kecepatan Transfer Data (5)
10

3. Pemborosan Ruang
Adalah besar ruang yang tidak digunakan untuk menyimpan data. Pemborosan
ruang terbagi menjadi :
a. Pemborosan karena gap (WG)
b. Pemborosan karena bloking (WR)
Nilai pemborosan ruang untuk tiap metode bloking adalah sebagai berikut :
 Fixed Blocking
W
= WG + WR atau
W
 WG = G/Bfr


Variable Length Spanned Blocking
W
= P + (P+G)/Bfr



Variable Length Unspanned Blocking
W
= P + (1/2 R + G)/Bfr

File Sequensial Berindeks
 Pengertian
 Struktur

File Sequensial Berindeks
 Indeks dan Parameter Indeks
 Algoritma Push-Trough
 Parameter Performansi File

2

File Sequensial Berindeks
File sequensial berindeks menambahkan
fasilitas sebuah indeks tunggal terhadap file
sequens sehingga pencarian dan pembaharuan
rekord berdasarkan atribut yang diindeks-kan
menjadi lebih efesien
 Ditujukan untuk keperluan akses data secara
langsung dan juga sequensial


3

Struktur File Sequensial
Berindeks
Komponen File Sequensial Berindeks :
• Main/Primary File (File Utama)
• Indeks
• Overflow Area

4

Struktur File Sequensial Berindeks


Contoh ilustrasi :

5

Indeks dan Parameter Indeks



a.

b.

Indeks berisi pasangan nilai atribut dengan pointer
acuan
File Indeks adalah kumpulan isian indeks untuk
mengacu record di file utama
Jenis Indeks ada 2 yaitu :
Indeks Statis  indeks yang diciptakan saat
reorganisasi dan tidak berubah karena
pembaharuan. Record baru ditempatkan difile
overflow dan dikaitkan kerecord sebelumnya
Indeks Dinamis Pembaharuan dilakukan pada file
utama bukan pada overflow

6

Indeks dan Parameter Indeks

a.

b.




Ada dua tipe pengaksesan pada indeks :
Block Anchor  Indeks tidak menunjuk
langsung ke record tetapi ke blok yang
memuat record
Record AnchorIndeks menunjuk langsung
ke record
Jika terdapat n rekord data, maka banyak entri
indeks diperlukan = n/Bfr
Tiap entri berukuran V+P byte (V=atribut
kunci, P = TID Pointer)
7

Parameter indeks

X = [ y log [n/Bfr]]
8

Algoritma Push-Trough
Rekord baru diinsert di posisi yang
sesuai
 Rekord sisa setelah rekord baru di-push
hingga akhir block
 Jika melebihi akhir block, push ke
overflow area


9

Contoh Implementasi Algoritma Push-Trough

10

Contoh Implementasi Algoritma Push-Trough

11

Parameter Performansi File


Ukuran Rekord (R)
R = aV+P
a : jumlah atribut
V : panjang rata-rata nilai atribut
P : ukuran pointer
• Jumlah rekord file sekuensial berindeks (n)
n = nm + o’
nm : jumlah rekord di file utama
o’ : jumlah rekord di overflow area
12

Parameter Performansi File

13

Parameter Performansi File

14

Parameter Performansi File

15

Parameter Performansi File

16

Parameter Performansi File

17

Parameter Performansi File

18

Tugas
Diketahui File sequensial berindeks: - Panjang nilai = 25 byte
Parameter Hardisk
- Putaran disk = 8000 rpm
- Seek time = 5 ms
- Transfer rate = 2048 byte/ms
- TRW = 2r
Parameter Penyimpanan
- Ukuran blok = 4096 byte
- Ukuran Pointer blok = 8 byte
- IBG = 1024 byte
Parameter File
- Jumlah rekord di file = 1000000
rekord
- Jumlah field = 8 field

Parameter indeks
- Ukuran indeks (V+P)= 20 byte
Parameter Reorganisasi
- File log transakasi = 5000 rekord
Parameter Pemrosesan
- Waktu pemrosesan block = 2 ms
Hitung :
fan-out (y), height (x), RTotal, TF, TN,
TI, TU, Tx, Ty jika metode bloking :
Variable length spanned blocking
!

19

Tugas
Diketahui File sequensial berindeks: - Panjang nilai = 25 byte
Parameter Hardisk
- Putaran disk = 8000 rpm
- Seek time = 5 ms
- Transfer rate = 2048 byte/ms
- TRW = 2r
Parameter Penyimpanan
- Ukuran blok = 4096 byte
- Ukuran Pointer blok = 8 byte
- IBG = 1024 byte
Parameter File
- Jumlah rekord di file = 1000000
rekord
- Jumlah field = 8 field

Parameter indeks
- Ukuran indeks (V+P)= 20 byte
Parameter Reorganisasi
- File log transakasi = 5000 rekord
Parameter Pemrosesan
- Waktu pemrosesan block = 2 ms
Hitung :
fan-out (y), height (x), RTotal, TF, TN,
TI, TU, Tx, Ty jika metode bloking :
Variable length spanned blocking
!

20





Struktur File Indeks Majemuk
BTree Insertion Algorithm
BTree Deletion Algorithm

1








Terdiri dari main file dan file-file index file
berindeks majemuk
Tidak ada rantai overflow
Tidak dikenal konsep atribut kunci  tidak
ada keterurutan berdasarkan atribut kunci
Pengubahan data langsung dilakukan terhadap
main file

2










Index bersifat multiple index, dinamis,record
anchored
Entri index terdiri dari atribut dan TID
Entri index terurut berdasarkan nilai atributnya
Next record diakses berdasarkan keterurutan
entri pada index-nya
Tiap index dapat bersifat multilevel
TID pada indeks berisi alamat block dan posisi
record
Perubahan pada main file berimplikasi terhadap
indeks-nya
Struktur indeks menggunakan BTree
3





Cari posisi yang sesuai bagi rekord baru, mulai
dari root BTree.
Jika tersedia space, insert new record sesuai
urutan, jika tidak terjadi overflow
Jika terjadi overflow :
- split menjadi dua node
- Pilih node tengah untuk naik ke level
berikutnya
- set pointer dari parent node ke child node

4




Diketahui BTree dengan kapasitas order d = 1
Gambarkan hasil Insert data :
cat, ant, dog, cow, rat, pig dan gnu pada
BTree tersebut.

5

6

7

8







Menghapus node daun (leaf node), tidak
melanggar kapasitas minimum
Menghapus non leaf node, ganti dengan satu
rekord dari daun, tidak melanggar kapasitas
minimum
Menghapus leaf node, melanggar kapasitas,
perbaiki dengan redistribusi rekord
Menghapus leaf node, melanggar kapasitas,
perbaiki dengan coalescing node

9

10

11

12

13

14

15

File Hash
 Konsep File Hash
 Fungsi Hash
 Collision

1

Konsep File Hash
• Merupakan organisasi file dengan metode akses

langsung (direct acsess), yang menggunakan suatu
fungsi untuk memetakan key menjadi address

2

Konsep File Hash(2)
• Fungsi yang digunakan disebut fungsi hash/KAT (key
to address transformation)
• Address yang dihasilkan dari hasil perhitungan fungsi
hash disebut dengan istilah home address
• Jadi, terdapat dua komponen dalam file hash :
- Ruang rekord, yang terdiri atas m slot address
- Fungsi hash, yang mentransformasi key menjadi
address
• Transfomasi key akan mudah jika key telah berupa nilai

integer, untuk key berupa karakter alphanumerik
terdapat proses prakondisi untuk mengubahnya
menjadi suatu nilai integer

3

Fungsi Hash
Ada beberapa fungsi hash yang dapat digunakan, seperti :
 Key Mod N, dengan N = jumlah slot address (ukuran tabel data)
Contoh : 25 mod 11 = 3
25 (mod 7) = 4
3 (mod 8) = 3
jika key bernilai negatif, maka bagi |key| dengan N untuk
dapatkan sisa r :
- untuk r = 0, maka k mod N = 0
- untuk r 0, maka k mod N = N-r
Contoh : -26 (mod 7)
=7–5=2
-371 (mod 8)
=8–3=5

4

Fungsi Hash(2)
 Truncation/substring, cara transformasi yang dilakukan

dengan mengambil hanya sebagian digit dari key
 Misal Nomor Kartu anggota club MAKRO Bandung 05

533107 70.
 Apabila diinginkan dipetakan ke tabel 10000 alamat,
maka 4 digit nomor dapat digunakan untuk alamat,
yaitu misal 3107

5

Fungsi Hash (3)
Folding (Metoda Pelipatan), dapat dilakukan dengan cara:
• Folding by boundary
contoh jika key = 123456789, maka transformasi ke 3 digit
address dengan teknik folding by boundary dapat dilakukan
dengan membagi digit key tsb dengan cara seolah-olah melipat
batas pembagian digit seperti berikut :
321
456
987+
654
• apabila kode – kode itu ditambahkan (tanpa carry) , maka
diperoleh 654.

6

Fungsi Hash(4)
Folding (Metoda Pelipatan), dapat dilakukan dengan cara:
• Folding by boundary
contoh jika key = 123456789, maka transformasi ke 3 digit
address dengan teknik folding by boundary dapat dilakukan
dengan membagi digit key tsb dengan cara seolah-olah melipat
batas pembagian digit seperti berikut :
321
456
987+
654
• apabila kode – kode itu ditambahkan (tanpa carry) , maka
diperoleh 654.

7

Fungsi Hash(5)
• Folding by shifting

contoh jika key = 123456789, maka transformasi ke 3 digit
address dengan teknik folding by boundary dapat
dilakukan dengan membagi digit key tsb dengan cara
seolah-olah menggeser batas pembagian digit seperti
berikut :

123
456
789 +
258

• apabila kode – kode itu ditambahkan (tanpa carry) ,
maka diperoleh 258
8

Fungsi Hash (5)
• Squaring
1. Metoda menentukan alamat dengan cara pengkuadratan kunci
kemudian hasilnya akan dilakukan truncation
2. Cara ini dilakukan agar terjadi kombinasi nilai kunci terdistribusi
dengan baik keseluruh alamat yang mungkin
3. Fungsi mid square adalah menghitung kwadrat key dan kemudian
menggunakan string bit tengah dari hasil sebagai alamat ke tabel
Contoh :
Key enam digit
:
123456
Dikwadratkan
:
15241383936
Apabila dikehendaki alamat 3 digit, maka dapat dipilih posisi 5 sampai
dengan 7, dengan demikian menghasilkan alamat 138.

9

Fungsi Hash (6)




Radix Conversion
Pada metoda ini kunci dianggap berbasis selain 10 dan kemudian dikonversi dalam basis 10
Contoh :1234 dianggap berbasis 11 berarti :
= (1*113) +(2*112)+(3*111)+(4*110)
= 1331 + 242 + 33 + 4
= 1610
Multiplicative Hashing
Floor dan Cell
x adalah bilangan bulat terbesar yang tidak melebihi x
x adalah bilangan bulat terkecil yang tidak lebih keci dibanding x
apabila x adalah bilangan bulat maka :
x = x =x
apabila x bukan bilangan bulat maka :
x +1= x
contoh :
3.14
=3
3.14 = 4
10







File multiring berorientasi pada pemrosesan subset
record yang efisien. Subset record didefinisikan sebagi
kelompok record berisi satu nilai yang sama.
Pendekatan multiring banyak digunakan pada sistem
basis data.
Subset record secara eksplisit dihubungkan dengan
menggunakan pointer. Penghubung mendefinisikan
urutan anggota dari subset. Satu record dapat menjadi
aggota dari beberapa subset. Tiap subset memiliki
record header yang beri informasi mengenai recordrecord anggotanya. Record-record header untuk
himpunan subset juga dapat dihubungkan dengan satu
penghubung.
Pada file multiring semua record mempunyai struktur
yang serupa tetapi isi dan ukurannya merupakan
fungsi multiring dimana record menjadi anggotanya.
File multiring dapat mamiliki sejumlah kategori record
berbeda.

Performansi File Multiring
1. Ukuran Record (R)
Proses pengestimasian akurat hanya dapat diperoleh dengan
mendaptarkan emua tipe serta frekuensi dan ukurannya karena tipe
tipe record berbeda yang berada pada file multiring.
R = a’ V

2. Waktu Pengambilan Rekord Tertentu (Tf)






Beberapa hal yang mendukung waktu pengambilan adalah jumlah
penghubung yang dicari dan panjang penghubung.
Pencarian untuk memperoleh record lengakap, sehingga x tingkat
harus dilewati. Panjang multiring (y) bergantung ukuran dari file,
jumlah tingkat dan cara pemartisian file menjadi multiring. Apabila
satu record akan di ambil, jumlah field hirarki harus seimbang dengan
jumlah argumen pencarian aF pada kunci pencarian. Untuk
pengambilan normal maka aF = x = ylog n dan guna penelusuran satu
tingkat, diperlukan pengaksesan y/2 record sedangkan untuk
pengaksesan record tingkat bawahmaka ditelusuri Sx.y record.
TF = [(x.y)/2] (s + r + btt)

3. Waktu Pengambilan Record Berikutnya (TN)



Proses pengambilan record berikutnya dilakukan mengikuti
penghubung.
TN= s + r + btt

4. Waktu Penyisipan Record (TI)





Proses penyisipan record waktunya dapat ditentukan dengan
menentukan terlebih dahulu ruang kosong yang sesuai dan
mencarisemua predesesor record yang baru. Kemudian ambil nilai link
yang tetapat. Setelah itu menset nilai tersebut ke record baru dan
menempatkan nilai posisi record baru kedalam area link pendahulu.
TI = a’link(TF + TRW) + s + r + btt + TRW
Dimana
a’link
= banyaknya pointer field

5. Waktu Pembaruan Record (TU)



Pada proses pembaruan record dilakukan pertama kali adalah mencari
rekord yang akan diperbarui dan kemudian melakukan penulisan ulang.
TU = TF + TRW

6. Waktu Pembacaan Seluruh Record (TX)




Pada proses ini diperlukan rancangan file yang baik agar tidak ada
recor yang dibaca lebih dari satu kali. Penelusuran terurut ruang tidak
mudah karena format record beragam. Kegiatan teknik yang terjadi
aitu pengaksesan terhadap header, kemudian pengaksesan terhadap
record anggota dan mengulangi untuk header berikutnya.
TX = n (1 + 1/y)(s + r + btt)

7. Waktu Reorganisasi File (TY)
Pada file multiring secara formal reoganisasi jarang dilaksanakan kecuali
apabila terjadi reformating.

COLLISION
 Collision

merupakan kondisi dimana terdapat lebih
dari satu key yang menempati slot address yang
sama
 Collision dapat diminimalisir dengan cara :
- Mengganti fungsi hash
- Mengurangi packing factor
 Packing Factor / packing density / load factor
adalah perbandingan antara jumlah data yang
tersimpan terhadap jumlah slot address yang
tersedia

1

COLLISION RESOLUTION
 Mengganti

fungsi hash atau mengurangi packing
factor hanyalah suatu teknik untuk mengurangi
terjadinya collision, tetapi tidak mengeliminasinya



Karenanya, diperlukan Collision Resolution, yaitu
prosedur untuk menempatkan data yang memiliki
home address yang sama, sedemikian hingga
banyaknya akses dari home address seminimum
mungkin

2

COLLISION RESOLUTION


Misalnya kita memiliki record A, B, dan C yang
sinonim dengan home addressnya ada di r, maka kita
membuat link untuk memindahkan record B ke posisi
s dari posisi r, kemudian record C akan menempati
lokasi t, sedangkan linknya diisi dengan ^ atau null.
Dengan Link

Tanpa Link
Record

Record

Link

^
R

r

A

S

A
B
X
C
^

s

B

T

.
.

t

C

^

.
.
.

3

METODA COLLISION RESOLUTION
 Metoda

collision resolution diklasifikasikan
sebagai berikut :
 Collision Resolution with Link
 Coalesced Hashing
 Collision Resolution without Link
 Progresive Overfl