TUGAS SISTEM DATABASE II Distributed Dat

TUGAS SISTEM DATABASE II
Review of:

Distributed Database Management System
Aspects of the Design of Distributed Databases
A New Data Re-Allocation Model for Distributed
Database Systems

Disusun oleh :
Felisita Tri Ayuningrum (11.6647)
Muhammad Miftakhul Romadlon (11.6800)
Yosefina Irwan (11.6961)
Kelompok 10 - 3KS1

SEKOLAH TINGGI ILMU STATISTIK
JAKARTA
2014
Distributed Database Management System | Kelompok 10

1


DAFTAR ISI
Abstract

1

1. PENDAHULUAN
2. ISI DAN PEMBAHASAN
2.1 Distributed Data Proccessing
2.2 Apa yang dimaksud dengan Sistem Database Terdistribusi?
2.3 Keuntungan dan kerugian dari Database Terdistribusi
2.4 Distributed Database Design
2.5 Alternative Desain Strategy
2.5.1
Top down design

2
3
3
4
5

7
7
7

2.5.2

Bottom-Up Desain

2.6 Transparansi SGBDD
2.7 Data Independence
2.8 Network Transparency
2.9 Transparansi dalam replikasi
2.10 Transparansi fragmentasi
2.11 Fragmen
2.12 Pernyataan Masalah dan Persyaratan Informasi
2.12.1 Deskripsi Masalah dan Notasi
2.12.2 Persyaratan Informasi
2.12.3 Informasi Database
2.12.4 Informasi Perilaku Query
2.12.5 Informasi Situs

2.12.6 Informasi Jaringan
2.13 Model yang Diusulkan dan Fungsi Biaya
2.14.1 Model yang Diusulkan
2.14 Prioritas Fragmen (FP)
2.15 Fungsi Harga
2.16 The Proposed Algorithm (Algoritma yang Diusulkan)
2.17 Experimental Results (Hasil Experimental)
2.17.1 Initial Allocation (Alokasi Awal)
2.17.2 Re-Allocation Process (Proses Pengalokasian Kembali)
2.18 Performance Evaluation (Evaluasi Kinerja)
3. PENUTUP
3.1 Kesimpulan
3.2 Kelebihan dan Kelemahan Paper
2.10 Transparansi fragmentasi
DAFTAR PUSTAKA

9
9
9
10

10
10
11
11
11
13
13
14
15
16
17
17
19
20
20
25
25
25
26
26

26
29
29
30

Abstract

Distributed Database Management System | Kelompok 10

2

Data-data yang telah terdistribusi akan diproses oleh system yang dapat
didistribusikan di antara beberapa komputer, serta dapat diakses dari salah satu
komputer tersebut.
Permasalahan desain database terdistribusi adalah dengan melibatkan
pengembangan model global, fragmentasi, dan alokasi data. Siswa diberikan model
entity-relationship konseptual untuk database dan deskripsi dari transaksi serta
lingkungan jaringan generik. Pendekatan bertahap mengenai solusi untuk masalah ini
dijelaskan berdasarkan nilai rata-rata asumsi mengenai beban kerja dan layanan.
Sebuah sistem manajemen database terdistribusi (SGBDD) adalah perangkat lunak

sistem yang memungkinkan proses manajemen dan pendistribusian BDD secara
transparan kepada pengguna (user). Sebuah SGBDD terdiri dari sebuah database
tunggal yang didekomposisi menjadi fragmen dengan kemungkinan beberapa fragmen
dikalikan, dan setiap fragmen atau salinan dari fragmen disimpan pada satu atau lebih
situs di bawah kendali DBMS lokal. Setiap situs mampu memproses permintaan
pengguna di sistem lokal, independen dari jaringan, dan mampu berpartisipasi dalam
pengolahan data di situs lain dalam jaringan. Selain itu, untuk mengatakan bahwa
suatu DBMS sudah terdistribusi maka CLE seharusnya memiliki permintaan global
yang minim.

1.

PENDAHULUAN

Distributed Database Management System | Kelompok 10

3

Sistem database terdistribusi (SBDD) memiliki dua pendekatan untuk
memenuhi pengolahan data, yaitu: sistem teknologi dan database jaringan komputer.

Sistem database telah berevolusi dari pengolahan data dimana setiap aplikasi
berfungsi untuk mendefinisikan dan memelihara data aplikasinya sendiri, serta
aplikasi lain berfungsi untuk mendefinisikan dan mengelola data secara terpusat.
Orientasi baru ini menyebabkan data independen, aplikasi tersebut menjadi kebal
terhadap perubahan organisasi data fisik atau logis dan sebaliknya. Sebuah motivasi
utama dalam menggunakan sistem database adalah integrasi data dan memberikan
akses terpusat dan dikendalikan untuk data. Di sisi lain, teknologi jaringan komputer
mempromosikan hal yang bertentangan dari berbagai upaya sentralisasi database. Hal
ini terlihat sukar khususnya untuk memahami bagaimana kedua pendekatan yang
kontras ini dapat diringkas dalam sebuah teknologi yang lebih kuat dan lebih
menjanjikan dari keduanya. Salah satu kunci untuk memahaminya adalah kesadaran
bahwa tujuan yang paling penting dari teknologi database adalah tidak terpusat, tapi
terintegrasi. Selain itu penting untuk digarisbawahi pula bahwa tidak ada istilah-istilah
yang tidak melibatkan istilah lain dalam pemahaman database terdistribusi.
Masalah desain penting yang berdampak besar terhadap
kinerja DDBS dan mengarah ke solusi optimal terutama di dalam
lingkungan terdistribusi yang dinamis adalah masalah fragmentasi,
replikasi, dan alokasi.
Ada tiga masalah penting yang harus diperhitungkan dalam
mendesain suatu database terdistribusi. Pertama, bagaimana relasi

global harus difragmentasi. Kedua, berapa banyak salinan fragment
yang harus direplikasi. Ketiga, teknik apa yang akan digunakan
untuk mengalokasikan fragmen ke situs jaringan yang berbeda dan
informasi apa yang akan difragmentasi dan dialokasikan.
Para

peneliti

telah

mengadopsi

berbagai

metode,

baik

probabilitas maupun heuristik untuk memecahkan masalah alokasi.
Metode


probabilitas

memberikan

banyak

skenario

untuk

menemukan solusi yang optimal tetapi mahal. Sedangkan metode
heuristik memberikan solusi yang mendekati optimal tetapi jarang

Distributed Database Management System | Kelompok 10

4

sekali


yang

benar-benar

optimal.

Kualitas

metode

heuristik

ditentukan oleh hasil yang diperoleh dari metode tersebut. Model
yang diusulkan di dalam paper ini lebih kepada pendekatan
heuristik

daripada

pendekatan


probabilitas,

meskipun

sedikit

menggabungkan kedua konsep tersebut.

2.

ISI DAN PEMBAHASAN

2.1

Distributed Data Proccessing
Pengolahan Data Terdistribusi adalah salah satu istilah yang psering

disalahgunakan dalam ilmu komputer dalam beberapa tahun terakhir. Istilah tersebut
digunakan untuk merujuk pada berbagai sistem seperti sistem multiprosesor,
pengolahan data dan jaringan komputer terdistribusi. Pemrosesan terdistribusi adalah
sebuah konsep yang sulit untuk memberikan definisi yang tepat, sehingga kami
memberi definisi dalam hal sistem database terdistribusi. Sebuah sistem komputasi
terdistribusi terdiri sejumlah elemen pengolahan otonom (tidak harus homogen) yang
saling berhubungan dengan jaringan komputer dan bekerja sama dalam melaksanakan
tugas-tugas (task) dari setiap pengguna. Dengan “pengolahan elemen” berarti
komputer dapat menjalankan program-programnya masing-masing.
Dalam konteks ini, terdapat pertanyaan: Apakah yang didistribusikan? Dalam
hal ini pengolahan logika adalah sesuatu yang harus didistribusikan. Definisi dari
sistem komputer yang diberikan di atas menyiratkan bahwa pengolahan logika atau
elemen pemrosesan telah didistribusikan. Berbagai fungsi dari sebuah sistem
komputer dapat dilakukan dengan membagi bagian perangkat keras atau perangkat
lunak. Lain halnya jika dilihat menurut distribusi data, yaitu data yang digunakan oleh
sejumlah aplikasi dapat didistribusikan ke beberapa node pengolahan dan akhirnya
kontrol dapat didistribusikan. Pelaksanaan pengendalian tugas yang berbeda dapat
didistribusikan, sehingga tidak dieksekusi oleh satu komputer saja. Dari sudut
pandang database terdistribusi, metode ini merupakan distribusi yang sangat
diperlukan dan sangat penting. Pertanyaan lain yang bisa diajukan adalah: Mengapa
mendistribusikan data? Jawaban klasik untuk pertanyaan ini adalah karena
pemrosesan terdistribusi struktur organisasi dalam perusahaan besar dengan
Distributed Database Management System | Kelompok 10

5

menggunakan metode ini berubah menjadi lebih baik dan sistem tersebut lebih
aman. Dari perspektif global, dapat dikatakan bahwa alasan utama untuk pemrosesan
terdistribusi adalah karena terdapat masalah besar dan rumit yang kita hadapi saat ini,
yaitu menggunakan variasi aturan terkenal yaitu “divide et impera”. Jika perangkat
lunak didistribusikan, maka pengolahan yang dibutuhkan dapat dibuat secara baik.
Oleh karena hal itu, maka terdapat pencerahan untuk memecahkan masalah-masalah
rumit. Pemecahan masalah dalam hal ini dilakukan dengan berbagi bagian yang lebih
kecil, yang dapat diselesaikan oleh kelompok perangkat lunak yang berbeda serta
terletak di komputer yang berbeda dan menghasilkan sistem yang berjalan pada lebih
banyak elemen pengolahan, tetapi dapat secara efektif melakukan tugas bersama.

2.2

Apa yang dimaksud dengan Sistem Database Terdistribusi?
Kami mendefinisikan database terdistribusi sebagai kumpulan database logika

yang saling terkait dan didistribusikan melalui jaringan komputer. Sebuah manajemen
database

terdistribusi

didefinisikan

sebagai

sistem

perangkat

lunak

yang

memungkinkan manajemen database terdistribusi dan membuat distribusi transparan
kepada pengguna (user).
Database terdistribusi adalah karakter virtual. Komponen-komponennya
disimpan pada database yang terpisah, yang terletak pada node yang terpisah dari
jaringan. Setiap node adalah suatu sistem dalam database, yang terdiri dari
databasenya sendiri, penggunanya dan DBMS lokal. Sistem terdistribusi dapat dilihat
sebagai suatu kemitraan antara DBMS lokal dan komponen baru di setiap node. Selain
hal itu, sistem ini menyediakan fungsi yang diperlukan untuk pasangan database.
Sebuah sistem basis data terdistribusi (SBDD) pun tidak hanya terdiri dari "kumpulan
file" yang dapat disimpan secara individual pada setiap node dari jaringan computer
namun juga hal-hal yang terkait dalam database tersebut. Berikut merupakan
gambaran dari jaringan antara berbagai site yang terhubung dalam suatu network
communication, dan di setiap site dapat mengakses dan mengolah database
(digambarkan dalam bentuk tabung). Hal ini dapat terlaksana karena menggunakan
sistem database yang terdistribusi, tidak terpusat.

Distributed Database Management System | Kelompok 10

6

Figure 1.1 Environment SBDD

2.3

Keuntungan dan kerugian dari Database Terdistribusi

Keuntungan:
-

Local Autonomy. Pengguna database layaknya seperti perhentian tertentu dalam
jaringan, yang memiliki kontrol data lokal, karena desentralisasi organization.
Data lokal disimpan secara lokal, di mana data secara logic berada dalam banyak
kasus serta dalam melaksanakan pengolahan yang telah tersimpan.
Contoh : pemerintahan di Indonesia khususnya untuk setiap daerah diberikan
suatu wewenang untuk melaksanakan otonomi daerah, yaitu dalam daerah tersebut
dapat mengolah data ataupun hal-hal yang terkait di daerahnya sendiri dan tetap
berpedoman dan bertanggung jawab terhadap daerahnya.

-

Performance Improvement. Eksekusi paralel dari beberapa tugas di tempat yang
berbeda, dapat mengurangi konflik akses data dan dapat meningkatkan baik
kecepatan pelaksanaan operasi pada database dan kecepatan akses ke informasi
yang tersimpan.
Contoh : terkait dengan poin sebelumnya yaitu mengenai otonomi daerah, hal
tersebut juga dapat mempermudah antara setiap daerah yang terintegrasi antara 1
daerah dengan daerah yang lainnya karena tergabung dalam suatu jaringan

Distributed Database Management System | Kelompok 10

7

sehingga meningkatkan pelaksanaan informasi dari setiap daerah dan kecepatan
akses juga lebih cepat.
-

Improving safety and available. Terdapat peningkatan keamanan dalam
penggunaan system database terdistribusi dan kesalahan pun dapat diminimalisir,
yaitu dalam hal kesalahan yang terjadi ketika data yang direplikasi pada beberapa
node, maka akan terjadi tidak tersedianya data dari sekumpulan data yang ada
ataupun masalah jaringan, yaitu data tidak dapat diakses (unavailable).

-

Expandability. Dalam lingkungan terdistribusi jauh lebih mudah untuk
meningkatkan ukuran database.

-

Partabilitas. Organisasi yang secara geografis telah didistribusikan melalui operasi
dan data dapat disimpan secara normal di tempat yang sama.

Kerugian :
-

Complexity. Permasalahan dalam SBDD lebih kompleks daripada yang terpusat,
termasuk masalah bersama, dan masih belum terselesaikan dalam lingkungan
terpusat. Masalahnya adalah kompleksitas programmer dan bukan pengguna.

-

Economic. Jika database Anda secara geografis tersebar, maka dibutuhkan
aplikasi yang digunakan untuk tempat penyimpanan data dan mengakses data,
sehingga hal-hal tersebut akan meningkatkan biaya komunikasi, membutuhkan
tambahan hardware dan software, yang meningkatkan biaya .

-

Distribution Control. Hal ini, yang juga merupakan keuntungan, menyebabkan
masalah waktu dan koordinasi .

-

Security. Hal ini juga diketahui kesulitan dalam mempertahankan kontrol yang
memadai keamanan jaringan, sehingga dalam database terdistribusi.

-

Adoption technology is difficult. Banyak perusahaan telah berinvestasi dalam
sistem database mereka yang tidak didistribusikan. Saat ini tidak ada alat atau
teknologi yang membantu pengguna untuk mengkonversi database terpusat
database terdistribusi .

2.4

Distributed Database Design

Distributed Database Management System | Kelompok 10

8

Sistem komputasi terdistribusi dirancang dengan melibatkan pengambilan
keputusan tentang penempatan data dan program dalam node jaringan computer serta
desain jaringan itu sendiri. Dalam kasus database terdistribusi, dengan asumsi bahwa
jaringan yang telah dirancang sudah dan terdapat salinan dari perangkat lunak DBMS
pada setiap node dalam jaringan di mana data disimpan, ditujukan untuk memusatkan
perhatian kita pada distribusi data.

2.5

Alternative Desain Strategy
Ada dua strategi utama untuk desain database terdistribusi yaitu desain top

down dan desain bottom-up.
Seperti nama yang telah diberikan kepada kedua design tersebut, maka strategi
ini adalah pendekatan yang sangat berbeda dengan proses desain. Tapi sebagian besar
aplikasi tidak begitu sederhana sehingga cocok sekali diterapkan dalam salah satu
strategi ini, sehingga sangat penting untuk mengetahui bahwa strategi ini harus
digunakan bersama-sama sebagai pelengkap satu sama lain.
2.5.3

Top down design
Pekerjaan ini dimulai dengan analisis kebutuhan yang mendefinisikan

lingkungan sistem. Dokumen ini melakukan persyaratan masuk untuk dua
kegiatan paralel yaitu: desain konseptual dan pandangan desain. Kegiatan
desain visual mendefinisikan antarmuka bagi pengguna akhir. Desain
konseptual adalah proses dimana sistem diperiksa untuk menentukan jenis
komponen entitas dan hubungan antara mereka. Desain konseptual dapat
diartikan sebagai integrasi pandangan pengguna. Hal ini sangat penting karena
model konseptual harus tidak hanya mendukung aplikasi yang sudah ada,
tetapi juga masa depan. Skema Konseptual global dan informasi tentang pola
akses dikumpulkan sebagai hasil dari pandangan desain didistribusikan
masukan langkah desain. Tujuannya adalah sekarang untuk merancang skema
konseptual melalui entitas distribusi lokal di seluruh node dari sistem
terdistribusi. Dalam model relasional, entitas yang sesuai hubungan. Daripada
mendistribusikan hubungan mereka divisi subrelatii digunakan, disebut

Distributed Database Management System | Kelompok 10

9

fragmen, dan mereka didistribusikan. Kegiatan desain sehingga didistribusikan
terdiri dari dua langkah: fragmentasi dan alokasi. Langkah terakhir dalam
proses desain adalah desain fisik, yang membuat hubungan antara skema
konseptual dan perangkat penyimpanan fisik lokal pada node yang sesuai data.
Entri dalam proses ini adalah skema konseptual lokal dan pola akses
informasi. Berikut skema pendekatan top down design.

Figure 1.2 Top-Down design process

2.5.2

Bottom-Up Desain
Pendekatan top-down cocok ketika kita sedang merancang sebuah

BDD mulai dari awal. Tapi itu sering terjadi bahwa beberapa database yang
Distributed Database Management System | Kelompok 10

10

sudah ada, dan kegiatan desain harus menyadari dan integrasi. Pendekatan
bottom-up cocok untuk lingkungan tersebut. Titik awal dalam merancang
bottom-up adalah skema konseptual lokal. Proses ini terdiri dalam integrasi
skema lokal dalam skema konseptual global.

2.6

Transparansi SGBDD
SGBDD Transparansi mengacu pada pemisahan semantik tingkat tinggi dari

sistem implementasi pada tingkat yang rendah. Dengan kata lain, menyembunyikan
rincian implementasi transparan kepada pengguna. Keuntungan dari situs transparan
DBMS

adalah

portabilitas,

reconfigurabilitatea,

menyediakan

lingkungan

pengembangan untuk aplikasi yang kompleks.

2.7

Data Independence
Independensi data adalah bentuk dasar dari SGBDD transparansi. Hal ini

mengacu pada kekebalan aplikasi untuk mengubah pengguna dalam mendefinisikan
dan mengorganisasi data, dan sebaliknya .
Anda dapat menyorot dua jenis data independen :
Independensi data logis mengacu pada kekebalan aplikasi pengguna dari
perubahan dalam struktur logika database. Jika aplikasi bekerja dengan subset dari
atribut dari sebuah hubungan, tidak akan sakit untuk menambahkan atribut baru ke
hubungan yang sama.
Physical data independence mengacu menyembunyikan rincian struktur
penyimpanan untuk aplikasi pengguna. Aplikasi ini tidak perlu dimodifikasi setiap
kali ada perubahan dalam organisasi data.
2.8

Network Transparency
Manajemen media database terdistribusi merupakan aset yang harus dikelola

oleh jaringan. Sebaiknya, pengguna akan dilindungi oleh rincian operasional jaringan.
Jika memungkinkan, jaringan yang ada harus tersembunyi. Kemudian tidak akan ada

Distributed Database Management System | Kelompok 10

11

perbedaan (dalam hal pengguna) antara aplikasi menggunakan database terpusat dan
orang-orang yang menggunakan database terdistribusi. Jenis transparansi disebut
transparansi jaringan.

2.9

Transparansi dalam replikasi
Hal ini diperlukan bahwa data yang didistribusikan oleh cara replikatif antara

mesin pada jaringan. Jadi data yang sama akan ditemukan di banyak mobil. Hal ini
meningkatkan kinerja sistem karena tuntutan yang berbeda dan bersaing pengguna
dapat lebih mudah puas. Sebagai contoh, data yang sering diakses oleh pengguna
dapat menyimpan mobilnya, dan bahwa pengguna lain dengan persyaratan akses yang
sama. Jika node jaringan tidak tersedia, data dapat diakses dari lokasi lain. Data apa
yang harus direplikasi di banyak anak-anak sangat tergantung pada aplikasi yang
mengaksesnya. Replikasi data tetapi menyebabkan beberapa masalah update. Fakta
bahwa pengguna tidak tahu berapa banyak salinan yang dibuat dan tidak tahu apa-apa
tentang keberadaan mereka, kita dapat memanggil replikasi transparan ( replikasi
Transparansi).

2.10

Transparansi fragmentasi
Hal ini dimaksudkan bahwa setiap objek database yang akan dibagi menjadi

fragmen kecil dan setiap fragmen diperlakukan sebagai objek database yang terpisah.
Hal ini disebabkan oleh alasan kinerja, ketersediaan dan kehandalan. Juga,
fragmentasi dapat mengurangi efek negatif dari replikasi.

2.11

Fragmen
Dalam paper ini , model DDBS data realokasi dinamis untuk

direplikasi

dan

non

-

direplikasi

diusulkan

menurut

matriks

pembaruan fragmen (UM), dan matriks biaya jarak (DM). Biaya realokasi

fragmen

ke

situs

jaringan

dievaluasi

dan

kemudian

Distributed Database Management System | Kelompok 10

12

keputusan migrasi dibuat dengan memilih situs Sj yang memiliki
biaya pembaruan permintaan tertinggi untuk fragmen Fi untuk
dipilih sebagai calon lokasi untuk menyimpan Fi fragmen untuk
meminimalkan komunikasi biaya.
Model ini menggunakan Fragment Prioritas (FP) teknik untuk
menghindari duplikasi fragmen (yang bisa terjadi pada tahap alokasi
awal) dan situs kendala pelanggaran setiap kali mereka terjadi.

2.12 Pernyataan Masalah dan Persyaratan Informasi
2.12.1

Deskripsi Masalah dan Notasi

Model yang diusulkan di dalam paper ini mengasumsikan
jaringan yang terkoneksi penuh terdiri dari situs S = {S1, S2, ….,
Sm}, di mana setiap situs memiliki kapasitas (C), fragment limit (FL)
dan sistem database lokal. Sebuah hubungan antara dua situs S i
dan Sj memiliki bilangan positif (CC ij) yang terkait yang mewakili
biaya transfer data dari situs Si ke Sj. Setiap situs memiliki
seperangkat query Q = {Q1, Q2, ..., Qk} yang dianggap sebagai
pertanyaan yang paling sering dieksekusi yang dihitung dari lebih
dari 75% pengolahan situs di DDBS. Setiap query Q k dapat
dijalankan di situs manapun dengan frekuensi tertentu, frekuensi
eksekusi k query di situs m dapat direpresentasikan oleh matriks m
x k (QFij). Misal S mengandung satu set fragmen F = {F 1, F2, ..., Fn)
merepresentasikan

partisi

hubungan

selama

fase

fragmentasi

desain DDBS. Untuk membuat alokasi lebih efsien kita perlu
menentukan tidak hanya jumlah salinan untuk setiap fragmen tetapi
juga menemukan alokasi yang tepat untuk masing-masing di situs
menurut informasi query yang dikumpulkan.
Ada dua defnisi optimal menurut [24]. Pertama, biaya
minimal (biaya penyimpanan setiap fragmen F i di situs Sk + biaya
query Fi di situs Sk + biaya update Fi di situs di mana Fi disimpan +
Distributed Database Management System | Kelompok 10

13

biaya komunikasi data). Kedua, kinerja (meminimalkan waktu
respon dan memaksimalkan sistem throughput.
Penulis di dalam paper ini mengadopsi defnisi yang pertama
(biaya minimal) untuk pengukuran yang optimal. Dengan demikian,
masalah optimalitas sesuai dengan model yang diusulkan di dalam
paper

ini

bisa

didefnisikan

sebagai

minimalisasi

biaya

komunikasi dalam proses pengalokasian ulang fragmen F i ke
situs Sj.
Tabel 1. Notasi Model
M
Sj
N
Fi
K
RN
Q
Qk
Qj#
RFij

Number of DDBS network sites
The jth site
Number of data fragments in DDBS
The ith data fragment
Number of DDBS queries
Relations number
Set of queries
The kth query
Queries number over site j
Access frequency value for retrieval query i at

UFij

site j
Access frequency value for updating query i at

QFki
Cj
CCij
FLi
TC

site j
Access frequency of the kth query at site j
Capacity of site j
Communication cost between site i and site j
Maximum number of fragments for site j
The total cost
Notasi yang digunakan di dalam paper ini dijelaskan di dalam

tabel 1;

2.12.2

Persyaratan Informasi

Pada bagian ini dianalisis lebih lanjut mengenai beberapa
informasi untuk menurunkan rumus biaya seperti fungsi biaya.
Informasi tersebut antara lain informasi database, informasi perilaku
query, informasi situs, dan jaringan informasi.
Distributed Database Management System | Kelompok 10

14

2.12.3

Informasi Database

Biasanya relasi terdiri dari banyak fragmen. Masing-masing
memiliki ukuran Z(Fi) yang perlu ditentukan sebelumnya karena
memainkan peran kunci dalam menghitung biaya komunikasi.
Z (Fi) = Card (Fi) * L (Fi) , i = 1,…, n.
Dimana L adalah panjang fragmen tuple dan kartu (Fi) adalah
kardinalitas fragmen (yaitu jumlah record fragmen), panjang (Fi)
dapat dihitung dengan menggunakan rumus berikut:
Length (Fi) = Σ LA , 1