Optimisasi Dengan Adanya Big Data Problem Chapter III V

BAB 3
SEMIDEFINITE PROGRAMMING (SDP)

3.1 Definisi SDP
Semidefinite Programming (SDP) adalah subbagian dari pembahasan konvek optimisasi, dengan optimisasi linier selama persimpangan kerucut dari semidefinit
positif matriks dengan sebuah ruang affinty (spectrahedron).
Program Semidefinit adalah bidang yang relatife baru dari optimisasi yang
tumbuh untuk beberapa alasan. Banyak permasalahan dalam riset operasi dan optimisasi kombinatorial dapat dimodelkan sebagai permasalahan semidefinit. Dalam
teori control otomatis, SDP digunakan dalam konteks pertidaksamaan matriks linier. SDP merupakan kasus khusus dari program kerucut dan dapat efisien diselesaikan dengan metode titik interior.
Permasalahan program linier adalah salah satu metode untuk memaksimumkan atau meminimumkan fungsi tujuan dari variable real melalui polytope. Semua
program linier dapat dinyatakan sebagai SDP, secara umum solusi dari SDP dari
permasalahan optimisasi polinomial dapat di aprokmasi. SDP telah digunakan
pada optimisasi sistem kompleks.
Didalam pemrograman semidefinit, digunakan vector bernilai real dan diperbolehkan untuk mengambil dot product dari vector, kendala nonnegative pada
variabel real di program linier diganti oleh semidefinit pada variabel matriks di
SDP. Secara khusus, masalah pemrograman semidefinit umum dapat didefenisikan
sebagai masalah pemrograman matematik dalam bentuk.

min
n


x1 ,...x ∈Rn

Subjek

X

i,j∈[n]

X

Ci,j .(X i .X j )

(3.1)

i,j∈[n]

Ci,j,k .(X i .X j ) ≤ bk

∀k


(3.2)

26

Universitas Sumatera Utara

27
matrik Mn × n dikatakan semidefinit positif jika itu adalah gramian matrik dari
beberapa vector (yaitu jika terdapat vector x1, . . . , xn seperti mi,j = xi .xj (untuk

semua i, j) jika ini terjadi maka ditunjukkan sebagi M  0 . Ada beberapa defenisi
yang setara lainnya menjadi semidefinit positif, misalnya matriks semidefinit positif
hanya memiliki nilai eigen nonnegative dan memiliki akar kuadrat pasti positif.
dilambangkan dengan Sn ruang semua n × n matrik simetri real. Ruang ini di
lengkapi dengan produk dalam ( dimana tr menunjukkan jejak)
T

hA, BiSn = tr(A , B) =

n

X

Ai,j .Bi,j

(3.3)

i=1,j=1

model matematikanya menjadi
min hC, XiSn

(3.4)

X∈ Sn

Subjek

hAk , XiSn ≤ bk ,

k = 1, . . . , m


(3.5)

X0
dimana entri i, j di C diberikan oleh Ci,j dari bagian sebelumnya dan Ak adalah
n × n matriks memiliki i, j entri ai,j,k dari bagian sebelumnya, jika ditambah slack
variabel, SDP dapat dikonversi menjadi bentuk model matematikanya menjadi
min hC, XiSn

(3.6)

X∈ Sn

Subjek

hAk , XiSn = bk ,

k = 1, . . . , m

(3.7)


X0
Contoh
Anggap berbentuk persegi dengan dua variabel digambarkan pada contoh ini dengan mendefinisikan Z1 = x2 , Z2 = y 2, Z3 = xy

Universitas Sumatera Utara

28

F (x, y) = 2x4 + 2x3 y − x2 + 5y 4
 " x2 #

 2 2  q11 q12 q13
q12 q22 q23
= x y xy
y2
q13 q23 q33
xy

= q11x4 + q22y 4 + (q33 + 2q12 )x2y 2 + 2q13 x3y + 2q23xy 3 = 0


Oleh karena itu, dari persamaan linier diperoleh:
q11 = 2, q22 = 5, q33 + 2q12 = −1, 2q13 = 2, 2q23 = 0
semidefinit positif Q memenuhi persamaan linier kemudian ditemukan dengan semidefinite programming. Solusinya diperoleh
#
2 −3 1
Q = −3 5 0 = LT .L
1
0 5
"

dan

#
"
1 2 −3 1
L= √ 0 5 0
2 1 0 5

di peroleh sum of squares (SOS)

2

F (x, y) = 12 (2x2 − 3y 2 + xy) + 21 (y 2 + 3xy)

2

Universitas Sumatera Utara

BAB 4
PEMBAHASAN DAN HASIL

4.1 Set-membership Identifiation/Estimation dan Big Data
Sistem identifikasi digunakan dalam statistik untuk membentuk model matematika
sistem dinamis dari suatu data. Pembahasan terpenting yaitu pemodelan (model
identifikasi) dan penanganan big data. Intinya bagaimana mendapatkan model
sistem/sinyal jika dihadapkan (diperlukan) jumlah data yang sangat besar. Kehadiran data yang besar bukan saja mendatangkan kompleksitas komputasi tetapi
juga kehadiran penambahan noise yang distribusinya penting untuk diketahui. Dengan demikian pendekatan model dan komputasi stokastik akan mewarnai objektif
model identifikasi.
Big data Problem dilakukan penanganannya dengan metode set-membership
estimation yang telah dikembangkan oleh (Schweppe, 1968).


Gambar 4.1

Pengaturan dasar error in variable (EIV ) untuk sistem dinamis
linier

Error in variable (EIV) adalah suatu model regresi yang menyatakan banyaknya
jumlah errors didalam variabel bebas. Analisis regresi adalah proses statistik untuk
memperkirakan/estimasi hubungan antara variabel (sebuah variabel tergantung
dan satu atau lebih variabel bebas).
Unsur pokok dari set-membership estimation dibuat dengan referensi dari permasalan yang disebut permasalahn error in variables (EIV),sederhana tetapi komplek yang menjadi fokus pembahasan yaitu masalah linier EIV dan untuk waktu

29

Universitas Sumatera Utara

30
yang sama, konsep dasar ini sedererhana tetapi kompleks, dari sudut pandang
kompleksitas pada komputer, yang menjadi konsep utama yang akan di bahas.
Dalam sistem kontrol ada input dan ada output, anggap sistem kontrol yang

di bahas yaitu sistem single input single output (SISO) linier time invariant (LTI)
Cerone, 1993) dimana xt adalah masukan barisan noise free dan linier block dimodelkan dengan sistem waktu diskrit yang merubah xt menjadi keluaran noise
free xt menurut persamaan beda/difference. Dalam sistem kontrol ada input dan
ada output, anggap sistem kontrol yang di bahas yaitu sistem single input single
output (SISO) linier time invariant (LTI) Cerone, 1993) dimana xt adalah masukan
barisan noise free dan linier block dimodelkan dengan sistem waktu diskrit yang
merubah xt menjadi keluaran noise free wt menurut persamaan beda/difference.

A(q −1)wt = B(q −1)xt .

(4.1)

dimana A(·) dan B(·) adalah polinomial didalam operator terbalik q −1 (q −1wt =
w(t−1)) dari bentuk

A(q −1) = 1 + a1q −1 + . . . + ana q −na

(4.2)

B(q −1) = b0 + b1q −1 + . . . + bnb q −nb


(4.3)

Input dan output dari barisan data dirusak oleh penambahan noise ξt dan ηt di
tulis
ut = xt + ξt

(4.4)

yt = wt + ηt

(4.5)

dimana ξt dan ηt dianggap interval yang di berikan batasan ∆ξk dan ∆ηk di tulis
|ξt | ≤ ∆ξk

(4.6)

|ηt| ≤ ∆ηk


(4.7)

Universitas Sumatera Utara

31
Parameter vector θ tidak diketahui dan θ ∈ Rp untuk diidentifikasi dan didefenisikan sebagai
θ = [a1 . . . ana b0 b1 . . . bnb ]T

(4.8)

dimana na+nb + 1 = p ketika feasible parameter set (FPS) Dθ adalah
Dθ = {θ ∈ Rp : A(q −1)(yt −ηt ) = B(q −1)(ut −ξt ), |ξt | ≤ ∆ξk , |ηt| ≤ ∆ηk ; t = 1, . . . , N }
(4.9)
dimana N = panjang barisan data
Model persamaan (4.9) menggambarkan himpunan semua nilai yang mungkin dari
parameter tetap yang tidak diketahui dari ukuran data, batasan nilai error dan
dianggap suatu model.
Dθ = {(θ, ξ, η) ∈ RpxRN xRN : A(q −1)(yt − ηt ) = B(q −1)(ut − ξt ),
|ξt | ≤ ∆ξk , |ηt| ≤ ∆ηk ; t = 1, ..., N }

(4.10)

na
nb
X
X
Dθ = {(θ, ξ, η) ∈ R xR xR :
ai (yt−i − ηt−i ) =
bj (ut−j − ξt−j ),
p

N

N

i=1

j=0

|ξt | ≤ ∆ξk , |ηt | ≤ ∆ηk ; t = 1, . . . , N }

(4.11)

dimana
ξ = [ξ1, ξ2 . . . , ξN ]T ∈ RN dan
η = [η1, η2 , . . . , ηN ]T ∈ RN
Jadi model yang akan dislesaikan adalah untuk menhitung fungsi tujuan yang
disebut parameter uncertainty intervals P U Ij di defenisikan sebagai berikut
P U Ij = [θj , θj ]

untuk

j = 1, . . . , p

(4.12)

dimana
θj =
θj =

min

θj

(4.13)

max

θj

(4.14)

θ,ξ,η ∈ Dθ,ξ,η

θ,ξ,η ∈ Dθ,ξ,η

Universitas Sumatera Utara

32
Dari model tersebut fungsi tujuan nya adalah P U Ij dan kendalanya adalah θj dan
θj Karena Dθ,ξ,η sebuah himpunan non konvex

(yt − ηt ) +

4.2

na
X
i=1

ai (yt−i − ηt−i ) =

nb
X
j=0

bj (ut−j − ξt−j ), (ut − ξt ),

Penanganan Big Data di Set-membership Identification dengan
Taksiran Optimisasi Polinomial

Pendekatan pertama yang dilakukan, tujuan dasar yang dipaparkan oleh (Cerone
et al., 2012). Berdasarkan aplikasi dari sparse Linear Matrix Inequality (LMI)
relaxation yang dikemukakan (Laserre, 2006), yang menjadi pembahasannya adalah
Feasible Parameter Set (FPS).
Dθ,ξ,η ={(θ, ξ, η) ∈ Rnθ+2N :
na

gt

i=1

gt+N

nb

X
. X
=
(yt−i − ηt−i )ai +
(ut−j − ξt−j )bi + ηt − yt ≥ 0
j=0

na
X

.
= −[

i=1

(yt−i − ηt−i )ai +

.
gk+2N = ∆ξk − ξk ≥ 0
.
gk+3N = ∆ξk + ξk ≥ 0
.
gk+4N = ∆ηk − ηk ≥ 0
.
gk+2N = ∆ηk + ηk ≥ 0
t = na + 1, . . . , N ;

nb
X
j=0

(ut−j − ξt−j )bi + ηt − yt] ≥ 0
(4.15)

k = 1, . . . , n}

Universitas Sumatera Utara

33
(Cerone, 2012) memaparkan sifat-sifat dalam permasalahan membentuk identifikasi antara lain:
Sifat 1:

1. Fungsi hanya bergantung dari variabel θj ;
2. t = na + 1, . . . , N , kendala polinomial gt ≥ 0 dan gt+N ≥ 0 didefinisikan
Dθ,ξ,η bergantung hanya dengan np + na + nb + 2 = 2np + 1 variabel yaitu
tidak diketahui parameter θj , j = 1, . . . , np ;sampel input noise ξk , k =
t, t − 1, . . . , t − nb dan sampel output noise ηk , k = t, t − 1, . . . , t − na;
3. Untuk t = 1, . . . , N , kendala nya adalah gk+2N ≥ 0, gk+3N ≥ 0, gk+4N ≥ 0
dan gk+5N ≥ 0 mendefenisikan Dθ,ξ,η bergantung hanya dari variabel ξt atau
ηt .

Sifat 2:
δ

Jika δ ≥ 1 ,defenisikan P U Ijδ = [θδj , θj ] untuk j = 1, . . . , np, interval P U Ijδ
memenuhi sifat sebagai berikut:

1. Menjamin relaxed interval tak tentu untuk setiap δ ≥ 1 interval P U Ijδ dijamin
berisi parameter sebenarnya θj , yaitu θj ∈ P U Ijδ ;

2. Meningkatkan keakuratan di dalam mengevaluasi relaxed interval tak tertentu untuk setiap δ ≥ 1,interval P U Ijδ menjadi lebih sulit jika δ relaxation

order ditingkatkan, yaitu P U Ijδ+1 ⊆ P U Ijδ ;

3. Kekonvergenan mempersulit di dalam interval tak tentu interval P U Ijδ konvergen untuk interval sulit P U Ij sebagai LMI relaxation order akan tidak
terbatas, yaitu:
δ

lim θδj = θj , lim θj = θ j

δ→∞

δ→∞

Universitas Sumatera Utara

34
Sifat 3:
Komplek komputasi, evaluasi dari P U Ijδ memerlukan penyelesaian SDP dimana
jumlah dari variabel optimisasi yaitu:




2np + 1 + 2δ
2np − 1 + 2δ
(N − na)
− (N − na − 1)


dan daerah fisibel Dδ dibentuk dari N −na moment matrik, setiap ukuran

.
dan 2(N − na) + 4N matrik local, yang lain ukuran 2np+2δ
δ−1

2np+1+2δ




Sifat 2 tentang hasil isi estimasi yang digunakan pada pendekatan optimisasi jarang
sifat 3 menunjukkan jumlah variabel optimisasi meliputi komputasi dari relaxed
estimasi yang linier dengan jumlah input dan output N untuk pengguna computer
mengestimasi juga ddalam jumlah data yang besar. Oleh karena itu penggunaan
pendekatan optimisasi jarang lebih efektif di dalam penanganan big data di dalam
identifikasi anggota, dimana big diartikan kira-kira seribu noise yang merusak input
output dari data. Tidak seperti jumlah data, dalam kenyataannya signifikan lebih
besar supaya jumlah data (kira-kira N = 10) dapat ditangani dengan memakai
moment/ SOS relaxation tanpa memanfaatkan struktur khusus yang jarang dari
masalah estimasi yang di sorot pada sifat 1.

4.3 Penanganan Big Data di Set-membership Identification dengan Reducing Ukuran Persoalan
Di sini Pendekatan alternative mengambil rujukan dari jurnal (Cerone, 2011), relax
efektif masalah optimisasi cembung di dalam sampel input output yang jumlahnya
besar.
Menggambarkan batasan terluar Dδs dari (Cerone, 1993). Himpunan Dδs diisi dari
Dδ dianggap bahwa regressor tak tentu tidak berkorelasi mempunyai bentuk
Dθs = {θ ∈ Rp : (φt − ∆φt )φ ≤ yt + ∆ηt, (φt + ∆φt)φ ≥ yt − ∆ηt ; t = 1, . . . , N }
(4.16)

Universitas Sumatera Utara

35
dimana
∆φt = {∆ηt−1 sgn(a1)....∆ηt−na sgn(ana )
∆ξ t sgn(b0)∆ξ t−1 sgn(b1)...∆ξt−nb sgn(bnb )}T

(4.17)

Himpunan Dθs adalah sebuah pendekatan terluar dari Dθ yaitu Dθs ⊇ Dθ Himpunan

Dθs didefenisikan kendala linier piecewise (tidak sebanding), walaupun umumnya

s
bukan cembung, itu adalah union dari 2p cembung himpunan Dθi
yaitu:

Dθs =

[ 2p

i=1

s
Dθi

(4.18)

s
, didefenisikan 2N + p kendala linier, intersection antara Dθs dan i −
dimana Dθi

th orthant dari ruang Rp . Andaikan relaxed parameter interval taktentu P U I sj
menjadi
s

P U Ijs = [θsj , θj ]

(4.19)

θsj = min p θsji

(4.20)

dimana
i=1,...2

s

s

θj = max p θji

(4.21)

θji = mins θj

(4.22)

θji = maxs θj

(4.23)

i=1,...2

dan
θ ∈ Dθi

θ ∈ Dθi

catatan bahwa, karena ξ dan η bukan variabel optimisasi dari permasalahan diatas
dan Dθs adalah sebuah pendekatan terluar dari Dθ maka
θsj ≤ θj

untuk semua j = 1, . . . , p

(4.24)

θsj ≥ θj

untuk semuaj = 1, . . . , p

(4.25)

dan
P U Ijs ⊇ P U Ij

untuk semua j = 1, . . . , p

(4.26)

4.4 Contoh Penanganan Big Data

Universitas Sumatera Utara

36
Contoh 1
Anggap sistem order 2 dengan nilai parameter sebenarnya θT = [a1
[−1.75 0.87

a2

b1

b1] =

− 1.25 1.88] batasan parameter yang akan di evaluasi untuk kum-

pulan data yang akan di uji dari N panjang persebaran data yaitu untuk N =
30, N = 200 dan N = 1000. Perhitungan Numerik di lakukan pada Matlab.
Sistem dijalankan dengan barisan input data random xt menggunakan distribusi
uniform antara [−1, +1]. Data input xt dan data output di rusak oleh penambahan random noise yaitu ξt dan ηt , distribusi uniform antara [−∆ξt, +∆ξt ] dan
[−∆ηt, +∆ηt] Pemilihan batasan error ∆ξt dan ∆ηt . Taksiran utama dirumuskan
s

s

θjcs = (θj + θsj )/2 dan batas parameter tak tentu ∆θjs = (θj − θsj )/2 menggunakan
δ

δ

static pendekatan EIV, selanjutnta θjc,δ = (θ j + θδj )/2 dan ∆θjδ = (θj − θδj )/2 dengan
menggunakan sparse LMI-relaxation berdasarkan EIV untuk relaxation orde δ = 2.
Tabel 4.1 Perkiraan parameter utama (θjcs , θjc,δ ) dan batasan tak tentu (∆θjs , ∆θjδ )
terhadap banyak data N. Nilai dari θjc,δ dan ∆θjδ di hitung untuk
relaxation tingkat δ = 2 untuk N = 30, N = 200 dan N = 1000
N

Nilai sebenarnya

θjcs

∆θjs

θjcδ

∆θjδ

30

-1.760
0.870
-1.250
1.880
-1.760
0.870
-1.250
1.880
-1.760
0.870
-1.250
1.880

-2.790
1.544
-2.031
3.048
-2.088
1.020
-1.759
2.358
-2.011
0.955
-1.447
2.369

2.016
1.328
1.441
2.348
1.123
0.566
1.110
1.506
0.965
0.467
0.769
1.326

-1.773
0.889
-1.436
2.132
-1.741
0.860
-1.376
2.062
-1.759
0.864
-1.316
2.106

0.218
0.222
0.712
1.017
0.150
0.149
0.679
0.925
0.091
0.094
0.462
0.515

200

1000

untuk N = 30
-1.760 Perkiraan parameter utama antara -2.790 sampai -1.773

Universitas Sumatera Utara

37
untuk N = 200
-1.760 Perkiraan parameter utama antara -2.088 sampai -1.741
untuk N = 1000
-1.760 Perkiraan parameter utama antara -2.011 sampai -1.759
Contoh 2
Anggap system order 2 dengan nilai parameter sebenarnya θT = [a1
[1.15 0.8

a2

b1

b1] =

−2.45 2.1] batasan parameter yang akan di evaluasi untuk kumpulan

data yang akan di uji dari N panjang persebaran data yaitu untuk N = 300. Perhitungan Numerik di lakukan pada Matlab. Sistem dijalankan dengan barisan
input data random xt menggunakan distribusi uniform antara [−1, +1]. Data input xt dan data output di rusak oleh penambahan random noise yaitu ξt dan ηt ,
distribusi uniform antara [−∆ξt, +∆ξt] dan [−∆ηt, +∆ηt ] Pemilihan batasan error
s

∆ξt dan ∆ηt . Taksiran utama dirumuskan θjcs = (θj + θ sj )/2 dan batas parames

ter tak tentu ∆θjs = (θj − θsj )/2 menggunakan static pendekatan EIV, selanjutnta
δ

δ

θjc,δ = (θj +θδj )/2 dan ∆θjδ = (θj −θδj )/2 dengan menggunakan sparse LMI-relaxation
berdasarkan EIV untuk relaxation orde δ = 2.

Tabel 4.2 Perkiraan parameter utama (θjcs , θjc,δ ) dan batasan tak tentu (∆θjs , ∆θjδ )
terhadap banyak data N. Nilai dari θjc,δ dan ∆θjδ di hitung untuk
relaxation tingkat δ = 2 untuk N=300
N

Nilai sebenarnya

θjcs

∆θjs

θjcδ

∆θjδ

300

1.1500
0.8000
-2.4500
2.1000

1.1583
0.8258
-2.7386
2.4363

0.1894
0.1939
2.3208
2.2893

1.1417
0.7974
-1.4509
2.2048

0.0942
0.0872
1.0545
1.0830

untuk N = 300
1.1500 Perkiraan parameter utama antara 1.1583 sampai 1.1417

Universitas Sumatera Utara

BAB 5
KESIMPULAN DAN SARAN

5.1 Kesimpulan
Sistem identifikasi digunakan dalam statistik untuk membentuk model matematika sistem dinamis dari ukuran data. Pembahasan terpenting yang akan di paparkan dalam tulisan ini yaitu pemodelan (model identifikasi) dan penanganan big
data. Intinya adalah bagaimana mendapatkan model sistem/sinyal jika dihadapkan (diperlukan) jumlah data yang sangat besar. Teknik moment/Sum of squares
relax diperlukan untuk menyelesikan model matematis yang berbentuk polinomial (konvek optimisasi) dengan teori Semidefinite Programming (SDP). Hasilnya
dapat dilihat semakin besar N maka makin mendekati nilai interval parameter
model dari nilai parameter sebenarnya. Interval batas bawah diperoleh dengan
meminimumkan fungsi tujuan model Parameter Uncertainty Intervals (P U I j ) dan
interval atas dengan memaksimumkan fungsi tujuan model Parameter Uncertainty
Intervals (P U I j ).

5.2 Saran
Ada beberapa metode untuk menyelesaikan optimisasi dari big data yang
telah dimodelkan secara matematis, tapi disarankan menggunakan metode semidefinite programming (sdp), karena sdp dapat menangani permasalahan yang nonconvex. Pembahasan dilakukan dari jumlah N terkecil yaitu 30 dan N terbesar
yaitu 1000 disarankan menggunakan N yang besar lagi, agar di peroleh estimasi
interval yang mendekati nilai parameter sebenarnya.

38

Universitas Sumatera Utara