Penentuan Frekuensi dalam Metode Polinom Lokal Kuadrat Terkecil untuk Mendeteksi Loncatan

PENENTUAN FREKUENSI DALAM METODE
POLINOM LOKAL KUADRAT TERKECIL
UNTUK MENDETEKSI LONCATAN

OLEH:
BAHARUDDIN

PROGRAM PASCASARJANA
INSTITUT PERTANIAN BOGOR
2002

ABSTRAK
BAHARUDDIN. Penentuan Frekuensi dalam Metode Polinom Lokal Kuadrat
Terkecil untuk Mendeteksi Loncatan. Dibimbing oleh BARIZI dan BUD1

SUSETYO.
Metode polinom lokal kuadrat terkecil adalah suatu metode statistika yang
dapat digunakan untuk mendeteksi adanya loncatan persamaan regresi. Metode ini
didasarkan pada pengepasan suatu fhgsi polinom terhadap tetangga terdekat dari
beberapa data. Banyaknya data setiap tetangga disebut fiekuensi (k).Penentuan
fiekuensi yang tepat diperlukan untuk mendapatkan hasil pendeteksian yang

benar. Penentuan ini dilakukan dengan simulasi.
Ukuran contoh yang digunakan dalam simulasi adalah n = 100,200,300
dan 400,sedangkan pengepasan setiap tetangga ddalcukan dengan memakai h g s i
linear. Hasil penelitian menunjukkan bahwa fiekuensi terbaik bergantung pada
ukuran contoh. Semakin besar ukuran cantoh yang dipakai, rasio antara fiekuensi
terbaik dengan ukuran contoh ( k l n ) semakin menurun. Frekuensi terbaik untuk
n = 100 adalah 15;k terbaik untuk n = 200 adalah 29;k terbaik wtuk n = 300
adalah 35;dan k terbaik untuk n = 400 adalah 41.

SURAT PERNYATAAN

Dengan ini saya menyatakan bahwa tesis yang berjudul:
Penentuan Frekuensi dalam Metode Polinom Lokal Kuadrat ~erkeciluntuk
Mendeteksi Loncatan
adalah hasil karya saya sendiri dan belum pemah dipublikasikan. Sumber data dan
informasi yang digunakan telah dinyatakan dengan jelas dan dapat diperiksa
kebenarannya.

Bogor, 13 Februari 2002


Baharuddin

Kupersembahkan karya ini untuk
Istri, anak d m kedua orangtuaku

PENENTUAN FREKUENSI DALAM METODE
POLINOM LOKAL KUADRAT TERKECIL
UNTUK MENDETEKSI LONCATAN

BAHARUDDIN

Tesis
sebagai salah satu syarat untuk memperoleh gelar
Magister Sains pada
Program Studi Statistika

PROGRAM PASCASARJANA
INSTITUT PERTANLAN BOGOR
2002


Judul Tesis

: Penentuan Frekuensi dalam Metode Polinom Lokal Kuadrat
Terkecil mtuk Mendeteksi Loncatan

Nama

: Baharuddin

NRP

: 99162

Program Studi : Statistka

Menyetujui,

1. Komisi Pembimbing

Anggota


Mengetahui,

Tanggal Lulus: 13 Februari 2002

Penuhs dilahirkan di Sengkang pada tanggd 31 Januari 1972 sebagai anak
pertama dari pasangan H.Muh. Said Mallo dan H.J. Sahri Toro. Pendidikan sarjana
ditempuh di Jurusan Matematika FMlPA Universitas Hasanuddin Makassar, lulus
tahun 1995. Pada tahun 1999, penulis diterima di Program Studi Statistika pada

Program Pascasarjana IPB. Beasiswa pendidikan pascasarjana (BPPS) diperoleh

dari DIrjen Dikti Departemen Pendidikan Nasional.
Penulis bekerja sebagai tenaga pengajar di Fakultas Matematika d m Ilmu
Pengetahuan Alam Universitas Haluoleo Kendari sejak tahun 1996.

PRAKATA

Puji dan syukur penulis panjatkan kehadirat Allah SWT atas segala rahmat
dan karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Shalawat dan

salam penulis ucapkan kepada junjungan kita Nabi Muhammad SAW, segenap
keluarga dan sahabatnya serta siapa saja yang menyerukan dakwahnya hingga
akhir zaman. Tema yang dipilih penulis dalam penelitian ini adalah metode
pendeteksi loncatan, dengan judul penentuan fiekuensi dalam metode polinom
lokal kuadrat terkecil untuk mendeteksi loncatan.
Terima kasih penylis ucapkan kepada Bapak Prof Dr. Baxizi, M.E.S. clan
Bapak Dr. Budi Susetyo, M. S. selaku pembimbing, serta teman-teman mahasiswa
STK '99 yang telah banyak membenkan saran. Ungkapan terima kasih juga saya
sampaikan kepada kedua orangtua dan selunrh keluarga atas segala doanya.
Semoga karya ilmiah ini bermanfaat.

Bogor, Februari 2002
Baharuddin

DAFTAR IS1
Halaman
DAFTAR TABEL ...............................................................

vi


DAFTAR GAMBAR ............................................................

vii

DAFTAR LAMPIRAN ..........................................................

viii

PENDAHULUAN ...............................................................
Latar Belakang ................................................................
Tujuan Penelitian .............................................................
TINJAUAN PUSTAKA .......................... : .............................
Regresi Polinom ..............................................................
Regresi dengan Loncatan ...................................................
Metode Polinom Lokal Kuadrat Terkecil .................................
DATA DAN METODE .........................................................
Sumber Data ..................................................................
Metode Penelitian ............................................................
HASIL DAN PEMBAHASAN ................................................
Ukuran Contoh n = 100 .....................................................

Ukuran Contoh n = 200 .....................................................
Ukuran Contoh n = 300 .....................................................
Ukuran Contoh n = 400 .....................................................
Pembahasan Umwn .........................................................
KESIMPULAN DAN SARAN ................................................
Kesimpulan ...................................................................
Saran ...........................................................................
DAFTAR PUSTAKA ...........................................................

20

DAFTAR TABEL
Halaman

1. Besar loncatan, jumlah data bangk~tandan taraf kepercayaan
2,,, yang dipakai pada ukuran contoh n .................................

7

2. Jumlah data banglatan dengan banyaknya posisi loncatan yang

terdeteksi untuk pemakaian fiekuensi k dan n = 100 ...................

10

3. Persentase data banglutan yang terdeteksi sebanyak tiga loncatan

untuk pemakaian fiekuensi k pada berbagai kerapatan data antar
loncatan dan n = 100 ........................................................

17

4. Nilai rancangan x, dan nilai standardisasi respon y, dari data

yang akan dideteksi ..........................................................
5. Koefisien

44

p,c') dari b g s i polmom yang dipas terhadap tetangga


dengan median xi

...........................................................

45

....................

46

6. Nilai operator 6:) dari tetangga dengan median xi

DAFTAR GAMBAR
Halaman

1. (a) Contoh pengepasan global (b) Contoh pengepasan lokal
terhadap dua segmen (posisi loncatan adalah x = 40) ..................

1


2. Persentase data banglutan yang terdeteksi sebanyak tiga loncatan
untuk pemakaian fiekuensi k dan n = 100 ...............................

11

3. Persentase data banglutan yang terdeteksi sebanyak tiga loncatan
untuk pemakaian eekuensi k dan n = 200 ................................

12

4. Persentase data banglatan yang terdeteksi sebanyak tiga loncatan
untuk pemakaian fiekuensi k dan n = 300 ...............................

14

5. Persentase data banglatan yang terdeteksi sebanyak tiga loncatan
untuk pemakaian fiekuensi k dan n = 400 ...............................

15


..........................

43

7. (a) Koefisien polinom bf) dari tetangga dengan median xi
(b) Nilai operator A(:) dari tetangga dengan median xi ................

47

8. Pendeteksian loncatan dengan makro minitab ..........................

48

6. Diagram pencar dari data yang akan dideteksi

DAFTAR LAMPIRAN
Halaman
1.

Contoh fmgsi yang dijadkan sumber data banglatan .................

22

2.

Diagram pencar dari contoh data banglutan yang dipakai ............

23

3.

Contoh h a d pendeteksian untuk n = 100 ...............................

4 . Contoh hasil pendeteksian untuk n = 200 ..............................
5.

Contoh h a d pendeteksian untuk n = 300 ..............................

6.

Contoh h a d pendeteksian untuk n = 400 ..............................

7.

Makro minitab untuk mendeteksi loncatan ..............................

8.

Jumlah data banglutan dengan banyalcnya posisi loncatan yang
terdeteksi untuk pemakaian fiekuensi k dan n = 200 .................

9.

Jumlah data bangkitan dengan banyaknya posisi loncatan yang
terdeteksi untuk pemakaian fiekuensi k dan n = 300 .................

10. Jumlah data bangkitan dengan banyaknya posisi loncatan yang
terdeteksi untuk pemakaian fiekuensi k dan n = 400 .................

11. Petunjuk penggunaan metode polinom lokal kuadrat terkecil
untuk mendeteksi adanya loncatan ......................................

PENDAHULUAN

Latar Belakang
Model regresi linear sederhana sering dtpakai untuk menyatakan hubungan
antara peubah respon Y dan peubah penjelas X. Apabila nilai-nil& (x, y) dianggap
sebagai satu kesatuan maka pengepasan global terhadap keseluruhan data dapat
dilakukan (Gambar la). Akan tetapi, jika nilai-nilai (x, y) &pat dipartisi menjadi
beberapa segmen maka pengepasan lokal terhadap setiap segmen lebih tepat
digunakan (Gambar lb). Persamaan regresi diperoleh dengan menggabungkan
semua persamaan regresi lokal. Model regresi ini dinamakan regresi loncatan
(Guthery 1974; Wegman & Wright 1983; QLU& Yandell 1998). Pengepasan
global terhadap data regresi lmcatan dapat menyebabkan berkurangnya nilai
koefisien determinasi R ~ .
Regresi loncatan mempunyai beberapa bentuk. Dalam penelitian ini, suatu
persamaan regresi dikatakan mengalami loncatan apabila koefisien intersep dari
dua segmen yang berdekatan adalah berbeda sedangkan koefisien lainnya sama

Gambar 1. (a) Contoh pengepasan global (b) Contoh pengepasan lokal terhadap
dua segmen (posisi loncatan adalah x = 40).

Loncatan persamaan regresi sering terjadi pada proses pengendalia. mutu
produksi, pergerakan harga barang atau data deret waktu. Loncatan pada proses
pengendalian mutu dapat disebabkan oleh menurunuya kemampuan mesin atau
operator menuut waktu dan pada suatu waktu tertentu dilakukan perbaikan atau
penggantian. Penyebab lain adalah adanya faktor atau pengaruh peubah lain yang
cukup signifikau terhadap respon yang diamati pada suatu waktu tertentu.
Metode polinom lokal kuadrat terkecil adalah suatu metode statistika yang
dapat digunakan untuk mendeteksi adanya loncatan. Metode ini dikembangkan
oleh Qiu dan Yandell(1998). Metode tersebut didasarkan pada pengepasan suatu

h g s i polinom terhadap tetangga terdekat dari beberapa data dengan memakai
metode kuadrat terkecil. Setiap tetangga (neighborhood) terdiri atas k data yang
saling berdekatan. Bilangan k ini disebut fiekuensi.
Sebelum tetangga dibentuk, data yang berukuran n diurut berdasarkan nilai

X Tetangga pertama beranggotakan k data terkecil pertama. Tetangga kedua
terdiri atas data terkecil kedua sampai data terkecil ke-(k+l), demikian seterusnya
sampai terbentuk (n+ 1-k) tetangga. Fungsi polinom yang dipas terhadap tetanggatetangga ini dinamakan polinom lokal.
Metode polinom lokal mudah diimplementasikan karena didasarkan pada
penggunaan penduga kuadrat terkecil. Hampir semua perangkat lunak statistika
dapat digunakan menghtung penduga tersebut. Disamping itu, pengetahuan awal
tentang banyaknya loncatan yang tejadi tidak diperlukan.
Metode polinom lokal dikembangkan dengan asumsi bahwa paling banyak
satu posisi loncatan yang termuat dalam setiap tetangga. Ini berarti bahwa jika k
yang digunakan sangat besar dan tetangga yang terbentuk memuat lebih dari satu

posisi loncatan maka algoritma hanya menganggap satu loncatan yang terjadi
dalam tetangga tersebut. Pemakaian k yang relatif besar juga dapat menghasilkan
pendeteksian yang salah. Algoritma memunculkan suatu indikasi loncatan yang
sebenarnya tidak terjadi. Sebaliknya, jika k yang digunakan sangat kecil maka
indikasi loncatan sering hilang karena polinom-polinom lokal yang terbentuk
belum merepresentasikan persamaan regresi yang sesungguhnya (belum stabil).
Olehnya itu, penentuan fiekuensi (k) yang tepat dqerlukan untuk mendapatkan

hasil pendeteksian yang benar. Penentuan ini dapat dilakukan dengan simulasi.

Tujuan Penelitian
Tujuan penelitian ihi adalah menentukan fiekuensi terbaik dalam metode
polinom lokal kuadrat terkecil yang dapat digunakan untuk mendeteksi adanya
loncatan dalam model regresi linear.

TINJAUAN PUSTAKA

Penentuan fiekuensi merupakan masalah umum dalam metode pengepasan
lokal. Hastie dan Tibshiraai (1 987,1990) menyarankan pemakaian 10%-50% data

untuk setiap pemulus garis bergerak dalam algoritma penskoran lokal. Silvennan
(1984), Htirdle, Hall dan Marron ( 1 988) menyarankan pemakaian metode validasi

silang untuk memilih the bandwidth.

Regresi Polinom

Model regresi polinom ordo ke-m dengan satu peubah penjelas ( X ) dapat
dinyatakan sebagai:

Y,=Po +&x,
dengan nilai-nilai x, < x, <

+..-+P,xy

+E,

. < x, dan galat-galat

(1)

(i=1,2;.;n)
{E,)

mempunyai rataan no1 dan

ragam a2.Jika m = 1 , maka model ( 1 ) menjadi persamaan regresi sederhana:
EtY I XI = Po + P1x

dengan E[Y I x ] adalah nilai harapan dari Y pada saat x,
intersep dan

(2)

Po merupakan koefisien

pl adalah koefisien kemiringan garis regresi terhadap sumbu-x.

Regresi dengan Loncatan

Suatu persamaan regresi dikatakan mengalami lacatan sebesar d pada
posisi x, ( 1 0.

Metode Polinom Lokal Kuadrat Terkecil
Misalkan N ( x , ) = { x i , ,x ~ +,.~ .,- X~, ,. -,xi-,+, ,xi, } adalah tetangga terdekat
dari xi dengan frekuensi k = 21 + 1 u, maka dapat diprediksi bahwa persamaan regresi mengalami loncatan

pada suatu x, dalam tetangga N(xi) .
Metode polinom lokal dikembangkan dengan asumsi bahwa paling banyak
satu loncatan yang terjadi dalam setiap tetangga N(xi) . Jika suatu loncatan terjadi
pada xi maka tidak ada loncatan lain dalam N(x,-, ) u N(x, ) u N(x,+, ) . Ini
berarti bahwa diantara dua loncatan (kalau terdapat lebih dari satu) hams terdapat
banyak data. Untuk menghindari pelanggaran asumsi hi, data yang akan dideteksi
sebaiknya berukuran besar (dalam hal hi,n besar sedanglcan k / n kecil).
Hubungan antara simpangan baku galat ( 6 ) , taraf kepercayaan (Z,,, ) ,
fiekuensi (k) yang dipakai, dengan besarnya loncatan (d) yang dapat dideteksi
oleh algoritma adalah:

Ini berarti bahwa jika k yang dipakai agak besar (dalam ha1 ini n juga lebih besar
karena k u, maka dikatakan bahwa terjadi salah
~ ( 0 ~ 5v0~)( 0 , 7 5 )dengan

deteksi. Hasil-hasil yang diperoleh dicatat menurut ukuran contoh, nomor urut
data bangkitan dan fiekuensi yang digunakan (Lampiran 3-6).
5.

Frekuensi (k) terkecil yang terbmyak mendeteksi ketiga loncatan yang ada
pada data-data banglutan dalam suatu ukuran contoh yang ditinjau ditetapkau
sebagai fiekuensi terbaik.

HASIL DAN PEMBAHASAN

Sembilan ratus enam puluh data banglutan telah diperoleh dengan
menggunakan Minitab release 11.12. Persamaan regresi daxi masing-masing data
banglutan tersebut mempunyai tiga posisi loncatan. Pendeteksian posisi loncatan
dilakukan dengan menggunakan makro minitab (Lampiran 7). H a d pendeteksian
dikelompokkan menurut fiekuensi (k) dan ukuran contoh data banglatan (n = 100,
200,300,400).

Ukuran Contoh n = 100
Frekuensi yang digunakan untuk mendeteksi posisi loncatan persamaan
regresi dari data yang berukuran n = 100 adalah k = 3,5,7, ..; 23. Tabel 2
menunjukkan bahwa penggunaan k yang sangat kecil(3 dm 5) menyebabkan
algoritma tidak mampu mendeteksi ketiga posisi loncatan. Hal ini disebabkan oleh
polinom-polinom lokal yang terbentuk belum stabil sehingga tidak mampu
memunculkan indikasi loncatan dalam difference operator.

Tabel 2. Jumlah data banglutan dengan banyaknya posisi loncatan yang terdeteksi
untuk pemakaian fiekuensi k dm n = 100

Penggunaan fiekuensi 7 dan 9 secara umum baru mampu mendeteksi satu
posisi loncatan. Sedangkan pemakaian k = 11 baru mampu mendeteksi dua posisi
loncatan. Tiga posisi loncatan telah terdeteksi sebanyak 54,58% dengan memakai
k = 13 (Gambar 2). Namun demikian, h a d ini belum optimum.

H a d pendeteksian optimum diperoleh dengan memakai fkekuensi k = 15 .
Algoritma mampu mendeteksi ketiga posisi loncatan sebanyak 96,25 persen dari
keseluruhan data. Dengan demikian, fiekuensi terbaik untuk data yang berukura.
n = 100 adalah 15.

Gambar 2. Persentase data bangkitan yang terdeteksi sebanyak tiga loncatan
untuk pemakaian fiekuensi k dan n = 100.
Penggunaan fiekuensi yang relatif besar (17, 19, 21 dan 23) menyebabkan
algoritma mendeteksi lebih dari tiga posisi loncatan. Disamping mendeteksi ketiga
loncatan yang sesungguhnya, algoritma juga memberikan indikasi loncatan yang
sebenarnya tidak ada. Indikasi loncatan tersebut muncul diantara posisi loncatan
yang sesungguhnya. Hal ini disebabkan oleh banyaknya data antara dua loncatan
dalam data bangkitan relatif sedikit untuk pemakaian fkekuensi tersebut, sehingga
asumsi yang berlaku dalam metode polinom lokal tidak dipenuhi

Ukuran Contoh n = 200
Frekuensi yang digunakan untuk mendeteksi posisi loncatan persamaan
regresi dari data yang berukuran n = 200 adalah k = 3,5,7, --,
49. Penggunaan
fiekuensi 3, 5 dan 7 menyebabkan algoritma belum m a q u mendeteksi ketiga
posisi loncatan (Lampiran 8). Hasil yang sama juga diperoleh jika dipakai k = 9
dan 11. Dengan memakai fiekuensi tersebut, algoritma baru mampu mendeteksi
satu posisi loncatan masing-masing sebanyak 25,83 persen dan 35 persen. Hal ini
disebabkan oleh polinompolinom lokal yang terbentuk belum stabil sehingga
tidak mampu memberikan indikasi loncatan dalam difference operator.
Pemakaian fiekuensi 13, 15 dan 17 secara umum baru mampu mendeteksi
satu posisi loncatan. Sedangkan penggunaan fi-ekuensi 19 dan 21 baru mampu
mendeteksi dua posisi loncatan. Tiga posisi loncatan telah terdeteksi masingmasing sebanyak 49,58%; 65%; dan 75,83% dengan menggunakan fiekuensi 23;
25 ;dan 27 (Gambar 3). Namun demikian, hasil tersebut belum optimum.

Gambar 3. Persentase data bangkitan yang terdeteksi sebanyak tiga loncatan
untuk pemakaian fiekuensi k dan n = 200.

Hasil pendeteksian optimum diperoleh dengan memakai fiekuensi k = 29
(Gambar 3). Algoritma mampu mendeteksi ketiga posisi loncatan sebanyak 97,08
persen dari keseluruhan data. Dengan demikian, fiekuensi terbaik untuk data yang
berukuran n = 200 adalah 29.
Penggunaan fiekuensi yang relatif besar ( 33,35,37, . 49 ) menyebabkan
-a,

algoritma mendeteksi lebih dari tiga posisi loncatan. Disamping mendeteksi ketiga
loncatan yang sesungguhnya, algoritma juga memberilcan indikasi loncatan yang
sebenarnya tidak ada. Indikasi loncatan tersebut muncul diantara posisi loncatan
yang sesungguhnya. Hal ini disebabkan oleh banyaknya data antara dua loncatan
dalam data bangkitan relatif sedikit untuk pemakaian fiekuensi tersebut, sehingga
asurnsi yang ber&

dalam metode polinom lokal tidak dqenuhi.

Ukuran Contoh n = 300

Frekuensi yang dipakai untuk mendeteksi posisi loncatan dari data yang
berukuran n = 300 adalah k = 3,5, --.,73 . Penggunaan fiekuensi yang sangat kecil
( k = 3, 5, 7 dan 9) menyebabkan algoritma tidak mampu mendeteksi ketiga posisi
loncatan yang ada (Lampiran 9). Satu posisi loncatan baru terdeteksi dengan
memakai fiekuensi 11, 13 dan 15. Sedangkan penggunaan k = 17, 19, 2 1 dan 23
secara m u m baru mampu mendeteksi dua posisi loncatan.
Frekuensi yang berhasil mendeteksi ketiga posisi loncatan pada data yang
berukuran n = 300 lebih banyak dibandingkan dengan fiekuensi pada data yang
berukuran 100 dan 200. Frekuensi tersebut adalah k = 25,27,

-as,

43. Frekuensi 25;

27; 29; 3 1; dan 33 mampu mendeteksi masing-masing sebanyak 46,25%; 61,25%;
67,5%; 82,92%; dan 91,25%. Hasil pendeteksian optimum diperoleh dengan

menggunakan k = 35 (Gambar 4). Dengan menggunakan fiekuensi tersebut,
algoritma mampu mendeteksi ketiga posisi loncatan sebanyak 98,75%. Dengan
demikian, frekuensi terbaik untuk data yang berukuran n = 300 adalah 35.

Gambar 4. Persentase data bangkitan yang terdeteksi sebanyak tiga loncatan
untuk pemakaian fiekuensi k dan n = 300.

Penggunaan fiekuensi 45,47,. -,73 menyebabkan algoritma mendeteksi
lebih dari tiga posisi loncatan. Disarnping mendeteksi ketiga posisi loncatan yang
sesungguhnya, algoritma juga memberikan mdikasi loncatan yang sebenarnya
tidak ada. Indikasi tersebut muncul diantara posisi loncatan yang sesmgguhnya.

Hal ini disebabkan oleh banyaknya data antara dua loncatan dalam data bangkitan
relatif sedikit untuk pemakaian frekuensi tersebut, sehingga asumsi yang berlaku
dalam metode polinom lokal tidak dipenuhi.

Ukuran Contoh n = 400
Hasil pendeteksian yang diperoleh dari data dengan ukuran n = 400 secara
umum identik dengan hasil yang diperoleh dari data dengan ukuran 100, 200 dan

300. Apabila fiekuensi yang digunakan sangat kecil maka algoritma tidak mampu
mendeteksi ketiga posisi loncatan yang ada (Lampiran 10). Sebaliknya, jika k
yang digunakan relatif besar maka algoritma memberikan indikasi loncatan lebih
dari tiga.
Frekuensi yang mampu mendeteksi ketiga posisi loncatan yang ada adalah
25,27,-.a, 55. Frekuensi 25,27,

a-,

33 mampu mendeteksi 68,75% sampai 84,16%.

Sedangkan penggunaan fi-ekuensi 35; 37; dan 39 menyebabkan algoritma mampu
mendeteksi masing-masing sebanyak 90,42%; 92,08%; d m 95,83%.
Hasil pendeteksian optimum diperoleh dengan memakai k = 4 1,43 dan 45
(Gambar 5). Dengan memakai fiekuensi tersebut, algoritma mampu mendeteksi
ketiga posisi loncatan sebanyak 98,75%. Hal ini menarik karena ada tiga fiekuensi
yang memberikan hasil pendeteksian yang sama. Namun demikian, berdasarkan
asumsi bahwa fi-ekuensi yang digunakan dalam metode polinom lokal adalah jauh
lebih kecil dari ukuran contoh. Ini berarti bahwa frekuensi terbaik untuk n = 400
adalah 4 1.

Gambar 5. Persentase data bangkitan yang terdeteksi sebanyak tiga loncatan
untuk pemakaian fiekuensi k dan n = 400.

Pembahasan Umum
Berdasarkan uraian sebelumnya, fiekuensi yang dapat memberikan hasil
pendeteksian optimum bergantung pada ukuran contoh. Frekuensi terbaik untuk
n = 100 adalah 15; k terbaik untuk n = 200 adalah 29; k terbaik untuk n = 300
adalah 35; sedangkan untuk n = 400, fiekuensi terbaik adalah 4 1.
Rasio antara fiekuensi terbaik dengan ukuran contoh yang dipakai ( k 1n )
adalah 151100 = 15% untuk n = 100 ; 29 1200 = 14,5% untuk n = 200 ; 35 1300
= 147% untuk n = 300 ; 4 11400 = 10,25% untuk n = 400 . H a d ini memberikan

suatu gambaran bahwa semakin besar ukuran contoh yang digunakan maka rasio
terbaik ( k 1n ) adalah semakin m e n m .
Penggunaan fiekuensi terbaik terhadap data dengan ukuran n = 100; 200;
300; dan 400 menyebabkan algoritma mampu mendeteksi ketiga posisi loncatan
masing-masing sebanyak 96,25%; 97,08%; 98,75%; dan 98,75% dari keseluruhan
data bangkitan. hi menunjukkan bahwa semakin besar ukuran contoh yang
dipakai kemampuan algoritma mendeteksi loncatan juga semakin besar. Hal ini
disebabkan oleh banyaknya data diantara dua posisi loncatan semakin bertambah.
Hasil ini relevan dengan asumsi bahwa paling banyak satu loncatan yang termuat
dalam setiap tetangga.
Persamaan regresi dari data bangkitan yang digunakan dalam penelitian ini
mempunyai tiga posisi loncatan. Banyaknya data (kerapatan) diantara dua posisi
loncatan yang berdekatan untuk n = 100 adalah 25. Kerapatan ini memenuhi
asumsi untuk pemakaian fiekuensi terbaik, k = 15. Tabel 3 menunjukkan bahwa
semakin s e a t data yang terdapat antara dua loncatan, persentase data bangkitan
yang terdeteksi (sebanyak tiga loncatan) untuk penggunaan k = 15 semakin

berkurang. Bahkan pemakaian k = 15 tidak lagi memberikan hasil yang optimum
apabila banyaknya data diantara dua loncatan sama dengan 20,21 clan 22. Hal ini
disebabkan oleh penggunaan k = 15 tidak memenuhi asumsi pa& kerapatan
tersebut.

Tabel 3. Persentase data bangkitan*yang terdeteksi sebanyak tiga lcmcatan
mtuk pemakaian fiekuensi k pada berbagai kerapatan data
antar loncatan dan n = 100

* Jumlah data bangkitan adalah 100.
Berdasarkan uraian sebelumnya, penggunaan k =15 pada data dengan
ukuran n = 100 dapat menghadkan pendeteksian optimum apabila banyaknya
data diantara dua loncatan (jika terdapat lebih dari satu) lebih besar dari 22. Akan
tetapi, informasi tentang banyaknya data antar loncatan pada data real seringkali
tidak diketahui. Sebagai altematif, data yang akan dideteksi dengan metode
polinom lokal sebaiknya bemkuran besar. Apabila data yang dideteksi berukuran
kecil maka sebaiknya hasil yang diperoleh diperiksa ulang mtuk m e m a n
tidak terjadinya salah deteksi. Pemeriksaan dapat dilakukan dengan menglutung
besar lmcatan pada masing-masing posisi yang terdeteksi. Besar loncatan yang
sesuai dengan rumus (6) menunjukkan bahwa hasil pendeteksian yang diperoleh
sudah tepat.

Beberapa karakteristik data yang &pat dijadikan petunjuk adanya loncatan
adalah (1) diagram pencar dari X-Y memperlihatkan kecendemgan data terbagi
menjadi beberapa populasi (segmen); (2) hubungan linear antara peubah X dan Y
tidak terlalu erat, dalarn hal ini nilai mutlak dari koefisien korelasi I r 1 relatif

kecil; (3) koefisien P, dari hasil pmgepasan global adalah nyata, akan tetapi nilai
koefisien determinasi R, relatif kecil; dan (4) deretan awal dari suku-suku galat
ceudenmg berkorelasi serial, dalam hal ini diagram pencar dari galat terhadap X
tidak acak.
Metode polinom lokal kuadrat terkecil mempunyai beberapa keterbatasan,
diantaranya (1) merupakan metode pendeteksi kasar sehhgga hasil pendeteksian
yang diperoleh masih harus diperiksa ulang untuk memastikan tidak terjadinya
salah deteksi; (2) metode ini lebi. tepat digunakan pada data deret wakty dalam
hal ini setiap nilai peubah penjelas x mempunyai tepat satu nilai respon y; dan (3)
besar loncatan yang dapat dideteksi bergantung pada simpangan baku galat, taraf

,,

kepercayaan ( 2, ) dm fiekumsi (k) yang digunakan dimana nilai-nilai ini hams
ditentukan sebelum pendeteksian.

KESIMPULAN DAN SARAN

Kesimpulan

Banyalcnya data (fiekuensi, k) setiap neighborhood dalam metode polinom
lokal yang &pat dipakai untuk mendeteksi adanya loncatan dengan menggunakan

w,'")
bergantung pada ukuran contoh (n). Semakin besar n, persentase n yang
dapat digunakan sebagai k semakin kecil. Diantara k yang ganjil, k terbaik untuk
n = 100 adalah 15; k terbaik untuk n = 200 adalah 29; k terbaik untuk n = 300
adalah 35; dan k terbaik untuk n = 400 adalah 41. Frekuensi tersebut merupakan

fiekuensi terbaik apabila banyahya data yang terletak diantara dua loncatan
(kalau terdapat lebih dari satu loncatan) lebih besar dari (3k - 1)/ 2. Batasan ini
merupakan asumsi yang hams dipenuhi dalam metode polinom lokal.

Saran

Metode polinom lokal lebih tepat digunakan pada data deret waktu
Beberapa karakteristik data yang dapat dipakai sebagai petunjuk adanya loncatan
adalah nilai koefisien determinasi R~ dari hasil pengepasan global relatif kecil

dan diagram pencar dari X-Ymenunjukkan kecenderungan data terbagi menjadi
beberapa segmen (populasi).
Apabila data yang akan dideteksi berukuran kecil maka sebaiknya hasil
yang diperoleh diperiksa ulang untuk memastikan tidak terjadinya salah deteksi.
Pemeriksaan dapat dilakdcan dengan menghtung besar loncatan pada masingmasing posisi yang terdeteksi. Apabila besar loncatan cukup si@kan
pendeteksian yang diperoleh sudah tepat.

maka hasil

DAFTAR PUSTAKA

Guthery SB. 1974. Partition regression. J Amer Statist Assoc 69:945-947.
W d l e W, Hall P, Marron S. 1988. How far are the optimally chosen smoothing
parameters &om their optimum?. J Amer Statist Assoc 83:86-95.
Hastie TJ, Tibshirani RJ.1987. Generalized additive mode&:some applications. J
Amer Statist Assoc 82:37 1-386.
Hastie TJ, Tibshirani RJ. 1990. Generalized Additive Models. New York:
Chapman & Hall.

Q u P, Yandell B. 1998. A local polynomial jump-detection algorithm in nonparametric regression. Technometxics 40: 141-152.
Silverman BW. 1984. A fast and efficient cross-validation method fbr smoothing
parameter choice in spline regression. J Amer Statist Assoc 79:584-589.
Wegman EJ, Wright IW.1983. Splines in statistics. J Amer Statist Assoc 78:351365.

LAMPIRAN

Lampiran 1. Contoh h g s i yang dijadikan sumber data bangkitan

Lampiran 2. Diagram pencar dari contoh data bangkitan yang dipakai

Lampiran 3. Contoh hasil pendeteksian untuk n = 100

Keterangan :

I
Dua
]
posisi loncatan yang terdeteksi
I

Lampiran 3. Lanjutan

Keterangan :

+ Dua posisi loncatan yang terdeteksi

Lampiran 3. Lanjutan

Keterangan :

1

1

1 Dua posisi ioncatan yang terdetekri

Lampiran 4. Contoh hasil pendeteksian untuk n = 200

Keterangan :

1

2

Dua posisi loncatan yang terdeteksi

Lampiran 4. Lanjutan

Keterangan :

1

2 Dua posisi Ioncatan yang terdeteksi

Lampiran 4. Lanjutan

Keterangan :

a+

Dua posisi loncatan yang terdeteksi

Lampiran 5. Contoh hasil pendeteksian untuk n = 300

Keterangan :

+

Dua posisi loncatan yang terdeteksi

Lampiran 5 . Lanjutan

Keterangan :

-, Dua posisi loncatan yang terdeteksi

Keterangan :

-+

Dua posisi loncatan yang terdeteksi

Lampiran 6 . Cantoh hasil pendeteksian mtuk n = 400

Keterangan :

2

Dua posisi loncatan yang terdeteksi

Lampiran 6. Lanjutan

Keterangan :

1 Dua posisi loncatan yang terdeteksi
2

Keterangan :

1

2

Dua posisi loncatan yang terdeteksi

Keterangan :

1 Dua posisi Ioncatan yang terdeteksi
2

Lampiran 7. Makro minitab untuk mendeteksi loncatan

gmacro
deteksi
noecho
name C1='X1
name C2= 'Respon Y '
let kl=count (Cl)

##Nilai peubah penjelas X ciiketik berurut pada kolom C 1
## Nilai peubah respon Y diketik pada kolom C2
## Ukuran data yang dideteksi

center C1 C3;
MinMax 1 kl.
let C3=C3/kl

## Nil4 rancangan 0 c x, < 1 pada kolom C3

center C2 C4.

##Standardisasi respon Y pada kolom C4

let k2=
let k3=
let k4=
let C1000 (1)=k2
name C1000='k'

## Isi hkuensi yang dipakai (lihat kesimpulan penelitian ini)
## Isi simpangan baku data
##Isi taraf kepercayaan yang dipakai (bergantungjenis data)
## Nilai k tercetak pada kolom C 1000

## Nilai Threshold

let k5=SQRT ( (6*( (5*k2)-3)) / ( ( (k2)**2)-1))
let k6=(k3)*(k4)*(kl/k2)*k5
let C999(1)=k6
name C999='u11
## Nilai threshold tercetak pada kolom C999
let k7=1+ (-l+k2)/2
let k8=1-k2+kl
let k9=ll

## Indeks median 1+1kolom x
# Banyaknya polinom lokal
##Lokasi cetak koefisien fi polinom pertama

do k10=1:k8
do kll=l:k2
let kl2=-l+klO+kll
let C5(kll)=C3(k12)
let C6(kll)=C4(k12)
enddo

## Loop untuk polinom ke-k 10
# Baris 1 sampai baris k

Regress C6 1 C5;
coefficients Ck9.
let C994 (k10)=Cl (k7)
let C995 (k10)=Ck9 (2)
let k9=l+k9
let k7=l+k7
enddo
name C994='x B1'
name C995='Koef B1'

##Nilaix,lokaltercetakpadakolomC5
##PeubahY lokaltercetakpadakolomC6
## Menglutung koefisien regresi
## Lokasi cetak koefisien &
## Nilai x untuk koefisien fi tercetak pada C994
## Nilai koefisien PItercetak pada kolom C995

Lampiran 7. Lanjutan

## Operator 6:)

let
let
let
let

k13= (-l+k2)/2
k14=l+k13
k15=1+ (2*k13)
k17=k2

## Nilai 1
## Indeks median 1+1
##Nilai k

do k18=1:k16
let C996 (k18)=Cl(k17)
## Nilai x untuk operator tercetak pada C996
let k19=C995(k14)-C995(k18)
let k20=C995 (k14)-C995 (k15)
let k21=abso (kl9)
let k22=abso (k20)
if k21=k22 or k21k22
let C997 (k18)=k20
endif

## Nilai operator A!)

tercetak pada C997

let k14=l+k14
let k15=l+k15
let k17=l+k17
let k23=C997 (k18)
let k24=abso (k23)
if k24>k6
let c998 (k18)=1
else if k24 %c:\jump. txt
I

r

Gambar 8. Pendeteksian loncatan dengan makro minitab.

Hasil pendeteksian dapat dilihat pa& kolom C996 dan C998. Jika terjadi suatu
loncatan maka pada kolom C998 tercetak angka 1, sedangkan angka yang tercetak
pada C996 menunjukkan posisi loncatan.