Analisis Model Regresi Nonparametrik Sirkular-Linear Berganda.

(1)

ANALISIS MODEL REGRESI NONPARAMETRIK SIRKULAR-LINEAR BERGANDA

KOMPETENSI STATISTIKA

SKRIPSI

KOMANG CANDRA IVAN 1108405007

JURUSAN MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS UDAYANA

BUKIT JIMBARAN 2016


(2)

ii

LEMBAR PERSEMBAHAN

Dengan rasa syukur yang mendalam tulisan ini saya persembahkan kepada: Ida Sang Hyang Widhi Wasa

Atas segala anugerahNya yang sangat melimpah,

Ayah, Ibu, Kakak, Adik, dan seluruh keluarga besar

Atas segala doa, dukungan, motivasi, dan inspirasi yang selalu menyertai,

“Sahabat kumpul bareng” Hardi Karmana, Alit Putra, Agus Widhiantara, dan anggota Markas Sading lainnya

Atas dukungan, motivasi dan segala bantuannya,

Sahabat di Jurusan Matematika, FMIPA Unud

Atas segala doa, semangat dan dukungannya dalam menyelesaian TA ini.


(3)

iii

ANALISIS MODEL REGRESI NONPARAMETRIK SIRKULAR-LINEAR BERGANDA

KOMPETENSI STATISTIKA [SKRIPSI]

Sebagai syarat untuk memperoleh gelar Sarjana Sains bidang Matematika pada Fakultas Matematika dan Ilmu Pengetahuan Alam

Universitas Udayana

Tulisan ini merupakan hasil penelitian yang belum pernah dipublikasikan

KOMANG CANDRA IVAN 1108405007

Pembimbing II Pembimbing I

Made Susilawati, S.Si., M.Si. I Wayan Sumarjaya, S.Si., M.Stats. NIP. 197109021998022001 NIP. 197704212005011001


(4)

iv

LEMBAR PENGESAHAN TUGAS AKHIR

Judul : Analisis Model Regresi Nonparametrik Sirkular-Linear Berganda

Kompetensi : Statistika

Nama : Komang Candra Ivan

NIM : 1108405007

Tanggal Seminar : 18 Maret 2016

Disetujii oleh:

Pembimbing II Pembimbing I

Made Susilawati, S.Si., M.Si. I Wayan Sumarjaya, S.Si., M.Stats. NIP. 197109021998022001 NIP. 197704212005011001

Penguji I

I Gusti Ayu Made Srinadi, S.Si., M.Stats. NIP.197704212005011001

Penguji III Penguji II

Ni Ketut Tari Tastrawati, S.Si., M.Si. Ir. I Komang Gde Sukarsa, M.Si. NIP.197405282002122002 NIP. 196501051991031004

Mengetahui

Ketua Jurusan Matematika FMIPA Universitas Udayana

Desak Putu Eka Nilakusmawati, S.Si., M.Si. NIP. 197106111997022001


(5)

v

Judul : Analisis Model Regresi Nonparametrik Sirkular-Linear Berganda Nama : Komang Candra Ivan

Pembimbing : 1. I Wayan Sumarjaya, S.Si., M.Stats. 2. Made Susilawati, S.Si., M.Si.

ABSTRAK

Data sirkular adalah data yang dapat digambarkan dalam besaran vektor. Analisis statistika yang digunakan untuk menganalisis data sirkular adalah analisis statistika sirkular. Dalam analisis regresi, jika salah satu atau keduanya dari variabel prediktor atau variabel respons adalah data sirkular, maka analisis regresi yang digunakan disebut analisis regresi sirkular. Data pengamatan pada statistika sirkular yang bersatuan arah atau waktu memiliki kecenderungan tidak memenuhi asumsi-asumsi yang mendasari uji parametrik, sehingga regresi nonparamterik bisa menjadi solusi. Estimasi fungsi regresi nonparametrik menggunakan estimator kernel epanechnikov untuk variabel linear dan von Mises untuk variabel sirkular. Hasil penelitian memperoleh hasil analisis data sirkular dengan statistika deskriptif sirkular memiliki hasil yang lebih baik daripada penggunaan statistika secara umum. Regresi nonparametrik sirkular-linear berganda dengan estimator kernel epanechnikov dan von Mises tidak menghasilkan model estimasi secara eksplisit seperti regresi parametrik melainkan estimasi dari titik-titik amatan. Kata Kunci : Data Sirkular, Regresi Sirkular, Regresi Nonparametrik Sirkular- Linear.


(6)

vi

Title : Nonparametric Cicular-Linear Multiple Regression Model Analysis Name : Komang Candra Ivan

Supervisor : 1. I Wayan Sumarjaya, S.Si., M.Stats. 2. Made Susilawati, S.Si., M.Si.

ABSTRACT

Circular data are data which value are in form of vector. Statistic analysis that is used in analyzing circular data is circular statistic analysis. In regression analysis, if any of predictor or response variables or both are circular then the regression analysis used is called circular regression analysis. Observation data in circular statistic which use direction and time units usually don’t satisfy all of the parametric assumptions, thus making nonparametric regression as a good solution. Nonparametric regression function estimation is using epanechnikov kernel estimator for the linier variables and von Mises kernel estimator for the circular variable. This study showed that the result of circular analysis by using circular descriptive statistic is better than common statistic. Multiple circular-linier nonparametric regressions with Epanechnikov and von Mises kernel estimator didn’t create estimation model explicitly as parametric regression does, but create estimation from its observation knots instead.

Keywords: Circular Data, Circular Regression, Circular-Linier Nonparametric Regression


(7)

vii

KATA PENGANTAR

Puji syukur penulis panjatkan kehadapan Ida Sang Hyang Widhi Wasa karena berkat rahmat-Nya penulis dapat menyelesaikan tugas akhir yang berjudul “Analisis Model Regresi Nonparametrik Sirkular-Linear Berganda”

Pada kesempatan ini penulis mengucapkan terima kasih kepada berbagai pihak yang telah memberikan bantuan sehingga tugas akhir ini dapat tersusun dengan baik, antara lain:

1. Ibu Desak Putu Eka Nilakusmawati, S.Si., M.Si selaku Ketua Jurusan Matematika F.MIPA Universitas Udayana.

2. Bapak I Wayan Sumarjaya, S.Si, M.Stats selaku ketua komisi Tugas Akhir dan sekaligus selaku pembimbing I telah banyak membantu dan membimbing dalam penyusunan tugas akhir ini

3. Ibu Made Susilawati, S.Si., M.Si sebagai pembimbing II yang telah banyak memberikan bimbingan, dukungan dan arahan hingga terselesaikannya tugas akhir ini.

4. Dosen penguji yaitu I Gusti Ayu Made Srinadi, S.Si., M.Stats., Ir. I Komang Gde Sukarsa, M.Si., dan Ni Ketut Tari Tastrawati, S.Si., M.Si., yang telah memberikan banyak masukan dalam penyempurnaan tugas akhir ini.

5. Bapak dan Ibu dosen di Jurusan Matematika yang telah memberikan saran dan masukan selama penyusunan tugas akhir ini.


(8)

viii

6. Keluarga, terutama kedua orang tua yang telah memberikan dukungan secara materi, memberikan semangat dan doa dalam menyelesaikan tugas akhir ini.

7. Teman-teman beserta semua pihak yang telah memberikan semangat dan membantu penulis dalam menyelesaikan tugas akhir ini

Penulis menyadari sepenuhnya bahwa tugas akhir ini belum sempurna. Oleh karena itu kritik dan saran yang membangun sangat penulis harapkan.

Bukit Jimbaran, 18 Maret 2016


(9)

ix

BIODATA ALUMNI

Nama Lengkap : Komang Candra Ivan

NIM : 1108405007

Jenis Kelamin : Laki-laki

Tempat, Tanggal Lahir : Busungbiu, 20 November 1992 Alamat : Banjar Kaja, Desa Busungbiu, Kec.

Busungbiu, Kab. Buleleng, Bali

Agama : Hindu

Tanggal Lulus : 18 Maret 2016 Kompetensi : Statistika IP Kumulatif : 3,45

Predikat Kelulusan : Sangat Memuaskan Nilai TOEFL Lokal : 500

Email : candraivankomang@gmail.com

Nomor HP : 081246290270

Nama Ayah : I Wayan Lain Nama Ibu : Ni Ketut Sumiati

Alamat Ayah/Ibu : Banjar Kaja, Desa Busungbiu. Kec. Busungbiu, Kab. Buleleng, Bali


(10)

x

DAFTAR ISI

Halaman

HALAMAN JUDUL ... i

LEMBAR PERSEMBAHAN ... ii

LEMBAR PERNYATAAN ... iii

LEMBAR PENGESAHAN ... iv

ABSTRAK ... v

ABSTRACT ... vi

KATA PENGANTAR ... vii

BIODATA ALUMNI ... ix

DAFTAR ISI ... x

DAFTAR TABEL ... xii

DAFTAR GAMBAR ... xiii

DAFTAR LAMPIRAN ... xiv

BAB I PENDAHULUAN ... 1

1.1 Latar Belakang ... 1

1.2 Rumusan Masalah ... 4

1.3 Tujuan Penelitian ... 4

1.4 Manfaat Penelitian ... 5

BAB II TINJAUAN PUSTAKA ... 6

2.1 Data ... 6

2.1.1 Ukuran Pemusatan Data ... 6


(11)

xi

2.2 Data dan Statistika Sirkular ... 8

2.2.1 Ukuran Pemusatan Data Sirkular ... 11

2.2.2 Ukuran Penyebaran Data Sirkular ... 16

2.3 Regresi Sirkular ... 16

2.4 Regresi Nonparametrik ... 18

2.4.1 Kernel Standar ... 18

2.4.2 Kernel Sirkular ... 20

2.5 Bandwidth ... 21

2.6 Regresi Nonparametrik Sirkular – Linear Berganda ... 22

BAB III METODE PENELITIAN ... 26

3.1 Jenis Data ... 26

3.2 Identifikasi Variabel Penelitian ... 26

3.3 Metode Analisis... 26

BAB IV HASIL DAN PEMBAHASAN ... 28

4.1 Deskripsi Data ... 28

4.2 Analisis Regresi Nonparametrik Sirkular-Linear Berganda ... 33

BAB V KESIMPULAN DAN SARAN... 42

5.1 Kesimpulan ... 42

5.2 Saran ... 42

DAFTAR PUSTAKA ... 44 LAMPIRAN


(12)

xii

DAFTAR TABEL

Tabel Halaman

4.1. Statistika Deskriptif Data Curah Hujan, Temperatur Maksimum,

Temperatur Minimum, Kecepatan Angin, dan Arah Angin ... 28

4.2. Statistika Deskriptif Data Arah Angin ... 29

4.3. Nilai Bandwidth dan CV untuk Variabel Temperatur Maksimum ... 34

4.4. Nilai Bandwidth dan CV untuk Variabel Temperatur Minimum ... 35


(13)

xiii

DAFTAR GAMBAR

Gambar Halaman

2.1. Hubungan Koordinat Kartesius dengan Koordinat Polar ... 9

2.2. Arah Acuan dan Arah Rotasi Pengamatan ... 10

2.3. Diagram Pancar (a), Histogram Siklik (b), dan Diagram Mawar (c) ... 11

2.4. Arah Rata-rata Sirkular dengan Statistika Linear untuk Dua Buah Pengamatan ... 12

2.5. Arah Rata-rata Sirkular dengan Statistika Linear untuk Empat Buah Pengamatan... ... 12

2.6. Median Sirkular untuk Data Genap dan Data Ganjil ... 15

2.7. Media Sirkular dan Median Linear ... 15

4.1. Histogram Data Curah Hujan ... 29

4.2. Histogram Data Kecepatan Angin ... 30

4.3. Histogram Data Temperatur Maksimum ... 30

4.4. Histogram Data Temperatur Minimum ... 31

4.5. Diagram Pancar Arah Angin ... 32

4.6. Plot dan ̂ Terhadap Hari Untuk Semua Data Amatan ... 39

4.7. Plot dan ̂ Terhadap Hari Untuk 150 Data Amatan Pertama ... 39

4.8. Plot Residual Terhadap Hari Untuk Semua Data Amatan ... 40


(14)

xiv

DAFTAR LAMPIRAN Lampiran

1. Data Curah Hujan, Temperatur Maksimum, Temperatur Minimum, Kecepatan Angin, dan Arah Angin.

2. Program Statistika Deskriptif dengan Bantuan Software R.

3. Program Statistika Deskriptif Data Sirkular Arah Angin dengan Bantuan Software R.

4. Program Untuk Menentukan Nilai Bandwidth Optimal pada Variabel Temperatur Maksimum Berdasarkan Kriteria CV dengan Kernel Epanechnikov dengan Bantuan Software R.

5. Output Nilai Bandwidth (h) dan CV dengan Kernel Epanechnikov Untuk Variabel Temperatur Maksimum.

6. Program Untuk Menentukan Nilai Bandwidth Optimal pada Variabel Arah Angin Berdasarkan Kriteria CV dengan Bantuan Software R.

7. Program Untuk Menentukan Nilai Fungsi Bessel Termodifikasi Orde Nol dengan Bandwidth sirkular 6,42 dengan Bantuan Software MATLAB R2009a.

8. Fungsi Linear Sirkular

9. Program Untuk Menentukan Nilai Fungsi Linear-Sirkular dengan Bantuan Software MATLAB R2009a.

10. Output Fungsi Linear Sirkular .

11. Program Untuk Menentukan Penduga Kernel ̂ dengan Bantuan Software MATLAB R2009a.


(15)

1 BAB I PENDAHULUAN 1.1Latar Belakang

Dalam beberapa kasus penelitian, peneliti terkadang harus melakukan pengukuran terhadap data yang bersatuan waktu atau derajat arah yang nilai-nilainya berulang secara periodik. Sebagai contoh penelitian pada bidang biologi tentang arah migrasi hewan menghasilkan data pengamatan yang bersatuan arah. Kumpulan data pengamatan yang bersatuan arah disebut data berarah (directional data). Jika penelitian tentang arah migrasi hewan tersebut dilakukan pada jarak migrasi tertentu, maka data pengamatan yang diperoleh akan memiliki besaran vektor. Jika pengamatan tersebut digambarkan dalam besaran vektor, maka data pengamatan disebut data sirkular (circular data) (Jammalamadaka dan SenGupta, 2001).

Berbeda dengan data pada umumnya, data sirkular tidak memiliki nilai minimum dan maksimum dan data awalnya sama dengan data terakhir yaitu data pada arah 0 radian akan sama dengan data pada arah radian untuk bilangan bulat positif. Untuk menganalisis data sirkular ada dua fungsi trigonometri yang dapat digunakan untuk menentukan posisi data yaitu fungsi sinus dan cosinus. Analisis statistika yang dapat digunakan untuk menganalisis data sirkular adalah analisis statistika sirkular. Penggunaan fungsi sinus dan cosinus dalam melakukan pengukuran rataan pada analisis statistika sirkular mengakibatkan pengukuran rataan pada data sirkular yang bersatuan arah atau waktu dengan analisis statistika sirkular lebih akurat dibandingkan analisis statistika linear (Nurhab, 2014).


(16)

2

Analisis statistika yang digunakan untuk mengetahui bentuk hubungan antara variabel prediktor (independent variable) dengan variabel respons (dependent variable) adalah analisis regresi. Jika salah satu atau keduanya dari variabel prediktor atau variabel respons tersebut merupakan data sirkular, maka analisis regresi yang digunakan disebut analisis regresi sirkular. Regresi sirkular dibagi menjadi tiga jenis (Scoot, 2002) yaitu regresi sirkular–linear (circular-linear regression), regresi sirkular-sirkular (circular-circular regression), dan regresi linear-sirkular (linear-circular regression). Diagnosis data sebelum melakukan penelitian akan sangat bermanfaat untuk menentukan jenis regresi yang digunakan. Penelitian yang dilakukan Nurhab (2014), menunjukkan bahwa dalam membangun model antara dua variabel prediktor sirkular dengan sebuah variabel respons linear, penggunaan analisis regresi linear berganda menghasilkan model regresi yang kurang baik dibandingkan dengan penggunaan analisis regresi sirkular.

Pada umumnya, di antara tiga jenis regresi sirkular yang paling sering digunakan dalam penelitian adalah regresi sirkular-linear atau pengembangannya (Scoot, 2002), tetapi penelitian menggunakan pengembangan regresi sirkular-linear dengan variabel prediktornya sirkular dan sirkular-linear masih jarang dilakukan. Dalam analisis regresi terdapat dua teknik pendekatan yang dapat digunakan untuk mengestimasi fungsi atau kurva regresi yaitu pendekatan parametrik dan nonparametrik. Pengamatan-pengamatan pada statistika sirkular yang bersatuan arah atau waktu akan memiliki kecenderungan tidak memenuhi asumsi-asumsi yang mendasari uji parametrik terutama asumsi sisaan harus berdistribusi normal.


(17)

3

Pada uji parametrik, pemilihan model yang tidak tepat akan berdampak pada hasil yang kurang memuaskan dan kurva yang dibentuk juga kurang sesuai, meskipun transformasi data masih bisa menjadi solusi, tetapi kesalahan dalam transformasi data bisa menghasilkan model yang lebih rumit (Sukarsa dan Srinadi, 2012).

Regresi nonparametrik bisa menjadi alternatif dalam penelitian jika pengamatan-pengamatan tidak memenuhi asumsi-asumsi yang mendasari uji parametrik karena penggunaan uji nonparametrik berlandaskan asumsi yang umum dan tidak memperhatikan asumsi kenormalan galat. Dalam regresi nonparametrik, estimasi fungsi menggunakan teknik smoothing. Estimator kernel adalah salah satu teknik smoothing yang paling umum digunakan dalam regresi nonparametrik karena dapat memberikan langkah-langkah yang mudah dipahami dalam menemukan struktur dari data (Wand dan Jones, 1995).

Penelitian yang menggunakan analisis regresi sirkular atau pengembangannya telah dilakukan pada banyak bidang penelitian sebagai alternatif untuk melakukan pengukuran pada data sirkular, seperti penelitian yang dilakukan pada bidang biologi, geografi, geologi-geofisika, kedokteran, meteorologi dan klimatologi, dan kelautan. Penelitian sebelumnya yang menggunakan analisis regresi sirkular-linear dilakukan oleh Qin (2011) yang membangun model regresi nonparametrik sirkular-linear berganda yang diaplikasikan pada data energi angin yang dipengaruhi oleh waktu, kecepatan angin, dan arah angin menghasilkan kesimpulan yaitu penggunaan regresi nonparametrik menghasilkan model yang lebih baik dibandingkan penggunaan


(18)

4

regresi parametrik. Penelitian lainnya dilakukan oleh Nurhab (2014) yang membangun model regresi berganda sirkular(2)-linear pada variabel sirkular yaitu arah angin dan arah awan terhadap variabel linear yaitu curah hujan di Bogor, menghasilkan kesimpulan yaitu dalam menganalisis data sirkular, penggunaan analisis regresi sirkular menghasilkan model yang lebih baik dibandingkan penggunaan analisis regresi linear berganda.

Banyaknya kasus data berarah yang dianalisis secara umum menjadi motivasi bagi penulis untuk melakukan penelitian lebih lanjut dengan menggunakan analisis regresi nonparametrik sirkular-linear berganda antara variabel respons linear dengan variabel prediktor sirkular dan linear.

1.2Rumusan Masalah

Berdasarkan latar belakang penelitian, maka rumusan masalah dalam penelitian ini adalah sebagai berikut

1. Bagaimana penerapan statistika sirkular pada data berarah atau data sirkular? 2. Bagaimana model regresi nonparametrik sirkular-linear berganda antara

variabel respons linear dengan variabel prediktor sirkular dan linear? 1.3Tujuan Penelitian

Adapun tujuan dari penelitian ini, yaitu sebagai berikut:

1. untuk mengetahui penerapan statistika sirkular pada data berarah atau data sirkular;

2. untuk mengetahui model regresi nonparametrik sirkular-linear berganda antara variabel respons linear dengan variabel prediktor sirkular dan linear.


(19)

5

1.4Manfaat Penelitian

Penelitian ini diharapkan bermanfaat bagi:

1. Bagi Peneliti

Penelitian ini bermanfaat bagi peneliti yang ingin melakukan pengukuran atau penelitian terhadap data yang bersatuan arah atau waktu karena dapat menjadi metode alternatif dalam melakukan penelitian terhadap data yang bersatuan arah atau waktu.

2. Bagi Mahasiswa

Penelitian ini bermanfaat bagi mahasiswa sebagai tambahan bahan ajaran terutama dalam ilmu statistika khususnya analisis regresi sirkular.


(20)

6 BAB II

TINJAUAN PUSTAKA

Bab ini membahas teori-teori dasar yang digunakan sebagai landasan pembahasan pada bab selanjutnya. Pembahasan teori meliputi pengertian data secara umum dan data sirkular, ukuran pemusatan dan penyebaran data, regresi sirkular, regresi nonparametrik, dan regresi nonparametrik sirkular-linear berganda.

2.1 Data

Data adalah nilai numerik hasil dari sebuah pengamatan (observation) yang dalam penelitian diasumsikan sebagai variabel (Kitchens, 1998). Data diolah oleh peneliti dan kemudian diinterpretasikan sehingga dapat dimengerti oleh orang lain yang tidak secara langsung melakukan pengamatan atau pengumpulan fakta dari sebuah kejadian.

2.1.2 Ukuran Pemusatan Data

Ukuran pemusatan data memberikan informasi tentang titik-titik di mana data pengamatan terpusat atau terkumpul dan dapat juga menjadi ciri khas dari kumpulan data pengamatan (Kitchens, 1998).

A. Nilai tengah (mean)

Jika adalah anggota suatu populasi terhingga berukuran , nilai tengah populasinya adalah


(21)

7

. (2.1)

Sedangkan, jika adalah sampel berukuran , maka nilai tengah sampelnya adalah

̅ ∑ (2.2)

B. Median

Median memiliki sifat membagi dua sama banyak kumpulan data yang telah diurutkan sebelumnya. Jika banyak data ganjil, maka median adalah data yang tepat berada di tengah yaitu pada amatan . Sedangkan, jika banyak data genap, maka median berada di antara dua data yang berada di tengah yaitu rata-rata dari pengamatan dan pengamatan .

C. Modus

Modus adalah suatu nilai amatan yang paling sering muncul dalam melakukan penelitian. Nilai modus dalam penelitian mungkin saja akan lebih dari satu. Penyajian data dalam bentuk grafik akan mempermudah dalam menentukan nilai modus dari kumpulan data.

2.1.3 Ukuran Penyebaran Data

Ukuran penyebaran data merupakan suatu informasi yang diperoleh dalam penelitian yang memberikan penjelasan seberapa jauh data-data yang diperoleh menyebar dari titik pemusatannya (Kitchens, 1998). Ukuran penyebaran data yang paling sering digunakan adalah ragam. Ragam (variance) memberikan informasi


(22)

8

rata-rata jarak kuadrat semua titik pengamatan terhadap titik pusat atau rataan. Jika adalah anggota suatu populasi terhingga berukuran , maka ragam populasinya adalah

∑ (2.3)

Sedangkan, jika adalah anggota suatu sampel berukuran , maka ragam sampelnya adalah

∑ ̅ (2.4)

2.2 Data dan Statistika Sirkular

Data sirkular adalah data yang nilai-nilainya berulang secara periodik dengan responnya bukan skalar tetapi angular atau berarah sehingga dikategorikan sebagai data berarah (Jammalamadaka dan SenGupta, 2001). Pengukuran data sirkular biasanya dalam satuan derajat sampai atau dalam satuan radian dari 0 radian sampai radian.

Dua alat yang sering digunakan untuk membantu dalam pemilihan arah pada proses pengukuran data sirkular adalah kompas dan jam. Dalam melakukan pengukuran, arah utara pada kompas dan pukul 00.00 pada jam biasanya disebut arah atau 0 radian. Arah migrasi hewan, arah terbang burung, atau arah angin dihitung dengan bantuan kompas. Waktu kejadian kasus kecelakaan, waktu kejadian kasus kriminal, waktu datangnya pasien dalam 24 jam di sebuah rumah sakit dihitung dalam jam.


(23)

9

Berbeda dengan data pada umumnya yang hanya memiliki satu dimensi pengukuran, data sirkular memiliki dua dimensi pengukuran yaitu jika pengamatan digambarkan pada koordinat kartesius dapat dinyatakan sebagai nilai atau pada koordinat polar dapat dinyatakan sebagai nilai dengan

sebagai jarak titik dari titik pusat pada sudut .

Gambar 2.1 Hubungan Koordinat Kartesius dengan Koordinat Polar (Nurhab, 2014)

Pada Gambar 2.1. perubahan koordinat polar menjadi koordinat kartesius dapat menggunakan persamaan trigonometri berikut

dan . (2.5)

Perbedaan lainnya dengan data pada umumnya adalah data sirkular tidak memiliki nilai minimum dan maksimum karena data awal sama dengan data akhir yaitu radian sama dengan radian. Nilai pengamatan pada sudut akan memiliki nilai yang sama dengan pengamatan yang terletak pada sudut untuk bilangan bulat positif, karena dalam analisis sirkular yang diperhatikan adalah arah bukan besaran vektor yaitu setiap titik pengamatan pada keliling lingkaran menyatakan sebuah arah. Pada Gambar 2.1, sebuah pengamatan menyatakan arah yang dibuat vektor terhadap sumbu positif atau menyatakan arah yang dibuat vektor terhadap sumbu positif. Koordinat kartesius amatan tersebut adalah dan koordinat polarnya

x y

P r


(24)

10

adalah . Karena yang diperhatikan adalah arah, maka jarak setiap amatan dari titik pusat dibuat sama dengan 1 . Sehingga diambil vektor-vektor tersebut menjadi vektor unit yaitu vektor dengan panjang satuan .

Representasi data sirkular dalam arah yang dipengaruhi sudut tentu tidak selalu unik yaitu nilai angularnya bergantung pada pemilihan arah acuan dan arah rotasi apakah searah dengan arah perputaran jarum jam (clockwise) atau berlawanan arah perputaran jarum jam (counter-clockwise) (Jammalamadaka dan SenGupta, 2001). Pemilihan arah utara sebagai arah acuan mengakibatkan arah perputaran positif yaitu searah dengan arah perputaran jarum jam, sedangkan pemilihan arah timur sebagai arah acuan mengakibatkan arah perputaran positif yaitu berlawanan arah perputaran jarum jam. Pada Gambar 2.2, arah adalah jika arah acuannya adalah arah utara dan arah rotasinya searah perputaran jarum jam, atau jika arah acuannya adalah arah timur dan arah rotasinya berlawanan arah perputaran jarum jam.

Gambar 2.2. Arah Acuan dan Arah Rotasi Pengamatan

Dalam analisis regresi sirkular-linear, perbedaan pemilihan arah acuan tidak memengaruhi koefisien determinasi dan statistik lima serangkai yaitu

r P Utara


(25)

11

statistik minimum, kuartil bawah, median, kuartil atas, dan statistik maksimum dari sisaannya, tetapi memengaruhi hasil dugaan parameter persamaan regresi sirkular-linear. Sedangkan perbedaan pemilihan arah rotasi tidak berpengaruh terhadap persamaan regresi sirkular-linear yang dibentuk (Nurussadad, 2011).

Representasi data sirkular dalam bentuk grafis menjadi hal yang sangat penting dan bentuknya tentu akan berbeda dengan representasi grafis data pada umumnya. Bentuk grafis yang biasa digunakan dalam analisis data sirkular adalah

Gambar 2.3. Diagram Pancar (a), Histogram Siklik (b), dan Diagram Mawar (c)

(Nurhab, 2014)

2.2.1 Ukuran Pemusatan Data Sirkular

Mengalisis data sirkular menggunakan dua fungsi trigonometri yaitu fungsi sinus � dan fungsi cosinus . Sehingga cara menghitung ukuran pemusatan dan ukuran penyebaran data sirkular akan berbeda dengan cara menghitung ukuran pemusatan dan ukuran penyebaran pada umumnya.

A. Arah rata-rata sirkular

Menurut Jammalamadaka dan SenGupta (2001), menentukan arah rata-rata data sirkular menggunakan metode yang digunakan pada statistika linear dapat menghasilkan arah rata-rata yang tidak sesuai dengan pusat dari data


(26)

12

pengamatan yang diperoleh. Sebagai contoh penelitian tentang arah migrasi burung. Misalkan dua burung terbang ke arah dan ke arah dan dipilih arah acuan nol derajat yaitu arah utara dan arah rotasi searah dengan arah perputaran jarum jam seperti yang ditunjukkan pada gambar berikut:

Gambar 2.4. Arah Rata-rata Sirkular dengan Statistika Linear untuk Dua Buah Pengamatan.

Pada Gambar 2.4, dengan menggunakan statistika linear diperoleh arah rata-rata yaitu yang menuju ke arah selatan, meskipun arah terbang kedua burung tersebut lebih terkonsentrasi ke arah utara. Jika dimisalkan lagi terdapat empat burung yang bermigrasi masing-masing ke arah , dan dengan arah acuan dan arah rotasi yang sama, maka dengan statistika linear diperoleh arah rata-rata yaitu yang menuju ke arah selatan seperti yang ditunjukkan pada gambar berikut:

Gambar 2.5. Arah Rata-rata Sirkular dengan Statistika Linear untuk Empat Buah Pengamatan.


(27)

13

Pada Gambar 2.5, dengan menggunakan statistika linear diperoleh arah rata-rata yaitu yang menuju ke arah selatan meskipun data semakin terkonsentrasi ke arah utara. Berdasarkan contoh tersebut, dapat ditunjukkan bahwa metode yang digunakan untuk mencari nilai rata-rata statistika linear tidak cukup baik untuk diterapkan pada data sirkular. Keragaman data sampel yang sangat bergantung pada nilai rata-rata tentu juga akan sangat dipengaruhi nilainya.

Menentukan arah rata-rata untuk data sirkular dilakukan dengan memperlakukan data sirkular dalam vektor unit dan menggunakan arah dari vektor resultannya (Jammalamadaka dan SenGupta, 2001). Arah rata-rata sirkular

̅ diperoleh dari

̅ , (2.6)

̅ , (2.7)

dengan � adalah fungsi cosinus dan fungsi sinus yang diperoleh dari

∑ (2.8)

� ∑ (2.9)

dengan adalah pengamatan ke- dan panjang vektor resultan diperoleh dari


(28)

14

Vektor resultan dari vektor unit diperoleh dengan menjumlahkan semua komponen arahnya

� . (2.11)

Balikan kuadran tertentu (invers quadrant-specific) tangen dari arah rata-rata sirkular ̅ diberikan untuk segala kemungkinan nilai fungsi dan � yaitu

̅ {

(2.12)

B. Median data sirkular

Mardia (1972) dalam Otieno (2002) menyatakan bahwa median sampel ̃ dari data sampel sirkular adalah titik pada keliling lingkaran yang memiliki sifat :

1. Diameter dengan adalah anti-median membagi lingkaran menjadi dua bagian, yang setiap bagiannya memiliki jumlah pengamatan sama banyak.

2. Sebagian besar data pengamatan berada disekitar titik dibandingkan di titik .

Jika > dan � ≥ Jika dan � > Jika <

Jika ≥ dan � < Jika dan �


(29)

15

Gambar 2.6. Median Sirkular untuk Data Genap dan Data Ganjil (Otieno, 2002)

Jika banyak data adalah genap, maka median sampel sirkular berada di antara dua pengamatan yang berdekatan dengan . Sedangkan jika banyak data adalah ganjil, maka median sampel sirkular adalah sebuah titik data pengamatan. Proses menentukan median pada data sirkular tidak bisa disamakan dengan proses penentuan median pada data linear yaitu prosedur pengurutan data dari data amatan terkecil sampai data amatan terbesar tidak bisa diterapkan pada penentuan median data sirkular (Otieno, 2002). Sebagai contoh, penelitian terhadap arah terbang tujuh ekor burung yaitu ke arah , , , , , , dan seperti yang ditunjukkan pada gambar berikut:

Gambar 2.7. Median Sirkular dan Median Linear

Pada Gambar 2.7., dengan memilih arah acuan nol derajat yaitu arah utara, arah rotasi searah dengan arah perputaran jarum jam dan dengan menggunakan prosedur yang diperkenalkan Mardia (1972) dalam Otieno (2002) diperoleh


(30)

16

median sirkular pada arah . Sedangkan, jika digunakan prosedur pengurutan data yang digunakan pada data linear, maka diperoleh median sirkular pada arah

. Tentu saja tidak sama dengan . Shepherd dan Fisher (1982) dalam Otieno (2002) mengemukakan bahwa bantuan grafik akan sangat membantu menentukan median sirkular.

C. Modus data sirkular

Modus data sirkular akan mudah ditentukan dengan bantuan grafik. Nilai modus akan muncul pada data yang terkonsentrasi di keliling lingkaran pada sudut atau arah tertentu. Seperti data pada umumnya, data sirkular mungkin saja memiliki nilai modus lebih dari satu.

2.2.2 Ukuran Penyebaran Data Sirkular

Mardia (1976) dalam Nurhab (2014) mendefinisikan ragam sampel sirkular sebagai

̅ (2.13)

dengan adalah panjang vektor resultan dan ̅ adalah panjang rata-rata dari vektor resultan dengan ̅ . Nilai ragam yang semakin kecil menandakan data semakin terkonsentrasi menuju suatu titik tertentu.

2.3 Regresi Sirkular

Variabel dalam suatu regresi terdiri dari variabel prediktor (independent variable) dan variabel respons (dependent variable). Menganalisis data sirkular


(31)

17

dengan analisis regresi jika dilihat dari jenis variabelnya akan membentuk tiga jenis model regresi sirkular yaitu (Scoot, 2002):

1. Regresi Sirkular–Linear (circular-linear regression)

Regresi sirkular–linear yaitu analisis regresi dengan variabel prediktor sirkular dan variabel responnya linear. Regresi sirkular–linear merupakan analisis regresi sirkular yang paling sering digunakan. Menurut SenGupta dan Ugwuowo (2006) model regresi sirkular linear antara variabel respons linear dan variabel prediktor sirkular adalah

(2.14)

dengan dan adalah parameter yang belum diketahui nilainya, adalah sebuah acrophase, dan adalah komponen galat acak. Sedangkan, adalah frekuensi angular (angular frequency) yaitu

(2.15)

atau

(2.16)

dengan adalah periode.

2. Regresi Sirkular-Sirkular (circular-circular regression)

Regresi sirkular-sirkular yaitu analisis regresi dengan variabel prediktor dan variabel respons sama-sama merupakan data sirkular.


(32)

18

3. Regresi Linear-Sirkular (linear-circular regression)

Regresi linear-sirkular yaitu analisis regresi dengan variabel prediktor linear dan variabel respons sirkular.

2.4 Regresi Nonparametrik

Statistika nonparametrik adalah statistika bebas sebaran yang digunakan dengan mengabaikan asumsi-asumsi yang harus dipenuhi pada statistika parametrik. Statistika nonparametrik disebut juga statistika bebas distribusi. Bentuk kurva dalam regresi nonparametrik tidak diketahui dan diasumsikan termuat dalam suatu ruang fungsi berdimensi tak hingga dan merupakan fungsi yang mulus (smooth).

Dalam statistika nonparametrik bentuk kurva yang kurang mulus dapat dipermulus (smoothing) dengan menggunakan teknik smoothing tertentu. Tujuan dari smoothing adalah membuang variabilitas dari data yang tidak memiliki efek-efek sehingga ciri-ciri dari data tampak lebih jelas. Salah satu teknik smoothing yang umum digunakan adalah estimator kernel pada pemanfaatannya dilakukan pada setiap titik data (Sukarsa dan Srinadi, 2012).

2.4.1 Kernel Standar

Estimator kernel merupakan pengembangan dari estimator histogram. Menurut Wand dan Jones (1995) bentuk fungsi kernel secara umum yaitu


(33)

19

dengan adalah parameter pemulus (smoother) yang disebut bandwidth. Fungsi kernel memiliki beberapa sifat yaitu:

1. ≥ untuk semua (2.18)

2. ∫ (2.19)

3. ∫ > (2.20)

4. ∫ (2.21)

5. , untuk semua (sifat simetris) (2.22) Beberapa jenis fungsi kernel yang umum digunakan yaitu

1. Kernel Uniform : | | (2.23) 2. Kernel Segitiga : | | | | (2.24) 3. Kernel Epanechnikov : | | (2.25) 4. Kernel Kuartik :

| | (2.26)

5. Kernel Triweight :

| | (2.27) 6. Kernel Cosinus : | | (2.28) 7. Kernel Gaussian :

√ ( ) < < (2.29) dengan adalah fungsi indikator untuk suatu himpunan yaitu

{


(34)

20

2.4.2 Kernel Sirkular

Kernel sirkular untuk orde dan parameter pemulus (smoothing) > adalah fungsi [ yang memiliki sifat (Marzio et al., 2009):

(i) untuk [ , representasi deret Fourier konvergen ke

{ ∑⁄ }

(ii) nyatakan ∫ kemudian , untuk < < , dan ;

(iii) apabila naik, maka menuju 1 untuk

Kernel von Mises adalah kernel sirkular orde kedua (second-order circular kernel) yang memiliki bentuk

[ ] (2.31)

dengan adalah variabel prediktor sirkular, adalah parameter konsentrasi (concentration parameter), dan adalah fungsi Bessel termodifikasi orde nol,

∫ [ ] . (2.32)

Sebaran von Mises adalah sebaran normal sirkular yang paling umum digunakan karena memiliki langkah kerja yang sama dengan sebaran normal pada data linear. Sebaran von Mises pertama kali diperkenalkan oleh von Mises pada tahun 1981 dengan sebaran


(35)

21

dengan adalah variabel prediktor sirkular, adalah arah rata-rata sirkular, adalah parameter konsentrasi (concentration parameter), dan adalah fungsi Bessel termodifikasi orde nol,

∫ [ ] . (2.34)

Jika sama dengan nol, maka =

dan akan mengikuti sebaran seragam (uniform) yang tanpa memperhatikan arah.

Sama seperti sebaran normal, metode yang digunakan untuk mengevaluasi sebaran von Mises adalah QQ-plot. Menurut Fisher (1993) dalam Nurhab (2014), jika sebaran data mengikuti sebaran von Mises maka plot data mengikuti garis lurus dengan kemiringan . Proses evaluasi dengan von Mises yaitu dimulai dengan mencari

̂ untuk (2.35) kemudian diurutkan dari nilai terkecil sampai terbesar . Langkah selanjutnya yaitu membuat plot (Fisher dalam Nurhab, 2014).

2.5 Bandwidth

Parameter bandwidth disebut juga parameter pemulusan (smoothing) yang memiliki peran seperti lebar interval pada histogram. Parameter bandwidth akan mengontrol kemulusan kurva regresi yang diestimasi. Pemilihan bandwidth yang terlalu kecil akan menghasilkan kurva yang sangat kasar, dan sebaliknya


(36)

22

pemilihan bandwidth yang terlalu besar akan menghasilkan kurva yang terlalu mulus yang akibatnya akan tidak sesuai dengan pola data yang sebenarnya (Hardle, 1994). Oleh karena itu, diperlukan suatu metode untuk memilih bandwidth yang optimal. Metode yang dapat digunakan yaitu metode Cross-Validation (CV) yang didefinisikan sebagai berikut

∑ ̂ (2.36) dengan ̂ adalah penduga leave-one-out dengan menghilangkan . Pemilihan bandwidth yang optimal dilakukan dengan memilih nilai awal

untuk meminimumkan persamaan (2.36) Langkah-langkah pemilihan bandwidth yang optimal berdasarkan kriteria CV minimum yaitu:

Langkah 1. Untuk , tentukan nilai dan minimumkan persamaan (2.36) sehingga diperoleh vektor parameter smoothing dan nilai CV,

dengan .

Langkah 2. Untuk , ulangi langkah 1 sampai menemukan kriteria yang sesuai sehingga dihasilkan rangkaian(series) nilai CV.

Langkah 3. Pilih nilai CV terkecil dari rangkaian nilai yang dihasilkan sehingga diperoleh nilai bandwidth optimal yaitu .

2.6 Regresi Nonparametrik Sirkular-Linear Berganda

SengGupta dan Ugwuowo (2006) memperkenalkan bentuk umum model regresi sirkular–linear berganda antara sebuah variabel respons linear dengan variabel prediktor linear dan variabel prediktor sirkular. Bentuk modelnya adalah


(37)

23

(2.37) dengan adalah variabel respons linear, adalah nilai rataan, adalah koefisien regresi, adalah variabel prediktor linear, adalah amplitudo, adalah frekuensi angular, adalah variabel prediktor sirkular yang menentukan periode , adalah acrophase dan adalah komponen galat acak. Pendugaan dinyatakan dalam satuan radian atau derajat arah,

(2.38)

atau

. (2.39)

Kemudian Qin (2011) mengasumsikan bentuk model regresi nonparametrik sirkular-linear berganda dengan bentuk

(2.40)

dengan adalah variabel respons skalar, adalah fungsi regresi,

( ) , dan masing-masing adalah dimensi linear dan dimensi sirkular , serta adalah variabel acak berdistribusi IID (Independent and

Identically Distributed) dengan rataan nol dan ragam unit dan bebas dari .


(38)

24

[

] (2.41)

sebagai desain matriks, dan

(2.42)

sebagai bobot matriks, dengan adalah sampel acak dari fungsi densitas peluang bersama dan adalah fungsi linear–sirkular

√ ∏

∏ ( ) (2.43) dengan adalah kernel linear standar dan adalah kernel sirkular orde kedua. Penduga kernel kuadrat terkecil linear lokal dari diperoleh dari masukan pertama dari vektor

( ̂ ̂) ∑

( ) . (2.44) Dengan demikian penduga kernel kuadrat terkecil linear lokal dari adalah


(39)

25

dengan adalah vektor berukuran ( dengan nilai 1 pada masukan pertama dan yang lainnya 0.

Vektor dari nilai yang diduga (fitted values) ̂ ̂ ̂ adalah


(1)

2.4.2 Kernel Sirkular

Kernel sirkular untuk orde dan parameter pemulus (smoothing) > adalah fungsi [ yang memiliki sifat (Marzio et al., 2009):

(i) untuk [ , representasi deret Fourier konvergen ke { ∑⁄ }

(ii) nyatakan ∫ kemudian , untuk < < , dan ;

(iii) apabila naik, maka menuju1untuk

Kernel von Mises adalah kernel sirkular orde kedua (second-order circular

kernel) yang memiliki bentuk

[ ] (2.31)

dengan adalah variabel prediktor sirkular, adalah parameter konsentrasi

(concentration parameter), dan adalah fungsi Bessel termodifikasi orde nol,

∫ [ ] . (2.32)

Sebaran von Mises adalah sebaran normal sirkular yang paling umum digunakan karena memiliki langkah kerja yang sama dengan sebaran normal pada data linear. Sebaran von Mises pertama kali diperkenalkan oleh von Mises pada tahun 1981 dengan sebaran


(2)

dengan adalah variabel prediktor sirkular, adalah arah rata-rata sirkular, adalah parameter konsentrasi (concentration parameter), dan adalah fungsi Bessel termodifikasi orde nol,

∫ [ ] . (2.34)

Jika sama dengan nol, maka =

dan akan mengikuti sebaran seragam

(uniform) yang tanpa memperhatikan arah.

Sama seperti sebaran normal, metode yang digunakan untuk mengevaluasi sebaran von Mises adalah QQ-plot. Menurut Fisher (1993) dalam Nurhab (2014), jika sebaran data mengikuti sebaran von Mises maka plot data mengikuti garis lurus dengan kemiringan . Proses evaluasi dengan von Mises yaitu dimulai dengan mencari

̂ untuk (2.35)

kemudian diurutkan dari nilai terkecil sampai terbesar . Langkah selanjutnya yaitu membuat plot (Fisher dalam Nurhab, 2014).

2.5 Bandwidth

Parameter bandwidth disebut juga parameter pemulusan (smoothing) yang memiliki peran seperti lebar interval pada histogram. Parameter bandwidth akan mengontrol kemulusan kurva regresi yang diestimasi. Pemilihan bandwidth yang terlalu kecil akan menghasilkan kurva yang sangat kasar, dan sebaliknya


(3)

pemilihan bandwidth yang terlalu besar akan menghasilkan kurva yang terlalu mulus yang akibatnya akan tidak sesuai dengan pola data yang sebenarnya (Hardle, 1994). Oleh karena itu, diperlukan suatu metode untuk memilih

bandwidth yang optimal. Metode yang dapat digunakan yaitu metode

Cross-Validation (CV) yang didefinisikan sebagai berikut

∑ ̂ (2.36)

dengan ̂ adalah penduga leave-one-out dengan menghilangkan . Pemilihan bandwidth yang optimal dilakukan dengan memilih nilai awal untuk meminimumkan persamaan (2.36) Langkah-langkah pemilihan bandwidth yang optimal berdasarkan kriteria CV minimum yaitu: Langkah 1. Untuk , tentukan nilai dan minimumkan persamaan (2.36)

sehingga diperoleh vektor parameter smoothing dan nilai CV, dengan .

Langkah 2. Untuk , ulangi langkah 1 sampai menemukan kriteria yang sesuai sehingga dihasilkan rangkaian(series) nilai CV.

Langkah 3. Pilih nilai CV terkecil dari rangkaian nilai yang dihasilkan sehingga diperoleh nilai bandwidth optimal yaitu . 2.6 Regresi Nonparametrik Sirkular-Linear Berganda

SengGupta dan Ugwuowo (2006) memperkenalkan bentuk umum model regresi sirkular–linear berganda antara sebuah variabel respons linear dengan variabel prediktor linear dan variabel prediktor sirkular. Bentuk modelnya adalah


(4)

(2.37)

dengan adalah variabel respons linear, adalah nilai rataan, adalah koefisien regresi, adalah variabel prediktor linear, adalah amplitudo, adalah frekuensi angular, adalah variabel prediktor sirkular yang menentukan periode , adalah acrophase dan adalah komponen galat acak. Pendugaan dinyatakan dalam satuan radian atau derajat arah,

(2.38)

atau

. (2.39)

Kemudian Qin (2011) mengasumsikan bentuk model regresi nonparametrik sirkular-linear berganda dengan bentuk

(2.40)

dengan adalah variabel respons skalar, adalah fungsi regresi, ( ) , dan masing-masing adalah dimensi linear dan

dimensi sirkular , serta adalah variabel acak berdistribusi IID (Independent and

Identically Distributed) dengan rataan nol dan ragam unit dan bebas dari .


(5)

[

] (2.41)

sebagai desain matriks, dan

(2.42)

sebagai bobot matriks, dengan adalah sampel acak dari fungsi densitas peluang bersama dan adalah fungsi linear–sirkular

√ ∏

∏ ( ) (2.43)

dengan adalah kernel linear standar dan adalah kernel sirkular orde kedua. Penduga kernel kuadrat terkecil linear lokal dari diperoleh dari masukan pertama dari vektor

( ̂ ̂) ∑

( ) . (2.44)

Dengan demikian penduga kernel kuadrat terkecil linear lokal dari adalah


(6)

dengan adalah vektor berukuran ( dengan nilai 1 pada masukan pertama dan yang lainnya 0.

Vektor dari nilai yang diduga (fitted values) ̂ ̂ ̂ adalah