4
regresi parametrik. Penelitian lainnya dilakukan oleh Nurhab 2014 yang membangun model regresi berganda sirkular2-linear pada variabel sirkular yaitu
arah angin dan arah awan terhadap variabel linear yaitu curah hujan di Bogor, menghasilkan kesimpulan yaitu dalam menganalisis data sirkular, penggunaan
analisis regresi sirkular menghasilkan model yang lebih baik dibandingkan penggunaan analisis regresi linear berganda.
Banyaknya kasus data berarah yang dianalisis secara umum menjadi motivasi bagi penulis untuk melakukan penelitian lebih lanjut dengan
menggunakan analisis regresi nonparametrik sirkular-linear berganda antara variabel respons linear dengan variabel prediktor sirkular dan linear.
1.2 Rumusan Masalah
Berdasarkan latar belakang penelitian, maka rumusan masalah dalam penelitian ini adalah sebagai berikut
1. Bagaimana penerapan statistika sirkular pada data berarah atau data sirkular?
2. Bagaimana model regresi nonparametrik sirkular-linear berganda antara
variabel respons linear dengan variabel prediktor sirkular dan linear?
1.3 Tujuan Penelitian
Adapun tujuan dari penelitian ini, yaitu sebagai berikut:
1. untuk mengetahui penerapan statistika sirkular pada data berarah atau data
sirkular; 2.
untuk mengetahui model regresi nonparametrik sirkular-linear berganda antara variabel respons linear dengan variabel prediktor sirkular dan linear.
5
1.4 Manfaat Penelitian
Penelitian ini diharapkan bermanfaat bagi: 1.
Bagi Peneliti
Penelitian ini bermanfaat bagi peneliti yang ingin melakukan pengukuran atau penelitian terhadap data yang bersatuan arah atau waktu karena dapat
menjadi metode alternatif dalam melakukan penelitian terhadap data yang bersatuan arah atau waktu.
2. Bagi Mahasiswa
Penelitian ini bermanfaat bagi mahasiswa sebagai tambahan bahan ajaran terutama dalam ilmu statistika khususnya analisis regresi sirkular.
6
BAB II TINJAUAN PUSTAKA
Bab ini membahas teori-teori dasar yang digunakan sebagai landasan pembahasan pada bab selanjutnya. Pembahasan teori meliputi pengertian data
secara umum dan data sirkular, ukuran pemusatan dan penyebaran data, regresi sirkular, regresi nonparametrik, dan regresi nonparametrik sirkular-linear
berganda.
2.1 Data
Data adalah nilai numerik hasil dari sebuah pengamatan observation yang dalam penelitian diasumsikan sebagai variabel Kitchens, 1998. Data diolah
oleh peneliti dan kemudian diinterpretasikan sehingga dapat dimengerti oleh orang lain yang tidak secara langsung melakukan pengamatan atau pengumpulan
fakta dari sebuah kejadian.
2.1.2 Ukuran Pemusatan Data
Ukuran pemusatan data memberikan informasi tentang titik-titik di mana data pengamatan terpusat atau terkumpul dan dapat juga menjadi ciri khas dari
kumpulan data pengamatan Kitchens, 1998. A.
Nilai tengah mean Jika
adalah anggota suatu populasi terhingga berukuran , nilai tengah populasinya adalah
7
∑ .
2.1
Sedangkan, jika adalah sampel berukuran , maka nilai tengah
sampelnya adalah ̅
∑ 2.2
B. Median
Median memiliki sifat membagi dua sama banyak kumpulan data yang telah diurutkan sebelumnya. Jika banyak data ganjil, maka median adalah data
yang tepat berada di tengah yaitu pada amatan . Sedangkan, jika banyak
data genap, maka median berada di antara dua data yang berada di tengah yaitu rata-rata dari pengamatan
dan pengamatan .
C. Modus
Modus adalah suatu nilai amatan yang paling sering muncul dalam melakukan penelitian. Nilai modus dalam penelitian mungkin saja akan lebih dari
satu. Penyajian data dalam bentuk grafik akan mempermudah dalam menentukan nilai modus dari kumpulan data.
2.1.3 Ukuran Penyebaran Data
Ukuran penyebaran data merupakan suatu informasi yang diperoleh dalam penelitian yang memberikan penjelasan seberapa jauh data-data yang diperoleh
menyebar dari titik pemusatannya Kitchens, 1998. Ukuran penyebaran data yang paling sering digunakan adalah ragam. Ragam variance memberikan informasi
8
rata-rata jarak kuadrat semua titik pengamatan terhadap titik pusat atau rataan. Jika
adalah anggota suatu populasi terhingga berukuran , maka ragam populasinya adalah
∑ 2.3
Sedangkan, jika adalah anggota suatu sampel berukuran , maka
ragam sampelnya adalah ∑
̅ 2.4
2.2 Data dan Statistika Sirkular
Data sirkular adalah data yang nilai-nilainya berulang secara periodik dengan responnya bukan skalar tetapi angular atau berarah sehingga dikategorikan
sebagai data berarah Jammalamadaka dan SenGupta, 2001. Pengukuran data sirkular biasanya dalam satuan derajat
sampai atau dalam satuan radian
dari 0 radian sampai radian.
Dua alat yang sering digunakan untuk membantu dalam pemilihan arah pada proses pengukuran data sirkular adalah kompas dan jam. Dalam melakukan
pengukuran, arah utara pada kompas dan pukul 00.00 pada jam biasanya disebut arah
atau 0 radian. Arah migrasi hewan, arah terbang burung, atau arah angin dihitung dengan bantuan kompas. Waktu kejadian kasus kecelakaan, waktu
kejadian kasus kriminal, waktu datangnya pasien dalam 24 jam di sebuah rumah sakit dihitung dalam jam.
9
Berbeda dengan data pada umumnya yang hanya memiliki satu dimensi pengukuran, data sirkular memiliki dua dimensi pengukuran yaitu jika
pengamatan digambarkan pada koordinat kartesius dapat dinyatakan sebagai
nilai atau pada koordinat polar dapat dinyatakan sebagai nilai dengan
sebagai jarak titik dari titik pusat pada sudut .
Gambar 2.1 Hubungan Koordinat Kartesius dengan Koordinat Polar Nurhab, 2014
Pada Gambar 2.1. perubahan koordinat polar menjadi koordinat kartesius dapat menggunakan persamaan trigonometri berikut
dan . 2.5
Perbedaan lainnya dengan data pada umumnya adalah data sirkular tidak memiliki nilai minimum dan maksimum karena data awal sama dengan data akhir
yaitu radian sama dengan radian. Nilai pengamatan pada sudut akan
memiliki nilai yang sama dengan pengamatan yang terletak pada sudut untuk
bilangan bulat positif, karena dalam analisis sirkular yang diperhatikan adalah arah bukan besaran vektor yaitu setiap titik pengamatan pada keliling
lingkaran menyatakan sebuah arah. Pada Gambar 2.1, sebuah pengamatan menyatakan arah yang dibuat vektor terhadap sumbu
positif atau menyatakan arah yang dibuat vektor terhadap sumbu
positif. Koordinat kartesius amatan tersebut adalah
dan koordinat polarnya
x y
P r
10
adalah . Karena yang diperhatikan adalah arah, maka jarak setiap amatan
dari titik pusat dibuat sama dengan 1 . Sehingga diambil vektor-vektor
tersebut menjadi vektor unit yaitu vektor dengan panjang satuan .
Representasi data sirkular dalam arah yang dipengaruhi sudut tentu tidak selalu unik yaitu nilai angularnya bergantung pada pemilihan arah acuan
dan arah rotasi apakah searah dengan arah perputaran jarum jam clockwise atau
berlawanan arah perputaran jarum jam counter-clockwise Jammalamadaka dan SenGupta, 2001. Pemilihan arah utara sebagai arah acuan
mengakibatkan arah perputaran positif yaitu searah dengan arah perputaran jarum jam, sedangkan
pemilihan arah timur sebagai arah acuan mengakibatkan arah perputaran
positif yaitu berlawanan arah perputaran jarum jam. Pada Gambar 2.2, arah adalah
jika arah acuannya adalah arah utara dan arah rotasinya searah perputaran jarum jam, atau
jika arah acuannya adalah arah timur dan arah rotasinya berlawanan arah perputaran jarum jam.
Gambar 2.2. Arah Acuan dan Arah Rotasi Pengamatan Dalam analisis regresi sirkular-linear, perbedaan pemilihan arah acuan
tidak memengaruhi koefisien determinasi dan statistik lima serangkai yaitu
r P
Utara
Timur
11
statistik minimum, kuartil bawah, median, kuartil atas, dan statistik maksimum dari sisaannya, tetapi memengaruhi hasil dugaan parameter persamaan regresi
sirkular-linear. Sedangkan perbedaan pemilihan arah rotasi tidak berpengaruh terhadap persamaan regresi sirkular-linear yang dibentuk Nurussadad, 2011.
Representasi data sirkular dalam bentuk grafis menjadi hal yang sangat penting dan bentuknya tentu akan berbeda dengan representasi grafis data pada
umumnya. Bentuk grafis yang biasa digunakan dalam analisis data sirkular adalah
Gambar 2.3. Diagram Pancar a, Histogram Siklik b, dan Diagram Mawar c Nurhab, 2014
2.2.1 Ukuran Pemusatan Data Sirkular
Mengalisis data sirkular menggunakan dua fungsi trigonometri yaitu fungsi sinus
� dan fungsi cosinus . Sehingga cara menghitung ukuran pemusatan dan ukuran penyebaran data sirkular akan berbeda dengan cara menghitung
ukuran pemusatan dan ukuran penyebaran pada umumnya. A.
Arah rata-rata sirkular Menurut Jammalamadaka dan SenGupta 2001, menentukan arah rata-
rata data sirkular menggunakan metode yang digunakan pada statistika linear dapat menghasilkan arah rata-rata yang tidak sesuai dengan pusat dari data
a b
c
12
pengamatan yang diperoleh. Sebagai contoh penelitian tentang arah migrasi burung. Misalkan dua burung terbang ke arah
dan ke arah dan dipilih
arah acuan nol derajat yaitu arah utara dan arah rotasi searah dengan arah perputaran jarum jam seperti yang ditunjukkan pada gambar berikut:
Gambar 2.4. Arah Rata-rata Sirkular dengan Statistika Linear untuk Dua Buah Pengamatan.
Pada Gambar 2.4, dengan menggunakan statistika linear diperoleh arah rata-rata yaitu
yang menuju ke arah selatan, meskipun arah terbang kedua burung tersebut lebih terkonsentrasi ke arah utara. Jika dimisalkan lagi terdapat
empat burung yang bermigrasi masing-masing ke arah , dan
dengan arah acuan dan arah rotasi yang sama, maka dengan statistika linear diperoleh arah rata-rata yaitu
yang menuju ke arah selatan seperti yang ditunjukkan pada gambar berikut:
Gambar 2.5. Arah Rata-rata Sirkular dengan Statistika Linear untuk Empat Buah Pengamatan.
13
Pada Gambar 2.5, dengan menggunakan statistika linear diperoleh arah rata-rata yaitu
yang menuju ke arah selatan meskipun data semakin terkonsentrasi ke arah utara. Berdasarkan contoh tersebut, dapat ditunjukkan
bahwa metode yang digunakan untuk mencari nilai rata-rata statistika linear tidak cukup baik untuk diterapkan pada data sirkular. Keragaman data sampel
yang sangat bergantung pada nilai rata-rata tentu juga akan sangat dipengaruhi nilainya.
Menentukan arah rata-rata untuk data sirkular dilakukan dengan memperlakukan data sirkular dalam vektor unit dan menggunakan arah dari
vektor resultannya Jammalamadaka dan SenGupta, 2001. Arah rata-rata sirkular ̅ diperoleh dari
̅ ,
2.6
̅ ,
2.7
dengan �
adalah fungsi cosinus dan fungsi sinus yang diperoleh dari
∑ 2.8
� ∑
2.9
dengan adalah pengamatan ke-
dan panjang vektor resultan diperoleh dari
‖ ‖ √ �
. 2.10
14
Vektor resultan dari vektor unit diperoleh dengan menjumlahkan
semua komponen arahnya �
. 2.11
Balikan kuadran tertentu invers quadrant-specific tangen dari arah rata- rata sirkular
̅ diberikan untuk segala kemungkinan nilai fungsi dan � yaitu
̅
{ 2.12
B. Median data sirkular
Mardia 1972 dalam Otieno 2002 menyatakan bahwa median sampel ̃
dari data sampel sirkular adalah titik
pada keliling lingkaran yang memiliki sifat :
1. Diameter dengan adalah anti-median membagi lingkaran menjadi
dua bagian, yang setiap bagiannya memiliki jumlah pengamatan sama banyak.
2. Sebagian besar data pengamatan berada disekitar titik dibandingkan di
titik .
Jika dan �
≥ Jika
dan � Jika
Jika ≥ dan �
Jika dan �
15
Gambar 2.6. Median Sirkular untuk Data Genap dan Data Ganjil Otieno, 2002
Jika banyak data adalah genap, maka median sampel sirkular berada di
antara dua pengamatan yang berdekatan dengan . Sedangkan jika banyak data
adalah ganjil, maka median sampel sirkular adalah sebuah titik data pengamatan. Proses menentukan median pada data sirkular tidak bisa disamakan dengan proses
penentuan median pada data linear yaitu prosedur pengurutan data dari data amatan terkecil sampai data amatan terbesar tidak bisa diterapkan pada penentuan
median data sirkular Otieno, 2002. Sebagai contoh, penelitian terhadap arah terbang tujuh ekor burung yaitu ke arah
, ,
, ,
, , dan
seperti yang ditunjukkan pada gambar berikut:
Gambar 2.7. Median Sirkular dan Median Linear
Pada Gambar 2.7., dengan memilih arah acuan nol derajat yaitu arah utara, arah rotasi searah dengan arah perputaran jarum jam dan dengan menggunakan
prosedur yang diperkenalkan Mardia 1972 dalam Otieno 2002 diperoleh
16
median sirkular pada arah . Sedangkan, jika digunakan prosedur pengurutan
data yang digunakan pada data linear, maka diperoleh median sirkular pada arah . Tentu saja
tidak sama dengan . Shepherd dan Fisher 1982 dalam
Otieno 2002 mengemukakan bahwa bantuan grafik akan sangat membantu menentukan median sirkular.
C. Modus data sirkular
Modus data sirkular akan mudah ditentukan dengan bantuan grafik. Nilai modus akan muncul pada data yang terkonsentrasi di keliling lingkaran pada
sudut atau arah tertentu. Seperti data pada umumnya, data sirkular mungkin saja memiliki nilai modus lebih dari satu.
2.2.2 Ukuran Penyebaran Data Sirkular
Mardia 1976 dalam Nurhab 2014 mendefinisikan ragam sampel sirkular sebagai
̅ 2.13
dengan adalah panjang vektor resultan dan
̅ adalah panjang rata-rata dari vektor resultan dengan
̅ . Nilai ragam yang semakin kecil menandakan data semakin terkonsentrasi menuju suatu titik tertentu.
2.3 Regresi Sirkular
Variabel dalam suatu regresi terdiri dari variabel prediktor independent variable dan variabel respons dependent variable. Menganalisis data sirkular
17
dengan analisis regresi jika dilihat dari jenis variabelnya akan membentuk tiga jenis model regresi sirkular yaitu Scoot, 2002:
1. Regresi Sirkular–Linear circular-linear regression
Regresi sirkular –linear yaitu analisis regresi dengan variabel prediktor
sirkular dan variabel responnya linear. Regresi sirkular –linear merupakan analisis
regresi sirkular yang paling sering digunakan. Menurut SenGupta dan Ugwuowo 2006 model regresi sirkular linear antara variabel respons linear
dan variabel prediktor sirkular
adalah
2.14 dengan
dan adalah parameter yang belum diketahui nilainya,
adalah sebuah acrophase, dan
adalah komponen galat acak. Sedangkan, adalah
frekuensi angular angular frequency yaitu
2.15
atau
2.16
dengan adalah periode.
2. Regresi Sirkular-Sirkular circular-circular regression
Regresi sirkular-sirkular yaitu analisis regresi dengan variabel prediktor dan variabel respons sama-sama merupakan data sirkular.
18
3. Regresi Linear-Sirkular linear-circular regression
Regresi linear-sirkular yaitu analisis regresi dengan variabel prediktor linear dan variabel respons sirkular.
2.4 Regresi Nonparametrik