BUKU AJAR STATISTIKA NONPARAMETRIK

  BUKU AJAR STATISTIKA NONPARAMETRIK Oleh: A N W A R SYARIFUDDIN PROGRAM STUDI AGRIBISNIS JURUSAN SOSEK FAKULTAS PERTANIAN UNIVERSITAS MATARAM DESEMBER 2016

ANALISIS INSTRUKSIONAL MATA KULIAH STATISTIKA NONPARAMETRIK

  SKS = 3 (2-1), Semester VI

TUJUAN INSTRUKSIONAL UMUM:

Setelah menyelesaikan mata kuliah Statistika Nonparametrik mahasiswa akan dapat memilih Uji Statistik Nonparametrik yang tepat untuk Penelitian Sosial Ekonomi Pertanian

  

Memilih Uji Statistik Nonparametrik untuk

Penelitian Sosial Ekonomi Pertanian

Memilih Uji Statistik Memilih Uji Statistik Memilih Uji Statistik Memilih model

Nonparametrik Nonparametrik Nonparametrik pengukuran

untuk Kasus untuk Kasus untuk Kasus korelasi dan

Sampel Sampel Sampel pengujiannya

  Satu Dua ” k

Menerapkan prinsip dan prosedur

Uji Hipotesis Statistik

  Menjelaskan konsep & prosedur perhitungan dasar statistika

  Setelah mengikuti proses pembelajaran mata kuliah ini (pada akhir semester) mahasiswa S1 Program Studi Agribisnis Fakultas Pertanian Universitas Mataram, diharapkan dapat menjelaskan dan menggunakan atau menerapkan alat analisis statistik nonparametrik secara tepat, dan dapat menginter- pretasikannya secara akurat.

BAB I STATISTIKA PARAMETRIK DAN NONPARAMETRIK Secara garis besar ilmu statistika dibagi menjadi dua bagian,

  yaitu: statistika parametrik dan statistika nonparametrik. Perbedaan kedua statistika tersebut diuraikan pada ulasan berikut.

1. Statistika Parametrik

  Statistika parametrik adalah ilmu statistika yang digunakan untuk data yang memiliki sebaran normal. Jika data tidak menyebar normal maka metode statistika nonparametrik dapat digunakan. Apa yang dapat dilakukan jika data tidak menyebar normal, namun statistika parametrik ingin tetap digunakan. Untuk kasus ini data sebaiknya ditransformasikan terlebih dahulu. Transformasi data perlu dilakukan agar data mengikuti sebaran normal. Transformasi dapat dilakukan dengan mengubah data ke dalam bentuk logaritma natural, menggunakan operasi matematik (membagi, menambah, atau mengali dengan bilangan tertentu), dan mengubah skala data dari nominal menjadi interval.

  Parametrik berarti parameter. Parameter adalah indikator dari suatu distribusi hasil pengukuran terhadap populasi. Indikator dari distribusi pengukuran berdasarkan statistika parametrik digunakan untuk parameter dari distribusi normal. Apa yang dimaksud dengan distribusi normal? Bagaimana mengetahui sebuah data berdistribusi normal atau tidak? Hal ini penting sekali untuk diketahui karena berdasarkan normal atau tidaknya distribusi ini baru dapat ditentukan apakah uji statistika parametrik atau nonparametrik yang digunakan.

  Distribusi normal dikenal juga dengan istilah Gaussian Distribution. Distribusi normal mengandung dua parameter, yaitu rata-rata (mean = µ)

  2

  dan ragam (varians = σ ). Parameter-parameter ini memberikan karakteristik yang unik pada suatu distribusi berdasarkan “lokasi”-nya (central tendency). Berbagai metode statistika mendasarkan perhi- tungannya pada kedua parameter tersebut.

  Penggunaan metode statistika parametrik mengikuti prinsip-prinsip distribusi normal. Prinsip-prinsip dari distribusi normal adalah: a. Distribusi dari suatu sampel yang dijadikan obyek pengukuran berasal dari populasi yang diasumsikan terdistribusi secara normal.

  b. Sampel diperoleh secara random, dengan jumlah sampel yang dianggap dapat mewakili populasi (n > 30).

  c. Distribusi normal merupakan bagian dari distribusi probabilitas yang kontinyu (continuous probability distribution). Implikasinya, skala pengukuran pun harus kontinyu. Skala pengukuran yang kontinyu adalah skala rasio dan interval. Kedua skala ini memenuhi syarat untuk menggunakan uji statistika parametrik.

  Bila syarat-syarat ini semua terpenuhi, maka metode statistika parametrik dapat digunakan. Contoh metode statistika parametrik diantaranya adalah uji-z (1 atau 2 sampel), uji-t (1 atau 2 sampel), korelasi pearson, perancangan percobaan (1-way ANOVA, 2-way

2. Statistika Nonparametrik Statistika nonparametrik disebut juga statistika bebas sebaran.

  Statistika nonparametrik tidak mensyaratkan bentuk sebaran parameter populasi. Statistika nonparametrik dapat digunakan pada data yang memiliki sebaran normal atau tidak.

  Istilah nonparametrik pertama kali digunakan oleh Wolfowitz, pada tahun 1942. Metode statistika nonparametrik merupakan metode statistika yang dapat digunakan dengan mengabaikan asumsi-asumsi yang melandasi penggunaan metode statistika parametrik, terutama yang berkaitan dengan distribusi normal. Istilah lain yang sering digunakan untuk statistika nonparametric adalah statistika bebas distribusi (distribution-free statistics) dan uji bebas asumsi (assumption-free test). Statistika nonparametrik banyak digunakan pada penelitian-penelitian sosial. Data yang diperoleh dalam penelitian sosial pada umumnya berbentuk kategori atau berbentuk ranking.

  Uji statistika nonparametrik ialah suatu uji statistika yang tidak memerlukan adanya asumsi-asumsi mengenai sebaran data populasi. Uji statistika ini disebut juga sebagai statistika bebas sebaran (distribution

  

free ). Statistika nonparametrik tidak mensyaratkan bentuk sebaran

  parameter populasi berdistribusi normal. Statistika nonparametrik dapat digunakan untuk menganalisis data yang berskala nominal atau ordinal karena pada umumnya data berjenis nominal dan ordinal tidak menyebar normal. Dari segi jumlah data, pada umumnya statistika

  Contoh metode statistika nonparametrik diantaranya adalah Chi- square test, Mann Withney test, Kruskal-Wallis, Friedman test, dan lain- lain.

  Keunggulan Statistika Nonparametrik

  Keunggulan statistika nonparametrik diantaranya: 1. Asumsi dalam uji-uji statistika nonparametrik relatif lebih longgar.

  Jika pengujian data menunjukkan bahwa salah satu atau beberapa asumsi yang mendasari uji statistika parametrik (misalnya mengenai sifat distribusi data) tidak terpenuhi, maka statistika nonparametrik lebih sesuai diterapkan dibandingkan statistika parametrik.

  2. Perhitungan-perhitungannya dapat dilaksanakan dengan cepat dan mudah, sehingga hasil penelitian segera dapat disampaikan.

  3. Untuk memahami konsep-konsep dan metode-metodenya tidak memerlukan dasar matematika serta statistika yang mendalam.

  4. Uji-uji pada statistika nonparametrik dapat diterapkan jika kita menghadapi keterbatasan data yang tersedia, misalnya jika data telah diukur menggunakan skala pengukuran yang lemah (nominal atau ordinal).

  5. Efisiensi statistika nonparametrik lebih tinggi dibandingkan dengan metode parametrik untuk jumlah sampel yang sedikit.

  Keterbatasan Statistika Nonparametrik

  Disamping keunggulan, statistika nonparametrik juga memiliki keterbatasan. Beberapa keterbatasan statistika nonparametrik antara lain: a. Jika asumsi uji statistika parametrik terpenuhi, penggunaan uji nonparametrik meskipun lebih cepat dan sederhana akan menyebab- kan pemborosan informasi.

  b. Jika jumlah sampel besar, tingkat efisiensi nonparametrik relatif lebih rendah dibandingkan dengan metode parametrik.

  c. Statistika nonparametrik tidak dapat dipergunakan untuk membuat prediksi (peramalan).

3. Langkah-Langkah Pemilihan Metode Statistika

  Kapan metode statistika nonparametrik digunakan? Metode pengujian ini digunakan bila salah satu syarat dalam statistika parametrik tidak terpenuhi. Syarat-syarat yang perlu diperhatikan untuk menentukan statistika apa yang akan digunakan dalam analisis, yaitu:

  1. Apakah distribusi data diketahui? Jika distribusi data tidak diketahui maka statistika yang sesuai adalah statistika nonparametrik. Jika distribusi data diketahui, maka kita harus melihat jenis distribusi data tersebut.

  2. Apakah data berdistibusi normal? Jika data tidak berdistribusi normal, maka statistika yang sesuai adalah statistika nonparametrik. Jika data berdistribusi normal, maka

  3. Apakah sampel ditarik secara random? Jika sampel tidak ditarik secara random, maka statistika yang sesuai adalah statistika nonparametrik. Jika sampel ditarik secara random, maka statistika yang sesuai adalah statistika parametrik.

  4. Apakah varians kelompok sama? Jika varians kelompok tidak sama, maka statistika yang sesuai adalah statistika nonparametrik. Jika varians kelompok sama, maka statistika yang sesuai adalah statistika parametrik.

  5. Bagaimana jenis skala pengukuran data? Jika skala pengukuran data nominal dan ordinal, maka statistika yang sesuai adalah statistika nonparametrik. Jika skala pengukuran data interval dan rasio, maka statistika yang sesuai adalah statistika parametrik.

  Selain sebaran, salah satu indikator penggunaan metode statistik parametrik atau nonparametrik adalah jenis data. Distribusi normal merupakan bagian dari distribusi probabilitas yang kontinyu (continuous

  

probability distribution ), karena itu skala pengukurannya pun haruslah

  kontinyu. Jenis data yang memiliki skala pengukuran yang kontinyu adalah data rasio dan interval.

  Karena dalam pemilihan metode statistika jenis data merupakan salah satu indikator, maka perlu dijelaskan kembali pengertian dan jenis- jenis data.

BAB II DATA DAN SKALA PENGUKURAN

1. Jenis Data

  Data adalah ukuran dari variabel. Data diperoleh dengan mengukur nilai satu atau lebih variabel dalam sampel (atau populasi).

  Data dapat diklasifikasikan menurut jenis, menurut dimensi waktu, dan menurut sumbernya.

  Data Menurut Jenis

  Menurut jenisnya, data terdiri dari data kuantitatif dan data kualitatif.

a. Data kuantitatif adalah data yang diukur dalam suatu skala

  numerik (angka). Data kuantitatif dapat dibedakan menjadi:

  • - Data interval , yaitu data yang diukur dengan jarak di antara

  dua titik pada skala yang sudah diketahui. Sebagai contoh: IPK mahasiswa (interval 0 hingga 4); usia produktif (interval 15 hingga 55 tahun); suhu udara dalam Celcius (interval 0 hingga 100 derajat).

  • - Data rasio , yaitu data yang diukur dengan suatu proporsi.

  Sebagai contoh: persentase jumlah pengangguran di Propinsi NTB, tingkat inflasi Indonesia pada tahun 2010, Gini rasio, persentase penduduk miskin di NTB, pertumbuhan ekonomi NTB.

b. Data kualitatif , adalah data yang tidak dapat diukur dalam skala

  numerik. Namun karena dalam statistik semua data harus dalam bentuk angka, maka data kualitatif umumnya dikuantifikasi agar dapat diproses. Kuantifikasi dapat dilakukan dengan mengklasi- fikasikan data dalam bentuk kategori. Data kualitatif dapat dibedakan menjadi:

  • - Data nominal , yaitu data yang dinyatakan dalam bentuk

  kategori. Sebagai contoh, industri di Indonesia oleh Badan Pusat Statistik digolongkan menjadi:

  • Industri rumah tangga, dengan jumlah tenaga kerjanya 1- 4 orang, yang diberi kategori 1.
  • Industri kecil, dengan jumlah tenaga 5 -19 orang, yang diberi kategori 2.
  • Industri menengah, dengan jumlah tenaga kerja 20-100 orang, yang diberi kategori 3.
  • Industri besar, dengan jumlah tenaga kerja lebih dari 100 orang, yang diberi kategori 4.

  Angka yang menyatakan kategori ini menunjukkan bahwa posisi data sama derajatnya. Dalam contoh di atas, angka 4 tidak berarti industri besar nilainya lebih tinggi dibanding industri kecil yang angkanya 1. Angka ini sekedar menunjukkan kode kategori yang berbeda.

  • - Data ordinal , yaitu data yang dinyatakan dalam bentuk kategori,
dalam skala peringkat. Sebagai contoh, tingkat kosmopolitan petani suatu daerah diketegorikan: Sangat rendah diberi kode 1.  Rendah diberi kode 2.  Sedang diberi kode 3.  Tinggi diberi kode 4.  Sangat tinggi diberi kode 5. 

  Dalam contoh di atas, angka 5 menunjukkan tingkat kosmopolitan yang tertinggi (besar nilainya lebih tinggi dibanding dengan tingkat 4, 3, 2, dan 1). Angka ini menunjukkan kode kategori dan nilai/derajat yang berbeda.

  Data Menurut Dimensi Waktu

  Menurut dimensi waktu, data dapat digolongkan menjadi:

a. Data runtut waktu ( time-series ) , yaitu data yang secara kronologis

  disusun menurut waktu. Data runtut waktu digunakan untuk melihat perubahan dalam rentang waktu tertentu. Variasi antar variabel terjadi karena adanya perbedaan waktu. Data runtut waktu dibedakan menjadi:

  Data harian, misalnya data Indeks Harga Saham setiap hari, data - harga sembilan bahan-bahan pokok.

  Data mingguan, misalnya data perkembangan harga beras - dalam satu minggu (7 hari).

  Data bulanan, misalnya data tingkat inflasi, data suku bunga - Bank Indonesia.

  Data kuartalan, misalnya data Produk Domestik Bruto suatu - Negara.

  Data tahunan, misalnya data pendapatan nasional setiap tahun - (12 bulan).

  

b. Data silang tempat ( cross-section ) , yaitu data yang dikumpulkan

  pada suatu titik waktu. Data silang tempat digunakan untuk mengamati perilaku dalam periode yang sama. Variasi variabel terjadi karena adanya perbedaan antar pengamatan. Data ini biasanya lebih sesuai untuk mendukung penelitian atau kajian-kajian perilaku individu, perusahaan, atau wilayah. Misalnya:

  Data Sensus yang diterbitkan setiap 10 tahun sekali. - Sebagai contoh: sensus penduduk untuk setiap kabupaten pada tahun 2000; sensus ekonomi dari setiap perusahaan di setiap kabupaten pada tahun 2006. Data jumlah penduduk miskin pada setiap desa di Propinsi NTB - pada tahun tertentu.

  Data pendapatan petani jagung pada suatu daerah tertentu. -

  

c. Data pooling , adalah kombinasi antara data runtut waktu dan silang

tempat.

  Data Menurut Sumbernya

  Berdasarkan sumbernya, data dapat digolongkan menjadi:

  

a. Data internal dan data eksternal. Data internal yaitu data yang

  bersumber dari dalam organisasi. Data eksternal yaitu data yang bersumber dari luar organisasi.

  

b. Data primer dan data sekunder. Data primer adalah data yang

  diperoleh melalui survei lapangan dengan menggunakan metode pengumpulan data tertentu. Data sekunder adalah data yang telah dikumpulkan oleh lembaga pengumpul data dan dipublikasikan kepada masyarakat pengguna data. Data sekunder akan lebih mempermudah dan mempercepat jalannya penelitian. Namun karena umumnya data sekunder dimaksudkan untuk konsumen peneliti dalam jumlah besar, seringkali data yang tersedia tidak sesuai benar dengan keinginan peneliti.

  Hal yang sering dikeluhkan apabila kita menggunakan data sekunder adalah: (1) ragam data statistik yang tersedia semakin banyak tetapi kelompok data yang dibutuhkan bagi suatu studi sering tidak cukup; (2) konsistensi dari data runtut waktu tidak selalu dapat dipertahankan; (3) angka-angka mengenaim asalah tertentu yang dikeluarkan oleh berbagai sumber resmi tidak konsisten satu sama lain.

  Uji reliabilitas data, penyederhanaan, agregasi, dan penyesuaian mutlak diperlukan agar diperoleh hasil yang dapat dipertanggungjawabkan.

2. Skala Pengukuran Variabel

  Dalam menentukan alat analisis statistika yang tepat dan cocok, seorang peneliti tidak hanya harus mengetahui model analisisnya tetapi juga harus memperhatikan skala pengukuran variabel dari data yang akan dianalisis. Misalnya saja seorang peneliti ingin mendeskripsikan seberapa besar penghasilan suatu kelompok masyarakat, maka statistika yang mungkin dapat digunakan adalah menggunakan rata-rata hitung (mean) dan simpangan baku (standar deviasi). Tetapi rata-rata (mean) ini kurang tepat kalau digunakan untuk menggambarkan tingkat pendidikan masyarakat tersebut. Salah satu statistik yang lebih cocok digunakan untuk menggam-barkan tingkat pendidikan masyarakat adalah modus, atau dapat juga menggunakan persentase. Meskipun model analisis yang dapat digunakan menggambarkan penghasilan dan tingkat pendidikan suatu masyarakat adalah analisis deskriptif, tetapi alat statistika yang digunakan berbeda. Kenapa hal ini berbeda ?

  Perbedaan penggunaan alat analisis sangat terkait dengan skala pengukuran variabel yang akan dideskripsikan itu. Oleh karena itu, pemahaman tentang skala pengukuran variabel yang akan dianalisis harus diperhatikan. Ada empat macam skala pengukuran variabel, yaitu skala nominal, ordinal, interval, dan rasio.

a. Skala Nominal

  Misalnya saja saat ini kita sebagai dosen perguruan tinggi X sedangkan Pak Ali yang tinggal di sebelah rumah kita bekerja di sebuah bank pemerintah. Maka variabel jenis pekerjaan atau profesi itu mempunyai skala pengukuran nominal. Nilai dari skala nominal ini hanyalah menunjuk-kan sebagai perbedaan saja, tenaga pengajar tentunya berbeda dengan seorang bankir.

  Contoh lainnya adalah misalnya seorang peneliti ingin mengetahui jenis transportasi apa saja yang digunakan oleh karyawan PT BATAGOR.

  Untuk maksud itu peneliti menjaring pertanyaan "Alat angkutan apakah yang Anda gunakan untuk ke kantor?". Ada banyak kemungkinan jawaban dari karyawan itu, misalnya saja dengan bersepeda motor, dengan berkendaraan umum, dengan bersepeda, atau dengan mobil jemputan yang disediakan oleh perusahaan. Maka variabel alat transportasi itu berskala pengukuran nominal.

b. Skala Ordinal

  Seorang ketua Lembaga Penelitian di Perguruan Tinggi bermaksud mengetahui usulan-usulan penelitian yang telah disetujui oleh Direktorat Jenderal Pendidikan Tinggi lima tahun terakhir berdasarkan jabatan fungsional peneliti utamanya. Tentunya informasi yang mungkin diperoleh adalah sekian peneliti utamanya lektor muda, sekian orang peneliti utamanya lektor, lektor madya, dan sebagainya. Nilai dari variabel jabatan fungsional itu menunjukkan adanya tingkatan atau order disamping

  

adanya perbedaan . Varaibel yang demikian dinamakan sebagai skala

  pengukuran yang ordinal. Skala pengukuran ini memberikan nilai yang dapat diurutkan, jabatan lektor muda tentunya lebih rendah daripada lektor atau lektor madya.

  Contoh lain untuk skala pengukuran ordinal adalah nilai mata kuliah mahasiswa. Ferry mendapat nilai C untuk mata kuliah Metodologi Penelitian, Sukino mendapat nilai B, Khaeruman mendapat nilai D. Nilai mata kuliah yang telah dikategorikan dengan A, B, C, D, dan E merupakan variabel yang berskala pengukuran ordinal. Nilai-nilai itu selain dapat membedakan kemampuan Ferry, Sukina, dan Khaeruman dalam mata kuliah Metodologi Penelitian tersebut tetapi juga menggambarkan

  

kedudukan , posisi, atau urutan kemampuan tiap mahasiswa dalam mata

kuliah tersebut.

c. Skala Interval

  Variabel temperatur atau suhu merupakan contoh yang pas dan baik untuk menggambarkan varaibel berskala pengukuran interval.

  Misalnya air di gelas A bersuhu 100 derajat Celcius, di gelas B 60 derajat Celsius, dan di gelas C 30 derajat Celsius. Disini terlihat bahwa suhu air di tiga gelas itu saling berbeda, air digelas A paling panas, dan di gelas C paling dingin diantara ketiga gelas yang ada. Selisih suhu air di gelas A dan gelas B adalah 40 derajat Celsius, tetapi tidak dapat dikatakan bahwa suhu air di gelas B dua kali suhu di gelas C. Dari contoh ini terlihat bahwa variabel suhu air selain memenuhi sifat adanya perbedaan dan dapat diurutkan, tampak juga bahwa kita dapat melihat berapa selisih suhu air dari tiap gelas yang berbeda itu. Hal ini dapat dikatakan bahwa variabel berskala pengukuran interval mempunyai ciri membedakan, meng- urutkan, dan mengandung unsur jarak .

d. Skala Rasio

  Variabel penghasilan merupakan contoh untuk skala pengukuran rasio. Misalnya penghasilan Rini setiap bulan sebagai dosen yang mempunyai jabatan Lektor Muda adalah 500 ribu rupiah, sedangkan Lusi yang baru setahun lalu menjabat Asisten Ahli berpenghasilan 300 ribu rupiah, ataupun Eko yang baru saja diangkat sebagai Asisten Ahli Madya hanya memperoleh 250 ribu rupiah per bulan. Penghasilan ketiga tenaga pengajar itu berbeda satu sama lainnya, dan juga Rini merupakan dosen yang berpenghasilan tertinggi diantara teman-temannya, dan Eko menduduki posisi yang terendah. Variabel penghasilan ini juga dapat memberikan informasi bahwa selisih penghasilan antara Rini dengan Lusi adalah 200 ribu rupiah, selisih penghasilan Lusi dengan Eko hanya sebesar 50 ribu rupiah. Dari contoh ini terlihat bahwa variabel penghasilan berskala pengukuran interval mempunyai ciri perbedaan, urutan, dan mengandung unsur adanya jarak atau selisih yang jelas dian-tara nilai variabelnya itu. Selain itu dapat juga dikatakan bahwa Rini berpenghasilan dua kali penghasilan Eko yang baru saja mengajar. Rasio dua kali ini sangat esak karena kedua nilai mempunyai nilai nol (titik nol) yang sama

  

dan mutlak . Nol mutlak inilah yang membedakan skala pengukuran rasio

dengan interval.

BAB III REGRESI DENGAN VARIABEL DUMMY Variabel di dalam analisis regresi bisa debedakan menjadi dua

  yaitu variabel kuantitatif dan variabel kualitatif. Model regresi pada bagian ini memfokuskan pada regresi dengan variabel independen kualitatif.

  Harga, volume produksi, volume penjualan, biaya promosi adalah beberapa contoh variabel yang datanya bersifat kuantitatif. Namun, bila kita membicarakan masalah jenis kelamin, tingkat pendidikan, status perkawinan, krisis ekonomi maupun kenaikan harga BBM berarti kita membicarakan variabel bersifat kualitatif.

  Variabel-variabel kualitatif tersebut sangat mempengaruhi perilaku agen-agen ekonomi. Variabel kualitatif ini bisa terjadi pada dara cross

  

section maupun data time series. Misalnya dalam data cross section kita

  bisa memasukkan jenis kelamin di dalam regresi dalam mempengaruhi volume penjualan handphone. Begitu pula data kualitatif seperti kenaikan harga BBM bisa kita masukkan di dalam regresi dalam mempengaruhi volume penjualan dalam data time series.

  Ada kalanya kita melakukan suatu regresi dimana variabel penjelas atau variabel tergantung berupa data kategorikal (sering disebut data nominal). Misalnya laki-laki dan perempuan, desa-kota, industri pangan, sandang, dan peralatan. Contoh kita ingin mengetahui jenis kelamin, lokasi, dan industri terhadap upah.

  1. Pengaruh jenis kelamin atas upah, modelnya, Upah = a + b

  1 DJK

  Dimana DJK adalah Dummy jenis kelamin (laki-laki dan wanita)

  2. Pengaruh lokasi terhadap upah, apakah desa lebih rendah upahnya dari kota, modelnya, Upah = a + b

  1 DLOK

  dimana DLOK adalah dummy lokasi

  3. Pengaruh industri terhadap upah, modelnya Upah = a + b

  1 DIND

  dimana DIND adalah dummy setiap klasifikasi industri Untuk memudahkan lihat contoh data berikut:

  Industri Kode Industri Upah

  Pangan 31 500 Sandang 32 522 Sandang 32 530 Pangan 31 512 Peralatan logam 38 600 Peralatan logam 38 642 Pangan 31 540 Pangan 31 520 Sandang 32 580 Sandang 32 570

  Cara Membuat Variabel Dummy

  Untuk dapat membedakan pengaruh masing-masing industri atas upah kita akan membuat variabel dummy. Caranya adalah memberi nilai 1 pada kategori tersebut dan memberi nol bagi kategori lainnya data berubah menjadi sebagai berikut.

  Industri Kode Industri Upah Dpangan Dsandang Dalat Pangan 31 500

  550

  Dari data di atas hasilnya adalah sebagai berikut Upah = 520 + 30 Dsandang + 100 Dalat

  2 Dalat

  Upah = a + b

  Contoh:

  Jika kita memiliki 3 dummy variabel maka kita bisa memasukkan 2 variabel dummy, sedangkan yang satu akan berfungsi menjadi benchmark atau pematok. Besarnya benchmark tidak lain adalah intercept atau nilai konstanta (a).

  2 640 600  

  620

  Peralatan=

  4 520 530 570 580    

  Sandang =

  1 Sandang 32 520

  4 500 520 520 540    

  1 Sekarang perhatikan upah rata-rata untuk masing-masing industri: Pangan = 520

  1 Sandang 32 570

  1 Sandang 32 580

  1 Pangan 31 520

  1 Pangan 31 540

  1 Peralatan logam 38 640

  1 Peralatan logam 38 600

  1 Pangan 31 520

  1 Sandang 32 530

1 Dsandang + b

  Jadi rata-rata upah industri pangan yang tidak dimasukkan ke dalam model menjadi intersep (benchmark) beda upah sandang terhadap pangan adalah nilai b

  9 Pangan 31 520

  1

  6 Sandang 32 580

  1

  9 Pangan 31 520

  1

  11 Pangan 31 540

  12 Peralatan logam 38 640

  9 Peralatan logam 38 600

  1

  1

  1

  9 Sandang 32 530

  1

  6 Sandang 32 520

  1

  Industri Kode Industri Upah Dpangan Dsandang Dalat Pangan 31 500

  Sekarang kita akan memasukkan data pendidikan pada data yang kita miliki di atas, data lengkapnya menjadi sebagai berikut.

  Kesimpulannya jika kita punya n variabel dummy, maka kita dapat memasukkan n-1 variabel dalam model regresi, dan yang menjadi intersep adalah nilai rata-rata variabel yang tidak dimasukkan. Perhatikan cara memaknai parameter hasil regresi yang menggunakan dummy di atas.

  Sekarang intersep (a) menjadi rerata industri alat, dan beda upah pangan terhadap industri alat adalah minus 100 dan beda upah industri alat adalah minus 70.

  Sebaliknya jika yang tidak dimasukkan dalam regresi adalah industri peralatan, maka hasil regresi akan berubah sebagai berikut: Upah = 620 - 100 Dpangan - 70 Dsandang

  =30 dan beda upah rata-rata industri peralatan terhadap industri pangan adalan 100.

  12 Hasil di atas dapat kita ringkas dan sajikan sebagai berikut: Upah = 448,4 - 18,62 Dsandang + 49,9 Dalat + 10,5 Pendidik 2 (12,)** (-1,04) (2,287)** (2,486)**

  R = 0,839 F = 0,40

  Makna hasil regresi sekarang adalah sebagai berikut: Pada tingkat pendidikan yang sama, maka upah industri sandang adalah minus 18,6 di bawah industri pangan (industri yang tidak diikutkan dalam regresi). Upah industri peralatan pada tingkat pendidikan yang sama adalah 49,9 di atas industri pangan. Mengapa angkanya menjadi semakin kecil dari sebelumnya?

  Hal ini disebabkan adanya perbedaan pendidikan di ketiga industri, perbedaan upah tidak semata disebabkan oleh perbedaan industri tetapi juga disebabkan oleh perbedaan pendidikan. Ini dapat juga dikatakan bahwa pendidikan menjadi variabel KONTROL yan bertugas memurnikan pengaruh perbedaan industri atas upah.

  Contoh :

  Menganalisis apakah masa kerja, tingkat pendidikan karyawan, dan jenis kelamin mempengaruhi gaji karyawan. Pendidikan dikategorikan menjadi dua yaitu Diploma dan Sarjana. Menggunakan data hipotetis sebanyak 20 karyawan suatu perusahaan.

  Yi = βo + β1 Xi + β2 D1 + β3 D2 Dimana : Yi = gaji karyawan Xi = masa kerja karyawan (tahun) D1 = 1 jika sarjana dan 0 jika tidak (diploma) D2 = 1 jika pria dan 0 bila wanita

  Data 20 Karyawan di Perusahaan PT Maju Mundur Gaji (juta) Masa_kerja Pendidikan Kelamin

  2,700

  11 3,400

  3

  1

  1 3,900

  18

  1 3,400

  14

  1 4,800

  9

  1

  1 2,200

  3

  1 6,400

  15

  1

  1 6,230

  17

  1 4,200

  20

  1 2,065

  2 3,510

  4

  1 2,500

  5

  1 2,800

  8

  1 2,975

  14 5,890

  15

  1 3,105

  15 3,200

  2

  1

  1 3,365

  19 3,850

  5

  1 6,910

  20

  1 Data dianalisis dengan SPSS dan hasil outputnya seperti berikut.

  Model Summary Adjusted Std. Error of Model R R Square R Square the Estimate a

  1 ,958 ,917 ,901 ,45176 a. Predictors: (Constant), Kelamin, Pendidikan, Masa_ kerja

  Nilai koefisien determinasi sebesar 0,917 artinya hasil regresi menunjukkan bahwa variasi masa kerja, tingkat pendidikan karyawan dan jenis kelamin mampu menjelaskan variasi gaji karyawan sebesar 91,7% dan sisanya sebesar 9,3% dijelaskan oleh faktor lain di luar model. b

  ANOVA Sum of

Model Squares df Mean Square F Sig.

a

  1 Regression 36,101 3 12,034 58,964 ,000 Residual

  3,265 16 ,204 Total 39,367

  19 a. Predictors: (Constant), Kelamin, Pendidikan, Masa_kerja b. Dependent Variable: Gaji

  Nilai F-hitung sebesar 58,964 dan nilai F-tabel pada α=5% dengan df (3,16) sebesar 3,24 (cari dalam tabel F). Nilai F-hitung lebih besar dari nilai F-tabel sehingga kita menolak Ho. Bisa juga melihat nilai signifikansi sebesar 0,000 < α = 0,05 maka Ho ditolak (H1 diterima). Hasil regresi ini mengindikasikan bahwa secara serentak variabel masa kerja, tingkat pendidikan karyawan dan jenis kelamin secara nyata mempengaruhi gaji karyawan.

  a Coefficients Unstandardized Standardized Coefficients Coefficients

  

Model B Std. Error Beta t Sig.

1 (Constant) 1,067 ,280 3,815 ,002

  Masa_kerja ,156 ,016 ,703 9,448 ,000 Pendidikan 2,183 ,207 ,774 10,560 ,000 Kelamin ,228 ,208 ,081 1,096 ,289 a.

  Dependent Variable: Gaji

  Uji signifikansi variabel independen terhadap variabel dependen menunjukkan bahwa nilai t-hitung variabel masa kerja sebesar 9,448; variabel dummy tingkat pendidikan sebesar 10,560; dan variabel dummy jenis kelamin sebesar 1,096. Sementara itu, nilai t-tabel uji dua sisi pada α=5% dengan df =16 sebesar 2,120 (cari dalam tabel t). Dengan demikian variabel masa kerja dan dummy tingkat pendidikan signifikan pada α=5% (nilai t-hitung > nilai t-tabel), sedangkan variabel dummy jenis kelamin tidak berpengaruh nyata. Bisa juga membandingkan nilai Sig. (probabilitas atau p-value) jika lebih kecil dari alpha maka Ho ditolak, artinya variabel tersebut berpengaruh nyata terhadap variabel dependen.

  Hasil regresi mengindikasikan bahwa variabel kualitatif tingkat pendidikan karyawan berpengaruh nyata terhadap gaji karyawan.

  Koefisien regresi variabel dummy tingkat pendidikan sebesar 2,183 dapat diartikan gaji karyawan berpendidikan sarjana lebih besar 2,183 juta dibandingkan dengan gaji karyawan berpendidikan tidak sarjana dengan asumsi variabel lain tetap. Variabel dummy jenis kelamin tidak signifikan maka dapat diartikan tidak ada perbedaan gaji antara karyawan pria dan dummy jenis kelamin 0,228 artinya gaji karyawan pria lebih tinggi 0,228 juta dibandingkan dengan gaji karyawan wanita tetapi secara statistika perbedaan itu tidak berbeda nyata. Karyawan Sarjana dan Pria :

  E(Yi | D1=1; D2=1, Xi) = (βo + β2 + β3) + β1Xi Karyawan Tidak Sarjana dan Pria :

  E(Yi | D1=0; D2=1, Xi) = (βo + β3) + β1Xi Karyawan Sarjana dan Wanita :

  E(Yi | D1=1; D2=0, Xi) = (βo + β2) + β1Xi Karyawan Tidak Sarjana dan Wanita :

  E(Yi | D1=0; D2=0, Xi) = βo + β1Xi Persamaan regresi Yi = 1,067 + 0,156 Xi + 2,183 D1 + 0,228 D2 Gaji karyawan berpendidikan sarjana dan pria :

  Y’ = (1,067 +2,183 + 0,228) + 0,156 Xi ===> Y’ = 3,478 + 0,156 Xi Gaji karyawan berpendidikan tidak sarjana dan pria :

  Y’ = (1,067 + 0,228) + 0,156 Xi ===> Y’ = 1,295 + 0,156 Xi Gaji karyawan berpendidikan sarjana dan wanita :

  Y’ = (1,067 + 2,183) + 0,156 Xi ===> Y’ = 3,250 + 0,156 Xi Gaji karyawan berpendidikan tidak sarjana dan wanita: Y’=1,067+0,156 Xi

  Soal Latihan : Sekarang buatlah analisis dengan data berikut.

  20 A

  40 C

  22

  50 C

  23

  52 A

  20

  11

  31 C

  30 B

  15

  40 Buatlah model analisis yang menjawab pertanyaan penelitian berikut:

  1. Apakah ketiga industri memiliki laba benar-benar yang berbeda? Buatlah dummy variabelnya.

  2. Apakah laba itu disebabkan oleh beda industri atau modal, berapa sumbangan masing-masing?

  3. Mana variabel yang signifikan? 4. Tunjukkan ketepatan modelnya.

  5. Ujilah asumsi klasiknya.

  20

  18

  INDUSTRI LABA KAPITAL A

  12

  10

  10 A

  12

  11 A

  14

  12 A

  9 B

  16 B

  13

  13 B

  15

  23 B

  11

  25 B

  10

  6. Sajikan hasil regresi secara internasional Soal di atas hanya dapat dipecahkan melalui program paket karena variabelnya menjadi banyak, gunakan program SPSS.

BAB IV JENIS UJI STATISTIKA NONPARAMETRIK

  2

1. Uji Chi Square (X )

  Chi-Square disebut juga dengan Kai Kuadrat. Chi Square adalah salah satu jenis uji komparatif non parametrik yang dilakukan pada dua variabel, di mana skala data kedua variabel adalah nominal. (Apabila dari 2 variabel, ada 1 variabel dengan skala nominal maka dilakukan uji chi square dengan merujuk bahwa harus digunakan uji pada derajat yang terendah).

  Uji chi-square merupakan uji non parametrik yang paling banyak digunakan. Namun perlu diketahui syarat-syarat uji ini adalah: frekuensi responden atau sampel yang digunakan besar, sebab ada beberapa syarat di mana chi square dapat digunakan yaitu:

  1. Tidak ada cell dengan nilai frekuensi kenyataan atau disebut juga Actual Count (F0) sebesar 0 (Nol).

  2. Apabila bentuk tabel kontingensi 2 X 2, maka tidak boleh ada 1 cell saja yang memiliki frekuensi harapan atau disebut juga expected

  count ("Fh") kurang dari 5.

  3. Apabila bentuk tabel lebih dari 2 x 2, misak 2 x 3, maka jumlah cell dengan frekuensi harapan yang kurang dari 5 tidak boleh lebih dari 20%.

  Rumus chi-square sebenarnya tidak hanya ada satu. Apabila tabel kontingensi bentuk 2 x 2, maka rumus yang digunakan adalah "koreksi yates". Untuk rumus koreksi yates, sudah kami bahas dalam artikel sebelumnya yang berjudul "Koreksi Yates".

  Apabila tabel kontingensi 2 x 2 seperti di atas, tetapi tidak memenuhi syarat seperti di atas, yaitu ada cell dengan frekuensi harapan kurang dari 5, maka rumus harus diganti dengan rumus "Fisher Exact Test".

  Pada buku ajar ini, akan fokus pada rumus untuk tabel kontingensi lebih dari 2 x 2, yaitu rumus yang digunakan adalah "Pearson Chi- Square". Formula uji Chi Square : Dimana :

  = Nilai kai-kuadrat

  fo = frekuensi observasi/pengamatan fe = frekuensi ekspetasi/harapan

  Untuk memahami apa itu "cell", lihat tabel di bawah ini: Pekerjaan

  Pendidikan Total

  1

  2 1 a b a+b 2 c d c+d 3 e f e+f

  Total a+c+e b+d+f N Tabel di atas, terdiri dari 6 cell, yaitu cell a, b, c, d, e dan f.

  Sebagai contoh kita gunakan penelitian dengan judul "Perbedaan Pekerjaan Berdasarkan Pendidikan".

  22

  3

  25

  2

  1

  24

  2

  3

  23

  1

  1

  1

  26

  3

  21

  2

  2

  20

  1

  1

  19

  2

  2

  1

  2

  2

  31

  1

  34

  1

  2

  33

  1

  2

  32

  2

  2

  1

  2

  1

  30

  2

  2

  29

  2

  1

  28

  2

  1

  27

  18

  2

  Teladan 1 : Gunakan data berikut:

  2

  2

  2

  7

  2

  3

  6

  2

  1

  5

  2

  4

  1

  2

  1

  3

  2

  2

  2

  1

  1

  1

  Responden Pendidikan Pekerjaan

  8

  2

  17

  3

  2

  3

  16

  2

  1

  15

  1

  2

  14

  1

  13

  9

  1

  3

  12

  2

  1

  11

  2

  1

  10

  2

  2

  1

  36

  56

  59

  1

  3

  58

  1

  1

  57

  2

  2

  2

  1

  2

  55

  1

  1

  54

  2

  3

  53

  2

  2

  60

  52

  2

  34

  26

  16 Total

  9

  7

  3

  24

  16

  8

  20

  3

  9

  11

  1

  2

  1

  Pekerjaan Total

  2. Maka akan kita lihat hasilnya sebagai berikut: Pendidikan

  Karena variabel pendidikan memiliki 3 kategori dan variabel pekerjaan memiliki 2 kategori, maka tabel kontingensi yang dipakai adalah tabel 3 x

  1 Dari data di atas, kita kelompokkan ke dalam tabel kontingensi.

  2

  1

  1

  40

  43

  2

  3

  42

  1

  1

  41

  2

  3

  1

  1

  2

  39

  2

  2

  38

  2

  3

  37

  1

  1

  44

  2

  48

  51

  1

  2

  50

  2

  3

  49

  1

  2

  2

  2

  3

  47

  1

  3

  46

  1

  1

  45

  2

  60 Dari tabel di atas, kita inventarisir per cell untuk mendapatkan nilai frekuensi kenyataan, sebagai berikut: Cell Fo a

  11 b 9 c 8 d

  6. Fh cell f = (16/60) x 34 = 9,067 Maka kita masukkan ke dalam tabel sebagai berikut:

  7 6,933 f

  16 13,600 e

  8 10,400 d

  9 11,333 c

  11 8,667 b

  Cell Fo Fh a

  5. Fh cell e = (16/60) x 26 = 6,933

  16 e 7 f

  4. Fh cell d = (24/60) x 34 = 13,600

  3. Fh cell c = (24/60) x 26 = 10,400

  2. Fh cell b = (20/60) x 34 = 11,333

  1. Fh cell a = (20/60) x 26 = 8,667

  Fh = (Jumlah Baris/Jumlah Semua) x Jumlah Kolom

  9 Langkah berikutnya kita hitung nilai frekuensi harapan per cell, rumus menghitung frekuensi harapan adalah sebagai berikut:

  9 9,067 Langkah berikutnya adalah menghitung Kuadrat dari Frekuensi Kenyataan dikurangi Frekuensi Harapan per cell.

  2

  1. Fh cell a = (11 - 8,667) = 5,444

  2

  2. Fh cell b = (9 - 11,333) = 5,444

  2

  3. Fh cell c = (8 - 10,400) = 5,760

  2

  4. Fh cell d = (16 - 13,600) = 5,760

  2

  5. Fh cell e = (7 - 6,933) = 0,004

  2

  6. Fh cell f = (9 - 9,067) = 0,004 Lihat hasilya pada tabel di bawah ini:

  2 Cell Fo Fh Fo - Fh (Fo - Fh)

  a 11 8,667 2,333 5,444 b 9 11,333 -2,333 5,444 c 8 10,400 -2,400 5,760 d

  16 13,600 2,400 5,760 e 7 6,933 0,067 0,004 f 9 9,067 -0,067 0,004

  Kuadrat dari Frekuensi Kenyataan dikurangi Frekuensi Harapan per cell kemudian dibagi frekuensi harapannya:

  1. Fh cell a = 5,444/8,667 = 0,628

  2. Fh cell b = 5,444/11,333 = 0,480

  3. Fh cell c = 5,760/10,400 = 0,554

  4. Fh cell d = 5,760/13,600 = 0,424

  5. Fh cell e = 0,004/6,933 = 0,001

  6. Fh cell f = 0,004/9,067 = 0,000 Kemudian dari nilai di atas, semua ditambahkan, maka itulah nilai

  2

  2 Cell Fo Fh Fo - Fh (Fo - Fh) (Fo - Fh) /Fh

  a

  11 8,667 2,333 5,444 0,628 b

  9 11,333 -2,333 5,444 0,480 c

  8 10,400 -2,400 5,760 0,554 d

  16 13,600 2,400 5,760 0,424 e

  7 6,933 0,067 0,004 0,001 f

  9 9,067 -0,067 0,004 0,000

  Chi-Square Hitung = 2,087 Untuk menjawab hipotesis, bandingkan chi-square hitung dengan chi-square tabel pada derajat kebebasan atau degree of freedom (DF) tertentu dan taraf signifikansi tertentu. Apabila chi-square hitung >= chi- square tabel, maka perbedaan bersifat signifikan, artinya H0 ditolak atau H1 diterima. DF pada teladan 2 di atas adalah 2. Didapat dari rumus ===>

  DF = (r - 1) x (k-1) di mana: r = baris. k = kolom. Pada contoh di atas, baris ada 3 dan kolom ada 2, sehingga DF = (2 - 1) x (3 -1) = 2. Apabila taraf signifikansi yang digunakan adalah 95% maka batas kritis 0,05 pada DF 2, nilai chi-square tabel sebesar = 5,991.

  Karena 2,087 < 5,991 maka perbedaan tidak signifikan, artinya Ho diterima atau H1 ditolak.

  Teladan 2 : untuk Data dari Sampel Tunggal

  Akan diuji distribusi frekuensi kategori variabel motivasi hasil amatan dengan distribusi frekuensi kategori variabel sama yang diharapkan. Hipotesis nol uji tersebut adalah: tidak terdapat perbedaan Prosedur ini banyak digunakan pada uji normalitas variabel. Rumus yang digunakan dalam uji tersebut adalah:

  

  8

  hitung < 2

  χ

  tabel = 9,49. Karena 2

  χ

  Pada taraf signifikasi () = 5% harga 2

  = 3,025. Derajad kebebasan (db) uji tersebut adalah jumlah kategori (k) dikurangi 1 = 4.

  χ

  Dengan cara tersebut, maka diperoleh 2

  30 30 3,025

  2 2,000 Total

  4

  8 0,000 Sangat Tinggi

  8

  10 0,400 Tinggi

  8 0,125 Sedang

    k i i i i

  7

  2 0,500 Rendah

  3

  2 )/E Sangat Rendah

  

Tabel Uji Statistik Nonparametrik Data dari Sampel Tunggal

dengan Chi-Kuadrat

Kategori O E ((O-E)

  2 )/E.

  perlu dibuat kolom ((O-E)