DASAR PEMILIHAN UJI STATISTIK

  01/27/10 1

DASAR PEMILIHAN UJI STATISTIK

  Saptawati Bardosono PENDAHULUAN

 Pada setiap penelitian biasanya data dikumpulkan

  untuk sejumlah besar variabel, sehingga dapat menyulitkan pemilihan uji statistik yang sesuai dan urutan penggunaannya Pemilihan uji statistik perlu direncanakan sejak

  

  awal penelitian, sehingga analisis data dapat memaksimalkan kualitas dan interpretasi dari temuan

   Pemilihan uji statistik berdasar kepada jenis

  rancangan penelitian yang ingin dianalisis

  PENDAHULUAN

  Manfaat dari perencanaan analisis:

  ١)

  Pedoman untuk menganalisis data

  ٢) Membantu pada saat interpretasi dan

  melaporkan hasil penelitian

  ٣)

  Menghasilkan analisis yang dapat menjawab pertanyaan penelitian secara jelas dan jujur

  PERENCANAAN ANALISIS UNTUK STUDI RCT

  Sesuai dengan rincian pertanyaan penelitian Perencanaannya meliputi:

  ١)

  Definisi operasional dari outcome primer dan/atau sekunder

  ٢) Metoda statistik yang akan digunakan ٣) Pedoman untuk penyesuaian data dasar variabel ٤) Bila perlu, analisis sub-kelompok

  

PERENCANAAN ANALISIS UNTUK

STUDI OBSERVASIONAL

  Seringkali tidak memungkinkan untuk menyusun perencanaan lengkap secara spesifik, namun minimal berdasar pada hipotesis2 nya

  Perencanaannya meliputi:

  ١) Definisi operasional dari variabel outcome dan

  exposure

  ٢) Variabel pengganggu dari hubungan antara

  outcome-exposure Bila perlu, analisis dari effect modifier

  ٣)

  DATA CHECKING & EDITING

  Harus dilakukan sebelum melakukan analisis data Tahap 1 dengan memeriksa distribusi dari masing2 variabel:

  ١) Untuk data kategorik, pastikan data sesuai

  dengan kategori yang ada dan frekuensi dari masing2 kategori masuk akal

  ٢) Untuk data numerik, lakukan range check

  (histogram) untuk mendapatkan data yang ekstrim

  DATA CHECKING & EDITING

  Tahap 2 dengan melakukan consistency check untuk memeriksa konsistensi kaitan antara 2 atau lebih variabel:

  ١)

  Dengan cross-classification, contoh antara seks dan paritas;

  ٢) Dengan scatter plots, contoh antara BB

  dengan umur atau BB dengan TB

  DATA CHECKING & EDITING

  Tindakan yang harus dilakukan:

  ١) Kesalahan harus diperbaiki dengan merujuk ke

  data aslinya (kuesioner) atau diisi sebagai missing value

  

٢) Bila datanya ekstrim tapi masih mungkin terjadi,

  maka tidak perlu diganti Lakukan checking untuk masing2 kelompok perlakuan

ANALISIS AWAL

  Distribusi dari masing2 variabel untuk:

   Checking ulang bahwa kesalahan telah

  diperbaiki

   Lebih mengenal karakteristik dari

  populasi yang diteliti Lakukan analisis awal untuk masing2 kelompok perlakuan

  SPESIFIKASI VARIABEL UNTUK ANALISIS

  Variabel2 dapat berperan lebih dari 1 dalam analisis Perlu dilakukan identifikasi:

  Variabel yang sudah diketahui sebagai

  

  pengganggu hubungan antara outcome-exposure

   Variabel lain yang mungkin menjadi

  pengganggu nantinya

  

 Variabel lain yang akan menjadi effect modifier

  (yang dapat mengubah ukuran ataupun arah dari hubungan outcome-exposure

REDUKSI DATA

  Sebelum melakukan analisis data secara formal, terkadang diperlukan untuk membuat variabel baru dengan mengelompokkan beberapa variabel asli

   Untuk variabel exposure kategorik,

  pengelompokkan diperlukan bila kategorinya banyak, contoh: jenis pekerjaan

REDUKSI DATA

  2) Untuk variabel exposure numerik, pengelompokkan diperlukan untuk: Menggunakan metoda berdasarkan stratifikasi

  • Menggunakan metoda grafik untuk memeriksa

  bagaimana outcome yang non-numerik berubah pada setiap tingkatan exposure Memeriksa adanya hubungan liniar antara

  • variabel exposure numerik dengan outcome non- numerik

REDUKSI DATA

  Untuk variabel exposure numerik, pengelompokkan dapat dilakukan dengan: Misalnya quintiles, untuk

  

  pengelompokkan menjadi 5

   Cut-off points berdasarkan data dari

  penelitian terdahulu atau standar normal

ANALISIS UNI-VARIABEL

  Dilakukan crude association antara exposure dan outcome,

yaitu memeriksa hubungan antara outcome dengan

masing2 exposure tanpa menghiraukan variabel2 lain dengan manfaat:

   Memeriksa tabel atau grafik sederhana serta hubungan yang merupakan informasi mengenai masing2 data

   Dapat memberikan pemikiran awal mengenai masing2

variabel tsb yang mempunyai hubungan kuat dengan

outcome

   Merupakan indikator penting pada saat dilakukan analisis untuk mengontrol variabel pengganggu

ANALISIS VARIABEL PENGGANGGU

  Untuk studi observasional mengontrol efek variabel pengganggu merupakan fokus utama analisis dengan:

   Metoda Mantel-Haenszel berdasarkan

  stratifikasi Modeling regresi

  

ANALISIS VARIABEL PENGGANGGU

  Strategi memilih variabel pengganggu: dengan variabel outcome sebagai gambaran dari teori yang ada dan arah

Membuat kerangka konsep untuk hubungan antara berbagai variabel

 Variabel yang sejak awal telah diketahui sebagai pengganggu harus dikontrol dalam analisis dari hubungan  eksplorasi:

Variabel pengganggu lainnya dapat ditemukan sebagai hasil analisis

a) variabel yang berhubungan dengan outcome dan exposure namun bukan memperhatikan arah dari hubungannya b) berdasarkan data yang dianalisis dan pengetahuan yang ada serta setelah sebagai penyebab antara keduanya 4) Semua variabel yang berhubungan dengan outcome diikutkan dalam regresi penyebab liniar ganda (cara stepwise), kecuali yang mempunyai hubungan sebagai

ANALISIS UNTUK INTERAKSI

  Ada tiga interaksi yang harus dibedakan:

   Interaksi antara variabel pengganggu 

  Interaksi antara variabel pengganggu dengan variabel exposure yang diteliti

   Interaksi antara exposure2 yang diteliti

ANALISIS YANG REPRODUKTIF

  1. Masukkan file data mentah ke program statistik, buat label untuk setiap variabel supaya mudah diidentifikasi, check apakah data sesuai dengan nilainya, check konsistensi antar variabel, buat variabel baru dengan recoding atau penggabungan variabel2 kemudian simpan data dalam file baru

ANALISIS YANG REPRODUKTIF

  2. Gunakan data dalam file baru untuk memeriksa hubungan antara variabel outcome dengan variabel2 exposure dan variabel pengganggu yang diteliti dengan menggunakan tabel, grafik serta melakukan analisis univariabel

ANALISIS YANG REPRODUKTIF

  3. Gunakan uji Mantel-Haenszel dan analisis regresi untuk mengetahui efek variabel exposure yang dikontrol oleh variabel pengganggu potensial

  4. Periksa interaksi antara variabel outcome, exposure dan pengganggu

  5. Buat tabel final untuk laporan penelitian

  PERMASALAHAN PADA ANALISIS DAN INTERPRETASI DATA ١. Multiple comparisons, menghubungkan semua variabel yang ada di luar hipotesis = data dredging akan mengakibatkan pelaporan hasil yang tidak benar/palsu

  ٢. Subgroup analysis, kadang sangat menggoda untuk mengembangkan hasil yang menarik bila hipotesis tak terbukti

  ٣. Data-driven comparisons, sebaiknya tidak melakukan pengelompokkan pada variabel exposure untuk menghasilkan hubungan yang lebih bermakna dengan variabel outcome

APA ITU STATISTIK

  Statistik merupakan kegiatan untuk:

  • Mengumpulkan data
  • Meringkas/menyajikan data
  • Menganalisis data dengan metoda tertentu  Menginterpretasi hasil analisis tersebut. Ilmu statistik berguna untuk membantu dalam pengambilan keputusan atas masalah tertentu.

MANFAAT STATISTIK

  • Memperkirakan rata2
  • >Mengetahui hubungan antar variabel2
  • Mengetahui dampak suatu intervensi
  • Dsb

JENIS STATISTIK

  

  Statistik deskriptif: Berkaitan dengan bagaimana data dikumpulkan dan diringkas

  

  Statistik inferensi: Berkaitan dengan analisis data dan interpretasi hasil analisis tersebut

JENIS DATA

  Data kualitatif: Data kuantitatif: 

  

Data yang dinyatakan dalam Data yang dinyatakan dalam

bentuk bukan angka bentuk angka Contoh: jenis pekerjaan, Contoh: usia, tinggi, status perkawinan, gender, penghasilan kepuasan, dll Harus dikuantifikasikan dengan skor atau ranking

JENIS DATA

  Data berskala nominal: data yang diperoleh dengan cara kategorisasi atau klasifikasi Contoh: jenis pekerjaan, pegawai negeri, diberi tanda 1 pegawai swasta, diberi tanda 2 wiraswasta, diberi tanda 3

  Cirinya: posisi setara dan tidak bisa dilakukan operasi matematika

JENIS DATA

  Data berskala ordinal: data yang diperoleh dengan cara kategorisasi atau klasifikasi, tetapi di antara data tsb terdapat hubungan

  Contoh: kepuasan pelayanan, sangat puas, diberi tanda 1 puas, diberi tanda 2 cukup puas, diberi tanda 3 tidak puas, diberi tanda 4 sangat tidak puas, diberi tanda 5

  Cirinya: posisi tidak setara dan tidak bisa dilakukan operasi matematika

JENIS DATA

  Data berskala interval: data yang diperoleh dengan cara pengukuran, di mana jarak dua titik pada skala sudah diketahui

  Contoh: temperatur ruangan untuk air membeku dan mendidih Celcius pada 0 sampai 100, jarak 100 Fahrenheit pada 32 sampai 212, jarak 180

  Cirinya: tidak ada kategorisasi dan bisa dilakukan operasi matematika

JENIS DATA

  Data berskala rasio: data yang diperoleh dengan cara pengukuran, di mana jarak dua titik pada skala sudah diketahui, dan mempunyai titik 0 yang absolut

  Contoh: jumlah buku di perpustakaan jika 5, berarti ada 5 buku, jika 0, berarti tidak ada buku sama sekali

  Cirinya: tidak ada kategorisasi dan bisa dilakukan operasi matematika

JENIS DATA VERSUS UJI STATISTIK

  Jenis data akan mempengaruhi pemilihan prosedur statistik yang akan digunakan: Data kuantitatif akan menggunakan prosedur statistik parametrik; Data kualitatif cenderung mengarah pada statistik non-parametrik

  Pengolahan Data Statistik

  Statistik parametrik, berhubungan dengan inferensi statistik yang membahas parameter2 populasi, seperti rata2, proporsi, dll.

  Cirinya: jenis data interval atau rasio, serta distribusi data (populasi) adalah normal atau mendekati normal

  Pengolahan Data Statistik

  Statistik non-parametrik, berhubungan dengan inferensi statistik yang tidak membahas parameter2 populasi

  Cirinya: jenis data nominal atau ordinal, serta distribusi data (populasi) tidak diketahui atau bisa disebut tidak normal

  Pengolahan Data Statistik

  Analisis univariat, di mana hanya ada satu pengukuran (variabel) untuk n sampel (Alat analisis: uji t, uji F< ANOVA dsb)

  Analisis multivariat, di mana ada dua atau lebih pengukuran untuk n sampel (Alat analisis: regresi, korelasi dsb)

  Pemilihan uji statistik Jumlah variabel Analisis univariat Analisis multivariat

  Jenis data Interval, rasio Nominal, ordinal Statistik Parametrik Statistik Non-Parametrik

  

Pengolahan data kuantitatif

Data interval/rasio Ukuran Variasi Bentuk Mean Median Modus Range Varians Standar deviasi Koefisien variasi Skweness Kurtosis

  Menguji normal tidaknya distribusi data 

  Boxplot

   Stem and Leaf 

  Kolmogorov-Smirnov

   Plot  Kurtosis dan skewness jika MEDIAN terletak persis di Boxplot:

tengah boxplot, maka distribusi data adalah

normal

   Nilai di atas garis adalah outlier atau nilai ekstrem

   Persentile (25) disebut HINGES  Persentile (50) atau MEDIAN

   Persentile (75) disebut HINGES  Nilai di bawah garis ini adalah outlier atau nilai ekstrem Stem and leaf

  Frequency Stem Leaf 1,00

  4 2,00

  5

  00 3,00 6 000 1,00

  7 1,00 Extremes

  ≥

  10,0) Kolmogorov-Smirnov dan Shapiro Wilk, bila nilai signifikansi < 0,05 maka distribusi adalah tidak normal

  Kolmogorov-smirnov Shapiro-Wilk Usia Statistik Df Sig. Statistik Df Sig Belum menikah

  0,176 35 0,008 0,926 35 0,033 Menikah 0,215 40 0,000 0,907 40 0,019 Plot

  Detrended Normal Q-Q Normal Q-Q plot plot

  Data akan tersebar di Sebagian besar data terpola sekeliling garis dekat garis tengah yang ada

  

Kurtosis dan skewness

  Jika rasio kurtosis (keruncingan) dan skewness (kemiringan) berada di antara –2 sampai dengan +2, maka distribusi data adalah normal

  Rasio kurtosis = nilai kurtosis /SE kurtosis Rasio skewness = nilai skewness / SE skewness

  Penyebaran Data  Distribusi data normal: mean dan standar

  deviasi

   Distribusi data tidak normal: median atau

  mode

   Persentil biasanya 10, 25, 50, 75, 90

  Distribusi data: skewness (kemiringan) dan

  

  kurtosis (keruncingan) Deskripsi data: rata2, SD, varians, range

  

  Analisis statistik (inferensi)

  Digunakan untuk estimasi nilai suatu

  

  parameter populasi dan uji hipotesis statistik (Ho/Hi, signifikansi, uji satu/dua sisi, statistik tabel/uji)

  Bagan statistik inferensi S tatistik P aram etrik Jum lah sam pel S atu populasi Dua populasi atau leb ih Uji Z Hubungan Uji t antar sam ple

B eb as B erhubungan

Uji Z Uji t berpasangan A NO V A / Uji F Uji t