II. MENDESKRIPSIKAN DATA - 2. describing data

II. MENDESKRIPSIKAN DATA

13 Desember 2005 Analisis Deskriptif Tujuan dari analisis deskritif adalah memberikan gambaran ringkas tentang suatu data.

Data bisa berupa data categorical atau data non-categorical. Meringkas data dalam bentuk angka statistik (Statistics) dapat dilakukan dengan beberapa cara berdasarkan:

1. Letak pusat data: persentase, mean, median, mode

2. Variasi data: rentang (range), standar deviasi, percentile Untuk mendapatkan angka statistik (Statistics) seperti yang disebutkan diatas, kita dapat menggunakan fungsi Analyze – Descriptive Statistics – Frequencies (lihat gambar

2.1a.). Gambar 2.1a. Menu Frequencies

Dalam kotak dialog Frequencies, kita dapat membuat pilihan Statistics dengan langkah- langkah sebagai berikut:

1. Sorot variabel yang akan dideskripsikan, lalu klik pada tanda í untuk memasukkan variabel tersebut ke dalam kotak dibawah Variable(s): (lihat gambar 2.1b.)

2. Pilih Display frequency tables di kotak dialog Frequencies untuk menampilkan

persentase dari suatu kategori untuk data categorical, misalnya persentase jumlah

responden di setiap kabupaten (var: kab), persentase ibu nifas yang menerima kapsul vitamin A (var: vaprogpp). Biasanya command/perintah ini sudah aktif secara otomatis (set as a default) pada saat kita menggunakan menu Frequencies (lihat

gambar 2.1b.). Kemudian klik OK. Hasil analisis atau output SPSS berupa tabel frekuensi dapat dilihat pada output 2.1. Gambar 2.1b. Menampilkan Tabel Frekuensi Output 2.1. Frequency Table Statistics

Program of giving VA capsule to postpartum Code of mother district

N Valid 980 988 Missing

8 Program of giving VA capsule to postpartum mother Cumulative

Frequency Percent Valid Percent Percent Valid No 205

20.7

20.9

20.9 Yes 730

73.9

74.5

95.4 Sometimes

4.6 4.6 100.0 Total 980 99.2 100.0

Missing

9 8 .8 Total 988 100.0

Code of district Cumulative Frequency Percent Valid Percent Percent

Valid pandeglang 358

36.2

36.2 cirebon 333

33.7

69.9 bangkalan 297

30.1

30.1 100.0

Total 988 100.0 100.0 Interpretasi output 2.1:

Table Statistics menjelaskan tentang jumlah data point (N) yang ada/valid untuk diproses pada variabel vaprogpp (N = 980) dan kab (N= 988). Sedangkan jumlah data point yang hilang (missing value) adalah delapan (8) pada variabel vaprogpp dan nol (0) pada variabel kab.

Tabel Program of Giving Vitamin A capsule to Postpartum mother dan tabel

Code of district merupakan tabel frekuensi. Cara menginterprestasikan isi tabel: ¾ Kolom pertama berisi kategori dari variabel categorical.

Contoh untuk variabel kabupaten, terdiri dari 3 kategori: Pandeglang, Cirebon dan Bangkalan. ¾ Kolom kedua (Frequency): menunjukkan jumlah data yang valid (N) dari tiap kategori.

Contoh: jumlah responden di kabupaten Pandeglang = 358. ¾ Kolom ketiga (Percent): menunjukkan persentase dari jumlah data valid per kategori dibagi dengan jumlah total data.

Contoh: pada tabel Program of Giving Vitamin A capsule to Postpartum

mother, jumlah ibu yang tidak menerima program vitamin A postpartum adalah

205/988 x 100% = 20,7% ¾ Kolom keempat (Valid Percent): menunjukkan hal yang sama dengan Percent jika tidak ada data yang hilang (missing value), seperti di tabel Code of district.

Jika ada data yang hilang, maka Valid Percent menunjukkan persentase jumlah data valid per kategori dibagi dengan jumlah total data valid. Contoh: pada tabel Program of Giving Vitamin A capsule to Postpartum

mother, valid percent dari ibu yang tidak menerima program vitamin A

postpartum adalah 205/980 x 100% = 20,9% ¾ Kolom kelima (Cumulative Percent): baris pertama menunjukkan Valid Percent dari kategori pertama, baris kedua menunjukkan kumulatif dari Valid Percent kategori pertama dengan Valid Percent kategori kedua dan seterusnya hingga pada akhirnya mencapai jumlah 100%.

Contoh: pada tabel Program of Giving Vitamin A capsule to Postpartum

mother, Cumulative Percent di baris pertama adalah 20.9 dan pada baris kedua adalah 20.9 + 74.5 = 95.4 dan pada baris terakhir adalah 95.4 + 4.6 = 100%.

3. Untuk mendeskripsikan data non-categorical berdasarkan letak pusat data (mean, median, mode) dan variasi data (standar deviasi, percentile, maksimum, minimum), klik Statistics dalam kotak dialog Frequencies. Dalam kotak dialog Statistics pilih angka statistik yang diperlukan untuk mendeskripsikan data. (lihat gambar 2.1c.), kemudian klik Continue – OK. Hasil analisis dapat dilihat pada output 2.2.

Gambar 2.1c. Kotak Dialog Statistics Output 2.2. Ringkasan dari data non-categorical Statistics Nilai HAZ (tinggi menurut Umur ibu umur) anak (dalam tahun)

N Valid 961 988 Missing

27 Mean

1.2976

28.06 Median -1.3600

27.00 Std. Deviation 1.30968 6.499 Range

8.04

33 Minimum

5.18

17 Maximum

2.86

50 Percentiles 10 -2.8880

20.00

90 .3500

37.00

Interpretasi output 2.2:

Dalam table Statistics terdapat deskripsi data HAZ (tinggi menurut umur) anak dan umur ibu (dalam tahun). ¾ N menunjukkan jumlah data valid pada masing-masing variabel mage dan chaz.

Pada variabel chaz terdapat 27 data yang hilang (missing value) dan pada variabel mage tidak ada data yang hilang. ¾ Mean menerangkan nilai rata-rata dari HAZ (tinggi menurut umur) anak dan umur ibu (dalam tahun). Jadi nilai rata-rata HAZ anak = -1,2976 SD dan nilai rata-rata umur ibu = 28,06 tahun. ¾ Median menerangkan data point yang letaknya tepat di tengah-tengah setelah data point dalam suatu variabel diurutkan (dari terbesar ke yang terkecil atau sebaliknya). Jadi angka median ini akan membagi data set dalam satu variabel menjadi 2 bagian sama besar. Contohnya: median -1,3600 SD menerangkan bahwa 50% dari anak yang menjadi subyek survei mempunyai HAZ -1,3600 SD ke atas dan 50% yang lainnya mempunyai HAZ 1,3600 SD ke bawah. Median usia ibu 27 tahun menunjukkan 50% dari ibu yang menjadi subyek survei berumur 27 tahun ke atas dan 50% yang lainnya berusia 27 tahun ke bawah. ¾ Standar deviasi (SD) menunjukkan sebaran/rentang/variasi data. Jika diasumsikan rentang usia ibu terletak pada 2 SD dari mean, dan nilai SD = 6,499, maka rentang usia ibu adalah: 28,06 ± (2 x 6,499) = 15,06 sampai 41,06 tahun. ¾ Maximum menunjukkan data point dengan nilai terbesar dalam suatu variabel.

Dan Minimum menunjukkan data point dengan nilai terkecil dalam suatu variabel. Kedua nilai ini, sama halnya dengan SD, bisa digunakan untuk mendeskripsikan rentang data. Jika kita perhatikan rentang data yang dideskripsikan dengan angka minimum dan angka maksimum masih berada dalam rentang data yang dihitung dengan menggunakan mean ± 2 SD. Range data dapat dihitung dengan adalah data maksimum – data minimum. Jika umur ibu termuda yang menjadi subyek survei adalah 17 tahun dan umur ibu tertua adalah 50 tahun, maka range umur ibu = 50-17 = 33 tahun. ¾ Percentile menunjukkan persentase subyek yang mempunyai nilai data point lebih kecil dari nilai percentile itu sendiri. Contohnya: jika 10 percentile dari data usia ibu adalah = 20, berarti ada 10% ibu berusia di bawah 20 tahun. Dan jika 90 percetile-nya = 37, berarti ada 90% ibu berusia di bawah 37 tahun.

Split File

Pada beberapa kondisi, jika kita ingin mendeskripsikan suatu data tetapi analisisnya dibagi dalam kelompok tertentu, misalnya kita ingin mendeskripsikan usia ibu dalam bentuk mean, median, standar deviasi, maximum, minimum, percentile di setiap kabupaten. Hal ini dapat dilakukan dengan menggunakan fungsi Split File. Tekan tombol

Data yang ada di layar tampilan Variable View, kemudian klik Split File. Di dalam

kotak dialog Split File, pilih Compare groups, lalu sorot variabel yang akan digunakan untuk mengelompokkan hasil analisis (dalam hal ini variabel kab), klik tanda untuk

memasukkan variabel tersebut ke dalam box di bawah Group based on:. Untuk meniadakan fungsi Split File, pilih analyze all cases, do not create groups yang ada di kotak dialog Split File. (lihat gambar 2.2a. dan gambar 2.2b.). Hasil analisis, setelah dilakukan split file, akan terpisah berdasarkan kabupaten seperti pada output 2.3.

Gambar 2.2a. Fungsi Split File Gambar 2.2b. Fungsi Split File

Output 2.3. Hasil analisis setelah split file Statistics

Umur ibu (dalam tahun) pandeglang N Valid 358

Missing Mean

28.71 Median

28.00 Std. Deviation 7.107

Range

33 Minimum

17 Maximum

50 Percentiles

20.00

39.00 cirebon N Valid 333

Missing Mean

27.85 Median

27.00 Std. Deviation 6.128

Range

27 Minimum

18 Maximum

45 Percentiles

20.00

36.00 bangkalan N Valid 297

Missing Mean

27.51 Median

26.00 Std. Deviation 6.078 Range

30 Minimum

18 Maximum

48 Percentiles

20.00

35.00 Select Cases Adakalanya pula kita ingin mendeskripsikan suatu data hanya dalam kelompok tertentu saja, misalnya kita ingin mendeskripsikan usia ibu dalam bentuk mean, median, standar deviasi, maximum, minimum, percentile hanya di kabupaten Pandeglang. Hal ini dapat dilakukan dengan menggunakan fungsi Select Cases. Tekan tombol Data yang ada di layar tampilan Variable View, kemudian klik Select Cases (letaknya tepat dibawah menu Split File). Di dalam kotak dialog Select Cases, pilih if condition is satified, lalu tekan tombol If… (lihat gambar 2.3a.) untuk membuka kotak dialog berikutnya.

Gambar 2.3a. Fungsi Select Cases

Sorot variabel yang akan digunakan untuk memilih kelompok hasil analisis (dalam hal ini variabel kab), klik tanda untuk memasukkan variabel tersebut ke dalam box di sebelah

kanannya, lalu tekan tombol =, setelah itu tekan tombol 1 jika hasil analisis yang akan kita tampilkan hanya data dari kabupaten Pandenglang saja. Klik Continue – OK (lihat

gambar 2.3b.). Gambar 2.3a. Fungsi Select Cases

Tampilan di layar Data View setelah fungsi Select Cases diaktifkan dapat dilihat pada

gambar 2.4. Dalam hal ini hanya data dari kabupaten Pandeglang saja yang dapat

dianalisa nantinya, sementara data dari kabupaten lain akan “dikeluarkan” dari analisa sampai fungsi Select Cases ditiadakan atau diubah. Untuk meniadakan fungsi Select Cases, pilih All Cases yang ada di kotak dialog Select Cases.

Gambar 2.4. Tampilan pada Data View saat fungsi Select Cases diaktifkan Hasil analisis data setelah fungsi Select Cases diaktifkan dapat dilihat di Output 2.4. Output 2.4. Hasil analisis jika fungsi Select Cases diaktifkan Statistics

Umur ibu (dalam tahun) pandeglang N Valid 358 Missing Mean

28.71 Median

28.00 Std. Deviation 7.107 Range

33 Minimum

17 Maximum

50 Percentiles

20.00

39.00

II. MENDESKRIPSIKAN DATA - 2. describing data