Simpangan Baku Ukuran Penyebaran Data Lanjutan

71 Statistika

K. Pemeriksaan Data Pencilan

Pada suatu data, tentu kalian pernah mempunyai data yang sangat berbeda dari data lainnya. Data ini mempunyai selisih yang cukup besar. Data yang demikian dinamakan pencilan atau data yang tidak konsisten , sedangkan data yang tidak berbeda dari kelompoknya dinamakan data normal. Misalkan terdapat suatu data x 1 , x 2 , x 3 , x 4 , ..., x n . Bagaimana cara memeriksa pencilan? Kalian telah mempelajari kuartil atas dan bawah, pagar dalam dan pagar luar. Jika suatu data berada 1 langkah di luar pagar dalam maupun 1 langkah di luar pagar luar, data itu merupakan data pencilan atau data tidak konsisten. Lebih khusus lagi, jika suatu data berada 2 langkah di luar Q 1 maupun Q 3 , data itu disebut data ekstrem. Data yang berada di antara pagar luar dan pagar dalam termasuk data nor- mal. Jadi, dapat kita katakan sebagai berikut. Misalkan terdapat x 1 , x 2 , x 3 , x 4 , ..., x n , pagar luar, P L = Q 3 + L dan pagar dalam, P D = Q 1 – L L adalah langkah maka a. untuk P D x i P L maka x i adalah data normal; b. untuk x i P D atau x i P L maka x i adalah data pencilan. Data pencilan kemungkinan berasal dari kesalahan pencatatan data, kesalahan dalam pengukuran, maupun data yang benar-benar menyimpang, seperti data bibit unggul di antara bibit-bibit lainnya atau data tentang kejadian yang mirip dengan peristiwa anomali air. Untuk mengamati data pencilan atau data normal, dapat dilihat dalam diagram kotak garis. Gambar 1.27 Contoh: Misalkan diketahui data: 2, 5, 5, 6, 6, 8, 10. Periksalah, apakah ada pencilannya? Penyelesaian: Dari data ini, diperoleh x min = 2, Q 1 = 5, Q 2 = 6, Q 3 = 8, dan x maks = 10. Jadi, L = 3 2 Q 3 – Q 1 = 3 2 8 – 5 = 9 2 . P D Q 1 x min x maks Q 2 Q 3 1L P L 1L data pencilan data pencilan 72 Mmt Aplikasi SMA 2 IPS Oleh karena itu, P D = Q 1 – L = 5 – 9 2 = 1 2 P L = Q 3 + L = 8 + 9 2 = 12 1 2 Karena tidak ada x i sedemikian rupa sehingga x i 1 2 atau x i 12 1 2 , maka data tersebut tidak terdapat pencilannya. Lebih jelas lagi, dapat dilihat pada diagram kotak garis berikut. Gambar 1.28 1. Manakah data-data berikut yang merupakan data pencilan atau data normal? a. 1, 2, 3, 5, 7, 9, 11, 20, 21 b. 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2 c. 2, 6, 7, 6, 2, 8, 6, 5, 7, 7, 7 d. 10, 100, 1.000, 10.000, 100.000 2. Diketahui data: 12, 15, 20, 25, 25, 26, 30, 20, 21, 36. a. Periksalah, apakah terdapat data pencilannya? b. Jika ada data pencilannya, data manakah itu? 3. Misalnya, diketahui suatu data tentang nilai ulangan Matematika dari suatu kelas adalah sebagai berikut. 20 25 30 35 40 25 30 40 45 60 25 30 100 40 40 40 45 55 50 45 30 35 60 65 60 25 a. Buatlah diagram kotak garis dengan terlebih dahulu menentukan statistik lima serangkainya. b. Dengan diagram kotak yang kalian buat, dapatkah kalian menentukan ada atau tidaknya data pencilan? Jika ada, data manakah itu? Mungkinkah dilacak penyebab munculnya data pencilan itu? 2 10 5 6 8 1 2 12 1 2 P D P L Uji Kompetensi 9 Kerjakan di buku tugas 73 Statistika 4. Berikut adalah data tentang telur yang dihasilkan ayam petelur selama 2 minggu berturut-turut. 500 505 495 295 300 500 505 510 510 515 495 490 495 400 Coba kalian selidiki, adakah data pencilannya? Jika ada, kemungkinan apakah yang menyebabkan munculnya data tersebut? 5. Selain dengan pemeriksaan data yang telah kalian pelajari, dapatkah kalian menentukan cara lain untuk menemukan suatu data pencilan? Coba kalian pikirkan. Adakan pengamatan terhadap proses produksi dari suatu pabrik yang memproduksi barang tertentu kalian boleh memilihnya. Kumpulkan data produksi dalam periode-periode tertentu misalnya, setiap jam, setiap hari, atau setiap minggu. Dari data yang kalian peroleh, carilah statistik-statistik data itu, baik yang berupa ukuran pemusatan, ukuran letak, maupun ukuran penyebarannya. Gunakan bantuan kalkulator atau software komputer untuk perhitungannya. Refleksi Kalian telah mengetahui statistika. Berdasarkan materi itu, apakah yang menarik bagi kalian? Dapatkah kalian melakukan kegiatan statistik dengan objek nilai-nilaimu? Coba jelaskan hasil kegiatan statistik yang kamu lakukan. Dari kegiatan statistik itu apakah hasil-hasil yang diperoleh itu dapat mencerminkan prestasimu? Jelaskan. Observasi Tugas Kerjakan di buku tugas Rangkuman 1. Statistik adalah kumpulan informasi atau keterangan berupa angka-angka yang disusun, ditabulasi, dan dikelompok-kelompokkan sehingga dapat memberikan informasi yang berarti mengenai suatu masalah atau gejala. Adapun ilmu tentang cara-cara mengumpulkan, menabulasikan, mengelompokkan, menganalisis, dan mencari keterangan yang berarti tentang informasi yang berupa angka-angka itu disebut statistika. 2. Kuartil adalah tiga nilai yang membagi data yang sudah diurutkan menjadi empat bagian yang sama banyak. Untuk data yang berukuran cukup besar, letak nilai kuartil ditentukan dengan rumus berikut. Letak Q i = datum ke- i 4 n + 1. 74 Mmt Aplikasi SMA 2 IPS Untuk data yang tersusun dalam daftar distribusi frekuensi, nilai kuartil ke-i, i = 1, 2, dan 3, ditentukan dengan rumus berikut. Q i = t b Qi + 1 4 n F f p i Q i • – ³ ³ ³ — ˜ µ µ µ . 3. Statistik lima serangkai adalah lima buah nilai statistik yang dianggap dapat menggambarkan kecenderungan pemusatan data, yaitu minimum x min , kuartil bawah Q 1 , median Q 2 , kuartil atas Q 3 , dan statistik maksimum x maks . 4. Desil adalah sembilan nilai yang membagi data menjadi sepuluh bagian sama banyak. Untuk data yang berukuran cukup besar, nilai desil ke-i, i = 1, 2, ..., 9, ditentukan dengan rumus letak D i = datum ke- x i n 10 1 + Untuk data yang tersusun dalam distribusi frekuensi, nilai desilnya dirumuskan dengan D i = t b D i + i n F f p i D i 10 • – ³ ³ ³ — ˜ µ µ µ 5. Jangkauan = statistik maksimum – statistik minimum. Jangkauan antarkuartil = Q 3 – Q 1 6. Diagram garis adalah cara menyajikan data kontinyu dalam bentuk grafik garis. Diagram lingkaran adalah cara menyajikan data statistik menggunakan daerah lingkaran. Diagram batang adalah cara menyajikan data statistik dengan batang-batang tegak atau mendatar, batang satu dengan yang lain tidak berimpit. 7. Diagram batang daun merupakan bentuk penyajian data yang memperlihatkan data asli dan disusun secara vertikal dengan menyertakan satuan batang dan daun. 8. Diagram kotak garis adalah diagram yang berbentuk kotak dan garis. 9. Histogram adalah diagram batang yang batang-batangnya berimpit, untuk menyajikan data yang telah tersusun dalam distribusi frekuensi Poligon frekuensi adalah garis yang menghubungkan titik-titik tengah puncak- puncak histogram. 10. Ogif ada dua macam, yaitu ogif positif dan ogif negatif. 11. Mean atau rata-rata hitung dirumuskan dengan x x n i i n = = - 1 atau x f x f i i i r i i r = = = - - 1 1 Jika menggunakan rata-rata sementara, mean dapat ditentukan dengan 75 Statistika x x f d f s i i i r i i r = + × = = - - 1 1 12. Modus adalah nilai yang paling sering muncul atau nilai yang frekuensinya paling besar. Modus dirumuskan dengan M = t b + d d d p 1 1 2 + £ ¤ ² ¥ ¦ ´ . 13. Simpangan rata-rata dirumuskan dengan S R = 1 1 n x x i i n = - . Untuk data yang tersusun dalam daftar distribusi frekuensi: S R = 1 1 n f x x i i i n × = - . 14. Ragam atau varians: S 2 = 1 2 1 n x x i i n = - . Untuk data yang tersusun dalam distribusi frekuensi: a. S 2 = 1 2 1 n x x f i i n i × = - b. S 2 = x f n x f n i i i r i i i r 2 1 1 × × £ ¤ ² ¥ ¦ ´ = = - - 15. Standar deviasi dirumuskan dengan S = S 2 . Carilah data tentang hasil ujian suatu mata pelajaran pada periode tertentu. Hal ini dapat kalian lakukan dengan browsing di internet. Dari data yang kamu peroleh, dengan menggunakan scientific calculator, tentukan nilai a. rata-rata; b. varians; c. standar deviasi. Coba bandingkan hasil yang kamu peroleh dengan mengguna- kan program komputer, misalnya Microsoft Excel. Kreativitas Tugas Kelompok Kerjakan di buku tugas