Analisis Data (6) Buatlah sebuah paper tentang
Tugas
Analisis Data A
PENGANTAR ANALISIS DATA
Kelompok 6:
St. Surya Rahmi ( H12113013)
Citra Farahdiba Isnandar (H12113022)
Fahri Fadlianto Nur (H12110267)
PRODI STATISTIKA
JURUSAN MATEMATIKA
30 Oktober 2014
(Part 1 Exploring and Understanding Data)
Nomor 6 halaman 142 (Part 1 Exploring and Understanding Data)
Bread. Clarksburg Bakery is trying to predict how many loaves to bake. In the last 100 days,
they have sold between 95 and 140loaves. Here is a histogram of the number of loaves they
sold for the last 100 days. Here is a histogram of the number of loaves they sold for the last
100 days.
a. Describe the distribution.
b. Which should be larger, the mean number of sales or the median? Explain.
c. Here are the summary statistics for Clarksburg Bakery's bread sales. Use these
statistics and the histogram above to create a boxplot. You may approximate the
values of any outliers.
Jawab :
Toko roti Clarksburg sedang mencoba untuk memprediksikan berapa banyak papan roti
untuk dibakar. Pada 100 hari terakhir, mereka telah menjual antara 95 dan 140 roti per hari.
a. Deskripsi distribusi.
Distribusi atau penyebaran datanya memiliki ekor lebih panjang ke kanan daripada
ke kiri, maka disebutlah distribusi tersebut memiliki kemencengan positif (kanan)
dan tentu saja penyebaran datanya tidak simetris.
b. Untuk kasus kemencengan positif, diketahui bahwa Modus < Median < Mean, maka
seharusnya pada kasus diata nilai Mean (rata-rata) harus lebih besar daripada
Mediannya.
c. Boxplot dari ringkasan data untuk Toko roti Clarksburg adalah sebagai berikut :
Nomor 14 halaman 144 (Part 1 Exploring and Understanding Data)
Accidents. In 2001, Progressive Insurance asked customers who had been involved in auto
accidents how far they were from home when the accident happened. The data are
summarized in the table.
Miles from Home
% of Accidents
Less than 1
23
1 to 5
29
6 to 10
17
11 to 15
8
16 to 20
6
Over 20
17
a) Create an appropriate graph of these data.
b) Do these data indicate that driving near home is particularly dangerous? Explain.
Jawab :
Kecelakaan. Pada tahun 2001, Asuransi progresif meminta pelanggan yang telah terlibat
dalam kecelakaan mobil seberapa jauh mereka dari rumah ketika kecelakaan itu terjadi.
a. Grafik yang tepat untuk data diatas adalah :
Accidents
17%
23%
20
Karena data menggunakan persentase, maka grafik yang cocok ialah pie chart.
b. Data yang menunjukkan bahwa mengendarai dari dekat rumah berbahaya yaitu
data 1 mile sampai 5 mile, karena menunjukkan persentasi paling tinggi yaitu 29%.
Nomor 22 halaman 146 (Part 1 Exploring and Understanding Data)
Winter Olympics 2002 speed skating. The top 25 men's and 25 women's SOO-mspeed
skating times are listed in the table below:
a) The mean finishing time was 73.46 seconds, with a standard deviation of 3.33
seconds. If the Normal model is appropriate, what percent of the times should be
within 1.67seconds of 73.46?
b) What percent of the times actually fall within this range?
c) Explain the discrepancy between a and b.
Jawab :
a) Jika waktu penyelesaian rata-rata adalah 73,46 detik, dengan deviasi standar 3,33
detik. Jika model normal sesuai, maka waktu harus berada dalam jarak 1.67seconds
dari 73,46.
Berikut adalah tampilan dari datanya :
b) Waktu yang benar-benar jatuh dalam kisaran ini adalah 6%.
Sebuah diagram lingkaran dari persentase medali dimenangkan oleh masing-masing
negara bahkan lebih membingungkan! Bagian-bagian dari grafik negara yang
mewakili yang memenangkan lebih sedikit dari 5 medali terlalu kecil untuk bahkan
label benar.
c) Mungkin
kita
terutama
tertarik
pada
negara-negara
yang
memenangkan banyak medali. Mari menggabungkan semua negara yang
memenangkan kurang dari 6 medali ke dalam satu kategori. Ini akan membuat
grafik kita lebih mudah untuk baca. Kami mungkin tertarik pada jumlah medali
menang, daripada persentase dari total medali won, jadi kita akan tetap dengan
bar chart. Sebuah bar chart juga lebih baik untuk perbandingan.
Nomor 30 halaman 148 (Part 1 Exploring and Understanding Data)
Birth order revisited. Consider again the data on birth order and college majors in Exercise
28.
a) What is the marginal distribution of majors?
b) What is the conditional distribution of majors for the oldest children?
c) What is the conditional distribution of majors for the children born second?
d) Do you think that college major appears to be independent of birth order? Explain.
Jawab :
a) Distribusi marginalnya adalah :
�� �� =
(� ��
��
�)
b) Distribusi bersyarat dari jurusan untuk anak-anak tertua
(�� ��, � �� ��
adalah :
3
Math/science : 21 = 0.14 = 14%
9
Agriculture : 21 = 0.43 = 43%
3
Humanities : 21 = 0.14 = 14%
6
Other : 21 = 0.29 = 29%
c) Distribusi bersyarat dari jurusan untuk anak-anak yang lahir kedua adalah :
14
Math/science : 69 = 0.20 = 20%
27
Agriculture : 69 = 0.39 = 39%
17
Humanities : 69 = 0.25 = 25%
11
Other : 69 = 0.16 = 16%
�)
d) Ya, menurut kami distribusi mayor bisa tampil sebagai urutan kelahiran yang
independen. Karena nilai dari distribusinya cukup akurat dan nilainya sesuai.
Nomor 38 halaman 150 (Part 1 Exploring and Understanding Data)
Profits. Here is a stem-and-leaf display showing profits as a percent of sales for 29 of the
forbes 500 largest U.S. corporation. The stems are split; each stem represents a span of 5%,
from a loss 9% to a profit of 25%.
a) Find the 5-number summary.
b) Draw a boxplot for these data.
c) Find the median and standard deviation.
d) Describe the distribution of profits for these corporation.
Jawab :
Laba. Berikut adalah tampilan stem-and-leaf menunjukkan keuntungan sebagai
persen dari penjualan untuk 29 dari Forbes 500 terbesar perusahaan-perusahaan AS.
Batang yang terbelah; setiap batang mewakili rentang 5%, dari kerugian sebesar 9%
menjadi keuntungan sebesar 25%.
a. Ringkasan data didapatkan pada diagram batang daun
-9,-9,-4,-3,-2,-1,1,1,1,1,2,3,4,4,4,5,5,5,5,6,7,9,10,10,11,11,13,22,25
Median =
Jumla h data
2
=
30
2
= 15
Mediannya data ke 15 yaitu 4.
Kuartil 1 = X (n+2)/4 = X (30+2)/4 = X 8
Kuartil 1 adalah data ke 1, yaitu 1
Kuartil 3 = X (3n+2)/4 = X (90+2)/4 = X 23
Kuartil 3 adalah data ke 23, yaitu 10
Nilai minimum = -9
Nilai maksimum = 25
b. Boxplot ketika dideroleh ringkasan data
c. Mean =
ΣX
n
=
137
20
= 4,567
Standar Deviasi =
n ( Xi − )2
i=1
X
n
=
1454 ,647
30
=
48,49 = 6,96
d. Deskripsi tentang distribusinya
Cukup simetris dan unimodal, berpusat sekitar 4% dari penjualan. 50% dari
perusahaan melaporkan % profit antara 1% dan 9%. Ada satu outlier di 25%
dari penjualan.
(Chapter II)
Nomor 11 Halaman 16 (Chapter 2)
Fitness: Are physically fit people less likely to die of cancer? An article in the May 2002
issue of Medicine and Science in Sports and Exercise reported results from a study that
followed 25,892 men aged 30 to 87 for 10 years. The most physically fit men had a 55% lower
risk of death from cancer that the least fit group.
Jawab :
Sebuah artikel dalam edisi Mei 2002, isu Kedokteran dan Ilmu di Olahraga dan Latihan
melaporkan hasil dari sebuah penelitian yang diikuti oleh 25.892 pria berusia 30-87 selama
10 tahun. Paling sehat secara fisik laki-laki memiliki risiko 55% lebih rendah dari kematian
akibat kanker.
When : Mei 2002
How (berapa lama dilakukan penelitian) : 10 tahun
Who : laki-laki yang berumur 30-87 tahun
What : Kemungkinan hidup karena kanker (hidup, mati) (kuantitatif)
Why : Untuk mengetahui pengaruh olahraga dan latihan dalam kehidupan
Nomor 17 Halaman 16 (Chapter 2)
Streams. As research for an ecology class, students at a college in upstate New York collect
data on streams each year. They record a number of biological, chemical, and physical
variables, including the stream name, the substrate of the stream (limestone, shale, or mixed),
the acidity of the water (pH), the temperature (0C), and the BCI(a numerical measure of
biological diversity).
Jawab :
Sebagai penelitian untuk kelas ekologi, mahasiswa di sebuah perguruan tinggi di New York
mengumpulkan data tentang aliran setiap tahun. Mereka merekam sejumlah biologi, kimia,
dan variabel fisik, termasuk nama sungai, substrat dari aliran (batu kapur, serpih, atau
campuran), keasaman air (pH), suhu (0C), dan BCI (ukuran numerik keanekaragaman
hayati).
When : Perguruan tinggi di New York
What : Nama sungai(kualitatif), substrat dari aliran (batu kapur, serpih, atau campuran)
(kualitatif), keasaman air (pH) (kuantitatif), suhu (0C) (kuantitatif), dan BCI (ukuran
numerik keanekaragaman hayati)(kuantitatif).
Who : Nama Sungai (yang terlibat).
Why : Untuk belajar ekologi dari sungai.
Nomor 18 Halaman 18 (Chapter 2)
Age and party. The Gallup Poll conducted a representative telephone survey of
1180American voters during the first quarter of 1999. Among the reported results were the
voter's region (Northeast, South, etc.), age, party affiliation, and whether or not the person
had voted in the 1998midterm Congressional election.
Jawab :
The Gallup Poll melakukan survei telepon perwakilan pemilih
1180 American selama
kuartal pertama tahun 1999. Di antara hasil yang dilaporkan adalah wilayah pemilih
(Northeast, South, dll), usia, afiliasi partai, dan apakah atau tidak orang telah memilih
dalam pemilihan Kongres 1998midterm.
What : Wilayah pemilih (Northeast, South, dll) (kualitatif), usia (kuantitatif), afiliasi
pesta(kualitatif), dan apakah atau tidak orang telah memilih atau tidak(kualitatif).
Who : Umur dan Pesta.
Why : Untuk mempelajari pengaruh usia dan pesta.
When : Tahun 1999.
Nomor 19 Halaman 16 (Chapter 2)
Air travel. The Federal Aviation Administration (FAA) monitors airlines for safety and
customer service.For each flight the carrier must report the type of aircraft, number of
passengers, whether or not the flights departed and arrived on schedule, and any
mechanical problems.
Jawab :
Federal Aviation Administration (FAA) memonitor penerbangan untuk keselamatan dan
pelanggan layanan.Untuk setiap penerbangan pembawa harus melaporkan jenis pesawat,
jumlah penumpang, apakah atau tidak penerbangan berangkat dan tiba sesuai jadwal, dan
masalah mekanis.
What : jenis pesawat (kualitatif), jumlah penumpang (kuantitatif), apakah atau tidak
penerbangan berangkat dan tiba sesuai jadwal(kualitatif), dan masalah mekanis(kualitatif).
Who : Perjalanan Udara
Why : Untuk memonitor keselamatan dan layanan pelanggan
Nomor 20 Halaman 16 (Chapter 2)
Fuel Economy. The Environmental Protection Agency (EPA) tracks fuel economy of
automobiles. Among the data they collect are the manufacturer (Ford, Toyota, etc.), vehicle
type (car, SUV,etc.), weight, horsepower, and gas mileage (mpg) for city and highway
driving.
Jawab :
Badan Perlindungan Lingkungan (EPA) melacak ekonomi bahan bakar mobil. Di antara
data yang mereka kumpulkan adalah produsen (Ford, Toyota, dll), jenis kendaraan (mobil,
SUV, dll.), Berat badan, tenaga kuda, dan gas mileage (mpg) untuk kota dan mengemudi
jalan raya.
Why :Untuk melacak ekonomi bahan bakar mobil
What : produsen (Ford, Toyota,
dll)(kualitatif), jenis kendaraan (mobil, SUV, dll.)
(kualitatif), berat badan (kuantitatif), tenaga kuda(kuantitatif),
dan gas mileage (mpg) untuk kota dan mengemudi jalan raya.
Who : Produsen
Nomor 21 Halaman 17 (Chapter 2)
Refrigerators. In 2002, Consumer Reports published an article evaluating refrigerators. It
listed 41 models, giving the brand, cost, size (cu ft), type (such as top-freezer), estimated
annual energy cost, an overall rating (good, excellent, etc.), and the repair history for that
brand (percentage requiring repairs over the past 5 years).
Jawab :
Pada tahun 2002, Consumer Reports menerbitkan sebuah artikel mengevaluasi lemari es.
Terdaftar 41 model, merek, biaya, ukuran (cu ft), jenis (seperti top-freezer), diperkirakan
biaya tahunan energi, rating keseluruhan (baik, sangat baik, dll), dan sejarah perbaikan
untuk setiap merek (persentase yang membutuhkan perbaikan selama 5 tahun terakhir).
What : merek (kualitatif), biaya (kuantitatif), ukuran (cu ft)( kuantitaif), jenis (seperti topfreezer)(kualitatif),
estimasi biaya tahunan energy (kualitatif), rating keseluruhan (baik
dll)(kualitatif), dan sejarah perbaikan untuk itu merek (persentase membutuhkan perbaikan
selama 5 tahun terakhir) (kualitatif).
When : 2002
Why : untuk mengevaluasi lemari es
Who : kulkas
Nomor 22 Halaman 18 (Chapter 2)
Lotto. A study of state-sponsored Lotto games in the United States (Chance, Winter
1998)listed the names of the states and whether or not the state had Lotto. For states that did,
the study indicated the number of numbers in the lottery, the number of matches required to
win, and the probability of holding a winning ticket.
Jawab :
Sebuah studi dari permainan Lotto disponsori negara di Amerika Serikat (Chance, Musim
Dingin 1998) terdaftar nama negara dan juga bukan negara memiliki Lotto. Untuk negara
yang memiliki Lotto penelitian menunjukkan jumlah angka dalam undian, jumlah
pertandingan yang dibutuhkan untuk menang, dan kemungkinan memegang tiket menang.
Who : Lotto
What : jumlah angka dalam undian (kuantitatif), jumlah pertandingan yang dibutuhkan
untuk menang (kuantitatif) dan kemungkinan memegang tiket menang (kualitatif)
Why : Untuk membuat daftar negara yang memiliki lotto
When : tahun 1998
Nomor 23 Halaman 17 (Chapter 2)
Sleep. In the Spring 2001 issue of Chance magazine, a psychology professor reported on data
he had collected about his sleep patterns. He kept daily records of the number of hours of
sleep he got, whether or not he suffered from "early awakening," whether or not he watched
TVin the morning and in the evening, the number of hours he spent standing during the
day, and his mood (happy/sad, on a scale from 10-90).
Jawab :
Pada musim semi 2001 isu dari majalah Chance, seorang profesor psikologi melaporkan
data yang telah dikumpulkan tentang pola tidurnya. Dia menyimpan catatan harian dari
jumlah jam tidur dia, apakah dia menderita “bangun lebih awal”, apakah dia menyaksikan
TV pagi dan malam hari, jumlah jam ia menghabiskan dengan berdiri di siang hari, dan
suasana hatinya (senang / sedih, dengan skala 10-90).
When ; tahun 2001
Who : Tidur
What : apakah dia menderita dari "kebangkitan awal (kualitatif), apakah dia
menyaksikan TV pagi hari dan di malam hari(kualitatif), jumlah
jam ia menghabiskan berdiri di siang hari(kuantitatif), dan mood (senang / sedih, dengan
skala 10-90) (kualitatif)
Nomor 24 Halaman 17 (Chapter 2)
Indy. The 2.5-mile Indianapolis Motor Speedway has been the home to a race on Memorial
Day nearly every year since 1911.Even during the first race there were controversies. Ralph
Mulford was given the checkered flag first but took three extra laps just to make sure he'd
completed 500 miles. When he finished, another driver, Ray Harroun, was being presented
with the winner's trophy, and Mulford's protests were ignored. Harroun averaged 74.6mph
for the 500miles. In 2003 the winner, Gil de Ferran, averaged 153.6mph. Here are the data for
the first few and four recent Indianapolis 500 races. Included also are the pole winners (the
winners of the trial the day before, when each driver drives alone to determine the position
on race day).
Jawab :
2,5 mil Indianapolis Motor Speedway telah menjadi rumah bagi perlombaan pada hari
peringatan hampir setiap tahun sejak 1911. Saat balapan pertama ada kontroversi. Ralph
Mulford diberi bendera kotak-kotak pertama tetapi mengambil tiga lap ekstra hanya untuk
memastikan ia menyelesaikan 500 mil. Ketika ia selesai, driver lain, Ray Harroun,
dipresentasikan dengan piala pemenang, dan protes Mulford telah diabaikan. Harroun ratarata 74.6mph untuk 500miles. Pada 2003the pemenang, Gil de Ferran, rata-rata 153.6mph.
Berikut adalah data untuk beberapa pertama dan empat Indianapolis 500 ras. Termasuk
juga adalah pole winner (pemenang sidang sehari sebelumnya, ketika setiap driver
mengendarai sendiri untuk menentukan posisi pada hari perlombaan).
Who : pemenang
What : tahun (kualitatif), pemenang (kualitatif), posisi jarak(kuantitatif), kecepatan ratarata(kuantitatif), pole winner (kualitatif), rata-rata kecepatan pole (kuantitatif)
Why : untuk mengetahui pemenang dengan kecepatan rata-ratanya
Nomor 25 Halaman 17 (Chapter 2)
Horse race. The Kentucky Derby is a horse race that has been run every year since 1875 at
Churchill Downs, Louisville, Kentucky. The race started as a 1.5-mile race, but in 1896 it was
shortened to 1.25 miles because experts felt that 3-year-old horses shouldn't run such a long
race that early in the season (it has been run in May every year but one-1901-when it took
place on April 29). Here are the data for the first few and a few recent races.
Jawab :
Pacuan kuda. The Kentucky Derby adalah pacuan kuda yang telah dijalankan setiap tahun
sejak 1875 di Churchill Downs, Louisville, Kentucky. Perlombaan dimulai dari1,5 mil, tetapi
pada tahun 1896 itu disingkat menjadi 1,25 kilometer karena para ahli merasa bahwa kuda 3
tahun tidak boleh menjalankan seperti perlombaan panjang yang di awal musim (telah
dijalankan Mei setiap tahun tetapi satu-1901-ketika itu terjadi pada tanggal 29 April).
Berikut adalah data untuk balapan pertama dan balapan terakhir :
Where: Churchill Downs, Louisville, Kentucky
Who : Balapan Kuda
What : Tanggal (kuantitatif), pemenang(kualitatif), margin (kuantitatif), jockey (kualitatif),
hadiah pemenang (kuantitatif), durasi (kuantitatif), kondisi jaur (kualitatif)
When : tahun 1901
Why : untuk mengetahui tentang perlombaan kuda di Churchill Downs
(Chapter III)
Nomor 15 halaman 39 (Chapter 3)
Auditing reform. In the wake of the EnronCorporation scandal, the Gallup Organization
asked 1001 American adults what kind of changes, if any, are needed in the way major
corporations are audited. Here is a display of the results.
a) Make a pie chart of the same data.
b) Which chart works better to summarize the data? Why?
c) Summarize the findings of the poll in a few sentences that might appear in a
newspaper article.
Jawab :
a) Pie Chart dari data yang sama adalah :
b) Grafik yang bekerja lebih baik untuk meringkas data adalah grafik batang karena
dengan grafik batang lebih mudah untuk membandingkan persentase dan membuat
urutan respon.
c) Rangkuman yang bisa kami buat dari data di atas adalah sebagian besar responden
mendukung beberapa jenis reformasi. 39% dari responden menganjurkan reformasi
utama, 35% mengatakan reformasi kecil yang diperlukan. Sementara hanya 17% dari
Amerika orang dewasa yang disurvei merekomendasikan lengkap overhaul, 74%
dari responden direkomendasikan baik besar atau kecil reformasi dengan cara
bahwa korporasi diaudit. Hanya 4% yang mendukung tidak ada reformasi sistem
saat ini.
Nomor 31 halaman 43 (Chapter 3)
Blood Pressure. A company held a blood pressure screening clinic for its employees. The
results are summarized in the table below by age group and blood pressure level :
a) Find the marginal distribution of blood pressure level
b) Find the conditional distribution of blood pressure level within each age group.
c) Compare these distribution with a segmented bar graph.
d) Write a brief description of the association between age and blood pressure among
these employees.
e) Does this prove that people’s blood pressure increases as they age? Explain.
Jawab :
a) Distribusi marjinal tekanan darah untuk karyawan perusahaan adalah total kolom
tabel, dikonversi ke persentase. 20% rendah, 49% normal dan 31% tekanan darah
tinggi.
b) Distribusi bersyarat dari tekanan darah dalam setiap kategori usia:
Di bawah umur 30 tahun
Rendah :
27
98
= 0.28 = 28%
48
Normal : 98 = 0.49 = 49%
23
Tinggi : 98 = 0.23 = 23%
Umur 30 – 49 tahun
37
Rendah : 179 = 0.21 = 21%
Normal :
91
179
= 0.51 = 51%
51
Tinggi : 179 = 0.28 = 28%
Umur di atas 50 tahun
Rendah :
31
197
= 0.16 = 16%
93
Normal : 197 = 0.47 = 47%
73
Tinggi : 197 = 0.37 = 37%
c) Jika
distribusi
bersyaratnya
dibandingkan
dengan
tersegmentasi dengan kategori usia adalah sebagai berikut :
sebuah
grafik
batang
d) Deskripsi singkat mengenai persatuan umur dan tekanan darah diantara semua
karyawan adalah dalam perusahaan ini, umur meningkat, persentase karyawan
dengan tekanan darah rendah berkurang, dan persentase karyawan dengan tekanan
darah tinggi meningkat.
e) Ini tidak membuktikan bahwa tekanan darah masyarakat meningkatkan dengan
bertambahnya usia mereka. Umumnya, sebuah asosiasi antara dua variabel tidak
berarti hubungan sebab-akibat. Secara khusus, ini Databerasal dari hanya satu
perusahaan dan tidak dapat diterapkan untuk semua orang. Selain itu, mungkin ada
beberapa variabel lain yang terkait dengan usia dan tekanan darah. Hanya
percobaan terkontrol dapat mengisolasi hubungan antara usia dan tekanan darah.
Nomor 33 halaman 43 (Chapter 3)
Family Planning. A 1945 study of 1438 pregnant women examined the associated between
the woman’s education level and the occurrence of unplanned pregnancies, producing these
data:
Does this indicate that more schooling taught young women better family planning? What
other explanations for these data can you think of? (Fertilihj Planning andFertility Rates by
Socio-Economic Status, Social and Psychological Factors Affecting Fertility, 1954).
Jawab :
Penjelasan kami mengenai data-data ini adalah bahwa jika persentase kehamilan yang tidak
direncanakan menurun, maka tingkat pendidikan meningkat. Namun, ini tidak berarti
bahwa di sekolah lebih diajarkan wanita muda mengenai perencanaan keluarga yang lebih
baik. Hubungan antara variabel bukan bukti hubungan sebab-akibat. Dalam hal ini, variabel
sosial ekonomi lainnya mungkin terkait dengan kehamilan dan tingkat pendidikan.
Mungkin beberapa wanita bahkan harus meninggalkan sekolah karena suatu kehamilan
yang tidak direncanakan.
Nomor 34 halaman 43 (Chapter 3)
Pet ownership. The U.S.Census Bureau reports the number of households owning various
types of pets. Specifically, they keep track of dogs, cats, birds, and horses
a) Do you think the income distributions of the households who own these different
animals would be roughly the same? Why or why not?
b) The table shows the percentages of income levels for each type of animal owned. Are
these row percentages, column percentages, or table percentages?
c) Do the data support your initial guess? Explain.
Jawab :
a) Tidak, menurut kami distribusi pendapatan rumah tangga menurut kepemilikan
hewan peliharaan tidak akan diharapkan sama. Merawat kuda jauh lebih mahal,
umumnya, daripada merawat anjing, kucing, atau burung. Rumah tangga dengan
kuda sebagai hewan peliharaan akan diharapkan untuk menjadi lebih umum di
kategori pendapatan yang lebih tinggi.
b) Tabel di atas adalah persentase kolom, karena masing-masing kolom totalnya 100%.
Setiap hewan peliharaan diklasifikasikan sebagai milik sebuah keluarga di salah satu
kategori tingkat pendapatan.
c) Ya, data mendukung tapi sampai batas tertentu. Persentase kuda dimana pemiliknya
memiliki pendapatan kurang dari $12.500 hanya 9%, dibandingkan dengan
persentase tahun 20-an untuk tingkat pendapatan lainnya, sedangkan tingkat
pendapatan dari pemilik hewan peliharaan lainnya kira-kira memiliki persentase
yang sama. Namun, dengan pengecualian mereka yang berpenghasilan kurang dari
$12.500, persentase di setiap tingkat pendapatan antara pemilik kuda yang tidak jauh
berbeda.
Nomor 37 halaman 44 (Chapter 3)
Hospitals. Most patients who undergo surgery make routine recoveries and are discharged
as planned. Others suffer excessive bleeding, infection, or other postsurgical complications
and have their discharges from the hospital delayed. Suppose your city has a large hospital
and a small hospital, each performing major and minor surgeries. You collect data to see
how many surgical patients have their discharges delayed by postsurgical complications,
and find the results shown in the following table.
Discharge Delayed
Major Surgery
Large
Small
Hospital
Hospital
120 of 800
10 of 50
Minor Surgery 10 of 200
20 of 250
a) Overall, for what percent of patients was discharge delayed?
b) Were the percentages different for major and minor surgery?
c) Overall, what were the discharge delay rates at each hospital?
d) What were the delay rates at each hospital for each kind of surgery?
e) The small hospital advertises that it has a lower rate of postsurgical complications.
Do you agree?
f) Explain, in your own words, why this confusion occurs.
Jawab :
a)
Total marjinal telah ditambahkan ke tabel:
Major
Procedure
Large Hospital
Small Hospital
Total
120 of 800
10 of 50
130 of 850
10 of 200
20 of 250
30 of 450
130 of 1000
30 of 300
160 of 1300
surgery
Minor
surgery
Total
Discharge tertunda Rumah Sakit :
Jumlah Operasi besar =120 dari 800 ,10 dari 50 ,130 dari 850.
Jumlah Operasi kecil = 10 dari 200, 20 dari 250, 30 dari 450 ,
Prosedur Total = 130 1000 30 300 160 1300 160 dari 1.300, atau sekitar 12,3% dari
pasien memiliki debit tertunda.
b) Perbedaan persentase antara operasi besar dan operasi kecil adalah pasien operasi
besar
tertunda
130
dari
850
kali,
atau
sekitar
15,3%
dari
Pasien operasi kecil tertunda 30 dari 450 kali, atau sekitar 6,7% dari waktu.
waktu.
c) Tingkat penundaan untuk masing-masing rumah sakit adalah :
Rumah Sakit besar memiliki tingkat penundaan 130 dari 1000, atau 13%.
Rumah Sakit Kecil memiliki tingkat penundaan 30 dari 300, atau 10%.
Rumah sakit kecil memiliki tingkat keseluruhan yang lebih rendah tertunda debit.
d) Laju penundaan untuk masing-masing rumah sakit pada setiap bedah adalah :
Rumah Sakit besar: Bedah Mayor 15% Bedah tertunda dan Kecil 5% tertunda.
Rumah Sakit kecil: Bedah Mayor 20% Bedah tertunda dan kecil 8% tertunda.
Meskipun rumah sakit kecil memiliki tingkat keseluruhan yang lebih rendah dari
debit tertunda, rumah sakit besar memiliki tingkat lebih rendah daripada debit
tertunda untuk setiap jenis operasi.
e) Kami tidak setuju karena tingkat penundaan secara keseluruhan untuk debit lebih
rendah untuk rumah sakit kecil, rumah sakit besar melakukan lebih baik untuk
kedua operasi baik operasi besar maupun operasi kecil.
f) Menurut kami, kekeliruan ini terjadi karena rumah sakit kecil melakukan
persentase yang lebih tinggi dari operasi minor dari operasi besar. 250 dari 300
operasi kecil di rumah sakit kecil atau sebesar (83%). Hanya 200 dari 1000 operasi
yang kecil di rumah sakit besar atau sebesar (20%). Operasi kecil memiliki tingkat
keterlambatan lebih rendah dari operasi besar (6,7% menjadi 15,3%), sehingga
tingkat keseluruhan rumah sakit kecil itu telah artifisial meningkat. Sederhananya,
itu adalah kesalahan untuk melihat persentase keseluruhan. Kebenaran yang nyata
ditemukan oleh melihat tingkat setelah informasi dipecah oleh jenis operasi, karena
tarif kelambatan untuk setiap jenis operasi yang begitu berbeda. Rumah sakit yang
lebih besar adalah lebih baik rumah sakit ketika membandingkan tarif delay
discharge.
Nomor 38 halaman 45 (Chapter 3)
Delivery Service. A company must decide which of two delivery services they will contract
with. During a recent trial period they shipped numerous packages with each service and
have kept track of how often delivered did not arrive on time. Here are the data :
Delivery
Service
Pack Rats
Boxer R Us
Type of service
Number
of Number of Late
Deliveries
Packages
Regular
400
12
Overnight
100
16
Regular
100
2
Overnight
400
28
a) Compare the two services overall percentage of late deliveries.
b) Based on the results in part a, the company has decided to hire Pack Rats. Do you
agree they deliver ontime more often? Why or why not? Be specific.
c) The results here are an instance of what phenomenon?
Jawab :
a) Persentase keseluruhan dua layanan dari pengiriman yang terlambat adalah
pada Pack Rats telah menyampaikan total 28 paket terlambat (12 Regular + 16
Semalam), dari Sebanyak 500 pengiriman (400 Regular + 100 Semalam). 28/500
= 5,6% dari paket yang terlambat. Kotak R Us telah melahirkan total 30 paket
terlambat (2 Regular + 28 Semalam) dari total 500 pengiriman (100 Regular + 400
Semalam). 30/500 = 6% dari paket yang terlambat.
b) Kami kurang sependapat, perusahaan harus menyewa box R Us bukannya Pack
Rats. Kotak R Us hanya memberikan 2% (2 dari 100) paket Reguler yang
terlambat, dibandingkan dengan Pack Rats, yang memberikan 3% (12 dari 400)
paket Reguler yang terlambat. Selain itu, box R Us hanya memberikan 7% (28
out 400) paket Overnight yang terlambat, dibandingkan dengan Pack Rats, yang
memberikan 16% nya Paket semalam terlambat. Kotak R Us baik di memberikan
Reguler dan Overnight paket.
c) Hasilnya adalah sebuah contoh turunan dari Simpson Paradox, karena tarif
pengiriman akhir keseluruhan rata-ratanya tidak adil. Kotak R Us memberikan
persentase yang lebih besar dari paket yang Semalam, di mana itu relatif lebih
sulit untuk tepat waktu. Pack Rats memberikan banyak paket Regular, di mana
lebih mudah untuk membuat pengiriman tepat waktu.
Nomor 39 halaman 45 (Chapter 3)
Graduate Admissions. A 1975 article in the magazine Science examined the graduate
admissions process at Berkeley for evidence of gender bias. The table below shows the
number of applicants accepted to each of four graduate programs. What percent of total
applicants were admitted?
a)
Overall, were a higher percentage of males or females admitted?
b) Compare the percentage of males and females admitted in each program.
c) Which of the comparisons you made do you consider to be the most valid? Why?
Program
Males accepted
Females accepted
(of aplication)
(of aplication)
Total
1
511 of 825
89 of 108
600 of 933
2
325 of 560
17 of 25
369 of 585
3
137 of 407
132 of 375
269 of 782
4
22 of 373
24 of 341
46 of 714
Total
1022 0f 2165
262 of 849
1284 of 3014
Jawab :
Sebuah artikel 1975 di majalah Science meneliti proses penerimaan pascasarjana di Berkeley
untuk bukti bias gender. Tabel di bawah menunjukkan jumlah pelamar yang diterima untuk
masing-masing empat program pascasarjana.
Males Accepted
Females Accepted
(of applicants)
(of applicants)
1
511 of 825
89 of 108
600 of 933
2
352 of 560
17 of 25
369 of 585
3
137 of 407
132 of 375
269 of 782
4
22 of 373
24 of 341
46 of 714
Total
1022 of 2165
262 of 849
1284 of 3014
Program
Total
a) Persentase yang lebih tinggi dari laki-laki atau perempuan yang mengaku
adalah ada 1284 pelamar yang mengaku dari total dari 3.014 pelamar =
1284/3014 = 42,6%
b) Perbandingan antara laki-laki dan perempuan yang mengaku adalah 1022 dari
2165 (47,2%) dari laki-laki yang mengaku sedangkan 262 dari 849 (30,9%) dari
perempuan dirawat. Karena ada empat perbandingan, maka tabel mengatur
persentase laki-laki dan perempuan diterima di masing-masing program.
Perempuan diterima pada tingkat yang lebih tinggi dalam setiap program.
Program
Males
Females
1
69 .9%
82.40%
2
62.90%
68.00%
3
33.70%
35.20%
4
5.90%
7%
c) Perbandingan tingkat penerimaan dalam setiap Program yang paling valid.
Keseluruhan persentase adalah rata-rata tidak adil. Gagal untuk mengambil
perbedaan jumlah pelamar dan tingkat penerimaan yang berbeda dari masingmasing program. perempuan cenderung berlaku untuk program-program yang
mendapatkan penerimaan sulit bagi semua orang. Ini adalah contoh dari
Simpson Paradox.
Nomor 40 halaman 45 (Chapter 3)
Be a Simpson! Can you design a Simpson's paradox? Two companies are vying for a city's
"Best Local Employer" award, to be given to the company most committed to hiring local
residents. While both employers hired 300 new people in the past year, Company Abrags
that it deserves the award because 70% of its new jobs went to local residents, compared to
only 60%for Company B.Company Bconcedes that those percentages are correct, but points
out that most of its new jobs were fulltime, while most of Company A's were part-time. Not
only that, says Company B, a higher percentage of its full-time jobs went to local residents
than did Company A's, and the same was true for part-time jobs. Thus, Company B argues,
it's a better local employer than Company A.
Show how it's possible for Company B to fill a higher percentage of both full-time and parttime jobs with local residents, even though Company A hired more local residents overalL
(Answers will vary.)
Jawab :
Jawaban dari soal ini akan bervariasi. Tiga arah tabel di bawah ini menunjukkan salah satu
kemungkinan. Jumlah lokal karyawan dari karyawan baru akan ditampilkan dalam setiap
sel.
Company A
Company B
Full-time New Employees
40 of 100 = 40%
90 of 200 = 45%
Part-time New Employees
170 of 200 = 85%
90 of 100 = 90%
Total
210 of 300 = 70%
180 of 300 = 60%
(Chapter IV)
Nomor 2 halaman 72 (Chapter 4)
Not a Histogram. Find a graph other than a histogram that shows the distribution of a
quantitive variable in a newspaper or a magazine article.
a) Does the article discuss the W's for the data?
b) What are the units for the variable?
c) Does the article use the range, IQR, or standard deviation?
d) Is the choice of measure of spread appropriate for the situation? Explain.
Jawab :
Sumber (www.ekonomi.kompasiana.com)
Dalam beberapa tahun terakhir, khususnya setelah pemilihan umum yang lalu, sejumlah inisiatif
telah digulirkan untuk memperkokoh landasan bagi pertumbuhan berkelanjutan, seperti pelayanan
satu atap dalam perizinan usaha, penyiapan undang-undang pertanahan, menghapuskan monopoli
a. What : Pertumbuhan Ekonomi Timor Leste – Indonesia
When : Tahun 200-2014
Why : Perbandingan ekonomi antara Timor Leste-Indonesia
Who : Timor Leste dan Indonesia
b. Tampilan data sudah sesuai dengan data yang ada. Karena untuk perbandingan 2 buah
objek, maka di butuhkan grafik garis yang terdiri dari 2 garis, yang satunya
menginterpretasikan Timor Leste, dan garis berwarna merah menginterpretasikan data
dari Indonesia. Jika kita menggunakan histogram, maka akan sulit melihat perbedaan
dari pertumbuhan ekonomi Timor Leste dan Indonesia.
c. Pada grafik, untuk variable di sumbu X adalah tahun, namun variable pada sumbu Y
tidak jelas diketahui pada artikel. Dan untuk distribusi datanya, pada Timor Leste
penyebarannya sangat terlihat signifikan pada tahun 200 sampai 2007 , pada Indonesia ,
penyebaran datanya merata karena hampir membentuk garis lurus.
d. Pada artikel tidak menjelaskan secara rinci tentang grafik yang ada. Karena kita tidak
dapat mengetahui secara pasti tentang pertumbuhan ekonomi setiap tahunnya. Yang
dapat di baca dari grafik ialah posisi pertumbuhan ekonomi Timor Leste itu meningkat,
sedangkan Indonesia datar , namun jumlah pertumbuhannya tidak dijelaskan pada
aartikel.
Nomor 19 halaman 73 (Chapter 4)
Payroll. A small warehouse employs a supervisor at $1200 a week, an inventory manager at
$700 a week, six stock boys at $400 a week, and four drivers at $500 a week.
a) Find the mean and median wage.
b) How many employees earn more than the mean wage?
c) Which measure of center best describes a typical wage at this company, the mean or
the median?
d) Which measure of spread would best describe the payroll, the range, the IQR, or the
standard deviation? Why?
Jawab :
Berdasarkan data di atas maka diketahui gaji dari pekerja sebuah gudang kecil dalam
seminggu adalah:
Seorang Supervisor sebesar 1200 dollar.
Seorang Manajer Persediaan sebesar 700 dollar.
6 orang laki-laki Penyedia Stok sebesar 400 dollar.
Dan 4 orang pengemudi sebesar 500 dollar.
Jika data ini disusun maka jadinya adalah .
400
400
400
400
400
500
500
500
500
700
1200
500
500
500
a) Median dan rata-rata dari data di atas adalah :
400
400
400
400
400
400
500
700
1200
Median berada pada data ke-6 dan data ke-7 = (400+500)/2 = 450 dollar.
Sedangkan rata-ratanya adalah =( 400(6)+ 500(4) + 700 + 1200 ) / 12 = 6300 / 12 = 525
dollar.
b) Hanya ada dua pekerja yang gajinya melebihi gaji rata-rata yaitu gaji dari supervisor
dan manajer persediaan. Yang masing-masing gajinya adalah 1200 dollar dan 700
dollar.
c) Median lebih baik daripada rata-rata untuk untuk mengukur pusat terbaik yang
menggambarkan upah khas di perusahaan ini. Karena mean hanya dipengaruhi
oleh dua upah saja. Sedangkan median dipengaruhi oleh enam upah.
d) Rentang Antar Kuartil karena Rentang Antar Kuartil adalah ukuran yang lebih baik
dari penyebaran untuk distribusi gaji dari kisaran atau deviasi standar. Standar
deviasi dan rentang keduanya dipengaruhi oleh dua upah yang lebih tinggi.
Nomor 33 halaman 75 (Chapter 4)
Acid rain. Two researchers measured the pH (a scale on which a value of 7 is neutral and
values below 7 are acidic) of water collected from rain and snow over a 6-month period in
Allegheny County, Pennsylvania. Describe their data with a graph and a few sentences.
4.57
5.67
5.08
5.62
4.39
4.41
5.29
4.26
5.51
4.64
4.26
4.82
4.31
4.40
4.63
4.30
5.78
4.29
4.45
4.56
4.52
4.12
4.12
4.39
4.73
4.60
Jawab :
Diketahui data dari suatu penelitian yang mengukur PH air dalam periode 6 bulan di
Allegheny Country,PA sebagai berikut :
4.57
5.67
5.08
5.62
4.39
4.41
5.29
4.26
5.51
4.64
4.26
4.82
4.31
4.40
4.63
4.30
5.78
4.29
4.45
4.56
4.52
4.12
4.12
4.39
4.73
4.60
Bila data tersebut digambarkan dalam sebuah grafik maka tampilannya adalah sebagai
berikut :
Distribusi pembacaan pH sampel air di Allegheny Country,PA adalah bimodal. Data kasar
seragam berpusat di sekitar PH dari 4.4. Data ini berkisar dari pH 4,1 - 4,9. Sedangkan pada
kelompok yang lain berpusat di sekitar pH 5,6.
Nomor 34 halaman 76 (Chapter 4)
Marijuana. In 1995 the Council of Europe published a report entitled The European School
Survey Project an Alcohol and Other Drags. Among other issues, the survey investigated the
percentages of 9th graders who had used marijuana. Here are the results for 20 Western
European countries.
Create an appropriate graph of these data, and describe the distribution.
Austria
10%
Italy
19%
Belgium
19%
Luxemburg
6%
Denmark
17%
Netherlands
31%
England
40%
No.Ireland
23%
Finland
5%
Norway
6%
France
12%
Portugal
7%
Germany
21%
Scotland
53%
Greece
2%
Spain
15%
Iceland
10%
Sweden
6%
Ireland
37%
Switzerland
27%
Jawab :
Dari laporan berjudul “The School Survey Eropa” yang memproyeksikan Alkohol dan
Drags Lainnya. Survei menyelidiki persentase anak kelas 9 yang telah menggunakan ganja.
Berikut adalah hasil untuk 20 negara Eropa Barat.
Austria
10%
Italy
19%
Belgium
19%
Luxemburg
6%
Denmark
17%
Netherlands
31%
England
40%
No.Ireland
23%
Finland
5%
Norway
6%
France
12%
Portugal
7%
Germany
21%
Scotland
53%
Greece
2%
Spain
15%
Iceland
10%
Sweden
6%
Ireland
37%
Switzerland
27%
Grafik yang sesuai dari data di atas adalah sebagai berikut :
Pendeskripsian dari distribusi datanya adalah :
Pada grafik di atas berbentuk Unimodal dengan pusat sekitar 10, tetapi hanya beberapa
negara yang melaporkan persentase lebih dari 20. Ini membuat distribusi terlihat miring ke
kanan, kecuali pada dua kelompok pertama yang berbeda.
Nomor 35 halaman 76 (Chapter 4)
Final grades. A professor (of something other than Statistics!) distributed the following
histogram to show the distribution of grades on his 200- point final exam. Comment o the
display.
Jawab :
Pada soal di atas didistribusikan histogram berikut untuk menunjukkan distribusi nilai
pada 200- titik ujian terakhirnya.
Komentar untuk tampilan grafiknya adalah lebar histogram terlalu lebar sehingga skala
untuk jumlah pelajar dengan nilai finalnya tidak begitu sesuai.
Nomor 36 halaman 76 (Chapter 4)
Final grades revisited. After receiving many complaints about his final grade histogram
fromstudents currently taking a Statistics course, the professor distributed the following
revised histogram.
a) Comment on this display.
b) Describe the distribution of grades.
Jawab :
Pada
soal
di
atas
diketahui
nilai
akhir
yang
ditinjau
kembali
dari
siswa saat mengambil kursus Statistik, Profesor mendistribusikan revisi histogramnya
seperti pada histogram berikut ini :
a) Komentar untuk tampilan grafiknya adalah batang dari histogram terlalu sempit
sehingga sulit untuk membaca informasi dari datanya.
b) Tampilan distribusinya miring ke kiri, modusnya dekat dengan 170, beberapa
outliernya berada di bawah 100. Data berkerumun cukup erat berkerumun kecuali
untuk outlier.
Nomor 37 halaman 76 (Chapter 4)
Zip codes. Holes R Us, an Internet company that sells piercing jewelry, keeps transaction
records on its sales. At a recent sales meeting, one of the staff presented a histogram of the
zip codes of the last 500 customers so that they might understand where sales are coming
from. Comment on the usefulness and appropriateness of the display.
Jawab :
Dari soal di atas disajikan histogram kode pos dari 500 pelanggan terakhir dari perusahaan
Internet sebagai berikut :
Komentar untuk kegunaan dan kesesuaian layar adalah baik yang sesuai atau berguna.
Kode pos adalah data kategori, tidak kuantitatif. Tabel di atas memang mengandung
beberapa informasi. Digit terkemuka memberikan gambaran kasar dari Timur ke Barat
penempatan di Amerika Serikat. Jadi kita melihat bahwa grafik hampir tidak memiliki
pelanggan di timur laut, tapi bar chart dengan digit terkemuka akan lebih tepat untuk
menggambarkannya.
Nomor 38 halaman 76 (Chapter 4)
Industry Codes. A recently hired investment analyst has been assigned to analyzed the
companies that make up the Fortune 800, a collection of the largest U.S companies. He codes
each company by the type of industry to which they belong. Here is a table showing some of
the industry types and the corresponding codes he uses.
The analyst produces the following histogram of the industry codes for the companies :
a) What might account for the gaps seen in the histogram?
b) Is the histogram unimodal?
c) What advice might you give the analyst about the appropriateness of this display?
Jawab :
Dari soal di atas diketahui tabel yang menunjukkan beberapa jenis industri dan sejumlah
kode yang terkait yang dipakai seorang analis untuk menganalisis perusahaan yang
membentuk Fortune 800, koleksi perusahaan-perusahaan AS terbesar, yaitu sebagai berikut :
Adapun histogram dari kode industri untuk perusahaannya adalah sebagai berikut :
a) Yang memperlihatkan kesenjangan di histogram adalah kodenya. Kodenya
merupakan bilangan bulat dan lebar binnya kurang dari 1. Kode dari histogram ini
kategoris dan tidak kuantitatif.
b) Tidak ada jawaban yang tepat untuk menjawab dari pernyataan ini. Karena
tampilannya tidak sesuai untuk jawaban yang diharapkan.
c) Tampilan histogramnya tidak sesuai. Datanya termasuk data kategoris. Sebaiknya
kita harus menggunakan bar chart.
Nomor 39 halaman 76-77 (Chapter 4)
Math Scores. The national Center for Education Statistics reported 1999 average
mathematics achievement scores for eight graders in 38 nations. Singapore led the group,
with an average of 604, while South Africa had the lowest average of 275. The United States
scored 502. The Average scores for each nation are given below :
604
587
585
582
579
558
540
534
532
531
530
526
525
520
520
519
511
505
502
496
491
482
479
476
472
469
467
466
448
447
429
428
422
403
392
345
337
275
a) Find the median, the IQR, the mean, and the standard deviation of these national
averages.
b) Which would you report? Why?
c) Write a brief summary of the performance of eighth graders worldwide. Be sure to
comment on the performance of the United States.
Jawab :
Dari soal di atas diketahui skor rata-rata nilai prestasi matematika untuk siswa kelas
delapan di 38 negara dilaporkan dari Pusat nasional untuk Statistik Pendidikan pada tahun
1999. Dimana Singapura memimpin kelompok, dengan rata-rata 604, sedangkan Afrika
Selatan memiliki rata-rata terendah dari 275. Amerika Serikat mencetak 502. Rata-rata nilai
tersebut adalah sebagai berikut :
604
587
585
582
579
558
540
534
532
531
530
526
525
520
520
519
511
505
502
496
491
482
479
476
472
469
467
466
448
447
429
428
422
403
392
345
337
275
a) Median, Rentang antar Kuartil, Rata-rata, dan Standar Deviasi dari rata-rata nasional
di atas adalah :
Pertama-tama akan dibuat tabel distribusinya
Rentang = data terbesar – data terkecil = 604 – 275 = 329
Banyak Kelas (K)= 1 + 3.322 log n
= 1 + 3.322 log 38
= 1 + 5.248 = 6.248
Panjang Kelas (P) = Rentang/Banyak Kelas
= 329/6.248 = 52.66 ≈ 53
(xi − x)2
fi xi
fi (xi − x)2
Nilai
Fi
Fk
xi
xi - x
275-328
1
1
301.5
-184.7
34114.09
301.5
34114.09
329-382
2
3
355.5
-130.7
34164.98
711
68329.96
383-436
5
8
409.5
-76.7
29414.45
2047.5
147072.25
437-490
9
17
463.5
-22.7
4637.61
4171.5
41738.49
491-544
15
32
517.5
31.3
14695.35
7762.5
220430.25
545-598
5
37
571.5
85.3
36380.45
2857.5
181902.25
599-652
1
38
625.5
139.3
19404.49
625.5
19404.49
Jumlah
38
136
18477
531089.53
Keterangan :
Fi = frekuensi
Fk = Frekuensi Kumulatif
xi = Tanda kelas = ½ (ujung bawah – ujung atas)
x = nilai rata-rata
i
Rumus dari kuartil n adalah (Qi) = b + p ( 4
n−F
fi
)
Dimana b = batas bawah kelas median, adalah kelas dimana median akan terletak,
p = panjang kelas median
n = ukuran sampel atau banyak data
Fi = jumlah semua frekuensi dengan tanda kelas lebih kecil dari tanda kelas
median
Fk = Frekuensi kelas Median
Kuartil Pertama (Q1)
1/4 . n = 1/4 . 38 = 9.5
b = 437 – 0.5 = 436.5
p = 490 – 437 = 53
1
(Q1) = b + p ( 4
n−F
) = 436.5+ 53 (
fi
9.5−8
)
9
= 436.5 + 53 (1.5/9) = 445.33
Kuartil Kedua(Median/Q2)
½ n = ½ . 38 = 19
b = 491 – 0.5 = 490.5
p = 544 – 491= 53
1
2
(Q2) = b + p (
n−F
fi
19−17
15
) = 490.5 + 53 (
) = 490.5 + 53 (2/15) = 497.57
Kuartil Ketiga (Q3)
3/4 . n = 3/4 . 38 = 28.5
b = 491 – 0.5 = 490.5
p = 544 – 491= 53
3
(Q3) = b + p ( 4
n−F
fi
) = 490.5 + 53 (
28.5−17
15
) = 490.5 + 53 (11.5/15) = 531.13
Rentang antar Kuartil = Q3 - Q1 = 497.57 - 445.33 = 52.24
Rata-rata dari data di atas adalah =
( Dimana
fi xi,
fi xi
fi
= 18477/38 = 486.24
fi diperoleh dari tabel frekuensi yang ada di atas )
Standar Deviasi dari data di atas adalah :
S2 =
fi (xi − x )2
n−1
= 531089.53/6 = 88514.92
S = 88514.92 = 297.51
b) Yang akan kami laporkan adalah karena rata-rata akan lebih besar dari median,
karena distribusinya tepat miring.
c) Ringkasan singkat dari rata-rata nilai prestasi matematika untuk siswa kelas delapan
seluruh dunia adalah rata-rata skor yang diperoleh beberapa negara pada
penghargaan tersebut adalah 486.24. Banyaknya skor yang bisa melewati rata-rata
skor tersebut ada 23 skor. Amerika Serikat mencetak 502. Skor Amerika Serikat
adalah mendekati nilai Kuartil ketiga yaitu 531.13.
Nomor 40 halaman 77 (Chapter 4)
Prisons. A report from the U.S. Department of Justice gave the following percent increases
in federal prison populations in 20 northeastern and midwestern states during 1999.
5.9, 1.3, 3.0, 5.9, 4.5, 5.6, 2.1, 6.3, 4.8, 6.9,
5.5, 5.3, 8.0, 4.4, 7.2, 3.2, 4.5, 3.5, 7.2, 6.4
a) Graph these data.
b) Calculate appropriate summary statistics.
c) Write a few sentences about these data. (Remember: shape, center, spread, unusual
features.)
Jawab :
Diketahui Populasi penjara federal di 20 negara bagian timur laut dan barat tengah selama
tahun 1999 adalah sebagai berikut :
5.9, 1.3, 3.0, 5.9, 4.5, 5.6, 2.1, 6.3, 4.8, 6.9,
5.5, 5.3, 8.0, 4.4, 7.2, 3.2, 4.5, 3.5, 7.2, 6.4
a) Grafik dari data di atas adalah sebagai berikut :
Satuan
desimal
1
3
2
1
3
0 2 5
4
4 5 5 8
5
3 5 6 9 9
6
3 4 9
7
2 2
8
0
b) Ringkasan datanya adalah sebagai berikut :
Bila data di atas diurutkan maka tampilannya adalah sebagai berikut :
1.3
2.1
3.0
3.2
3.5
4.4
4.5
4.5
4.8
5.3
5.5
5.6
5.9
5.9
6.3
6.4
6.9
7.2
7.2
8.0
Nilai terkecil = 1,3
Nilai terbesar = 8,0
Kuartil Pertama =
Kuartil Kedua =
Kuartil Ketiga =
3,5 +4,4
=
2
5,3+5,5
2
6,3+6,4
2
7,9
= 5,4
= 6,35
c) Bentuknya mendekati pola simetris. Frekuensi terbanyak pada satuan 5, pusat atau
nilai tengahnya berada pada 5,4 dan penyebaranya hampir merata.
Nomor 41 halaman 77 (Chapter 4)
Gasoline usage. The U.S. Department of Transportation collects data on the amount of
gasoline sold in each state.The following data show the per capita (gallons used per person)
consumption in the year 2000. Using appropriate graphical displays and summary statistics,
write a report on the gasoline use by state in the year 2000.
Jawab :
Diketahui data tentang jumlah bensin yang dijual di setiap state pada tahun 2000 yang
ditampilkan seperti di atas. Apabila data tersebut dibuatkan tabel distribusi frekuensi maka
tampilannya akan menjadi :
Nilai
Fi
Fk
296.66-340.66
2
2
340.67-384.67
1
3
384.68-428.68
3
6
428.69-472.69
15
21
472.70-516.70
12
33
516.71-560.71
14
47
560.72-604.72
3
50
Tampilan grafik yang sesuai dengan data di atas adalah sebagai berikut :
Tampilan Grafik
16
14
12
10
8
6
4
2
0
318,66
362,67
406,68
450,69
494,7
538,71
582,72
Ringkasan datanya adalah :
Nilai terkecil = 296.66
Nilai terbesar = 586.58
i
Rumus dari kuartil n adalah (Qi) = b + p ( 4
n−F
fi
)
Dimana b = batas bawah kelas median, adalah kelas dimana median akan terletak,
p = panjang kelas median
n = ukuran sampel atau banyak data
F=
Fi = jumlah semua frekuensi dengan tanda kelas lebih kecil dari tanda kelas
median.
F = Frekuensi kelas Median
Kuartil Pertama (Q1)
1/4 . n = 1/4 . 50 = 12.5
b = 428.69 – 0.005 = 428.685
p = 472.69 - 428.69 = 44
1
(Q1) = b + p ( 4
n−F
fi
) = 428.685+ 44 (
12.5−6
15
) = 428.685 + 44 (6.5/15) = 447.75
25−21
12
) = 472.695+ 44 (4/12) = 487.36
Kuartil Kedua(Median/Q2)
½ n = ½ . 50 = 25
b = 472.70 – 0.005 = 472.695
p = 516.70 – 472.70 = 44
(Q2) = b + p (
1
2
n−F
fi
) = 472.695+ 44 (
Kuartil Ketiga (Q3)
3/4 . n = 3/4 . 50 = 37.5
b = 516.71 – 0.005 = 516.705
p = 560.71
Analisis Data A
PENGANTAR ANALISIS DATA
Kelompok 6:
St. Surya Rahmi ( H12113013)
Citra Farahdiba Isnandar (H12113022)
Fahri Fadlianto Nur (H12110267)
PRODI STATISTIKA
JURUSAN MATEMATIKA
30 Oktober 2014
(Part 1 Exploring and Understanding Data)
Nomor 6 halaman 142 (Part 1 Exploring and Understanding Data)
Bread. Clarksburg Bakery is trying to predict how many loaves to bake. In the last 100 days,
they have sold between 95 and 140loaves. Here is a histogram of the number of loaves they
sold for the last 100 days. Here is a histogram of the number of loaves they sold for the last
100 days.
a. Describe the distribution.
b. Which should be larger, the mean number of sales or the median? Explain.
c. Here are the summary statistics for Clarksburg Bakery's bread sales. Use these
statistics and the histogram above to create a boxplot. You may approximate the
values of any outliers.
Jawab :
Toko roti Clarksburg sedang mencoba untuk memprediksikan berapa banyak papan roti
untuk dibakar. Pada 100 hari terakhir, mereka telah menjual antara 95 dan 140 roti per hari.
a. Deskripsi distribusi.
Distribusi atau penyebaran datanya memiliki ekor lebih panjang ke kanan daripada
ke kiri, maka disebutlah distribusi tersebut memiliki kemencengan positif (kanan)
dan tentu saja penyebaran datanya tidak simetris.
b. Untuk kasus kemencengan positif, diketahui bahwa Modus < Median < Mean, maka
seharusnya pada kasus diata nilai Mean (rata-rata) harus lebih besar daripada
Mediannya.
c. Boxplot dari ringkasan data untuk Toko roti Clarksburg adalah sebagai berikut :
Nomor 14 halaman 144 (Part 1 Exploring and Understanding Data)
Accidents. In 2001, Progressive Insurance asked customers who had been involved in auto
accidents how far they were from home when the accident happened. The data are
summarized in the table.
Miles from Home
% of Accidents
Less than 1
23
1 to 5
29
6 to 10
17
11 to 15
8
16 to 20
6
Over 20
17
a) Create an appropriate graph of these data.
b) Do these data indicate that driving near home is particularly dangerous? Explain.
Jawab :
Kecelakaan. Pada tahun 2001, Asuransi progresif meminta pelanggan yang telah terlibat
dalam kecelakaan mobil seberapa jauh mereka dari rumah ketika kecelakaan itu terjadi.
a. Grafik yang tepat untuk data diatas adalah :
Accidents
17%
23%
20
Karena data menggunakan persentase, maka grafik yang cocok ialah pie chart.
b. Data yang menunjukkan bahwa mengendarai dari dekat rumah berbahaya yaitu
data 1 mile sampai 5 mile, karena menunjukkan persentasi paling tinggi yaitu 29%.
Nomor 22 halaman 146 (Part 1 Exploring and Understanding Data)
Winter Olympics 2002 speed skating. The top 25 men's and 25 women's SOO-mspeed
skating times are listed in the table below:
a) The mean finishing time was 73.46 seconds, with a standard deviation of 3.33
seconds. If the Normal model is appropriate, what percent of the times should be
within 1.67seconds of 73.46?
b) What percent of the times actually fall within this range?
c) Explain the discrepancy between a and b.
Jawab :
a) Jika waktu penyelesaian rata-rata adalah 73,46 detik, dengan deviasi standar 3,33
detik. Jika model normal sesuai, maka waktu harus berada dalam jarak 1.67seconds
dari 73,46.
Berikut adalah tampilan dari datanya :
b) Waktu yang benar-benar jatuh dalam kisaran ini adalah 6%.
Sebuah diagram lingkaran dari persentase medali dimenangkan oleh masing-masing
negara bahkan lebih membingungkan! Bagian-bagian dari grafik negara yang
mewakili yang memenangkan lebih sedikit dari 5 medali terlalu kecil untuk bahkan
label benar.
c) Mungkin
kita
terutama
tertarik
pada
negara-negara
yang
memenangkan banyak medali. Mari menggabungkan semua negara yang
memenangkan kurang dari 6 medali ke dalam satu kategori. Ini akan membuat
grafik kita lebih mudah untuk baca. Kami mungkin tertarik pada jumlah medali
menang, daripada persentase dari total medali won, jadi kita akan tetap dengan
bar chart. Sebuah bar chart juga lebih baik untuk perbandingan.
Nomor 30 halaman 148 (Part 1 Exploring and Understanding Data)
Birth order revisited. Consider again the data on birth order and college majors in Exercise
28.
a) What is the marginal distribution of majors?
b) What is the conditional distribution of majors for the oldest children?
c) What is the conditional distribution of majors for the children born second?
d) Do you think that college major appears to be independent of birth order? Explain.
Jawab :
a) Distribusi marginalnya adalah :
�� �� =
(� ��
��
�)
b) Distribusi bersyarat dari jurusan untuk anak-anak tertua
(�� ��, � �� ��
adalah :
3
Math/science : 21 = 0.14 = 14%
9
Agriculture : 21 = 0.43 = 43%
3
Humanities : 21 = 0.14 = 14%
6
Other : 21 = 0.29 = 29%
c) Distribusi bersyarat dari jurusan untuk anak-anak yang lahir kedua adalah :
14
Math/science : 69 = 0.20 = 20%
27
Agriculture : 69 = 0.39 = 39%
17
Humanities : 69 = 0.25 = 25%
11
Other : 69 = 0.16 = 16%
�)
d) Ya, menurut kami distribusi mayor bisa tampil sebagai urutan kelahiran yang
independen. Karena nilai dari distribusinya cukup akurat dan nilainya sesuai.
Nomor 38 halaman 150 (Part 1 Exploring and Understanding Data)
Profits. Here is a stem-and-leaf display showing profits as a percent of sales for 29 of the
forbes 500 largest U.S. corporation. The stems are split; each stem represents a span of 5%,
from a loss 9% to a profit of 25%.
a) Find the 5-number summary.
b) Draw a boxplot for these data.
c) Find the median and standard deviation.
d) Describe the distribution of profits for these corporation.
Jawab :
Laba. Berikut adalah tampilan stem-and-leaf menunjukkan keuntungan sebagai
persen dari penjualan untuk 29 dari Forbes 500 terbesar perusahaan-perusahaan AS.
Batang yang terbelah; setiap batang mewakili rentang 5%, dari kerugian sebesar 9%
menjadi keuntungan sebesar 25%.
a. Ringkasan data didapatkan pada diagram batang daun
-9,-9,-4,-3,-2,-1,1,1,1,1,2,3,4,4,4,5,5,5,5,6,7,9,10,10,11,11,13,22,25
Median =
Jumla h data
2
=
30
2
= 15
Mediannya data ke 15 yaitu 4.
Kuartil 1 = X (n+2)/4 = X (30+2)/4 = X 8
Kuartil 1 adalah data ke 1, yaitu 1
Kuartil 3 = X (3n+2)/4 = X (90+2)/4 = X 23
Kuartil 3 adalah data ke 23, yaitu 10
Nilai minimum = -9
Nilai maksimum = 25
b. Boxplot ketika dideroleh ringkasan data
c. Mean =
ΣX
n
=
137
20
= 4,567
Standar Deviasi =
n ( Xi − )2
i=1
X
n
=
1454 ,647
30
=
48,49 = 6,96
d. Deskripsi tentang distribusinya
Cukup simetris dan unimodal, berpusat sekitar 4% dari penjualan. 50% dari
perusahaan melaporkan % profit antara 1% dan 9%. Ada satu outlier di 25%
dari penjualan.
(Chapter II)
Nomor 11 Halaman 16 (Chapter 2)
Fitness: Are physically fit people less likely to die of cancer? An article in the May 2002
issue of Medicine and Science in Sports and Exercise reported results from a study that
followed 25,892 men aged 30 to 87 for 10 years. The most physically fit men had a 55% lower
risk of death from cancer that the least fit group.
Jawab :
Sebuah artikel dalam edisi Mei 2002, isu Kedokteran dan Ilmu di Olahraga dan Latihan
melaporkan hasil dari sebuah penelitian yang diikuti oleh 25.892 pria berusia 30-87 selama
10 tahun. Paling sehat secara fisik laki-laki memiliki risiko 55% lebih rendah dari kematian
akibat kanker.
When : Mei 2002
How (berapa lama dilakukan penelitian) : 10 tahun
Who : laki-laki yang berumur 30-87 tahun
What : Kemungkinan hidup karena kanker (hidup, mati) (kuantitatif)
Why : Untuk mengetahui pengaruh olahraga dan latihan dalam kehidupan
Nomor 17 Halaman 16 (Chapter 2)
Streams. As research for an ecology class, students at a college in upstate New York collect
data on streams each year. They record a number of biological, chemical, and physical
variables, including the stream name, the substrate of the stream (limestone, shale, or mixed),
the acidity of the water (pH), the temperature (0C), and the BCI(a numerical measure of
biological diversity).
Jawab :
Sebagai penelitian untuk kelas ekologi, mahasiswa di sebuah perguruan tinggi di New York
mengumpulkan data tentang aliran setiap tahun. Mereka merekam sejumlah biologi, kimia,
dan variabel fisik, termasuk nama sungai, substrat dari aliran (batu kapur, serpih, atau
campuran), keasaman air (pH), suhu (0C), dan BCI (ukuran numerik keanekaragaman
hayati).
When : Perguruan tinggi di New York
What : Nama sungai(kualitatif), substrat dari aliran (batu kapur, serpih, atau campuran)
(kualitatif), keasaman air (pH) (kuantitatif), suhu (0C) (kuantitatif), dan BCI (ukuran
numerik keanekaragaman hayati)(kuantitatif).
Who : Nama Sungai (yang terlibat).
Why : Untuk belajar ekologi dari sungai.
Nomor 18 Halaman 18 (Chapter 2)
Age and party. The Gallup Poll conducted a representative telephone survey of
1180American voters during the first quarter of 1999. Among the reported results were the
voter's region (Northeast, South, etc.), age, party affiliation, and whether or not the person
had voted in the 1998midterm Congressional election.
Jawab :
The Gallup Poll melakukan survei telepon perwakilan pemilih
1180 American selama
kuartal pertama tahun 1999. Di antara hasil yang dilaporkan adalah wilayah pemilih
(Northeast, South, dll), usia, afiliasi partai, dan apakah atau tidak orang telah memilih
dalam pemilihan Kongres 1998midterm.
What : Wilayah pemilih (Northeast, South, dll) (kualitatif), usia (kuantitatif), afiliasi
pesta(kualitatif), dan apakah atau tidak orang telah memilih atau tidak(kualitatif).
Who : Umur dan Pesta.
Why : Untuk mempelajari pengaruh usia dan pesta.
When : Tahun 1999.
Nomor 19 Halaman 16 (Chapter 2)
Air travel. The Federal Aviation Administration (FAA) monitors airlines for safety and
customer service.For each flight the carrier must report the type of aircraft, number of
passengers, whether or not the flights departed and arrived on schedule, and any
mechanical problems.
Jawab :
Federal Aviation Administration (FAA) memonitor penerbangan untuk keselamatan dan
pelanggan layanan.Untuk setiap penerbangan pembawa harus melaporkan jenis pesawat,
jumlah penumpang, apakah atau tidak penerbangan berangkat dan tiba sesuai jadwal, dan
masalah mekanis.
What : jenis pesawat (kualitatif), jumlah penumpang (kuantitatif), apakah atau tidak
penerbangan berangkat dan tiba sesuai jadwal(kualitatif), dan masalah mekanis(kualitatif).
Who : Perjalanan Udara
Why : Untuk memonitor keselamatan dan layanan pelanggan
Nomor 20 Halaman 16 (Chapter 2)
Fuel Economy. The Environmental Protection Agency (EPA) tracks fuel economy of
automobiles. Among the data they collect are the manufacturer (Ford, Toyota, etc.), vehicle
type (car, SUV,etc.), weight, horsepower, and gas mileage (mpg) for city and highway
driving.
Jawab :
Badan Perlindungan Lingkungan (EPA) melacak ekonomi bahan bakar mobil. Di antara
data yang mereka kumpulkan adalah produsen (Ford, Toyota, dll), jenis kendaraan (mobil,
SUV, dll.), Berat badan, tenaga kuda, dan gas mileage (mpg) untuk kota dan mengemudi
jalan raya.
Why :Untuk melacak ekonomi bahan bakar mobil
What : produsen (Ford, Toyota,
dll)(kualitatif), jenis kendaraan (mobil, SUV, dll.)
(kualitatif), berat badan (kuantitatif), tenaga kuda(kuantitatif),
dan gas mileage (mpg) untuk kota dan mengemudi jalan raya.
Who : Produsen
Nomor 21 Halaman 17 (Chapter 2)
Refrigerators. In 2002, Consumer Reports published an article evaluating refrigerators. It
listed 41 models, giving the brand, cost, size (cu ft), type (such as top-freezer), estimated
annual energy cost, an overall rating (good, excellent, etc.), and the repair history for that
brand (percentage requiring repairs over the past 5 years).
Jawab :
Pada tahun 2002, Consumer Reports menerbitkan sebuah artikel mengevaluasi lemari es.
Terdaftar 41 model, merek, biaya, ukuran (cu ft), jenis (seperti top-freezer), diperkirakan
biaya tahunan energi, rating keseluruhan (baik, sangat baik, dll), dan sejarah perbaikan
untuk setiap merek (persentase yang membutuhkan perbaikan selama 5 tahun terakhir).
What : merek (kualitatif), biaya (kuantitatif), ukuran (cu ft)( kuantitaif), jenis (seperti topfreezer)(kualitatif),
estimasi biaya tahunan energy (kualitatif), rating keseluruhan (baik
dll)(kualitatif), dan sejarah perbaikan untuk itu merek (persentase membutuhkan perbaikan
selama 5 tahun terakhir) (kualitatif).
When : 2002
Why : untuk mengevaluasi lemari es
Who : kulkas
Nomor 22 Halaman 18 (Chapter 2)
Lotto. A study of state-sponsored Lotto games in the United States (Chance, Winter
1998)listed the names of the states and whether or not the state had Lotto. For states that did,
the study indicated the number of numbers in the lottery, the number of matches required to
win, and the probability of holding a winning ticket.
Jawab :
Sebuah studi dari permainan Lotto disponsori negara di Amerika Serikat (Chance, Musim
Dingin 1998) terdaftar nama negara dan juga bukan negara memiliki Lotto. Untuk negara
yang memiliki Lotto penelitian menunjukkan jumlah angka dalam undian, jumlah
pertandingan yang dibutuhkan untuk menang, dan kemungkinan memegang tiket menang.
Who : Lotto
What : jumlah angka dalam undian (kuantitatif), jumlah pertandingan yang dibutuhkan
untuk menang (kuantitatif) dan kemungkinan memegang tiket menang (kualitatif)
Why : Untuk membuat daftar negara yang memiliki lotto
When : tahun 1998
Nomor 23 Halaman 17 (Chapter 2)
Sleep. In the Spring 2001 issue of Chance magazine, a psychology professor reported on data
he had collected about his sleep patterns. He kept daily records of the number of hours of
sleep he got, whether or not he suffered from "early awakening," whether or not he watched
TVin the morning and in the evening, the number of hours he spent standing during the
day, and his mood (happy/sad, on a scale from 10-90).
Jawab :
Pada musim semi 2001 isu dari majalah Chance, seorang profesor psikologi melaporkan
data yang telah dikumpulkan tentang pola tidurnya. Dia menyimpan catatan harian dari
jumlah jam tidur dia, apakah dia menderita “bangun lebih awal”, apakah dia menyaksikan
TV pagi dan malam hari, jumlah jam ia menghabiskan dengan berdiri di siang hari, dan
suasana hatinya (senang / sedih, dengan skala 10-90).
When ; tahun 2001
Who : Tidur
What : apakah dia menderita dari "kebangkitan awal (kualitatif), apakah dia
menyaksikan TV pagi hari dan di malam hari(kualitatif), jumlah
jam ia menghabiskan berdiri di siang hari(kuantitatif), dan mood (senang / sedih, dengan
skala 10-90) (kualitatif)
Nomor 24 Halaman 17 (Chapter 2)
Indy. The 2.5-mile Indianapolis Motor Speedway has been the home to a race on Memorial
Day nearly every year since 1911.Even during the first race there were controversies. Ralph
Mulford was given the checkered flag first but took three extra laps just to make sure he'd
completed 500 miles. When he finished, another driver, Ray Harroun, was being presented
with the winner's trophy, and Mulford's protests were ignored. Harroun averaged 74.6mph
for the 500miles. In 2003 the winner, Gil de Ferran, averaged 153.6mph. Here are the data for
the first few and four recent Indianapolis 500 races. Included also are the pole winners (the
winners of the trial the day before, when each driver drives alone to determine the position
on race day).
Jawab :
2,5 mil Indianapolis Motor Speedway telah menjadi rumah bagi perlombaan pada hari
peringatan hampir setiap tahun sejak 1911. Saat balapan pertama ada kontroversi. Ralph
Mulford diberi bendera kotak-kotak pertama tetapi mengambil tiga lap ekstra hanya untuk
memastikan ia menyelesaikan 500 mil. Ketika ia selesai, driver lain, Ray Harroun,
dipresentasikan dengan piala pemenang, dan protes Mulford telah diabaikan. Harroun ratarata 74.6mph untuk 500miles. Pada 2003the pemenang, Gil de Ferran, rata-rata 153.6mph.
Berikut adalah data untuk beberapa pertama dan empat Indianapolis 500 ras. Termasuk
juga adalah pole winner (pemenang sidang sehari sebelumnya, ketika setiap driver
mengendarai sendiri untuk menentukan posisi pada hari perlombaan).
Who : pemenang
What : tahun (kualitatif), pemenang (kualitatif), posisi jarak(kuantitatif), kecepatan ratarata(kuantitatif), pole winner (kualitatif), rata-rata kecepatan pole (kuantitatif)
Why : untuk mengetahui pemenang dengan kecepatan rata-ratanya
Nomor 25 Halaman 17 (Chapter 2)
Horse race. The Kentucky Derby is a horse race that has been run every year since 1875 at
Churchill Downs, Louisville, Kentucky. The race started as a 1.5-mile race, but in 1896 it was
shortened to 1.25 miles because experts felt that 3-year-old horses shouldn't run such a long
race that early in the season (it has been run in May every year but one-1901-when it took
place on April 29). Here are the data for the first few and a few recent races.
Jawab :
Pacuan kuda. The Kentucky Derby adalah pacuan kuda yang telah dijalankan setiap tahun
sejak 1875 di Churchill Downs, Louisville, Kentucky. Perlombaan dimulai dari1,5 mil, tetapi
pada tahun 1896 itu disingkat menjadi 1,25 kilometer karena para ahli merasa bahwa kuda 3
tahun tidak boleh menjalankan seperti perlombaan panjang yang di awal musim (telah
dijalankan Mei setiap tahun tetapi satu-1901-ketika itu terjadi pada tanggal 29 April).
Berikut adalah data untuk balapan pertama dan balapan terakhir :
Where: Churchill Downs, Louisville, Kentucky
Who : Balapan Kuda
What : Tanggal (kuantitatif), pemenang(kualitatif), margin (kuantitatif), jockey (kualitatif),
hadiah pemenang (kuantitatif), durasi (kuantitatif), kondisi jaur (kualitatif)
When : tahun 1901
Why : untuk mengetahui tentang perlombaan kuda di Churchill Downs
(Chapter III)
Nomor 15 halaman 39 (Chapter 3)
Auditing reform. In the wake of the EnronCorporation scandal, the Gallup Organization
asked 1001 American adults what kind of changes, if any, are needed in the way major
corporations are audited. Here is a display of the results.
a) Make a pie chart of the same data.
b) Which chart works better to summarize the data? Why?
c) Summarize the findings of the poll in a few sentences that might appear in a
newspaper article.
Jawab :
a) Pie Chart dari data yang sama adalah :
b) Grafik yang bekerja lebih baik untuk meringkas data adalah grafik batang karena
dengan grafik batang lebih mudah untuk membandingkan persentase dan membuat
urutan respon.
c) Rangkuman yang bisa kami buat dari data di atas adalah sebagian besar responden
mendukung beberapa jenis reformasi. 39% dari responden menganjurkan reformasi
utama, 35% mengatakan reformasi kecil yang diperlukan. Sementara hanya 17% dari
Amerika orang dewasa yang disurvei merekomendasikan lengkap overhaul, 74%
dari responden direkomendasikan baik besar atau kecil reformasi dengan cara
bahwa korporasi diaudit. Hanya 4% yang mendukung tidak ada reformasi sistem
saat ini.
Nomor 31 halaman 43 (Chapter 3)
Blood Pressure. A company held a blood pressure screening clinic for its employees. The
results are summarized in the table below by age group and blood pressure level :
a) Find the marginal distribution of blood pressure level
b) Find the conditional distribution of blood pressure level within each age group.
c) Compare these distribution with a segmented bar graph.
d) Write a brief description of the association between age and blood pressure among
these employees.
e) Does this prove that people’s blood pressure increases as they age? Explain.
Jawab :
a) Distribusi marjinal tekanan darah untuk karyawan perusahaan adalah total kolom
tabel, dikonversi ke persentase. 20% rendah, 49% normal dan 31% tekanan darah
tinggi.
b) Distribusi bersyarat dari tekanan darah dalam setiap kategori usia:
Di bawah umur 30 tahun
Rendah :
27
98
= 0.28 = 28%
48
Normal : 98 = 0.49 = 49%
23
Tinggi : 98 = 0.23 = 23%
Umur 30 – 49 tahun
37
Rendah : 179 = 0.21 = 21%
Normal :
91
179
= 0.51 = 51%
51
Tinggi : 179 = 0.28 = 28%
Umur di atas 50 tahun
Rendah :
31
197
= 0.16 = 16%
93
Normal : 197 = 0.47 = 47%
73
Tinggi : 197 = 0.37 = 37%
c) Jika
distribusi
bersyaratnya
dibandingkan
dengan
tersegmentasi dengan kategori usia adalah sebagai berikut :
sebuah
grafik
batang
d) Deskripsi singkat mengenai persatuan umur dan tekanan darah diantara semua
karyawan adalah dalam perusahaan ini, umur meningkat, persentase karyawan
dengan tekanan darah rendah berkurang, dan persentase karyawan dengan tekanan
darah tinggi meningkat.
e) Ini tidak membuktikan bahwa tekanan darah masyarakat meningkatkan dengan
bertambahnya usia mereka. Umumnya, sebuah asosiasi antara dua variabel tidak
berarti hubungan sebab-akibat. Secara khusus, ini Databerasal dari hanya satu
perusahaan dan tidak dapat diterapkan untuk semua orang. Selain itu, mungkin ada
beberapa variabel lain yang terkait dengan usia dan tekanan darah. Hanya
percobaan terkontrol dapat mengisolasi hubungan antara usia dan tekanan darah.
Nomor 33 halaman 43 (Chapter 3)
Family Planning. A 1945 study of 1438 pregnant women examined the associated between
the woman’s education level and the occurrence of unplanned pregnancies, producing these
data:
Does this indicate that more schooling taught young women better family planning? What
other explanations for these data can you think of? (Fertilihj Planning andFertility Rates by
Socio-Economic Status, Social and Psychological Factors Affecting Fertility, 1954).
Jawab :
Penjelasan kami mengenai data-data ini adalah bahwa jika persentase kehamilan yang tidak
direncanakan menurun, maka tingkat pendidikan meningkat. Namun, ini tidak berarti
bahwa di sekolah lebih diajarkan wanita muda mengenai perencanaan keluarga yang lebih
baik. Hubungan antara variabel bukan bukti hubungan sebab-akibat. Dalam hal ini, variabel
sosial ekonomi lainnya mungkin terkait dengan kehamilan dan tingkat pendidikan.
Mungkin beberapa wanita bahkan harus meninggalkan sekolah karena suatu kehamilan
yang tidak direncanakan.
Nomor 34 halaman 43 (Chapter 3)
Pet ownership. The U.S.Census Bureau reports the number of households owning various
types of pets. Specifically, they keep track of dogs, cats, birds, and horses
a) Do you think the income distributions of the households who own these different
animals would be roughly the same? Why or why not?
b) The table shows the percentages of income levels for each type of animal owned. Are
these row percentages, column percentages, or table percentages?
c) Do the data support your initial guess? Explain.
Jawab :
a) Tidak, menurut kami distribusi pendapatan rumah tangga menurut kepemilikan
hewan peliharaan tidak akan diharapkan sama. Merawat kuda jauh lebih mahal,
umumnya, daripada merawat anjing, kucing, atau burung. Rumah tangga dengan
kuda sebagai hewan peliharaan akan diharapkan untuk menjadi lebih umum di
kategori pendapatan yang lebih tinggi.
b) Tabel di atas adalah persentase kolom, karena masing-masing kolom totalnya 100%.
Setiap hewan peliharaan diklasifikasikan sebagai milik sebuah keluarga di salah satu
kategori tingkat pendapatan.
c) Ya, data mendukung tapi sampai batas tertentu. Persentase kuda dimana pemiliknya
memiliki pendapatan kurang dari $12.500 hanya 9%, dibandingkan dengan
persentase tahun 20-an untuk tingkat pendapatan lainnya, sedangkan tingkat
pendapatan dari pemilik hewan peliharaan lainnya kira-kira memiliki persentase
yang sama. Namun, dengan pengecualian mereka yang berpenghasilan kurang dari
$12.500, persentase di setiap tingkat pendapatan antara pemilik kuda yang tidak jauh
berbeda.
Nomor 37 halaman 44 (Chapter 3)
Hospitals. Most patients who undergo surgery make routine recoveries and are discharged
as planned. Others suffer excessive bleeding, infection, or other postsurgical complications
and have their discharges from the hospital delayed. Suppose your city has a large hospital
and a small hospital, each performing major and minor surgeries. You collect data to see
how many surgical patients have their discharges delayed by postsurgical complications,
and find the results shown in the following table.
Discharge Delayed
Major Surgery
Large
Small
Hospital
Hospital
120 of 800
10 of 50
Minor Surgery 10 of 200
20 of 250
a) Overall, for what percent of patients was discharge delayed?
b) Were the percentages different for major and minor surgery?
c) Overall, what were the discharge delay rates at each hospital?
d) What were the delay rates at each hospital for each kind of surgery?
e) The small hospital advertises that it has a lower rate of postsurgical complications.
Do you agree?
f) Explain, in your own words, why this confusion occurs.
Jawab :
a)
Total marjinal telah ditambahkan ke tabel:
Major
Procedure
Large Hospital
Small Hospital
Total
120 of 800
10 of 50
130 of 850
10 of 200
20 of 250
30 of 450
130 of 1000
30 of 300
160 of 1300
surgery
Minor
surgery
Total
Discharge tertunda Rumah Sakit :
Jumlah Operasi besar =120 dari 800 ,10 dari 50 ,130 dari 850.
Jumlah Operasi kecil = 10 dari 200, 20 dari 250, 30 dari 450 ,
Prosedur Total = 130 1000 30 300 160 1300 160 dari 1.300, atau sekitar 12,3% dari
pasien memiliki debit tertunda.
b) Perbedaan persentase antara operasi besar dan operasi kecil adalah pasien operasi
besar
tertunda
130
dari
850
kali,
atau
sekitar
15,3%
dari
Pasien operasi kecil tertunda 30 dari 450 kali, atau sekitar 6,7% dari waktu.
waktu.
c) Tingkat penundaan untuk masing-masing rumah sakit adalah :
Rumah Sakit besar memiliki tingkat penundaan 130 dari 1000, atau 13%.
Rumah Sakit Kecil memiliki tingkat penundaan 30 dari 300, atau 10%.
Rumah sakit kecil memiliki tingkat keseluruhan yang lebih rendah tertunda debit.
d) Laju penundaan untuk masing-masing rumah sakit pada setiap bedah adalah :
Rumah Sakit besar: Bedah Mayor 15% Bedah tertunda dan Kecil 5% tertunda.
Rumah Sakit kecil: Bedah Mayor 20% Bedah tertunda dan kecil 8% tertunda.
Meskipun rumah sakit kecil memiliki tingkat keseluruhan yang lebih rendah dari
debit tertunda, rumah sakit besar memiliki tingkat lebih rendah daripada debit
tertunda untuk setiap jenis operasi.
e) Kami tidak setuju karena tingkat penundaan secara keseluruhan untuk debit lebih
rendah untuk rumah sakit kecil, rumah sakit besar melakukan lebih baik untuk
kedua operasi baik operasi besar maupun operasi kecil.
f) Menurut kami, kekeliruan ini terjadi karena rumah sakit kecil melakukan
persentase yang lebih tinggi dari operasi minor dari operasi besar. 250 dari 300
operasi kecil di rumah sakit kecil atau sebesar (83%). Hanya 200 dari 1000 operasi
yang kecil di rumah sakit besar atau sebesar (20%). Operasi kecil memiliki tingkat
keterlambatan lebih rendah dari operasi besar (6,7% menjadi 15,3%), sehingga
tingkat keseluruhan rumah sakit kecil itu telah artifisial meningkat. Sederhananya,
itu adalah kesalahan untuk melihat persentase keseluruhan. Kebenaran yang nyata
ditemukan oleh melihat tingkat setelah informasi dipecah oleh jenis operasi, karena
tarif kelambatan untuk setiap jenis operasi yang begitu berbeda. Rumah sakit yang
lebih besar adalah lebih baik rumah sakit ketika membandingkan tarif delay
discharge.
Nomor 38 halaman 45 (Chapter 3)
Delivery Service. A company must decide which of two delivery services they will contract
with. During a recent trial period they shipped numerous packages with each service and
have kept track of how often delivered did not arrive on time. Here are the data :
Delivery
Service
Pack Rats
Boxer R Us
Type of service
Number
of Number of Late
Deliveries
Packages
Regular
400
12
Overnight
100
16
Regular
100
2
Overnight
400
28
a) Compare the two services overall percentage of late deliveries.
b) Based on the results in part a, the company has decided to hire Pack Rats. Do you
agree they deliver ontime more often? Why or why not? Be specific.
c) The results here are an instance of what phenomenon?
Jawab :
a) Persentase keseluruhan dua layanan dari pengiriman yang terlambat adalah
pada Pack Rats telah menyampaikan total 28 paket terlambat (12 Regular + 16
Semalam), dari Sebanyak 500 pengiriman (400 Regular + 100 Semalam). 28/500
= 5,6% dari paket yang terlambat. Kotak R Us telah melahirkan total 30 paket
terlambat (2 Regular + 28 Semalam) dari total 500 pengiriman (100 Regular + 400
Semalam). 30/500 = 6% dari paket yang terlambat.
b) Kami kurang sependapat, perusahaan harus menyewa box R Us bukannya Pack
Rats. Kotak R Us hanya memberikan 2% (2 dari 100) paket Reguler yang
terlambat, dibandingkan dengan Pack Rats, yang memberikan 3% (12 dari 400)
paket Reguler yang terlambat. Selain itu, box R Us hanya memberikan 7% (28
out 400) paket Overnight yang terlambat, dibandingkan dengan Pack Rats, yang
memberikan 16% nya Paket semalam terlambat. Kotak R Us baik di memberikan
Reguler dan Overnight paket.
c) Hasilnya adalah sebuah contoh turunan dari Simpson Paradox, karena tarif
pengiriman akhir keseluruhan rata-ratanya tidak adil. Kotak R Us memberikan
persentase yang lebih besar dari paket yang Semalam, di mana itu relatif lebih
sulit untuk tepat waktu. Pack Rats memberikan banyak paket Regular, di mana
lebih mudah untuk membuat pengiriman tepat waktu.
Nomor 39 halaman 45 (Chapter 3)
Graduate Admissions. A 1975 article in the magazine Science examined the graduate
admissions process at Berkeley for evidence of gender bias. The table below shows the
number of applicants accepted to each of four graduate programs. What percent of total
applicants were admitted?
a)
Overall, were a higher percentage of males or females admitted?
b) Compare the percentage of males and females admitted in each program.
c) Which of the comparisons you made do you consider to be the most valid? Why?
Program
Males accepted
Females accepted
(of aplication)
(of aplication)
Total
1
511 of 825
89 of 108
600 of 933
2
325 of 560
17 of 25
369 of 585
3
137 of 407
132 of 375
269 of 782
4
22 of 373
24 of 341
46 of 714
Total
1022 0f 2165
262 of 849
1284 of 3014
Jawab :
Sebuah artikel 1975 di majalah Science meneliti proses penerimaan pascasarjana di Berkeley
untuk bukti bias gender. Tabel di bawah menunjukkan jumlah pelamar yang diterima untuk
masing-masing empat program pascasarjana.
Males Accepted
Females Accepted
(of applicants)
(of applicants)
1
511 of 825
89 of 108
600 of 933
2
352 of 560
17 of 25
369 of 585
3
137 of 407
132 of 375
269 of 782
4
22 of 373
24 of 341
46 of 714
Total
1022 of 2165
262 of 849
1284 of 3014
Program
Total
a) Persentase yang lebih tinggi dari laki-laki atau perempuan yang mengaku
adalah ada 1284 pelamar yang mengaku dari total dari 3.014 pelamar =
1284/3014 = 42,6%
b) Perbandingan antara laki-laki dan perempuan yang mengaku adalah 1022 dari
2165 (47,2%) dari laki-laki yang mengaku sedangkan 262 dari 849 (30,9%) dari
perempuan dirawat. Karena ada empat perbandingan, maka tabel mengatur
persentase laki-laki dan perempuan diterima di masing-masing program.
Perempuan diterima pada tingkat yang lebih tinggi dalam setiap program.
Program
Males
Females
1
69 .9%
82.40%
2
62.90%
68.00%
3
33.70%
35.20%
4
5.90%
7%
c) Perbandingan tingkat penerimaan dalam setiap Program yang paling valid.
Keseluruhan persentase adalah rata-rata tidak adil. Gagal untuk mengambil
perbedaan jumlah pelamar dan tingkat penerimaan yang berbeda dari masingmasing program. perempuan cenderung berlaku untuk program-program yang
mendapatkan penerimaan sulit bagi semua orang. Ini adalah contoh dari
Simpson Paradox.
Nomor 40 halaman 45 (Chapter 3)
Be a Simpson! Can you design a Simpson's paradox? Two companies are vying for a city's
"Best Local Employer" award, to be given to the company most committed to hiring local
residents. While both employers hired 300 new people in the past year, Company Abrags
that it deserves the award because 70% of its new jobs went to local residents, compared to
only 60%for Company B.Company Bconcedes that those percentages are correct, but points
out that most of its new jobs were fulltime, while most of Company A's were part-time. Not
only that, says Company B, a higher percentage of its full-time jobs went to local residents
than did Company A's, and the same was true for part-time jobs. Thus, Company B argues,
it's a better local employer than Company A.
Show how it's possible for Company B to fill a higher percentage of both full-time and parttime jobs with local residents, even though Company A hired more local residents overalL
(Answers will vary.)
Jawab :
Jawaban dari soal ini akan bervariasi. Tiga arah tabel di bawah ini menunjukkan salah satu
kemungkinan. Jumlah lokal karyawan dari karyawan baru akan ditampilkan dalam setiap
sel.
Company A
Company B
Full-time New Employees
40 of 100 = 40%
90 of 200 = 45%
Part-time New Employees
170 of 200 = 85%
90 of 100 = 90%
Total
210 of 300 = 70%
180 of 300 = 60%
(Chapter IV)
Nomor 2 halaman 72 (Chapter 4)
Not a Histogram. Find a graph other than a histogram that shows the distribution of a
quantitive variable in a newspaper or a magazine article.
a) Does the article discuss the W's for the data?
b) What are the units for the variable?
c) Does the article use the range, IQR, or standard deviation?
d) Is the choice of measure of spread appropriate for the situation? Explain.
Jawab :
Sumber (www.ekonomi.kompasiana.com)
Dalam beberapa tahun terakhir, khususnya setelah pemilihan umum yang lalu, sejumlah inisiatif
telah digulirkan untuk memperkokoh landasan bagi pertumbuhan berkelanjutan, seperti pelayanan
satu atap dalam perizinan usaha, penyiapan undang-undang pertanahan, menghapuskan monopoli
a. What : Pertumbuhan Ekonomi Timor Leste – Indonesia
When : Tahun 200-2014
Why : Perbandingan ekonomi antara Timor Leste-Indonesia
Who : Timor Leste dan Indonesia
b. Tampilan data sudah sesuai dengan data yang ada. Karena untuk perbandingan 2 buah
objek, maka di butuhkan grafik garis yang terdiri dari 2 garis, yang satunya
menginterpretasikan Timor Leste, dan garis berwarna merah menginterpretasikan data
dari Indonesia. Jika kita menggunakan histogram, maka akan sulit melihat perbedaan
dari pertumbuhan ekonomi Timor Leste dan Indonesia.
c. Pada grafik, untuk variable di sumbu X adalah tahun, namun variable pada sumbu Y
tidak jelas diketahui pada artikel. Dan untuk distribusi datanya, pada Timor Leste
penyebarannya sangat terlihat signifikan pada tahun 200 sampai 2007 , pada Indonesia ,
penyebaran datanya merata karena hampir membentuk garis lurus.
d. Pada artikel tidak menjelaskan secara rinci tentang grafik yang ada. Karena kita tidak
dapat mengetahui secara pasti tentang pertumbuhan ekonomi setiap tahunnya. Yang
dapat di baca dari grafik ialah posisi pertumbuhan ekonomi Timor Leste itu meningkat,
sedangkan Indonesia datar , namun jumlah pertumbuhannya tidak dijelaskan pada
aartikel.
Nomor 19 halaman 73 (Chapter 4)
Payroll. A small warehouse employs a supervisor at $1200 a week, an inventory manager at
$700 a week, six stock boys at $400 a week, and four drivers at $500 a week.
a) Find the mean and median wage.
b) How many employees earn more than the mean wage?
c) Which measure of center best describes a typical wage at this company, the mean or
the median?
d) Which measure of spread would best describe the payroll, the range, the IQR, or the
standard deviation? Why?
Jawab :
Berdasarkan data di atas maka diketahui gaji dari pekerja sebuah gudang kecil dalam
seminggu adalah:
Seorang Supervisor sebesar 1200 dollar.
Seorang Manajer Persediaan sebesar 700 dollar.
6 orang laki-laki Penyedia Stok sebesar 400 dollar.
Dan 4 orang pengemudi sebesar 500 dollar.
Jika data ini disusun maka jadinya adalah .
400
400
400
400
400
500
500
500
500
700
1200
500
500
500
a) Median dan rata-rata dari data di atas adalah :
400
400
400
400
400
400
500
700
1200
Median berada pada data ke-6 dan data ke-7 = (400+500)/2 = 450 dollar.
Sedangkan rata-ratanya adalah =( 400(6)+ 500(4) + 700 + 1200 ) / 12 = 6300 / 12 = 525
dollar.
b) Hanya ada dua pekerja yang gajinya melebihi gaji rata-rata yaitu gaji dari supervisor
dan manajer persediaan. Yang masing-masing gajinya adalah 1200 dollar dan 700
dollar.
c) Median lebih baik daripada rata-rata untuk untuk mengukur pusat terbaik yang
menggambarkan upah khas di perusahaan ini. Karena mean hanya dipengaruhi
oleh dua upah saja. Sedangkan median dipengaruhi oleh enam upah.
d) Rentang Antar Kuartil karena Rentang Antar Kuartil adalah ukuran yang lebih baik
dari penyebaran untuk distribusi gaji dari kisaran atau deviasi standar. Standar
deviasi dan rentang keduanya dipengaruhi oleh dua upah yang lebih tinggi.
Nomor 33 halaman 75 (Chapter 4)
Acid rain. Two researchers measured the pH (a scale on which a value of 7 is neutral and
values below 7 are acidic) of water collected from rain and snow over a 6-month period in
Allegheny County, Pennsylvania. Describe their data with a graph and a few sentences.
4.57
5.67
5.08
5.62
4.39
4.41
5.29
4.26
5.51
4.64
4.26
4.82
4.31
4.40
4.63
4.30
5.78
4.29
4.45
4.56
4.52
4.12
4.12
4.39
4.73
4.60
Jawab :
Diketahui data dari suatu penelitian yang mengukur PH air dalam periode 6 bulan di
Allegheny Country,PA sebagai berikut :
4.57
5.67
5.08
5.62
4.39
4.41
5.29
4.26
5.51
4.64
4.26
4.82
4.31
4.40
4.63
4.30
5.78
4.29
4.45
4.56
4.52
4.12
4.12
4.39
4.73
4.60
Bila data tersebut digambarkan dalam sebuah grafik maka tampilannya adalah sebagai
berikut :
Distribusi pembacaan pH sampel air di Allegheny Country,PA adalah bimodal. Data kasar
seragam berpusat di sekitar PH dari 4.4. Data ini berkisar dari pH 4,1 - 4,9. Sedangkan pada
kelompok yang lain berpusat di sekitar pH 5,6.
Nomor 34 halaman 76 (Chapter 4)
Marijuana. In 1995 the Council of Europe published a report entitled The European School
Survey Project an Alcohol and Other Drags. Among other issues, the survey investigated the
percentages of 9th graders who had used marijuana. Here are the results for 20 Western
European countries.
Create an appropriate graph of these data, and describe the distribution.
Austria
10%
Italy
19%
Belgium
19%
Luxemburg
6%
Denmark
17%
Netherlands
31%
England
40%
No.Ireland
23%
Finland
5%
Norway
6%
France
12%
Portugal
7%
Germany
21%
Scotland
53%
Greece
2%
Spain
15%
Iceland
10%
Sweden
6%
Ireland
37%
Switzerland
27%
Jawab :
Dari laporan berjudul “The School Survey Eropa” yang memproyeksikan Alkohol dan
Drags Lainnya. Survei menyelidiki persentase anak kelas 9 yang telah menggunakan ganja.
Berikut adalah hasil untuk 20 negara Eropa Barat.
Austria
10%
Italy
19%
Belgium
19%
Luxemburg
6%
Denmark
17%
Netherlands
31%
England
40%
No.Ireland
23%
Finland
5%
Norway
6%
France
12%
Portugal
7%
Germany
21%
Scotland
53%
Greece
2%
Spain
15%
Iceland
10%
Sweden
6%
Ireland
37%
Switzerland
27%
Grafik yang sesuai dari data di atas adalah sebagai berikut :
Pendeskripsian dari distribusi datanya adalah :
Pada grafik di atas berbentuk Unimodal dengan pusat sekitar 10, tetapi hanya beberapa
negara yang melaporkan persentase lebih dari 20. Ini membuat distribusi terlihat miring ke
kanan, kecuali pada dua kelompok pertama yang berbeda.
Nomor 35 halaman 76 (Chapter 4)
Final grades. A professor (of something other than Statistics!) distributed the following
histogram to show the distribution of grades on his 200- point final exam. Comment o the
display.
Jawab :
Pada soal di atas didistribusikan histogram berikut untuk menunjukkan distribusi nilai
pada 200- titik ujian terakhirnya.
Komentar untuk tampilan grafiknya adalah lebar histogram terlalu lebar sehingga skala
untuk jumlah pelajar dengan nilai finalnya tidak begitu sesuai.
Nomor 36 halaman 76 (Chapter 4)
Final grades revisited. After receiving many complaints about his final grade histogram
fromstudents currently taking a Statistics course, the professor distributed the following
revised histogram.
a) Comment on this display.
b) Describe the distribution of grades.
Jawab :
Pada
soal
di
atas
diketahui
nilai
akhir
yang
ditinjau
kembali
dari
siswa saat mengambil kursus Statistik, Profesor mendistribusikan revisi histogramnya
seperti pada histogram berikut ini :
a) Komentar untuk tampilan grafiknya adalah batang dari histogram terlalu sempit
sehingga sulit untuk membaca informasi dari datanya.
b) Tampilan distribusinya miring ke kiri, modusnya dekat dengan 170, beberapa
outliernya berada di bawah 100. Data berkerumun cukup erat berkerumun kecuali
untuk outlier.
Nomor 37 halaman 76 (Chapter 4)
Zip codes. Holes R Us, an Internet company that sells piercing jewelry, keeps transaction
records on its sales. At a recent sales meeting, one of the staff presented a histogram of the
zip codes of the last 500 customers so that they might understand where sales are coming
from. Comment on the usefulness and appropriateness of the display.
Jawab :
Dari soal di atas disajikan histogram kode pos dari 500 pelanggan terakhir dari perusahaan
Internet sebagai berikut :
Komentar untuk kegunaan dan kesesuaian layar adalah baik yang sesuai atau berguna.
Kode pos adalah data kategori, tidak kuantitatif. Tabel di atas memang mengandung
beberapa informasi. Digit terkemuka memberikan gambaran kasar dari Timur ke Barat
penempatan di Amerika Serikat. Jadi kita melihat bahwa grafik hampir tidak memiliki
pelanggan di timur laut, tapi bar chart dengan digit terkemuka akan lebih tepat untuk
menggambarkannya.
Nomor 38 halaman 76 (Chapter 4)
Industry Codes. A recently hired investment analyst has been assigned to analyzed the
companies that make up the Fortune 800, a collection of the largest U.S companies. He codes
each company by the type of industry to which they belong. Here is a table showing some of
the industry types and the corresponding codes he uses.
The analyst produces the following histogram of the industry codes for the companies :
a) What might account for the gaps seen in the histogram?
b) Is the histogram unimodal?
c) What advice might you give the analyst about the appropriateness of this display?
Jawab :
Dari soal di atas diketahui tabel yang menunjukkan beberapa jenis industri dan sejumlah
kode yang terkait yang dipakai seorang analis untuk menganalisis perusahaan yang
membentuk Fortune 800, koleksi perusahaan-perusahaan AS terbesar, yaitu sebagai berikut :
Adapun histogram dari kode industri untuk perusahaannya adalah sebagai berikut :
a) Yang memperlihatkan kesenjangan di histogram adalah kodenya. Kodenya
merupakan bilangan bulat dan lebar binnya kurang dari 1. Kode dari histogram ini
kategoris dan tidak kuantitatif.
b) Tidak ada jawaban yang tepat untuk menjawab dari pernyataan ini. Karena
tampilannya tidak sesuai untuk jawaban yang diharapkan.
c) Tampilan histogramnya tidak sesuai. Datanya termasuk data kategoris. Sebaiknya
kita harus menggunakan bar chart.
Nomor 39 halaman 76-77 (Chapter 4)
Math Scores. The national Center for Education Statistics reported 1999 average
mathematics achievement scores for eight graders in 38 nations. Singapore led the group,
with an average of 604, while South Africa had the lowest average of 275. The United States
scored 502. The Average scores for each nation are given below :
604
587
585
582
579
558
540
534
532
531
530
526
525
520
520
519
511
505
502
496
491
482
479
476
472
469
467
466
448
447
429
428
422
403
392
345
337
275
a) Find the median, the IQR, the mean, and the standard deviation of these national
averages.
b) Which would you report? Why?
c) Write a brief summary of the performance of eighth graders worldwide. Be sure to
comment on the performance of the United States.
Jawab :
Dari soal di atas diketahui skor rata-rata nilai prestasi matematika untuk siswa kelas
delapan di 38 negara dilaporkan dari Pusat nasional untuk Statistik Pendidikan pada tahun
1999. Dimana Singapura memimpin kelompok, dengan rata-rata 604, sedangkan Afrika
Selatan memiliki rata-rata terendah dari 275. Amerika Serikat mencetak 502. Rata-rata nilai
tersebut adalah sebagai berikut :
604
587
585
582
579
558
540
534
532
531
530
526
525
520
520
519
511
505
502
496
491
482
479
476
472
469
467
466
448
447
429
428
422
403
392
345
337
275
a) Median, Rentang antar Kuartil, Rata-rata, dan Standar Deviasi dari rata-rata nasional
di atas adalah :
Pertama-tama akan dibuat tabel distribusinya
Rentang = data terbesar – data terkecil = 604 – 275 = 329
Banyak Kelas (K)= 1 + 3.322 log n
= 1 + 3.322 log 38
= 1 + 5.248 = 6.248
Panjang Kelas (P) = Rentang/Banyak Kelas
= 329/6.248 = 52.66 ≈ 53
(xi − x)2
fi xi
fi (xi − x)2
Nilai
Fi
Fk
xi
xi - x
275-328
1
1
301.5
-184.7
34114.09
301.5
34114.09
329-382
2
3
355.5
-130.7
34164.98
711
68329.96
383-436
5
8
409.5
-76.7
29414.45
2047.5
147072.25
437-490
9
17
463.5
-22.7
4637.61
4171.5
41738.49
491-544
15
32
517.5
31.3
14695.35
7762.5
220430.25
545-598
5
37
571.5
85.3
36380.45
2857.5
181902.25
599-652
1
38
625.5
139.3
19404.49
625.5
19404.49
Jumlah
38
136
18477
531089.53
Keterangan :
Fi = frekuensi
Fk = Frekuensi Kumulatif
xi = Tanda kelas = ½ (ujung bawah – ujung atas)
x = nilai rata-rata
i
Rumus dari kuartil n adalah (Qi) = b + p ( 4
n−F
fi
)
Dimana b = batas bawah kelas median, adalah kelas dimana median akan terletak,
p = panjang kelas median
n = ukuran sampel atau banyak data
Fi = jumlah semua frekuensi dengan tanda kelas lebih kecil dari tanda kelas
median
Fk = Frekuensi kelas Median
Kuartil Pertama (Q1)
1/4 . n = 1/4 . 38 = 9.5
b = 437 – 0.5 = 436.5
p = 490 – 437 = 53
1
(Q1) = b + p ( 4
n−F
) = 436.5+ 53 (
fi
9.5−8
)
9
= 436.5 + 53 (1.5/9) = 445.33
Kuartil Kedua(Median/Q2)
½ n = ½ . 38 = 19
b = 491 – 0.5 = 490.5
p = 544 – 491= 53
1
2
(Q2) = b + p (
n−F
fi
19−17
15
) = 490.5 + 53 (
) = 490.5 + 53 (2/15) = 497.57
Kuartil Ketiga (Q3)
3/4 . n = 3/4 . 38 = 28.5
b = 491 – 0.5 = 490.5
p = 544 – 491= 53
3
(Q3) = b + p ( 4
n−F
fi
) = 490.5 + 53 (
28.5−17
15
) = 490.5 + 53 (11.5/15) = 531.13
Rentang antar Kuartil = Q3 - Q1 = 497.57 - 445.33 = 52.24
Rata-rata dari data di atas adalah =
( Dimana
fi xi,
fi xi
fi
= 18477/38 = 486.24
fi diperoleh dari tabel frekuensi yang ada di atas )
Standar Deviasi dari data di atas adalah :
S2 =
fi (xi − x )2
n−1
= 531089.53/6 = 88514.92
S = 88514.92 = 297.51
b) Yang akan kami laporkan adalah karena rata-rata akan lebih besar dari median,
karena distribusinya tepat miring.
c) Ringkasan singkat dari rata-rata nilai prestasi matematika untuk siswa kelas delapan
seluruh dunia adalah rata-rata skor yang diperoleh beberapa negara pada
penghargaan tersebut adalah 486.24. Banyaknya skor yang bisa melewati rata-rata
skor tersebut ada 23 skor. Amerika Serikat mencetak 502. Skor Amerika Serikat
adalah mendekati nilai Kuartil ketiga yaitu 531.13.
Nomor 40 halaman 77 (Chapter 4)
Prisons. A report from the U.S. Department of Justice gave the following percent increases
in federal prison populations in 20 northeastern and midwestern states during 1999.
5.9, 1.3, 3.0, 5.9, 4.5, 5.6, 2.1, 6.3, 4.8, 6.9,
5.5, 5.3, 8.0, 4.4, 7.2, 3.2, 4.5, 3.5, 7.2, 6.4
a) Graph these data.
b) Calculate appropriate summary statistics.
c) Write a few sentences about these data. (Remember: shape, center, spread, unusual
features.)
Jawab :
Diketahui Populasi penjara federal di 20 negara bagian timur laut dan barat tengah selama
tahun 1999 adalah sebagai berikut :
5.9, 1.3, 3.0, 5.9, 4.5, 5.6, 2.1, 6.3, 4.8, 6.9,
5.5, 5.3, 8.0, 4.4, 7.2, 3.2, 4.5, 3.5, 7.2, 6.4
a) Grafik dari data di atas adalah sebagai berikut :
Satuan
desimal
1
3
2
1
3
0 2 5
4
4 5 5 8
5
3 5 6 9 9
6
3 4 9
7
2 2
8
0
b) Ringkasan datanya adalah sebagai berikut :
Bila data di atas diurutkan maka tampilannya adalah sebagai berikut :
1.3
2.1
3.0
3.2
3.5
4.4
4.5
4.5
4.8
5.3
5.5
5.6
5.9
5.9
6.3
6.4
6.9
7.2
7.2
8.0
Nilai terkecil = 1,3
Nilai terbesar = 8,0
Kuartil Pertama =
Kuartil Kedua =
Kuartil Ketiga =
3,5 +4,4
=
2
5,3+5,5
2
6,3+6,4
2
7,9
= 5,4
= 6,35
c) Bentuknya mendekati pola simetris. Frekuensi terbanyak pada satuan 5, pusat atau
nilai tengahnya berada pada 5,4 dan penyebaranya hampir merata.
Nomor 41 halaman 77 (Chapter 4)
Gasoline usage. The U.S. Department of Transportation collects data on the amount of
gasoline sold in each state.The following data show the per capita (gallons used per person)
consumption in the year 2000. Using appropriate graphical displays and summary statistics,
write a report on the gasoline use by state in the year 2000.
Jawab :
Diketahui data tentang jumlah bensin yang dijual di setiap state pada tahun 2000 yang
ditampilkan seperti di atas. Apabila data tersebut dibuatkan tabel distribusi frekuensi maka
tampilannya akan menjadi :
Nilai
Fi
Fk
296.66-340.66
2
2
340.67-384.67
1
3
384.68-428.68
3
6
428.69-472.69
15
21
472.70-516.70
12
33
516.71-560.71
14
47
560.72-604.72
3
50
Tampilan grafik yang sesuai dengan data di atas adalah sebagai berikut :
Tampilan Grafik
16
14
12
10
8
6
4
2
0
318,66
362,67
406,68
450,69
494,7
538,71
582,72
Ringkasan datanya adalah :
Nilai terkecil = 296.66
Nilai terbesar = 586.58
i
Rumus dari kuartil n adalah (Qi) = b + p ( 4
n−F
fi
)
Dimana b = batas bawah kelas median, adalah kelas dimana median akan terletak,
p = panjang kelas median
n = ukuran sampel atau banyak data
F=
Fi = jumlah semua frekuensi dengan tanda kelas lebih kecil dari tanda kelas
median.
F = Frekuensi kelas Median
Kuartil Pertama (Q1)
1/4 . n = 1/4 . 50 = 12.5
b = 428.69 – 0.005 = 428.685
p = 472.69 - 428.69 = 44
1
(Q1) = b + p ( 4
n−F
fi
) = 428.685+ 44 (
12.5−6
15
) = 428.685 + 44 (6.5/15) = 447.75
25−21
12
) = 472.695+ 44 (4/12) = 487.36
Kuartil Kedua(Median/Q2)
½ n = ½ . 50 = 25
b = 472.70 – 0.005 = 472.695
p = 516.70 – 472.70 = 44
(Q2) = b + p (
1
2
n−F
fi
) = 472.695+ 44 (
Kuartil Ketiga (Q3)
3/4 . n = 3/4 . 50 = 37.5
b = 516.71 – 0.005 = 516.705
p = 560.71