Penerapan Metode CHAID dan Regresi Logistik dalam Analisis Segmentasi Pasar Konsumen Aqua

PENERAPAN METODE CHAID DAN REGRESI LOGISTIK DALAM
ANALISIS SEGMENTASI PASAR KONSUMEN AQUA

DIMAS FAJAR AIRLANGGA

DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2011

ABSTRAK
DIMAS FAJAR AIRLANGGA. Penerapan Metode CHAID dan Regresi Logistik dalam Analisis
Segmentasi Pasar Konsumen Aqua. Dibimbing oleh BUDI SUSETYO dan AJI HAMIM
WIGENA.
Metode yang umum digunakan untuk menyelesaikan masalah pengklasifikasian adalah metode
CHAID (Chi-square Automatic Interaction Detection) dan regresi logistik. Metode CHAID dapat
menjelaskan hubungan terstruktur antara peubah respon dengan peubah penjelas sehingga
memberikan informasi yang mudah dimengerti, sedangkan regresi logistik dapat menunjukkan
pengaruh terhadap peubah respon dari suatu kategori dalam peubah penjelas yang dibandingkan
dengan kategori referensinya. Penelitian ini bertujuan menerapkan metode CHAID dalam

menganalisis segmentasi pasar konsumen Aqua dan menerapkan regresi logistik untuk menguji
kekonsistenan peubah yang berpengaruh dalam metode CHAID. Hasil CHAID menunjukkan
empat peubah penjelas yang berpengaruh terhadap rencana membeli Aqua, yaitu kota, usia,
pendidikan, dan pengeluaran per bulan. Analisis CHAID menghasilkan dua belas segmen pasar
konsumen Aqua. Pengujian peubah dengan menggunakan analisis regresi logistik pada tiap node
dari dendogram CHAID memberikan hasil yang konsisten.
Kata kunci : metode CHAID, regresi logistik, segmentasi pasar

PENERAPAN METODE CHAID DAN REGRESI LOGISTIK DALAM
ANALISIS SEGMENTASI PASAR KONSUMEN AQUA

DIMAS FAJAR AIRLANGGA

Skripsi
Sebagai salah satu syarat untuk memperoleh gelar Sarjana Statistika
pada Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor

DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR
BOGOR
2011

Judul Skripsi

: Penerapan Metode CHAID dan Regresi Logistik dalam Analisis
Segmentasi Pasar Konsumen Aqua
: Dimas Fajar Airlangga
: G14070027

Nama
NRP

Disetujui

Pembimbing I

Pembimbing II


Dr. Ir. Budi Susetyo, MS
NIP. 196211301986031003

Dr. Ir. Aji Hamim Wigena, M.Sc
NIP. 195209281977011001

Diketahui
Ketua Departemen Statistika
Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor

Dr. Ir. Hari Wijayanto, M.Si
NIP. 196504211990021001

Tanggal Lulus :

RIWAYAT HIDUP
Penulis dilahirkan di Bogor pada tanggal 9 Agustus 1989 sebagai anak pertama dari
pasangan Aryo Prasuko dan Ety Dwiyatmi. Penulis menyelesaikan pendidikan dasar di SD Tunas
Jakasampurna Bekasi pada tahun 2001. Jenjang pendidikan selanjutnya penulis tempuh di Sekolah

Menengah Pertama Negeri 1 Bekasi dan lulus tahun 2004. Pada tahun 2007 penulis menyelesaikan
pendidikannya di Sekolah Menengah Atas Negeri 1 Bekasi dan pada tahun yang sama penulis
diterima sebagai mahasiswa Departemen Statistika Fakultas Matematika dan Ilmu Pengetahuan
Alam Institut Pertanian Bogor melalui Undangan Seleksi Masuk IPB (USMI).
Selama menjadi mahasiswa, penulis aktif dalam kepengurusan Himpunan Profesi Gamma
Sigma Beta periode 2009/2010 sebagai staf divisi science. Dalam bidang akademik, penulis juga
pernah menjadi asisten dosen mata kuliah Agama Kristen Protestan, Kimia Dasar, dan Metode
Statistika. Pada Bulan Februari sampai April 2011, penulis diberi kesempatan untuk melaksanakan
praktik lapang di PT. Grup Riset Potensial.

KATA PENGANTAR
Puji dan syukur penulis panjatkan kepada Tuhan Yang Maha Esa atas segala rahmat dan
karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Karya ilmiah ini merupakan hasil
penelitian penulis dalam rangka memenuhi tugas akhir yang merupakan salah satu syarat untuk
memperoleh gelar Sarjana Statistika pada Departemen Statistika Fakultas Matematika dan Ilmu
Pengetahuan Alam Institut Pertanian Bogor.
Terima kasih penulis ucapkan kepada Bapak Dr. Ir. Budi Susetyo, MS dan Bapak Dr. Ir.
Aji Hamim Wigena, M.Sc selaku pembimbing yang telah memberikan bimbingan dan saran
kepada penulis dalam meyelesaikan penelitian. Penulis mengucapkan terima kasih kepada PT.
Mars Indonesia yang telah mengizinkan penggunaan data untuk penelitian ini. Ungkapan terima

kasih juga disampaikan kepada orang tua dan keluarga atas doa dan dukungannya serta semua
pihak yang telah membantu penulis dalam menyelesaikan karya ilmiah ini.
Semoga karya ilmiah ini bermanfaat.

Bogor, November 2011

Dimas Fajar Airlangga

DAFTAR ISI
Halaman
DAFTAR LAMPIRAN ....................................................................................................... vii
PENDAHULUAN
Latar Belakang.........................................................................................................
Tujuan .....................................................................................................................

1
1

TINJAUAN PUSTAKA
Segmentasi Pasar .....................................................................................................

Metode CHAID ......................................................................................................
Analisis Regresi Logistik .........................................................................................

1
1
2

METODOLOGI
Data .........................................................................................................................
Metode ....................................................................................................................

3
3

HASIL DAN PEMBAHASAN
Analisis CHAID.......................................................................................................
Analisis Regresi Logistik pada Node 0......................................................................
Analisis Regresi Logistik pada Node 1......................................................................
Analisis Regresi Logistik pada Node 2......................................................................
Analisis Regresi Logistik pada Node 3......................................................................

Analisis Regresi Logistik pada Node 4......................................................................
Analisis Regresi Logistik pada Node 13....................................................................

3
5
5
5
5
6
6

KESIMPULAN ..................................................................................................................

6

DAFTAR PUSTAKA .........................................................................................................

6

LAMPIRAN .......................................................................................................................


8

vii

DAFTAR LAMPIRAN
1
2
3
4
5
6
7

Halaman
Dendogram pemisahan hasil analisis CHAID pada taraf nyata 10% .................................. 8
Hasil analisis regresi logistik pada Node 0 ........................................................................ 9
Hasil analisis regresi logistik pada Node 1 ........................................................................ 9
Hasil analisis regresi logistik pada Node 2 ........................................................................ 9
Hasil analisis regresi logistik pada Node 3 ....................................................................... 10

Hasil analisis regresi logistik pada Node 4 ........................................................................ 10
Hasil analisis regresi logistik pada Node 13 ...................................................................... 10

1

PENDAHULUAN
Latar Belakang
Ketersediaan air minum yang layak dan
berkualitas saat ini semakin sulit diperoleh.
Kesulitan tersebut menyebabkan peningkatan
konsumsi Air Minum Dalam Kemasan
(AMDK) sehingga mendorong pertumbuhan
bisnis AMDK di Indonesia. Perusahaan yang
mengelola bisnis AMDK terus melakukan
peningkatan untuk memperluas pangsa pasar
produk-produknya. Aqua sebagai perusahaan
yang mengelola bisnis AMDK, sebaiknya
meningkatkan penjualannya agar dapat
bersaing dengan perusahaan lainnya. Salah
satu cara untuk meningkatkan penjualan

adalah dengan mengetahui segmentasi pasar
konsumen Aqua.
Segmentasi
pasar
bertujuan
mengelompokkan pasar yang besar dan
heterogen ke dalam segmen-segmen pasar
yang lebih kecil dan homogen. Perusahaan
dapat menyesuaikan produk dan strategi
pemasarannya dengan kebutuhan pelanggan
berdasarkan segmen pasar yang dituju.
Dengan demikian segmentasi pasar membantu
perusahaan memusatkan penjualannya pada
segmen yang berpotensial memberikan
keuntungan bagi perusahaan tersebut.
Metode yang sering digunakan dalam
riset pemasaran, khususnya dalam segmentasi
pasar adalah metode CHAID (Chi-square
Automatic Interaction Detection). Metode
CHAID merupakan metode eksplorasi untuk

mengetahui hubungan peubah respon dengan
peubah penjelas serta mendeteksi adanya
interaksi antar peubah penjelas secara
otomatis. Metode lain yang dapat digunakan
untuk menghasilkan klasifikasi adalah regresi
logistik. Regresi logistik digunakan untuk
menjelaskan hubungan antara peubah penjelas
yang berskala kontinu atau kategorik dengan
peubah respon yang berskala kategorik.
Metode CHAID dan regresi logistik
memiliki kelebihan dan kelemahan. Metode
CHAID memiliki kelebihan, yaitu hasilnya
sederhana
berupa
dendogram
yang
menjelaskan hubungan terstruktur antara
peubah respon dengan peubah penjelas
sehingga memberikan informasi yang mudah
dimengerti. Sementara regresi logistik
menghasilkan model yang lebih rumit
dipahami. Kelebihan dari regresi logistik
adalah memiliki nilai rasio odds yang dapat
menunjukkan seberapa besar pengaruh
terhadap peubah respon dari suatu kategori
dalam peubah penjelas yang dibandingkan
dengan kategori referensinya. Sedangkan

metode CHAID tidak memiliki nilai rasio
odds. Dalam penelitian ini, kelebihan dari
metode CHAID dan regresi logistik akan
digunakan untuk menghasilkan analisis
segmentasi pasar yang lebih baik.

1.

2.

Tujuan
Tujuan dari penelitian ini adalah:
Menerapkan metode CHAID untuk
menganalisis
segmentasi
pasar
konsumen Aqua.
Menerapkan regresi logistik untuk
menguji kekonsistenan peubah yang
berpengaruh dalam metode CHAID.
TINJAUAN PUSTAKA

Segmentasi Pasar
Segmentasi
pasar
merupakan
pengelompokkan
individu
(konsumen)
menjadi beberapa kelompok (segmen) di
mana individu yang berada dalam satu
segmen memiliki ciri-ciri atau perilaku yang
relatif sama (homogen) dibandingkan dengan
individu pada kelompok lain (Kotler 2003).
Ada beberapa pendekatan yang digunakan
untuk melakukan segmentasi pasar, yaitu
demografi,
geografi,
dan
psikografi.
Pendekatan demografi meliputi peubah usia,
jenis kelamin, pekerjaan, pendidikan, dan
pendapatan. Pendekatan geografi cenderung
membagi konsumen berdasarkan wilayah
tempat tinggal, sedangkan pendekatan
psikografi meliputi gaya hidup, sikap-sikap,
dan minat konsumen.
Metode CHAID
Metode CHAID (Chi-square Automatic
Interaction Detection) merupakan salah satu
tipe dari decision tree yang menggunakan
kriteria chi-square dalam pengoperasiannya
(Alamudi et al. 1998). CHAID menghasilkan
pohon nonbiner yang dapat diterapkan pada
masalah tipe klasifikasi dan tipe regresi.
Metode CHAID digunakan sebagai metode
eksplorasi nonparametrik untuk mengetahui
peubah-peubah penjelas yang dominan
menjelaskan peubah respon.
Prinsip
metode
CHAID
adalah
memisahkan data menjadi kelompokkelompok melalui tahap-tahap tertentu.
Tahapan ini diawali dengan membagi data
menjadi beberapa kelompok berdasarkan satu
peubah penjelas yang pengaruhnya paling
nyata terhadap peubah respon. Masing-masing
kelompok yang diperoleh diperiksa secara
terpisah untuk membaginya lagi menjadi
beberapa kelompok berdasarkan peubah

2

penjelas. Dengan demikian melalui metode
CHAID dapat diketahui peubah-peubah
penjelas yang pengaruhnya paling nyata
terhadap peubah respon. Algoritma CHAID
adalah sebagai berikut (Kass 1980):
1. Buat tabulasi silang untuk masingmasing kategori peubah penjelas dengan
kategori peubah respon.
2. Buat sub tabulasi silang berukuran 2 × d
yang mungkin tersusun. d adalah
banyaknya kategori peubah respon.
Kemudian tentukan nilai
semua
subtabel tersebut. Dengan ditetapkan,
tentukan nilai
yang terkecil. Jika
, maka kedua kategori
peubah penjelas yang memiliki
digabung menjadi satu kategori. Untuk
peubah ordinal, penggabungan hanya
dapat dilakukan terhadap kategori yang
berurutan.
3. Jika terdapat kategori gabungan yang
terdiri dari tiga atau lebih kategori asal,
maka harus dilakukan pembagian biner
terhadap kategori gabungan tersebut.
Dari pembagian ini ditentukan
terbesar > , maka
terbesar. Jika
pembagian biner berlaku. Kembali ke
tahap 2.
4. Setelah diperoleh penggabungan optimal
untuk setiap peubah penjelas, hitung
nilai-p untuk masing-masing tabel yang
terbentuk. Nilai-p dari tabel yang
mengalami
pengurangan
kategori
dikalikan dengan koreksi Bonferoni
sesuai dengan tipe peubahnya. Jika nilaip terkecil < , maka peubah tersebut
merupakan peubah penjelas yang
pengaruhnya paling nyata bagi peubah
respon.
5. Jika pada tahap 4 diperoleh peubah yang
pengaruhnya paling nyata, kembali ke
tahap 1 untuk setiap bagian data hasil
pemisahan.
Statistik uji yang digunakan adalah
dengan rumus:

dengan:
total baris
total kolom
indeks baris
indeks kolom
nilai sel baris ke-i kolom ke-j
nilai harapan sel baris ke-i kolom ke-j

Koreksi Bonferoni untuk tabel yang
mengalami pengurangan kategori sesuai
dengan tipe peubahnya:
1. Peubah nominal:

2.

Peubah ordinal:

3.

Peubah float:

Analisis Regresi Logistik
Analisis regresi logistik merupakan
analisis yang digunakan untuk memodelkan
hubungan antara peubah respon yang berskala
kategorik dengan peubah penjelas yang
berskala kategorik atau kontinu.
Model regresi logistik dengan p buah
peubah penjelas adalah:

dengan:
Untuk memeriksa peranan peubahpeubah penjelas dalam model, dilakukan
pengujian terhadap parameter model. Uji yang
digunakan adalah statistik uji G dan statistik
uji Wald.
Statistik uji G digunakan untuk menguji
peranan peubah penjelas di dalam model
secara bersama-sama (Hosmer dan Lemeshow
2000). Hipotesis yang diuji adalah:
H0 :
H1 : minimal ada satu
dengan i =
1,2,…,p.
Statistik uji G didefinisikan sebagai:

Statistik uji Wald digunakan untuk
menguji parameter
secara parsial (Hosmer
dan Lemeshow 2000). Hipotesis yang diuji
adalah:
H0 :
dengan i = 1,2,…,p
H1 :
Statistik uji Wald didefinisikan sebagai:

Interpretasi koefisien untuk model ini
dapat dilakukan dengan melihat nilai rasio
oddsnya. Rasio odds adalah ukuran asosiasi
yang
memperkirakan
seberapa
besar
kecenderungan pengaruh peubah-peubah
penjelas terhadap peubah respon. Rasio odds
dapat diinterpretasikan sebagai kecenderungan

3

Y=1 pada X=1 sebesar
pada X=0.

kali dibandingkan

METODOLOGI
Data
Data penelitian ini berasal dari hasil
survei oleh PT. Mars Indonesia. Survei
dilakukan terhadap 2265 responden di tujuh
kota, yaitu Jakarta, Bandung, Semarang,
Surabaya,
Medan,
Makassar,
dan
Banjarmasin.
Peubah respon dalam penelitian ini
adalah rencana konsumen membeli air minum
merek Aqua di mana bernilai 1 untuk
konsumen yang berencana membeli Aqua dan
bernilai 0 untuk konsumen yang tidak
berencana membeli Aqua. Sedangkan peubah
penjelas yang digunakan adalah sebagai
berikut:
1. Kota:
0 = Jakarta
4 = Medan
1 = Bandung
5 = Makassar
2 = Semarang
6 = Banjarmasin
3 = Surabaya
2. Jenis kelamin:
0 = wanita
1 = pria
3. Pendidikan:
0 = SD
3 = diploma
1 = SMP
4 = S1/S2/S3
2 = SMA
4. Rata-rata pengeluaran per bulan:
0 = > Rp 2.000.000
1 = Rp 1.500.001 – Rp 2.000.000
2 = Rp 700.001 – Rp 1.500.000
3 = Rp 500.001 – Rp 700.000
4 = Rp 500.000
5. Status pernikahan:
0 = belum menikah 2 = duda/janda
1 = menikah
6. Pekerjaan:
0 =direktur/profesional/manajer/pemilik
perusahaan
1 = ibu rumah tangga/pensiunan
2 = mahasiswa/pelajar
3 = karyawan/pegawai biasa
4 = guru/tenaga terampil/buruh
5 = lainnya
7. Usia:
0 = < 22 tahun
1 = 22-34 tahun
2 = > 34 tahun

Metode
Langkah-langkah yang dilakukan dalam
penelitian ini adalah:
1. Melakukan analisis CHAID terhadap
peubah respon dan peubah-peubah
penjelasnya.
2. Melakukan interpretasi hasil dari analisis
CHAID.
3. Melakukan analisis regresi logistik pada
tiap node yang dihasilkan dalam analisis
CHAID.
4. Melihat kekonsistenan hasil uji dalam
regresi logistik dengan hasil dari metode
CHAID.
5. Membandingkan hasil analisis dari
metode CHAID dan regresi logistik.
HASIL DAN PEMBAHASAN
Analisis CHAID
Analisis CHAID terhadap tujuh peubah
penjelas menghasilkan dendogram dengan
empat peubah penjelas yang berpengaruh
nyata pada taraf nyata 10%. Peubah-peubah
tersebut adalah kota, usia, pendidikan, dan
pengeluaran per bulan. Terlihat pada
Lampiran 1 bahwa dari 2665 responden
sebesar 1698 responden berencana membeli
Aqua dan 967 responden tidak berencana
membeli.
Peubah pertama yang mengelompokkan
responden adalah kota. Kota membagi
responden ke dalam lima kelompok, yaitu
kelompok pertama adalah Jakarta dan
Surabaya, kelompok kedua adalah Medan,
kelompok ketiga adalah Bandung dan
Semarang, kelompok keempat adalah
Makassar, dan kelompok kelima adalah
Banjarmasin.
Pengelompokan
ini
menunjukkan bahwa Jakarta dan Surabaya
memiliki karakter pasar yang homogen.
Kehomogenan juga terdapat pada karakter
pasar Bandung dan Semarang. Sementara
pada karakter pasar antar kelompok memiliki
perbedaan yang disebabkan adanya interaksi
antar peubah penjelas di tiap kelompok yang
tidak sama. Perbedaan karakter pasar ini
mengakibatkan perusahaan tidak dapat
menerapkan strategi pemasaran yang sama
untuk semua kota.
Konsumen untuk Jakarta dan Surabaya
dibagi menjadi dua kelompok berdasarkan
peubah usia, yaitu konsumen yang berusia di
bawah 22 tahun dan konsumen yang berusia
22 tahun ke atas. Kelompok pertama meliputi
138 responden yang terdiri dari 118 yang
berencana membeli Aqua dan 20 yang tidak
berencana membeli. Kelompok kedua

4

meliputi 872 responden yang terdiri dari 644
yang berencana membeli Aqua dan 228 yang
tidak
berencana
membeli.
Hal
ini
menunjukkan bahwa konsumen dari berbagai
tingkatan usia di Jakarta dan Surabaya
umumnya memiliki rencana membeli Aqua.
Konsumen untuk Medan dibagi dalam
tiga
kelompok
berdasarkan
peubah
pendidikan,
yaitu
konsumen
dengan
pendidikan SD sebesar 33 responden, SMP
sebesar 78 responden, dan di atas SMP
sebesar 196 responden. Pada tiap kelompok
tersebut, responden yang berencana membeli
Aqua terdiri dari kelompok SD sebesar
63.6%, kelompok SMP sebesar 89.7%, dan
kelompok di atas SMP sebesar 79.1%. Dapat
diketahui bahwa konsumen dari berbagai
tingkatan pendidikan di Medan sebagian besar
memiliki rencana membeli Aqua.
Segmentasi konsumen Bandung dan
Semarang dibagi menjadi dua kelompok
berdasarkan peubah pendidikan, yaitu
konsumen yang berpendidikan SD sebesar
111 responden dan konsumen yang
berpendidikan di atas SD sebesar 610
responden. Sebesar 46.8% konsumen yang
berpendidikan SD berencana membeli Aqua,
sedangkan sebesar 66.6% konsumen yang
berpendidikan di atas SD berencana membeli
Aqua. Dapat diketahui bahwa konsumen yang
tidak berencana membeli Aqua umumnya
terdapat pada konsumen yang berpendidikan
SD. Oleh karena itu, perusahaan dapat
memperbaiki strategi pemasarannya untuk
segmen konsumen yang berpendidikan SD
sehingga
ketertarikan
membeli
pada
konsumen tersebut meningkat. Perusahaan
juga dapat memusatkan penjualannya pada
segmen konsumen yang berpendidikan di atas
SD karena sebagian besar konsumen pada
segmen tersebut tertarik membeli Aqua.
Konsumen untuk Makassar dibagi dalam
tiga
kelompok
berdasarkan
peubah
pengeluaran per bulan, yaitu konsumen
dengan pengeluaran per bulan lebih dari Rp
2.000.000, antara Rp 1.500.001 sampai Rp
2.000.000, dan Rp 1.500.000 ke bawah.
Kelompok pertama meliputi 37 responden
yang terdiri dari 24 yang berencana membeli
Aqua dan 13 yang tidak berencana. Kelompok
kedua meliputi 80 responden dan kelompok
ketiga meliputi 204 responden. Sebesar 41.2%
responden dengan pengeluaran per bulan Rp
1.500.001 – Rp 2.000.000 berencana membeli
Aqua,
sedangkan
responden
dengan
pengeluaran per bulan Rp 1.500.000 ke bawah
yang berencana membeli Aqua sebesar 22.1%.

Konsumen dengan pengeluaran per
bulan Rp 1.500.000 ke bawah terbagi lagi
menjadi dua kelompok berdasarkan peubah
usia, yaitu konsumen yang berusia 34 tahun
ke bawah dan konsumen yang berusia di atas
34 tahun. Responden yang berencana membeli
Aqua pada kelompok berusia 34 tahun ke
bawah adalah sebesar 27.9% sedangkan pada
kelompok berusia di atas 34 tahun sebesar
15.1%. Dapat diketahui bahwa konsumen
dengan pengeluaran per bulan Rp 2.000.000
ke bawah umumnya tidak berencana membeli
Aqua. Oleh karena itu, perusahaan dapat
memusatkan penjualan di Makassar pada
segmen konsumen yang memiliki pengeluaran
per bulan lebih dari Rp 2.000.000. Perusahaan
juga
sebaiknya
memperbaiki
strategi
pemasarannya terhadap segmen konsumen
dengan pengeluaran per bulan Rp 2.000.000
ke bawah agar dapat meningkatkan
penjualannya.
Responden yang terdapat di Banjarmasin
sebesar 306 responden yang terdiri dari 130
yang berencana membeli Aqua dan 176 yang
tidak berencana. Dapat diketahui bahwa
konsumen yang tinggal di Banjarmasin
umumnya tidak berencana membeli Aqua.
Oleh karena itu, perusahaan sebaiknya
memperbaiki strategi pemasarannya agar
penjualan Aqua di Banjarmasin meningkat.
Tidak terdapat interaksi antarpeubah penjelas
di Banjarmasin karena tidak ada peubah
penjelas lagi yang nyata.
Analisis CHAID menghasilkan dua belas
segmen pasar konsumen Aqua. Segmen
pertama adalah konsumen yang berada di
Jakarta dan Surabaya dengan usia di bawah 22
tahun. Segmen kedua adalah konsumen yang
berada di Jakarta dan Surabaya dengan usia 22
tahun ke atas. Segmen ketiga adalah
konsumen yang berada di Medan dengan
pendidikan SD. Segmen keempat adalah
konsumen yang berada di Medan dengan
pendidikan SMP. Segmen kelima adalah
konsumen yang berada di Medan dengan
pendidikan di atas SMP. Segmen selanjutnya
adalah konsumen yang berada di Bandung dan
Semarang dengan pendidikan SD. Segmen
ketujuh adalah konsumen yang berada di
Bandung dan Semarang dengan pendidikan di
atas SD. Segmen kedelapan adalah konsumen
yang berada di Makassar dengan pengeluaran
per bulan Rp 1.500.000 ke bawah dan berusia
34 tahun ke bawah. Segmen kesembilan
adalah konsumen yang berada di Makassar
dengan pengeluaran per bulan Rp 1.500.000
ke bawah dan berusia di atas 34 tahun.
Segmen kesepuluh adalah konsumen yang

5

berada di Makassar dengan pengeluaran per
bulan antara Rp 1.500.001 sampai Rp
2.000.000.
Segmen
kesebelas
adalah
konsumen yang berada di Makassar dengan
pengeluaran per bulan lebih dari Rp
2.000.000. Segmen kedua belas adalah
konsumen yang berada di Banjarmasin.
Analisis Regresi Logistik pada Node 0
Pendugaan model regresi logistik dengan
menggunakan prosedur backward elimination
terhadap tujuh peubah penjelas menghasilkan
nilai statistik uji G sebesar 340.994 dengan pvalue sebesar 0.000. Pengujian secara
simultan menunjukkan bahwa model nyata
pada taraf nyata 10% (Lampiran 2).
Pengujian parameter secara parsial
dengan menggunakan statistik uji Wald
menunjukkan bahwa terdapat empat peubah
penjelas yang berpengaruh nyata, yaitu kota,
pendidikan, pengeluaran per bulan, dan usia.
Hasil uji G dan uji Wald menunjukkan bahwa
seluruh peubah penjelas tersebut nyata
sehingga dapat dibentuk model logit sebagai
berikut:

Kota merupakan peubah penjelas yang
berpengaruh paling nyata karena memiliki
nilai statistik uji Wald terbesar. Hasil yang
sama juga didapat dalam metode CHAID,
yaitu peubah penjelas yang memiliki pengaruh
paling nyata terhadap peubah respon adalah
kota. Hal ini menandakan bahwa hasil regresi
logistik pada node 0 memiliki kekonsistenan
dengan hasil yang didapat oleh metode
CHAID.
Interpretasi koefisien parameter dalam
regresi logistik dapat dilihat dari nilai dugaan
rasio odds. Nilai rasio odds dapat
menunjukkan seberapa besar kemungkinan
seorang konsumen di suatu kota dalam
berencana membeli Aqua dibandingkan
dengan konsumen di kota lainnya. Sebagai
contoh, nilai dugaan rasio odds untuk kota
Bandung adalah sebesar 0.548. Hal ini berarti
bahwa
kemungkinan
konsumen
yang
berencana membeli Aqua di Bandung lebih
sedikit 0.548 kali daripada konsumen di
Jakarta.

Analisis Regresi Logistik pada Node 1
Pendugaan model regresi logistik pada
node 1 (Jakarta dan Surabaya) menghasilkan
peubah usia sebagai peubah penjelas yang
berpengaruh nyata terhadap peubah respon
pada taraf nyata 10% (Lampiran 3). Peubah
usia juga memiliki pengaruh nyata terhadap
peubah respon dalam analisis CHAID. Hal ini
menandakan bahwa terjadi kekonsistenan
antara hasil dari regresi logistik pada node 1
dengan hasil metode CHAID.
Interpretasi nilai rasio odds untuk usia
antara 22 tahun sampai 34 tahun adalah
peluang konsumen di Jakarta dan Surabaya
yang berusia antara 22 tahun sampai 34 tahun
untuk membeli Aqua lebih sedikit 0.512 kali
daripada konsumen dengan usia di bawah 22
tahun. Nilai dugaan rasio odds untuk usia
lebih dari 34 tahun sebesar 0.457, artinya
peluang konsumen di Jakarta dan Surabaya
dengan usia lebih dari 34 tahun yang
berencana membeli Aqua lebih sedikit 0.457
kali dibandingkan dengan konsumen dengan
usia di bawah 22 tahun.
Analisis Regresi Logistik pada Node 2
Hasil pendugaan model regresi logistik
pada node 2 (Medan) menunjukkan peubah
pendidikan sebagai peubah penjelas yang
berpengaruh nyata terhadap peubah respon
pada taraf nyata 10% (Lampiran 4). Hasil dari
analisis CHAID juga menunjukkan peubah
pendidikan berpengaruh nyata terhadap
peubah respon. Dari hasil kedua metode
tersebut dapat diketahui bahwa hasil regresi
logistik pada node 2 konsisten dengan metode
CHAID.
Interpretasi dugaan rasio odds untuk
pendidikan SMP adalah peluang konsumen di
Medan dengan pendidikan SMP yang
berencana membeli Aqua lebih banyak 5 kali
daripada konsumen dengan pendidikan SD.
Sementara interpretasi dugaan rasio odds
untuk pendidikan SMA adalah peluang
konsumen di Medan yang berpendidikan
SMA untuk membeli Aqua lebih banyak
2.106 kali dibandingkan dengan konsumen
dengan pendidikan SD.
Analisis Regresi Logistik pada Node 3
Pendugaan model regresi logistik pada
node
3
(Bandung
dan
Semarang)
menghasilkan peubah pendidikan sebagai
peubah penjelas yang berpengaruh nyata pada
taraf nyata 10% (Lampiran 5). Pada metode
CHAID
juga
menghasilkan
peubah
pendidikan sebagai peubah penjelas yang
memiliki pengaruh nyata terhadap peubah

6

respon. Dari hasil kedua metode menunjukkan
bahwa terjadi kekonsistenan antara hasil
regresi logistik pada node 3 dengan metode
CHAID.
Nilai dugaan rasio odds yang dihasilkan
untuk pendidikan SMP sebesar 2.250, artinya
bahwa kemungkinan konsumen di Bandung
dan Semarang yang berpendidikan SMP untuk
membeli Aqua lebih banyak 2.250 kali
daripada konsumen yang berpendidikan SD.
Sementara interpretasi nilai rasio odds untuk
pendidikan SMA adalah peluang konsumen di
Bandung dan Semarang dengan pendidikan
SMA yang berencana membeli Aqua lebih
banyak 1.873 kali dibandingkan dengan
konsumen dengan pendidikan SD.
Analisis Regresi Logistik pada Node 4
Hasil pendugaan model regresi logistik
pada node 4 (Makassar) menunjukkan peubah
pengeluaran per bulan sebagai peubah
penjelas berpengaruh nyata terhadap peubah
respon pada taraf nyata 10% (Lampiran 6).
Dari dendogram dapat diketahui peubah
pengeluaran per bulan juga merupakan peubah
penjelas yang memiliki pengaruh nyata pada
metode CHAID. Hal ini menunjukkan bahwa
terjadi kekonsistenan pada hasil dari kedua
metode tersebut.
Sebagai contoh, nilai dugaan rasio odds
untuk pengeluaran per bulan antara Rp
1.500.001 sampai Rp 2.000.000 adalah
sebesar 0.380, artinya peluang konsumen di
Makassar yang memiliki pengeluaran per
bulan antara Rp 1.500.001 sampai Rp
2.000.000 untuk membeli Aqua lebih sedikit
0.380 kali daripada konsumen dengan
pengeluaran per bulan lebih dari Rp
2.000.000. Sementara dugaan rasio odds
untuk pengeluaran per bulan antara Rp
700.001 sampai Rp 1.500.000 dapat
diinterpretasikan bahwa peluang konsumen
dengan pengeluaran per bulan antara Rp
700.001 sampai Rp 1.500.000 di Makassar
yang berencana membeli Aqua lebih sedikit
0.179 kali daripada konsumen dengan
pengeluaran per bulan lebih dari Rp
2.000.000.
Analisis Regresi Logistik pada Node 13
Pendugaan model regresi logistik pada
node 13 menghasilkan peubah usia sebagai
peubah penjelas yang berpengaruh nyata pada
taraf nyata 10% (Lampiran 7). Peubah usia
juga memiliki pengaruh nyata terhadap
peubah respon dalam analisis CHAID. Hal ini
menandakan bahwa hasil dari regresi logistik

pada node 13 konsisten dengan hasil metode
CHAID.
Nilai dugaan rasio odds yang dihasilkan
untuk usia lebih dari 34 tahun sebesar 0.295.
Hal ini berarti bahwa kemungkinan konsumen
di Makassar yang memiliki pengeluaran per
bulan Rp 1.500.000 ke bawah dan berusia
lebih dari 34 tahun untuk membeli Aqua lebih
sedikit 0.295 kali daripada konsumen dengan
pengeluaran per bulan Rp 1.500.000 ke bawah
dan berusia di bawah 22 tahun.
KESIMPULAN
Hasil CHAID menunjukkan bahwa
peubah yang berpengaruh terhadap rencana
membeli Aqua, yaitu kota, usia, pendidikan,
dan pengeluaran per bulan. Analisis CHAID
menghasilkan dua belas segmen pasar
konsumen Aqua. Pengujian peubah dengan
menggunakan analisis regresi logistik pada
tiap
node
dari
dendogram
CHAID
memberikan hasil yang konsisten.
Konsumen yang berada di Medan
memiliki peluang lebih besar dalam berencana
membeli Aqua daripada konsumen di kota
lainnya. Di Jakarta dan Surabaya, konsumen
yang berusia 22 tahun ke atas memiliki
kemungkinan lebih sedikit dalam berencana
membeli Aqua daripada konsumen dengan
usia di bawah 22 tahun. Konsumen di Medan,
Bandung, dan Semarang dengan pendidikan di
atas SD berpeluang lebih besar dalam
berencana membeli Aqua daripada konsumen
dengan pendidikan SD. Konsumen di
Makassar dengan pengeluaran per bulan lebih
dari Rp 2.000.000 memiliki peluang lebih
besar dalam berencana membeli Aqua
daripada konsumen dengan pengeluaran per
bulan Rp 2.000.000 ke bawah. Kemungkinan
konsumen di Makassar dengan usia 22 tahun
ke atas dan pengeluaran per bulan Rp
1.500.000 ke bawah yang berencana membeli
Aqua lebih sedikit daripada konsumen yang
berusia di bawah 22 tahun dan pengeluaran
per bulan Rp 1.500.000 ke bawah.
DAFTAR PUSTAKA
Alamudi A, Wigena AH, Aunuddin. 1998.
Eksplorasi Struktur Data Menggunakan
Metode CHAID. Forum Statistika dan
Komputasi. Institut Pertanian Bogor.
ISSN: 0853 8115.
Hosmer DW, Lemeshow S. 2000. Applied
Logistic Regression. Second Edition.
New York: John Wiley and Sons.

7

Kass GV. 1980. An Exploratory Technique
for Investigating Large Quantities of
Categorical Data. Appl. Statist. 29, No.
2: 119-127.
Kotler P. 2003. Marketing Management.
Eleventh Edition. New Jersey: Pearson
Education.

LAMPIRAN

Lampiran 1 Dendogram pemisahan hasil analisis CHAID pada taraf nyata 10%.

8

9

Lampiran 2 Hasil analisis regresi logistik pada Node 0
Peubah

Standard
Error

Beta

Kota

Statistik
Uji Wald
252.043

Derajat
bebas
6

Nilai-p

Rasio Odds

.000

Kota(1)

-.602

.142

17.858

1

.000

.548

Kota(2)

-.615

.155

15.811

1

.000

.541

Kota(3)

-.130

.150

.753

1

.386

.878

Kota(4)

.235

.174

1.832

1

.176

1.265

Kota(5)

-1.931

.158

149.478

1

.000

.145

Kota(6)

-1.457

.153

90.491

1

.000

.233

10.255

4

.036

Pendidikan (1)

.187

.137

1.868

1

.172

1.205

Pendidikan (2)

.051

.125

.165

1

.684

1.052

Pendidikan (3)

.136

.232

.346

1

.556

1.146

Pendidikan (4)

.679

.237

1.972

Pendidikan

Pengeluaran per bulan

8.199

1

.004

20.838

4

.000

Pengeluaran per bulan (1)

-.142

.142

1.010

1

.315

.867

Pengeluaran per bulan (2)

-.418

.130

10.349

1

.001

.659

Pengeluaran per bulan (3)

-.615

.161

14.521

1

.000

.541

Pengeluaran per bulan (4)

-.651

.352

3.432

1

.064

.521

4.643

2

.098

2.364

1

.124

Usia
Usia(1)

-.210

.136

.811

Usia(2)

-.280

.130

4.637

1

.031

.756

Constant

1.578

.206

58.476

1

.000

4.846

Lampiran 3 Hasil analisis regresi logistik pada Node 1
Peubah

Beta

Standard
Error

Usia

Statistik
Uji Wald

Derajat
bebas

Nilai-p

8.978

2

.011

Rasio Odds

Usia(1)

-.669

.270

6.123

1

.013

.512

Usia(2)

-.784

.262

8.978

1

.003

.457

Constant

1.775

.242

53.877

1

.000

5.900

Rasio
Odds

Lampiran 4 Hasil analisis regresi logistik pada Node 2
Peubah

Beta

Standard
Error

Pendidikan

Statistik
Uji Wald

Derajat
bebas

Nilai-p

10.568

4

.032

Pendidikan (1)

1.609

.520

9.585

1

.002

5.000

Pendidikan (2)

.745

.409

3.317

1

.069

2.106

Pendidikan (3)

.604

.627

.926

1

.336

1.829

Pendidikan (4)

1.743

1.109

2.468

1

.116

5.714

Constant

.560

.362

2.391

1

.122

1.750

10

Lampiran 5 Hasil analisis regresi logistik pada Node 3
Peubah

Beta

Standard
Error

Statistik
Uji Wald

Derajat
bebas

Nilai-p

12.116

4

.017

Pendidikan

Rasio Odds

Pendidikan (1)

.811

.245

10.971

1

.001

2.250

Pendidikan (2)

.628

.230

7.429

1

.006

1.873

Pendidikan (3)

.809

.434

3.467

1

.063

2.245

Pendidikan (4)

.873

.427

4.180

1

.041

2.393

Constant

.034

.283

.015

1

.904

1.035

Lampiran 6 Hasil analisis regresi logistik pada Node 4
Peubah

Beta

Standard
Error

Statistik
Uji Wald

Derajat
bebas

Nilai-p

29.053

4

.000

Pengeluaran per bulan

Rasio Odds

Pengeluaran per bulan (1)

-.967

.413

5.492

1

.019

.380

Pengeluaran per bulan (2)

-1.722

.400

18.517

1

.000

.179

Pengeluaran per bulan (3)

-1.999

.494

16.411

1

.000

.135

Pengeluaran per bulan (4)

-2.606

.705

13.649

1

.000

.074

.613

.344

3.170

1

.075

1.846

Constant

Lampiran 7 Hasil analisis regresi logistik pada Node 13
Peubah

Beta

Standard
Error

Usia

Statistik
Uji Wald

Derajat
bebas

Nilai-p

6.939

2

.031

Rasio Odds

Usia(1)

-.639

.450

2.016

1

.156

.528

Usia(2)

-1.220

.466

6.841

1

.009

.295

Constant

-.511

.365

1.957

1

.162

.600