PENDEKATAN DATA KORPUS DALAM PENGAJARAN

National Conference of Research on Language Education 2016

PENDEKATAN DATA KORPUS DALAM PENGAJARAN DAN
PEMBELAJARAN BAHASA MELAYU
Ahmad Harith Syah B. Md. Yusuf1, Zuraidah bt Mohd Sulaiman2, Hoo Fang Jing3,
Raihan Ibrahim4

ABSTRAK
Secara tradisinya, penggunaan buku tatabahasa sebagai rujukan utama dari sudut
pengajaran dan pembelajaran (P&P) bahasa di dalam bilik darjah bagi memahami aspek
tatabahasa tertentu bukanlah sesuatu yang janggal. Namun, dunia P&P hari ini begitu
berbeza ditambah dengan kemajuan dan perkembangan teknologi perkomputeran.
Perkembangan dan kemajuan ini telah membuka prospek baharu dari sudut P&P khususnya
P&P bahasa Melayu. Melalui perkembangan ini, korpus linguistik telah dibangunkan yang
pada asalnya menyajikan data autentik untuk penyelidikan bahasa dan linguistik, namun
telah mengorak langkah kepada pengaplikasian metode di dalam P&P bahasa. Sejak 30
tahun yang lalu, penggunaan korpus linguistik dalam sesi P&P telah mula menampakkan
kerelevanan walaupun pada peringkat awalnya korpus linguistik masih belum digunakan
secara meluas di dalam P&P (Varley, 2008). Relevannya korpus linguistik di dalam P&P
dinyatakan oleh Maddalena (2001) bahawa penggunaan contoh-contoh bahasa yang
sebenar di dalam korpus linguistik lebih memanfaatkan pelajar berbanding contoh-contoh

yang dibuat-buat oleh guru yang tidak menggambarkan bentuk-bentuk bahasa yang lebih
asli. Dengan mengaplikasikan bentuk-bentuk barisan konkordan, makna imbuhan awalan
peN-1 dijana dengan menggunakan perisian AntConc bagi meneliti kerencaman makna yang
ada di dalam data korpus berbanding dengan makna yang diberikan di dalam buku
tatabahasa. Melalui penelitian dan analisis konkordan, para pelajar dapat mempelajari
pelbagai maklumat kebahasaan khususnya yang berkait dengan kedinamikan dan
kepelbagaian makna berdasarkan data-data sebenar.
Kata Kunci:
Data Korpus, Korpus Linguistik, Pengajaran dan Pembelajaran, Bahasa Melayu, Konkordan
& Kolokasi

PENGENALAN
1

Kajian mengenai imbuhan peN- (Ahmad Harith Syah, 2008; Nor Hashimah Jalaluddin & Ahmad Harith Syah, 2009) telah
dilakukan sebelum ini dengan tumpuan diberikan kepada aspek semantik dan pragmatik. Justeru, dengan mengambil kira
dapatan kajian tersebut, kertas ini melanjutkan lagi penelitian dengan menumpukan kepada P&P bahasa Melayu melalui
pendekatan data korpus khususnya yang berkait dengan konkordan dan kolokasi imbuhan tersebut.

National Conference of Research on Language Education 2016


Proses pengajaran dan pembelajaran (P&P) bahasa Melayu menekankan penggunaan
tatabahasa mengikut kemampuan pelajar melalui gabungan beberapa kemahiran, iaitu
mendengar, bertutur, membaca dan menulis. Penguasaan yang baik dalam tatabahasa
dapat membantu pelajar mengujarkan bahasa dengan wacana yang sempuna sejajar
dengan peringkat umur dan memupuk daya pengembangan berbahasa bagi kepentingan
pendidikan tinggi dan seterusnya ketika menceburi dunia pekerjaan. Bagi memastikan
matlamat ini tercapai seseorang pendidik perlu merancang dan memilih aspek tatabahasa
sebagai bahan pengajaran berserta contoh penggunaannya dalam konteks dan kegiatan
bahasa yang benar-benar sesuai dan bermakna.
Pendidik bahasa hendaklah melakukan pengolahan teknik pengajaran dengan berbantukan
bahan berteknologi yang bertujuan untuk merangsang pelajar berfikir secara kritis dalam
proses pembelajaran bahasa (Zaitul Azma 2010).
Perkembangan teknologi terkini
khususnya yang melibatkan pengajaran dan pembelajaran bahasa berbantukan komputer
(computer assisted language learning/CALL) telah membuka ruang dan pendekatan baharu
yang berupaya memberi impak pengajaran yang lebih positif dan terkini. Pendekatan atau
metodologi baharu ini bukan sahaja dapat memanfaatkan pelajar, malah ia berupaya
membantu guru atau pensyarah untuk menjadi lebih kreatif dan inovatif semasa sesi P&P.
Dengan mengambil kira metodologi dan perkembangan teknologi hari ini, pembinaan

pangkalan data korpus telah menjadikan data ini sebagai sumber yang begitu berguna
bukan sahaja di dalam penyelidikan linguistik, malah berguna kepada pedagogi bahasa. Ini
dinyatakan oleh Woolard (2000) bahawa korpus bahasa sememangnya menjadi asas
kepada penghasilan kamus dan sebagai bahan-bahan pengajaran.
Menyedari hakikat ini, penggunaan teknik yang tepat, menarik dan terkini yang bersifat
kontemporari sangatlah dituntut. Satu daripada contoh bahan bantu berteknologi yang boleh
digunakan ialah penggunaan komputer dan perisiannya. Aplikasi data korpus berkomputer
dalam bidang pedagogi bahasa (Teaching Collocation), leksikografi dan kajian linguistik
dilihat menjadi metode terkini yang berupaya mengukuhkan proses P&P bahasa Melayu.
Pendekatan ini sebenarnya telah lama digunakan secara meluas di Barat seiring dengan
kehendak dan perkembangan teknologi yang boleh dimanfaatkan selain dapat membantu
memeri nahu bahasa dengan lebih sistematik dan efisien. Di Malaysia, data korpus
berkomputer digunakan secara aktif dalam bidang perkamusan terutamanya oleh pihak
Dewan Bahasa dan Pustaka. Kemajuan ini telah membuka prospek baharu dalam
mewujudkan impak dan penggunaan yang positif dalam kalangan pendidik bahasa.
Menurut J. McH. Sinclair (1996), data korpus berkomputer boleh ditakrifkan sebagai korpus
yang diberi penanda, kod dan diformatkan secara piawai serta dapat dicapai dan diproses
dengan komputer. Kamus linguistik (1997) menjelaskan bahawa korpus merupakan data
mentah linguistik yang dikutip daripada kerja lapangan atau teks bertulis dan dianalisis untuk
membuat penyataan saintifik mengenai ciri-ciri fonologi, tatabahasa atau leksikal sesuatu

bahasa. Cirswell (1989) melihat bahawa penggunaan data korpus berkomputer
memudahkan penyampaian bahan serta menggalakkan penglibatan pelajar secara lebih
aktif.

National Conference of Research on Language Education 2016

Melalui data korpus berkomputer, korpus linguistik yang diwujudkan mengetengahkan satu
alternatif baharu bahan bantu mengajar termasuklah aspek imbuhan sebagai komponen
utama dalam pedagogi bahasa Melayu. Menerusi data korpus ini para pendidik dapat
menggambarkan bentuk-bentuk imbuhan yang lebih baik dan asli. Imbuhan dapat dijana
melalui korpus dengan lebih mudah sama ada dalam bentuk baris-baris konkordan, ayat
mahupun perenggan.
SOROTAN KOSA ILMU
Dalam bahagian ini, perbincangan lebih menumpukan kepada pemanfaatan data korpus
oleh para pengkaji khususnya dalam pengajaran dan pembelajaran bahasa. Melalui sorotan
ilmiah ini, kita akan dapati bahawa terdapat pelbagai pendekatan yang boleh digunakan
dengan tujuan untuk menjadikan P&P bahasa (sama ada bahasa Melayu atau bahasa
Inggeris) menjadi lebih kreatif, inovatif dan bervariasi. Pada masa yang sama, para pelajar
dapat melayari sendiri data-data berkonteks secara induktif mahupun deduktif.
Minat terhadap pengaplikasian korpus linguistik ke atas pedagogi bahasa mula meningkat

sekitar tahun 1990-an. Peningkatan jumlah kosa ilmu melalui penerbitan jurnal artikel
dengan memfokuskan kepada pengajaran dan pembelajaran korpus melalui Persidangan
Antarabangsa Pengajaran dan Pembelajaran Korpus yang dianjurkan di Lancaster, Oxford,
Graz, Bertinoro, Granada, Paris, dan Lisbon (McEnery & Xiao 2010) telah menunjukkan
bahawa korpus linguistik mempunyai peranan penting dan khusus di dalam P&P bahasa.
Antara pengkaji yang menjalankan kajian seperti ini meliputi Wichmann et. al. (1997),
Partington (1998), Bernardini (2000), Burnard & McEnery (2000), Kettemann & Marko (2002,
2006), Aston (2001), Ghadessy, Henry, & Roseberry (2001), Hunston (2002), Granger et al
(2002), Connor & Upton (2002), Tan (2002), Sinclair (2003, 2004), Aston et. al. (2004),
Mishan (2005), Nesselhauf (2005), Römer (2005), Braun, Kohn & Mukherjee (2006), Gavioli
(2006), Scott & Tribble (2006), Hidalgo, Quereda & Santana (2007), O’Keeffe, McCarthy &
Carter (2007), Aijmer (2009), dan Campoy, Gea-valor & Belles-Fortuno (2010). Kajian-kajian
mereka ini meliputi penggunaan korpus di dalam pedagogi bahasa. Antaranya seperti
pendeskripsian bahasa berasaskan korpus, analisis korpus di dalam bilik darjah dan
penyelidikan korpus pelajar (Keck 2004).
Dalam kajian Campillos et.al (2007), mereka mengaplikasikan kaedah pengajaran dan
pembelajaran berasaskan web (web-based) dengan menggunakan data korpus dari
subkorpus bahasa Sepanyol (C-ORAL-ROM) dengan tujuan untuk mendedahkan
penggunaan bahasa sebenar dan bersifat spontan kepada pelajar-pelajar kategori
pertengahan dan lanjutan. Sampel bahasa yang diaplikasikan meliputi tatabahasa bahasa

Sepanyol, kandungan leksikal dan kandungan komunikasi. Bunyi-bunyi bahasa dan
transkripsi bahasa digunakan berdasarkan beberapa ciri-ciri seperti tahap kesukaran,
tatabahasa, fungsi komunikatif, perbendaharaan kata, kelajuan pertuturan dan diksi. Melalui
pengaplikasian pengajaran berasaskan web yang dilakukan ini, ia bukan sahaja memberi
kelebihan kepada penggunaan korpus di dalam kajian linguistik aplikasi, malah teknologi
perkomputeran seperti web-based mampu melengkapkan kaedah atau metodologi di dalam
pedagogi bahasa.

National Conference of Research on Language Education 2016

Pengaplikasian pembelajaran berasaskan korpus atau “data-driven learning” (john 1986,
1994) di dalam pengajaran dan pembelajaran bahasa Inggeris untuk tujuan khusus (ESP)
membenarkan pelajar untuk meneroka sendiri data secara hand-on di samping menawarkan
pendekatan berasaskan inkuiri (inquiry-based approach) dalam meneroka corak
penggunaan bahasa sebenar dan menjadikan mereka (pelajar) sebagai penyelidik (John
2002) yang berupaya untuk menyelesaikan permasalahan linguistik. Dalam kajian Marza
(2014) yang berfokus kepada pembelajaran ESP (bahasa Inggeris untuk pelancongan),
kajian ini menumpukan kepada pengaplikasian data korpus khusus COMETVAL (Corpus
Multilingüe de Turismo de la Universidad de Valencia) yang dilihat mempunyai pelbagai
fungsi dan peranan dalam proses pembelajaran bahasa asing untuk tujuan khusus.

Seramai 25 orang pelajar terlibat di dalam kajian rintis ini. Dengan menjalankan beberapa
bengkel yang menerapkan pelbagai aktiviti berasaskan korpus, para pelajar didedahkan
dengan fungsi data dan aplikasi profesional data tersebut. Para pelajr juga diberi boring
soal selidik yang direka secara ad hoc dengan tujuan untk mengetahui persepsi mereka
mengenai penggunaan data korpus khusus. Dapatan menunjukkan para pelajar begitu
positif dan bermotivasi tentang penggunaan data korpus di dalam kelas kerana data yang
mempunyai pelbagai genre tersebut dilihat lebih asli dan tidak bias.
Dalam kajian Bloch (2009) pula, beliau menggunakan program konkordan berasaskan web
dengan tujuan untuk membantu para pelajar untuk membuat pemilihan kesesuaian kata
kerja yang digunakan untuk membuat laporan dan tindakan semasa bertutur atau berucap
(reporting verbs). Menurut beliu, kata kerja ini penting khususnya dalam membuat sebarang
bentuk penegasan di dalam penulisan akademik. Melalui program tersebut, satu bentuk
antara muka (interface) direka bagi membolehkan para pelajar membuat pemilihan
perkataan, ayat dan retorik berdasarkan kriteria yang berkait dengan pemilihan penulis
dalam memilih kata kerja tersebut. Berdasarkan pemillihan tersebut, program tersebut akan
membuat carian ayat di dalam pangkalan data yang diperolehi daripada korpus penulisan
akademik. Di sini, para pelajar akan disediakan dengan sampel ayat yang sepadan dengan
kriteria yang dipilih dengan kata kerja tersebut. Melalui perbincangan yang dibuat, andaian
mengenai pedagogi bagi tujuan pembelajaran kelas kata kerja tersebut memberi impak
positif apabila ia digabungkan ke dalam reka bentuk program berasaskan web, dan

implementasi program konkordan dan P&P tatabahasa dan perbendaharaan kata berjaya
dilaksanakan dengan baik di dalam kelas penulisan akademik bahasa kedua.
Dengan menggunakan model multi-perspektif analisis wacana (perspektif tekstual,
perspektif genre dan perspektif sosal) (Bhatia 2002), Pérez-Llantada (2009) membuat
pendeskripsian pendekatan korpus untuk pengajaran dan pembelajaran tatabahasa
pertuturan bahasa Inggeris untuk tujuan akademik. Melalui perspektif tektual, para pelajar
dapat mengenal pasti item tatabahasa melalui statistik frekuensi, corak kolokasi, makna
peka-konteks dan penggunaan perkataan di dalam wacana. Melalui perspektif genre pula,
data korpus mendedahkan pelajar kepada leksiko-tatabahasa merentasi genre atau jenisjenis teks akademik yang berbeza. Berdasarkan perspektif yang ketiga yang melibatkan
perspektif sosial, model korpus boleh digunakan bagi tujuan untuk meningkatkan kesedaran
pelajar mengenai peranan penutur yang berbeza wacana, keistimewaan wacana dan status
pemilihan tatabahasa. Melalui P&P berasaskan korpus ini, para pelajar didedahkan dengan
output linguistik, dan menyediakan komen terhadap tindak balas pelajar mengenai
metodologi ini. Dapatan data melalui proses penilaian mencadangkan bahawa korpus yang
dianalisis berasaskan model multi-perspektif (Bhatia 2002) boleh menghasilkan beberapa
pendekatan di dalam P&P seperti maklum balas pelajar yang positif melalui input dan
sampel tatabahasa yang autentik, membantu para pelajar untuk mengenal pasti dan

National Conference of Research on Language Education 2016


memahami teks, genre dan aspek sosial tatabahasa dalam konteks sebenar, dan berupaya
membangunkan keupayaan pelajar untuk mengaplikasikan tatabahasa yang tepat dan
wajar. Melalui penelitian ini, menerima arahan tatabahasa melalui data korpus sedikit
sebanyak berupaya membantu para pelajar untuk berkomunikasi secara efektif dan
memahami realiti dunia wacana.
Selain itu, pedagogi bahasa Melayu tidak terlepas daripada pengaplikasian pendekatan
korpus linguistik. Dalam kajian Hishamudin, Faizah dan Mashetoh (2014), mereka
menyatakan kewajaran penggunaan data korpus sebagai sebahagian daripada penulisan
ilmiah pelajar-pelajar tingkatan 6 bagi sukatan pelajaran bahasa Melayu. Penulisan ilmiah
yang dimaksudkan merupakan kompenan baharu yang diperkenalkan dalam sukatan
pelajaran bahasa Melayu tingkatan 6. Bagi mereka, pemanfaatan data korpus pada skala
yang kecil (sesuai dengan tahap pengajian Sijil Tinggi Persekolahan Malaysia) mampu
membina kajian rintis khususnya dalam memahami, mengenal pasti, mengklasifikasikan,
menghuraikan dan menjelaskan fenomena kebahasaan sekaligus mampu membina
kemahiran kognitif, manipulatif dan kemahiran insaniah pelajar. Selain itu, data korpus juga
diaplikasikan dalam kelas oleh pelajar dalam membuat penelitian leksikografi. Dalam kajian
yang dibuat oleh Intan Syafinaz, Nor Hashimah dan Khairul Taufiq (2014), para pelajar
diperkenalkan dengan korpus bahasa Melayu (data korpus DBP-UKM) dan teori Frame
Semantics (Fillmore et.al. 2003) bagi tujuan untuk meneliti makna perkataan berdasarkan
teori tersebut. Penelitian tersebut mendapati bahawa data korpus dan teori yang digunakan

begitu membantu para pelajar dalam mengkaji entri kata kerja ‘memerlukan’ dan ‘mencari’,
yang merupakan kata kerja berfrekuensi paling tinggi. Dapatan para pelajar melalui
praktikal di dalam kelas tersebut dapat memberi satu penemuan yang menarik di samping
mencadangkan Frame Semantics sebagai salah satu teori yang dapat membantu bidang
leksikografi. Pada masa yang sama, ia turut menyediakan latihan praktikal secara hands-on
kepada pelajar-pelajar linguistik.
Selain itu, Lay dan Hui (2011) telah membina satu pangkalan Data Korpus Kata Bahasa
Melayu untuk digunakan bagi pelajar-pelajar sekolah rendah. Sistem atas talian ini
mengandungi maklumat buku teks bahasa Melayu yang digunakan di sekolah antaranya
seperti maklumat-maklumat linguistik yang berkaitan dengan pembelajaran bahasa. Mereka
mensasarkan pengguna data korpus ini melibatkan guru, guru pendidikan khas, ibu bapa,
dan penyelidik sama ada untuk tujuan penyelidikan atau pengajaran dan pembelajaran.
Pada masa yang sama, pembangunan data korpus ini turut membuktikan keberkesanannya
dalam penyelidikan dan pendidikan khususnya apabila melibatkan guru-guru yang mengajar
murid-murid disleksia.
Dengan mengambil kira tujuan asal pembinaan data korpus, ia bukan sahaja telah
memanfaatkan kajian-kajian linguistik, malah melalui beberapa sorotan kosa ilmu
memerlihatkan korpus digital ini mula menapak di dalam pedagogi bahasa. Pengaplikasian
pelbagai pendekatan membolehkan P&P bahasa menjadi lebih inovatif dan terkini.
KEPENTINGAN KAJIAN


National Conference of Research on Language Education 2016

Kajian ini cuba memperlihatkan aplikasi data korpus berkomputer sebagai satu teknik
alternatif yang terkini dan berinovasi untuk dipraktikkan dalam sesi P&P tatabahasa Melayu.
Secara umumnya, kajian ini akan menumpukan penggunaan perisian AntConc, iaitu
program yang digunakan untuk mengumpul, memproses dan menganalisis data. Bentuk
konkordan makna imbuhan awalan peN- akan dijana bagi memperlihatkan kedinamikan dan
kepelbagaian makna bersandarkan data-data sebenar korpus berkomputer. Melalui bentuk
konkordan ini, kerencaman makna yang terdapat dalam data korpus dengan makna yang
diberikan di dalam buku tatabahasa juga dapat diteliti.
DATA KORPUS
Dasarnya, istilah korpus, data korpus atau korpus berkomputer merupakan istilah-istilah
bersinonim yang sering digunakan dalam penyelidikan linguistik. Kamus Linguistik (1997)
mendefinisikan korpus sebagai data mentah linguistik yang dikutip daripada kerja lapangan
atau teks bertulis, dan dianalisis untuk membuat penyataan saintifik tentang ciri fonologi,
tatabahasa, atau leksikal sesuatu bahasa. Kamus Dewan Edisi Ketiga (1994) pula memberi
maksud sebagai himpunan makalah (tulisan dan sebagainya) mengenai sesuatu perkara
tertentu atau kumpulan bahan untuk kajian (seperti kumpulan contoh penggunaan kata).
Selain itu, Crystal (1997) menyatakan bahawa data korpus merupakan koleksi data
linguistik, sama ada teks bertulis atau transkripsi ucapan yang dirakamkan yang boleh
digunakan sebagai titik permulaan pemerian linguistik atau sebagai cara mengesahkan
hipotesis tentang bahasa.
Selain itu, disenaraikan juga beberapa definisi yang diberikan oleh tokoh-tokoh linguistik
mengenai data korpus. Antaranya seperti berikut:
“A corpus is a collection of pieces of language that are selected and
ordered according to explicit linguistic criteria in order to be used as a
sample of the language” (Butler 2004)
“A collection of texts in an electronic database … necessarily consist of
structured collection of text specifically compiled for linguistic analysis, that
they are large or that they attempt to be representative of a language as a
whole” (Kennedy 1998)
“Collection of texts assumed to be representative of a give language put
together so that it can be used for linguistics analysis”
(Tognini-Bonelli 2001)
“A collection of sampled text, written and spoken, in machine-readable
form which may be annotated with various forms of linguistics information”
(McEnery, Xiao & Tono 2006)
Berdasarkan definisi-definisi yang diberikan seperti di atas, dapat disimpulkan bahawa data
korpus merupakan data mentah linguistik sama ada lisan mahupun tulisan yang

National Conference of Research on Language Education 2016

mengandungi pelbagai maklumat-maklumat kebahasaan. Maklumat-maklumat kebahasaan
ini dapat dirungkai dengan mengaplikasikan pelbagai bentuk kajian dan pendekatan. Data
yang disimpan secara digital ini juga mampu dicapai dalam skala yang besar melalui
perisian-perisian tertentu. Walaupun pada asasnya korpus yang dibina itu berfungsi sebagai
sampel bahasa bagi penyelidikan linguistik, namun perkembangan teori dan pendekatan
korpus telah membuka ruang kepada kajian pedagogi bahasa seawal tahun 1800, misalnya
seperti kajian yang dilakukan oleh Fries & Traver (1940) serta Bongers (1947). Justeru,
hasil pembinaan pangkalan data korpus seperti Pangkalan Data Korpus Dewan Bahasa &
Pustaka, pemanfaatannya perlu dibuat bagi menjadikan P&P bahasa Melayu lebih bervariasi
dan inovatif.
PANGKALAN DATA KORPUS DEWAN BAHASA DAN PUSTAKA (DBP)
Di Malaysia, pembinaan data korpus bahasa Melayu diinspirasikan melalui terbinanya
korpus Brown. Dengan kerjasama Dewan Bahasa & Pustaka dan Universiti Sains Malaysia,
pangkalan data korpus DBP telah dibangunkan secara berperingkat. Kejayaan pembinaan
korpus bahasa Melayu ini menjadikan ia sebagai data korpus terbesar di dalam Malaysia.
Menurut Hajar Abdul Rahim (2014), data korpus DBP hari ini mengandungi sebanyak 128
juta patah perkataan. Keseluruhan korpus ini terdiri daripada 10 subkorpus yang mewakili
pelbagai genre teks. Antaranya seperti buku (novel, buku akademik, buku umum, buku
teks), majalah (umum dan pelbagai bidang), surat khabar (harian, tabloid, edisi Ahad),
terjemahan (buku akademik dan pembacaan umum), efemeral (risalah, brosur,
pengiklanan), drama, puisi, kad dan teks-teks tradisional (buku teks sekolah rendah dan
menengah). Perlu dimaklumkan bahawa data korpus sebanyak 128 juta kata ini hanya
setakat tahun 2008 sahaja. Namun, usaha pengumpulan data ini diteruskan dari semasa ke
semasa. Menurut Hajar Abdul Rahim (2014) lagi, apabila data telah disisih sepenuhnya,
sejumlah 25 juta perkataan tambahan teks-teks berbahasa Melayu akan dimuat naik ke
dalam sistem korpus menjelang tahun 2015. Walaupun begitu, untuk tujuan kertas ini data
korpus DBP-UKM yang berjumlah 5 juta patah kata digunakan bagi meneliti peranan
konkordan dan kolokasi imbuhan peN- di dalam P&P bahasa Melayu.
KERELEVANAN DATA KORPUS DI DALAM P&P
Data korpus merupakan data yang bersifat autentik. Data ini menawarkan data bahasa
berkonteks. Ia juga disebut oleh Larsen-Freeman (2002) sebagai “grammar of choice”
dalam penggunaan bahasa iaitu suatu pilihan yang dibuat oleh penutur natif berdasarkan
konteks tertentu. Sebagai sebuah data yang berkonteks, pengajaran tatabahasa di dalam
wacana berkonteks merupakan asas bagi tatabahasa fungsian (functional grammar). Pada
masa yang sama, tatabahasa dilihat bukan sahaja dari sudut bentuk malah ia juga berkait
rapat dengan semantik (makna) dan pragmatik (Celce-Murcia & Larsen-Freeman 1999;
Celce-Murcia & Olshtain, 2000; Halliday, 1994; Halliday & Hasan, 1989; Larsen-Freeman,
2002, 2003; McCarthy & Carter, 1994). Keterkaitaan di antara bentuk, makna dan konteks
ini membawa kepada cadangan Larsen-Freeman (2003) bahawa bentuk-bentuk bahasa,
makna dan penggunaan bahasa seharusnya diintegrasikan secara menyeluruh. Di samping
guru dan pelajar disediakan dengan maklumat yang mudah mengenai penggunaan bahasa

National Conference of Research on Language Education 2016

sebenar khususnya dari segi kekerapan dan kolokasi (Thornbury 2002), penerokaan datadata semulajadi juga mampu untuk membangunkan kemahiran pelajar di dalam pengkajian
(Bernardini 2004).
Menurut Johns (1991), pembelajaran berpandukan data (data-driven learning) telah terbukti
berkesan khususnya yang berkait dengan teknik-teknik analisis korpus. Beliau juga
mencadangkan bahawa pelajar seharusnya dibimbing dalam menerokai sesuatu bahasa
sama seperti ahli linguistik korpus menerokai fakta-fakta bahasa tertentu yang sebelum ini
tidak diketahui. Pandangan ini turut dinyatakan oleh Leech (1997) bahawa:
“the critical and argumentative type of essay assignment […] should be
balanced with the type of assignment […] which invites the student to
obtain, organize, and study real-language data according to individual
choice. This latter type of task gives the student the realistic expectation
of breaking new ground as a ‘researcher’, doing something which is a
unique and individual contribution, rather than a reworking and evaluation
of the research of others”
Sebelum kewujudan korpus, guru-guru terpaksa bergantung kepada instuisi sepenuhnya
dalam meneliti penggunaan perkataan atau bahasa (Thornbury 2002). Realiti ini berubah
apabila kewujudan korpus telah berjaya memanfaatkan P&P. Walaupun data korpus tidak
mampu untuk menggambarkan keseluruhan pengalaman linguistik, tetapi kewujudannya
telah membantu guru-guru untuk meneliti ciri-ciri linguistik khusus untuk tujuan pengajaran
dengan melangkaui batasan intuisi (Gavioli & Aston, 2001).
Selain itu, Johns (1986, 1994) turut menyatakan bahawa pembelajaran dengan
mengggunakan pendekatan berasaskan korpus atau “pembelajaran berpandukan data”
membenarkan para pelajar untuk belajar secara hands-on. Pada masa yang sama,
pendekatan ini mampu untuk melahirkan para pelajar yang berjiwa penyelidik linguistik
(Johns, 2002) dalam meneliti corak penggunaan bahasa asli di samping mampu untuk
menyelesaikan masalah keperluan linguistik kini dan masa hadapan. Kebaikan dan
kerelevanan data korpus di dalam pengajaran dan pembelajaran turut dibuktikan dalam
kajian-kajian yang dilakukan oleh Cobb (1997), Cresswell (2007) dan Stevens (1991).
Misalnya, bentuk-bentuk konkordan yang dijana melalui data korpus bukan sahaja terbukti
sebagai kaedah yang berguna untuk mempelajari ciri-ciri kontekstual semulajadi sesuatu
bahasa (Cobb, 1997), malah penyelidik juga telah membuktikan bahawa bentuk-bentuk
konkordan begitu berguna dalam menyelesaikan masalah penulisan para pelajar khususnya
dalam P&P bahasa asing (Bernardini 2004; Chambers 2005; Gaskell & Cobb, 2004; Gray,
2005). Varley (2008) menambah bahawa pengaplikasian data korpus di dalam P&P juga
mampu memberi impak positif kepada pelajar khususnya dalam meningkatkan penguasaan
bahasa dalam kalangan pelajar.
Melalui beberapa pandangan mengenai kerelevanan korpus linguistik di dalam P&P, Cheng
(2010) merumuskan bahawa matlamat korpus linguistik di dalam P&P meliputi beberapa
perkara. Pertama sebagai alat pengajaran yang meliputi teori dan prinsip yang menjadi

National Conference of Research on Language Education 2016

pencetus kepada penggunaan data korpus. Keduanya ialah sebagai alat pengajaran untuk
mengeksploitasi bahasa iaitu dari sudut praktikal dan aspek berorientasikan metodologi
analisis berasaskan korpus. Ketiga merangkumi pengeksploitasian untuk pengajaran
bahasa seperti penggunaan data korpus untuk meningkatkan proses pengajaran
(Fligelstone, 1993).
Dan, yang keempat sebagai proses pengajaran yang mampu
mewujudkan sumber maklumat (Renouf, 1997). Melalui rumusan serta pandangan di atas,
jelas bahawa data korpus yang tersedia secara digital mampu membuka ruang baharu di
dalam pedagogi bahasa supaya suasana P&P menjadi lebih kreatif dan berinovatif.
FUNGSI KONKORDAN DAN KOLOKASI DALAM MENELITI UNSUR MAKNA IMBUHAN
PeNDalam bahagian ini, perbincangan meliputi pengaplikasian data korpus yang dijana dengan
menggunakan perisian AntConc khususnya bagi melihat peranan konkordan dan kolokasi
imbuhan peN-. Secara umumnya, konkordan merujuk kepada pembentukkan indeks
pengabjadan untuk semua perkataan dalam teks korpus yang menunjukkan setiap konteks
perwujudan sesuatu kata. Konkordan menyediakan maklumat yang penting tentang makna
dan konteks penggunaannya. Pelbagai maklumat seperti maklumat semantik, sintaksis,
pragmatik, gaya, huraian makna dan ayat contoh boleh diperoleh apabila menganalisis
konkordans. Kekerapan kewujudan sesuatu kata dalam keseluruhan teks korpus atau
sebahagiannya juga dapat ditunjukkan. Sistem korpus kerap dikaitkan dengan pangkalan
data leksikal yang menjadi wahana dalam proses penyusunan sesebuah kamus (Ibrahim
1994). Kolokasi pula merujuk kepada perkataan atau frasa yang sering digunakan bersama
kata atau frasa lain di mana penggunaannya dianggap betul oleh penutur bahasa berkenaan
walaupun makna bagi ujaran tersebut tidak dapat dijangka. Di dalam perisian AntConc,
kolokasi perkataan yang dijana dapat diteliti sama ada berdasarkan kolokasi di sebelah
kanan atau kolokasi di sebelah kiri. Dengan adanya pendekatan korpus linguistik ini, kini
para pelajar dapat melayari sendiri data-data asli bahasa di samping membuat
perbandingan makna imbuhan peN- yang diberikan di dalam buku tatabahasa dengan
makna imbuhan berdasarkan data korpus.
Dalam P&P bahasa Melayu, buku Tatabahasa Dewan (Nik Safiah et.al 1993) merupakan
buku tatabahasa pegangan yang menjadi rujukan sama ada di sekolah mahupun di
universiti. Walaupun begitu, terdapat pelbagai lagi buku-buku tatabahasa yang boleh
dijadikan rujukan khususnya semasa proses P&P bahasa Melayu. Berikut disenaraikan
beberapa buku-buku tatabahasa bahasa Melayu:
a. Pelita Bahasa Melayu (1-3) (Za’ba 1965, 2000)
b. Bahasa Melayu Hari Ini (1-3) (Karim Shariff, Li Chuan Siu & Daud Baharudin 1962).
c. Asas Bahasa Melayu (1-5) (Abdul Rahman Yusop 1964)
d. Rampaian Susuk Ayat Melayu (Abu Hassan dan Abdul Rahman Darus 1963,1965)

National Conference of Research on Language Education 2016

e. Bahasa Melayu Hari Ini (buku 1-3) (Karim Shariff, Li Chuan Siu & Daud Baharum
1962)
f.

Bahasa Kebangsaan untuk Tingkatan 1-3 yang mempunyai 6 jilid (Mokhtar
Muhammad Dom 1964, 1965, 1966, 1967, 1968, 1969)

g. Tatabahasa Bahasa Melayu (Arbak Othman 1981)
h. Nahu Melayu Muktahir (Asmah Omar 1993)
i.

Nahu Melayu Moden (Abdullah Hassan dan Liaw Yock Fang 1994)

j.

The Morphology of Malay (Abdullah Hassan 1974)

k. Tatabahasa Pedagogi Bahasa Melayu (Abdullah Hassan 1993)
l.

Binaan dan Fungsi Perkataan Bahasa Melayu (Hashim Musa 1993)

m. Tatabahasa Dewan (Nik Safiah et.al 1993)
Dengan mangambil kira beberapa buku tatabahasa yang disenaraikan, terdapat pelbagai
makna imbuhan peN- yang disenaraikan di dalam buku tatabahasa tersebut.
Ketidakselarasan makna yang diberikan disebabkan oleh penghasilan buku tatabahasa lebih
tertumpu kepada contoh-contoh ayat bikinan penulis. Dengan hanya ayat-ayat bikinan, ia
tidak dapat menjelaskan fungsi makna sesuatu unsur bahasa tersebut. Ini disokong oleh
pendapat Azhar M Simin (1993) bahawa buku-buku yang dicontohi dengan ayat
bikinan/intuisi hanya memuatkan struktur dan sumber maklumat bahasa Melayu.
Menurutnya lagi, mengetahui struktur sahaja tidak menjamin bahawa seseorang berupaya
menggunakan bahasa dengan betul. Maka dengan itu, maklumat penggunaan diperlukan.
Justeru, maklumat penggunaan ini dapat diperolehi melalui pengaplikasian data korpus di
dalam P&P bahasa.

Zaba,
1969
Arbak,
1981
Abdullah,
1974













√ √
√ √ √
√ √

Penanda abstrak

Alat

Ukuran

Hasil perbuatan

Penyebab

Pen-derita

Orang/benda yang
memiliki sifat kata dasar

Penjawat tugas

Pelaku/orang yang gemar
akan sesuatu

Pelaku/orang yang
melakukan sesuatu

Berikut dirumuskan makan imbuhan peN- berdasarkan beberapa buku tatabahasa:



National Conference of Research on Language Education 2016

Abdullah,
1993
Asmah,
1993
Hashim,
1993
Nik safiah
karim
et.al,
1993
Abdullah
& Liaw,
1994




















√ √
√ √ √



√ √







Jadual 1: Rumusan makna imbuhan peNBerdasarkan jadual di atas, kita dapati terdapat 10 makna imbuhan peN- yang disenaraikan
oleh 8 buku tatabahasa bahasa Melayu. Melalui penyenaraian ini, kita lihat bahawa setiap
daripada buku tatabahasa memberikan makna yang tidak selaras. Misalnya Za’ba (1969)
dan Abdullah & Liaw (1994) hanya menyenaraikan 4 makna imbuhan tersebut sedangkan
buku tatabahasa lain menyenaraikan lebih daripada 4 makna. Daripada kesemua buku
tatabahasa tersebut, hanya dua unsur makna yang selaras iaitu makna “pelaku/orang yang
melakukan sesuatu” dan “alat”. Ketidakselarasan unsur makna ini disebabkan oleh
pemerian makna oleh buku tatabahasa tersebut hanya melihat kepada contoh berdasarkan
intuisi dan contoh-contoh tunggal tanpa konteks. Misalnya makna peN- + pandu menjadi
pemandu diperi maknanya sebagai seseorang yang memandu (orang/pelaku). Makna yang
diberikan ini hanya diperi hanya berdasarkan struktur kata sahaja. Jadi, makna kata
tersebut tidak memperlihatkan kepelbagaian fungsi.
Berbeza dengan contoh di bawah:

Pada zaman moden ini, anjing digunakan sebagai ***pemandu*** bagi
orang
yang cacat penglihatan.

Berdasarkan contoh yang dijana melalui data korpus DBP-UKM, kata pemandu tidak
merujuk kepada orang yang memandu (makna pada peringkat kata), tetapi merujuk kepada
makna haiwan (makna konteks) iaitu anjing. Perkataan anjing tersebut berkolokasi dengan
perkataan pemandu. Ini kerana makna tersebut tidak diperi berdasarkan struktur tetapi
mengambil kira konteks ujaran. Pendekatan sebegini disokong oleh pendapat Azhar M.
Simin (1993) dengan menyatakan bahawa manusia pada kebiasannya tidak berujaran
melalui struktur tetapi melalui penggunaan ujaran. Justeru, melalui pendekatan korpus ini,

National Conference of Research on Language Education 2016

ia membuka ruang baharu kepada para pelajar semasa proses P&P khususnya dalam
melayari sendiri unsur-unsur tatabahasa melalui data yang lebih asli.
Penjanaan data korpus oleh pelajar membolehkan mereka menyelidik unsur makna yang
wujud di dalam data sebenar. Misalnya penjanaan konkordan dengan menggunakan
perisian AntConc bagi perkataan pemandu (peN- + pandu) seperti di bawah:

Melalui janaan kata tersebut, para pelajar boleh membuat analisis bagi setiap konkordan
dalam meneliti makna konteks kata pemandu khususnya dalam meneliti kolokasi bagi kata
tersebut. Secara umum, berdasarkan data korpus DBP-UKM yang berjumlah 5 juta kata,
jumlah konkordan yang terbit berdasarkan carian kata pemandu adalah sebanyak 568
konkordan. Melalui konkordan tersebut, statistik jenis kata yang berkolokasi (Collocate
Types) adalah sebanyak 1717 dan bilangan token yang berkolokasi (Collocate Tokens)
adalah sebanyak 5680. Dengan jumlah jenis kolokasi dan token yang berkolokasi tersebut,
para pelajar boleh membuat analisis konkordan bagi meneliti unsur makna bagi perkataan
pemandu.

National Conference of Research on Language Education 2016

Hasil janaan data korpus, para pelajar akan mendapati bahawa kata pemandu (melalui
analisis konkordan dan kolokasi kiri (L1-L5) dan kanan (R1-R5)) tidak hanya mempunyai
makna “orang/manusia”, malah ia melibatkan beberapa unsur makna lain seperti alat/benda,
haiwan/tumbuhan dan abstrak. Unsur makna seperti ini tidak dinyatakan di dalam buku
tatabahasa iaitu yang berkait dengan kepelbagaian fungsi makna2. Tetapi, melalui
pendekatan ini ia membenarkan para pelajar untuk melayari sendiri data-data yang lebih
autentik dengan membuat penelitian berdasarkan konteks. Hasilnya, para pelajar akan
memperolehi maklumat-maklumat baharu yang tidak dinyatakan di dalam buku-buku
tatabahasa khususnya yang berkaitan dengan kepelbagain fungsi makna.
Berikut disenaraikan contoh ayat yang mempunyai pelbagai fungsi makna bagi kata
pemandu:
1. Makna “orang/manusia”
Dalam waktu lebih kurang 3 jam, ***pemandu*** kereta dari Kuala
Lumpur akan tiba di bandar Mersing dan sejam kemudian boleh sampai
di Tekek.
2. Makna alat/benda
Jika perisian Windows 95 ataupun versi seterusnya sudah terdapat pada
computer anda, maka eloklah kiranya saudara memastikan perisian
***pemandu*** CD (driver) sudah dipasangkan terlebih dahulu dan yang

2

Analisis kepelbagaian fungsi makna peN- yang lebih terperinci dari sudut semantik dan pragmatik boleh dilihat di dalam
kajian Ahmad Harith Syah (2008) dan Nor Hashimah & Ahmad Harith Syah (2009).

National Conference of Research on Language Education 2016

pentingnya ialah anda harus memastikan ianya berfungsi dengan
sempurna.
3. Makna haiwan
Pada zaman moden ini, anjing digunakan sebagai ***pemandu*** bagi
orang yang cacat penglihatan.
4. Makna abstrak
Sikap ini bersesuaian dengan tekanan mereka yang lebih umum yang
diberi kepada alam sebagai ***pemandu*** kehidupan sempurna
manusia, dan penekanan yang kuat terhadap etimologi diberikan kepada
"bentuk asal" atau "bunyi-bunyi pertama" perkataan yang dikatakan
beronomatopia tetapi kemudiannya telah mengalami perubahan yang
pelbagai rupa (Robins, 1993: 25).

Berdasarkan keempat-empat contoh ayat yang dijana melalui barisan konkordan, penelitian
menunjukkan perkataan pemandu mempunyai ciri-ciri kepelbagaian makna. Kepelbagaian
makna ini memperlihatkan kewibawaan korpus linguistik untuk dijadikan bahan atau sumber
pengajaran di dalam P&P bahasa Melayu. Melaluinya para pelajar dapat mengaplikasikan
teknik analisis korpus dengan meneliti makna berdasarkan konkordan dan kolokasi
perkataan pemandu tersebut.
Jika diteliti unsur makna yang pertama iaitu orang/manusia, kita dapati bahawa perkataan
pemandu berkolokasi dengan perkataan di sebelah kanan iaitu kereta dengan membentuk
frasa pemandu kereta. Pembentukan frasa ini membolehkan ia ditafsir maknanya dengan
jelas iaitu orang/manusia. Bagi contoh kedua pula, makna perkataan pemandu merujuk
kepada alat/benda. Berdasarkan kolokasi perkataan tersebut, kita dapati bahawa perkataan
pemandu berkolokasi di kiri dan kanan iaitu perisian dan CD. Kedua-dua kolokasi kiri dan
kanan membentuk frasa perisian pemandu CD yang boleh ditafsir maknanya sebagai
alat/benda.
Untuk contoh ketiga yang merujuk kepada makna haiwan, kata pemandu berkolokasi
dengan kata anjing yang dilihat berfungsi sebagai anteseden. Kolokasi sebelah kiri ini
berada pada kedudukan L3. Jika makna pemandu ditafsir tanpa mengaitkan dengan
konteks ayat tersebut, makna haiwan tidak dapat difahami oleh pembaca. Walaupun begitu,
makna haiwan ini juga tidak pernah dibincangkan di dalam mana-mana buku tatabahasa
(rujuk jadual 1). Antara faktor yang menyebabkan makna haiwan ini tidak dibincangkan di
dalam buku tatabahasa adalah kerana pemerian makna di dalam buku-buku tersebut tidak
mengambil kira data-data sebenar.
Lihat pula contoh di bawah:

National Conference of Research on Language Education 2016

Kaedah penanaman hidroponik dibuat dalam kawasan yang tertutup
dengan jarring untuk menghalang serangga ***perosak***.
Berdasarkan contoh perosak, para pelajar yang meneliti konkordan akan menemui ayat
seperti di atas. Melalui kolokasi di sebelah kiri iaitu serangga, ia akan membentuk frasa
serangga perosak yang jelas merujuk kepada makna haiwan. Penjanaan data-data ini
membolehkan para pelajar menganalisis secara hands-on data-data tersebut sekaligus
berupaya menemui sesuatu yang tidak diketahui sebelum ini.
Selain daripada makna baharu yang ditemui (merujuk kepada makna haiwan), satu lagi
unsur makna baharu yang tidak dibincangkan di dalam buku tatabahasa ialah makna
tumbuhan. Lihat contoh di bawah:

Harga anak pokok palma adalah yang tertinggi (RM57.55RM206.69/polibeg) berbanding dengan pokok hiasan kumpulan lain
[pokok naungan dan pinggiran jalan (RM8.60-RM172.67/polibeg),
pokok renek berdaun (RM3.44-RM 10.74/ polibeg), pokok renek
berbunga (RM3.00-RM6.41/polibeg), dan pokok ***penutup*** bumi,
tumbuhan jalar dan pemanjat (RM0.93 - RM6.23/polibeg)].
Berdasarkan contoh perkataan penutup, kata tersebut berkolokasi di sebelah kiri dengan
perkataan pokok sekaligus membentuk frasa pokok pelindung. Dengan adanya kolokasi
perkataan ini membolehkan makna itu ditafsir dengan tepat dari segi penggunaannya.
Bagi unsur makna terakhir iaitu abstrak, perkataan pemandu berkolokasi di sebelah kiri
pada permulaan ayat dengan perkataan sikap yang berfungsi sebagai anteseden. Sikap
yang difahami sebagai sesuatu yang abstrak dirujuk oleh perkataan pemandu. Melalui
kolokasi perkataan tersebut, makna bagi pemandu boleh ditafsir berdasarkan konteks.
Tanpa peranan kolokasi, makna pemandu hanya ditafsir pada peringkat struktur kata yakni
sebagai “orang yang memandu”, yang jelas tidak membawa makna sebenar di dalam ayat
tersebut.
Daripada beberapa contoh yang dipaparkan, jelas bahawa data korpus yang mempunyai
nilai keaslian penggunaan bahasa membolehkan para pelajar menyelidik sesuatu unsur
tatabahasa dengan lebih berkesan. Dengan adanya latihan secara hands-on, ia melatih
para pelajar bukan hanya menumpukan kepada proses pembelajaran berdasarkan buku
semata-mata, malah ia membuka ruang bagi pelajar untuk meneroka bahasa secara lebih
inovatif di samping membuat perbandingan di antara dapatan data korpus dengan buku
tatabahasa. Justeru, guru-guru seharusnya mula mempraktikkan pendekatan ini di dalam
P&P supaya ia memberi satu suasana pembelajaran yang lebih efektif.

KESIMPULAN
Secara kesimpulannya, antara kebaikan yang boleh didapati melalui pendekatan data
korpus ialah para pelajar terdedah kepada satu bentuk pendekatan deduktif dan induktif di

National Conference of Research on Language Education 2016

dalam P&P. Pendekatan deduktif membolehkan para pelajar didedahkan dengan contohcontoh yang lebih asli berbanding dengan contoh-contoh melalui buku tatabahasa yang
diliha lebih tertumpu kepada data intuisi. Data asli menyajikan satu bentuk dapatan yang
mungkin tidak pernah disebut di dalam buku tatabahasa. Misalnya mengenai makna haiwan
dan tumbuhan serta kepelbagaian fungsi imbuhan peN-. Tanpa peranan data korpus, unsur
tatabahasa seperti ini tidak dapat dirungkai sebaiknya. Melalui pendekatan induktif pula,
para pelajar berupaya membuat satu bentuk kesimpulan sendiri unsur tatabahasa melalui
pelayaran terhadap data korpus. Ini sekaligus akan membuka ruang kepada pelajar untuk
berfikir secara kritis dan kreatif melalui analisis korpus yang dijalankan.
Dalam pada itu, pendekatan data korpus membentuk pelajar yang lebih berautonomi dan
berdikari semasa proses P&P. Oleh kerana pendekatan yang digunakan secara hands-on,
para pelajar perlu melakukan sebarang bentuk analisis korpus secara individu. Pada masa
yang sama, penafsiran data juga akan melahirkan pelajar yang lebih berjiwa penyelidik. Ini
kerana analisis korpus yang dilakukan membenarkan para pelajar untuk mengembara ke
setiap pelusuk data bagi membuat satu kesimpulan yang lebih spesifik. Sebagai pendidik,
kita sebolehnya ingin melahirkan pelajar yang mampu untuk berdikari dalam pelbagai aspek.
Juster, pengaplikasian pendekatan data korpus sedikit sebanyak berupaya membentuk
suasana autonomi dan berdikari.

National Conference of Research on Language Education 2016

RUJUKAN
Ahmad Harith Syah. 2008. Fungsi Makna Imbuhan Awalan peN-: Satu Analisis Teori
Relevans. Tesis Sarjana. Universiti Kebangsaan Malaysia.
Abdullah Hassan & Ainon Mohd. 1994. Tatabahasa Dinamika. Utusan Publications &
Distributors Sdn. Bhd.
Abdullah Hassan & Liaw Yock Fang 1994. Nahu Melayu Moden. Fajar Bakti Sdn. Bhd.
Abdullah Hassan, 1974. The Morphology of Malay. Kuala Lumpur: Dewan Bahasa dan
Pustaka
Abdullah Hassan. 1993. Tatabahasa Pedagogi Bahasa Melayu. Utusan Publications &
Distributors Sdn. Bhd.
Aijmer, K. (2009) Corpora and Language Teaching. Amsterdam: John Benjamins.
Arbak Othman. 1981. Tatabahasa Bahasa Malaysia. Kuala Lumpur: Penerbit Sarjana
Enterprise
Asmah Hj Omar 1993. Nahu Melayu Muktahir. Kuala Lumpur: Dewan Bahasa dan
Pustaka
Aston, G. (ed.) (2001) Learning with Corpora. Houston, TX: Athelstan.
Aston, G., Bernardini, S. and Stewart, D. (eds.) (2004) Corpora and Language Learners.
Amsterdam: John Benjamins.
Bhatia, V. (2002). Applied genre analysis: A multi-perspective model. Ibérica, 4, 3-19.
Bernardini, S. (2000) Competence, Capacity, Corpora: A Study in Corpus-aided Language
Learning. Bologna: CLUEB.
Bernardini, S. (2004). Corpora in the classroom: An overview and some reflections on future
developments. In J. McH. Sinclair (Ed.), How to use corpora in language teaching
(pp.15-36). Amsterdam: Benjamins.
Bloch, J. 2009. The Design of an Online Concordancing Program for Teaching About
Reporting Verbs. Language Learning and Technology. Vol. 13. No.1. p59-78.
Braun, S., Kohn, K. and Mukherjee, J. (eds.) (2006) Corpus Technology and Language
Pedagogy. Frankfurt: Peter Lang.

National Conference of Research on Language Education 2016

Burnard, L. and McEnery, A. (eds.) (2000) Rethinking Language Pedagogy from a Corpus
Perspective. Frankfurt: Peter Lang.
Butler, C. S. 2004. Corpus Studies and Functional Linguistics Theories. dlm. Function of
Language. Vol II (2). Amsterdam: John Benjamins Publishing Company.
Campillos, Leonardo; Gozalo, Paula; Guirao, José María & Antonio, Moreno Sandoval
(2007) Exploiting a spoken corpus in language teaching/learning: An advanced
webbased tool. Proceedings from Corpus Linguistics Conference Series.CL2007,
University
of
Birmingham,
UK,
July
27-30
2007.
Online:
http://www.birmingham.ac.uk/documents/college-artslaw/corpus/conferencearchives/2007/99Paper.pdf
Campoy, M., Gea-valor, M. and Belles-Fortuno, B. 2010. Corpus-based Approaches to
English Language Teaching. London: Continuum.
Celce-Murcia, M., & Larsen-Freeman, D. (1999). The grammar book: An ESL/EFL teachers’
Course (2nd ed.). Boston: Heinle & Heinle.
Celce-Murcia, M., & Olshtain, E. (2000). Discourse and context in language teaching.
Cambridge: Cambridge University Press.
Cobb, T. (1997). Is there Any Measurable Learning from Hands-on Concordancing? System.
25(3), (pp. 301-315).
Chambers, A. (2005). Integrating corpus consultation in language studies. Language
Learning and Technology, 9 (2), 111-125.
Cheng, Winnie (2010). What can a corpus tell us about language teaching? In Anne
O’Keeffe, Michael McCarthy (Eds.) The Routledge Handbook of Corpus Linguistics,
(pp. 319-332). Routledge.
Connor, U. and Upton, T. (eds.) (2002) Applied Corpus Linguistics: A Multidimensional
Perspective. Amsterdam: Rodopi.
Cresswell, A. (2007). Getting to ‘Know’ Connectors? Evaluating Data-driven Learning in a
Writing Skills Course. In E. Hidalgo, L. Quereda and J. Santana (eds.), Corpora in
the Foreign Language Classroom (pp. 267-288). Amsterdam: Rodopi.
Crystal, D. 1997. A dictionary of linguistics and phonetics Ed. Oxford, UK; Cambridge,
Mass.: Blackwell.
Crystal, David. (1998 edition). A Ditionary of Linguistics and Phonetics. Malden,
Massachusetts.: Blackwell Publihsers Inc.

National Conference of Research on Language Education 2016

Criswell, J.R. 1989. Rethinking Microcomputer Instruction as Part of Teacher Education
Reform. Educational Technology 23(11): 40-43.
Ejazi Yahaya (2004). Hubungan Antara Imbuhan Dengan Kata Kerja dari Perspektif
Pengajaran & Pembelajaran Berbantukan Komputer, Tesis MA USM.
Fligelstone, S. (1993). Some Reflections on the Question of Teaching, from a Corpus
Linguistics Perspective. ICAME Journal 17, 97–110.
Gaskell, D., & Cobb, T. (2004). Can learners. ICAME Journal use concordance feedback for
writing errors? System, 32, 301-319.
Gavioli, L. & Aston, G. (2001). Enriching Reality: Language Corpora in Language Pedagogy.
ELT Journal, 55(3), 238–46.
Ghadessy, M., Henry, A. and Roseberry, R. (eds.) (2001) Small Corpus Studies and ELT:
Theory and Practice. Amsterdam: John Benjamins.
Gray, B. E. (2005). Error-specific concordancing for intermediate ESL/EFL writers. Retrieved
January 18, 2013 from http://
dana.ucc.na4.edu/~bde6/coursework/Projects/PedagogicalTip/homepage.html.
Granger, S., Hung, J. and Petch-Tyson, S. (eds.) (2002) Computer Learner Corpora, Second
Language Acquisition, and Foreign Language Teaching. Amsterdam: John
Benjamins.
Hishamudin Isam, Faizah Ahmad & Mashetoh Abd. Mutalib. 2014. Wajaran penggunaan
data korpus dalam penulisan ilmiah : Dimensi baharu sukatan pelajaran Bahasa
Melayu Sijil Tinggi Pelajaran Malaysia (STPM). Jurnal Pendidikan Bahasa Melayu.
Vol. 4 (2). hlm 67-77.
Intan Safinaz Zainudin, Nor Hashimah Jalaluddin & Khairul Taufiq Abu Bakar. 2014. The use
of corpus and Frame Semantics in a lexicography class : Evaluating dictionaries
entries. Procedia – Social and Behaviorial Sciences. 116 : hlm 2316-2320
Johns, T. (1986). Microconcord: A Language-learner’s Research Tool. System 14(2), 151162.
Johns, T. (1994). From Printout to Handout: Grammar and Vocabulary Teaching in the
Context of Data-driven Learning. In T. Odline (Ed.), Perspectives on Pedagogical
Grammar (pp. 27-45). Cambridge: Cambridge University Press.
Kamus Dewan, 1994 (Edisi Ketiga) Kuala Lumpur: Dewan Bahasa dan Pustaka

National Conference of Research on Language Education 2016

Kamus Linguistik 1997. Kuala Lumpur : Dewan Bahasa dan Pustaka
Lay Wah Lee & Hui Min low. 2011. Developing an online Malay Language Word Corpus for
primary schools. International Journal of Education and Developing using Information
and Communication Technology (IJEDICT). Vol 7 (3). hlm 96-101.
McCarthy, M. & Carter, R. (1994). Language as discourse: Perspectives for language
teaching. London: Longman.
Maddalena, S.R. (2001). An investigation into how corpus analysis may be used in the
second language classroom to solve some of the problems surrounding non-native
speakers’ understanding of seemingly synonymous words. Retrieved August 15,
2009 from ERIC database.
Marza, N. E. 2014. A Practical Corpus-based Approach to Teaching English for Tourism.
International Journal of Applied Linguistics & English Literature. Vol. 3 No. 1 p129136
Hajar Abdul Rahim. 2014. Corpora in language research in Malaysia. Kajian Malaysia. Vol.
32 (1): 1-16
Halliday, M. A. K. (1994). Introducing functional grammar. London: Arnold.
Halliday, M. A. K., & Hasan, R. (1989). Language, context, and text: Aspects of language in
a social semiotic perspective. Oxford: Oxford University Press.
Hashim Musa (1993). Binaan dan Fungsi Perkataan Dalam Bahasa Melayu. Kuala
Lumpur: Dewan Bahasa dan Pustaka.
Hock, S.A. (1993). Kesan Strategi Kognitif, Pengetahuan Asas Ilustrasi Visual Terhadap
Pemprosesan Teks Ekspositori dalam Pembelajaran Berbantukan Komputer. Tesis
PhD.USM.
Ibrahim Ahmad. 1994. Perkamusan Melayu: Suatu Pengenalan. Kuala Lumpur: Dewan
Bahasa & Pustaka.
Johns, T. (1986). Microconcord: A Language-learner’s Research Tool. System 14(2), 151162.
Johns, T. 1991. Should you be persuaded - two samples of data-driven learning materials.
In T. Johns & P. King (eds) Classroom Concordancing (ELR Journal,4] pp 1-16.
Johns, T. (1994). From Printout to Handout: Grammar and Vocabulary Teaching in the
Context of Data-driven Learning. In T. Odline (Ed.), Perspectives on Pedagogical
Grammar (pp. 27-45). Cambridge: Cambridge University Press.

National Conference of Research on Language Education 2016

Johns, T. (2002). Data-driven Learning: The Perpetual Challenge. In B. Kettemann & G.
Marko, Teaching and learning by doing corpus analysis (pp. 107-117). Proceedings
of the Fourth International Conference on Teaching and Language Corpora, Graz 1924 July, 2000.
Kennedy, G. 1998. An Introduction to Corpus Linguistics. London: Longman
Keck, C. (2004) ‘Corpus linguist