Leksikon Animalmedicin Leksikon animalmadicin dalam pengobatan
Khazanah Bahasa, Sastra dan Budaya Serumpun himpunan tulisan
190
Salinah Jaafar, dkk .....
bahasa Inggeris telah menjadi contoh dan panduan kepada pengumpulan data korpus negara lain.
Korpus bahasa Inggeris berkomputer pertama kali dibina ialah korpus Brown “Brown Corpus” yang
dibina oleh Nelson Francis dan Henry Kucera di Universiti Brown pada tahun 1960. Pengumpulan data
korpus kemudiannya berkembang kepada beberapa korpora bahasa Inggeris seperti Korpus Kebangsaan
Amerika “American National Corpus ANC”, Korpus Kebangsaan British “British National Corpus BNC”,
Korpus
Lancester-OsloBergen “Lancaster-Oslo
Bergen Corpus LOB”, Korpus Komtemporari Bahasa
Inggeris Amerika “Corpus of Contemporary American English COCA”,
Korpus Freiburg-LOB Bahasa Inggeris British “Freiburg–LOB Corpus of British English
FLOB”, Korpus Frown Frown corpus, Korpus Bertulis
Bahasa Inggeris New Zealand “Wellington Corpus of Written New Zealand English WWC”
dan Korpus PENN “PENN corpus”.
Rajah di bawah menunjukkan carta pembinaan korpus tersebut:
Korpus Jumlah Perkataan
Juta Jenis Data
Brown 1
2,000 sampel yang diambil dari pelbagai
data bertulis
Khazanah Bahasa, Sastra dan Budaya Serumpun himpunan tulisan
191
Salinah Jaafar, dkk .....
ANC American National Corpus
20 Data lisan dan
tulisan BNC British National
Corpus 100
90 data tulisan dan 10 lisan.
LOB Lancaster-Oslo- Bergen
1 2,000 sampel yang
diambil dari pelbagai data bertulis
COCA The Corpus of Contemporary
American English 425
Pelbagai bentuk data tulisan dan lisan.
FLOB Freiburg–LOB Corpus of British
English 1
2,000 sampel yang diambil dari pelbagai
data bertulis Frown
1 2,000 sampel yang
diambil dari pelbagai data bertulis
WWC Wellington Corpus of Written
New Zealand English 1
2,000 sampel yang diambil dari pelbagai
data bertulis PENN Corpora of
Historical English 3
Teks dan sampel teks yang dikumpulkan
dari prosa Bahasa Inggeris British
berdasarkan sejarah.
Rajah 1: Korpora Bahasa Inggeris Aichele 2004, Nartey Ngula 2014.
Penyelidikan dalam bidang korpus linguistik ini seterusnya berkembang mengjangkaui bahasa Inggeris
ke seluruh dunia yang meliputi bahasa Cina, bahasa Denmark, bahasa Belanda, bahasa Rusia, dan Sepanyol
Khazanah Bahasa, Sastra dan Budaya Serumpun himpunan tulisan
192
Salinah Jaafar, dkk .....
Scannel, 2007. Pengkaji bahasa seluruh dunia hari ini dapat melihat betapa pentingnya pembinaan korpus
dilakukan terutama dalam menjalankan penyelidikan bahasa. Data korpus bukan sahaja akan membantu
pembelajaran dan analisis bahasa Adab, 2002 tetapi juga akan menyediakan maklumat tatabahasa dan
peraturan tatabahasa, kolokasi dan koligasi perkataan dan frasa di samping dapat membantu analisis kajian
bahasa dibuat secara cepat dan tepat Tognini-Bonelli, 2004. Oleh sebab itu penyelidikan yang melibatkan
pembinaan data korpus adalah amat penting kepada semua ahli bahasa seluruh dunia.
Bahasa Melayu dan Pembinaan Data Korpus di Malaysia
Menyedari peri pentingnya korpus dalam
penyelidikan bahasa, ahli-ahli bahasa dan juga para penyelidik dari pelbagai institusi di Malaysia turut
membina korpora bahasa Inggeris dan juga bahasa Melayu. Ini dapat dibuktikan dengan wujudnya
beberapa penulisan hasil penyelidikan tentang huraian linguistik bahasa Melayu , bahasa Inggeris sebagai
bahasa kedua dan juga bahasa Inggeris di Malaysia yang dilihat sebagai variasi bahasa Abdul Rahim,
2014. Menurut Abdul Rahim, walaupun bahasa Melayu merupakan bahasa rasmi dan dituturkan oleh
keseluruhan rakyat Malaysia, tetapi korpus bahasa