Bahasa Alamiah Natural LanguageUncontrolled Vocabulary

suatu dokumen dan hanya mengambil konsep yang ada dalam tema utama. Pengindeksan mendalam biasanya dilakukan oleh lembaga-lembaga penerbit informasi, misalnya pengindeks jurnal. Penerbit indeks jurnal biasanya menetapkan konsep yang diambil dari sub-sub bab dari suatu artikel pada jurnal.

2.3 Bahasa Indeks

Pengindeksan secara manual dan otomatis akan menghasilkan bahasa indeks. Bahasa indeks merupakan istilah atau kata yang dipilih menjadi representasi isi dari dokumen. Istilah tersebut boleh berupa istilah alami atau bahasa alamiah natural language dan kosa kata terkendali controlled vocabulary. Bahasa alamiah adalahbahasa asli dari dokumen itu sendiri. Sedangkan kosa kata terkendali adalah istilah yang terkontrol karena telah dikonsultasikan kepada tesaurus. Ditinjau dari sisi sistem temu kembali informasi, tesaurus adalah suatu daftar pengendali authority list istilah-istilah khusus yang digunakan dalam sistem temukembali informasi. Akan tetapi bila ditinjau dari segi fungsinya tesaurus adalah saranapengawasan istilah yang digunakan untuk penerjemahan bahasa alamiah dokumen kebahasa yang lebih terkendali. Tesaurus berisi sejumlah istilah indeks denganmenggunakan bahasa yang terkendali, sehingga sering disebut juga dengan bahasaterkontrol controlled language. Tujuan utama tesaurus adalah juga untukmemudahkan temu kembali dokumen, dan untuk mencapai konsistensi dalampengindeksan dokumen pada sistem simpan dan temu kembali informasi.

2.3.1 Bahasa Alamiah Natural LanguageUncontrolled Vocabulary

Menurut Lancaster, 1986 : 159 dalam Hasugian, 2003 : 5“bahasa alamiah adalah bahasa dari dokumen yang diindeks”. Dari pendapat tersebut dapat dinyatakan bahwa bahasa alamiah adalah bahasa asli dokumen itu sendiri. Biasanya bahasa tersebut merupakan bahasa yang tidak terkendali uncontrolled vocabulary. Bahasa alamiah yang dihasilkan dari dokumen masih akan dicocokkan dengan tesaurus kemudian dijadikan indeks subjek dari dokumen tersebut. “Pengindeksan bahasa alamiah adalahpengindeksan yang dilakukan pada semua istilah baik dari judul, abstrak, maupun dariteks lengkap full text dokumen, Universitas Sumatera Utara terkecuali stopword atau daftar kata umum yangtidak digunakan dalam penelusuran” Rowley, 1992 : 272. Dari pendapat tersebut dapat dinyatakan bahwa pengindeksan bahasa ilmiah adalah pengindeksan yang menghilangkan stopword dan tidak menggunakannya sebagai istilah indeks. Bahasa alamiah memiliki kelebihan dan kelemahan. Kelebihan dari bahasa alamiah adalah: 1. Bahasa alamiah dapat dengan mudah dimengerti oleh pengguna tanpa harus memerluka pelatihan khusus, dan berbagai nuansa makna dapat diekspresikan dengan lebih leluasa Meadow, 1992 : 37-38. Dari pendapat tersebut dapat dijelaskan bahwa bahasa almiah mudah dimengerti oleh pengguna tanpa memerlukan pelatihan khusus, sehinggga memudahkan bagi pengguna dalam penelusuran dapat mengekspresikan gagasan, perasaan dan keinginan untuk mendapatkan dokumen yang diinginkannya. Bagi praktisi dan ilmuwan, hal ini juga memberi keuntungan karena istilah yang digunakan kurang lebih sama dengan istilah yang terdapat dalam dokumen. 2. Bahasa alamiah memiliki spesifikasi specification yang tinggi Lancaster, 1977 : 23 dalam Hasugian 2003: 6. Dari pendapat tersebut dapat dijelaskan bahwa spesifikasi istilah muncul karena dapat menggunakan seluruh istilah yang terdapat dalam dokumen sebagai kata kunci. Spesifikasi istilah akan memudahkan pencarian untuk mendapatkan ketepatan precision yang tinggi. Semakin tinggi spesifikasi istilah yang digunakan dalam penelusuran, maka akan semakin tinggi ketepatan, sedangkan perolehan recall akan semakin rendah. Sebaliknya bila spesifikasi istilah rendah, maka perolehan akan semakin tinggi, sedangkan ketepatan cenderung rendah. 3. Bahasa alamiah memiliki kedalaman exhaustivity yang tinggi Foskett, 1985 : 114. Dari pernyataan tersebut dapat dijelaskan bahwa banyak tema atau subjek baru yang dihasilkan dokumen yang dapat dijadikan sebagai istilah baru dalam penelusuran. Karena pada prinsipnya, bahwa semua kata terkecuali stopword dapat dijadikan sebagai keyword dalam penelusuran. Universitas Sumatera Utara Selain memiliki sejumlah kelebihan, bahasa alamiah juga memiliki berbagai kelemahan, beberapa diantaranya adalah : 1. Bahasa almiah tidak atau kurang ringkas lack of consiseness Meadow, 1992 : 38. Dari pendapat tersebut dapat dijelaskan bahwa penelusuran cenderung akan menggunakan kata-kata yang sering digunakan atau istilah yang familiar. Istilah yang digunakan penelusur sering berupa kata atau istilah berbeda atau tidak standard sehingga sering terjadi kehilangan informasi saat penelusuran. Sebagai contoh, seorang penelusur mungkin akan menggunakan kata kunci kesusastraan dalam penelusuran informasi mengenai dunia sastra, yang bisa jadi tidak akan menghasilkan dokumen yang diinginkan karena dalam dokumen tersebut tidak ada kata kesusastraan, yang hanya adalah sastra. 2. Mempunyai ambiguitas ambiguity yang tinggi. Meadaw, 1992 : 37 Dari pendapat. tersebut dapat dinyatakan bahwa Ambiguitas adalah kata atau istilah yang dapat memiliki lebih dari satu arti sehingga mengakibatkan kerancuan. Ambiguitas dapat terjadi karena sinomim atau homograf. Sinonim yaitu bentuk kata yang berbeda tetapi artinya sama, dapat menyebabkan terpencarnya informasi mengenai topik yang sama. 3. Kesulitan komputer untuk menginterpretasikan teks Meadew, 1992 : 37 Dari pendapat tersebut dapat dijelaskan bahwa ketidakmampuan sistem menyerap atau menangkap makna dari suatu pernyataan. Hal ini terjadi karena dalam memproses bahasa alami, komputer tidak bisa bekerja sebagaimana otak manusia, terkecuali komputer tersebut dilengkapi dengan suatu knowledge base. Dari pendapat di atas dapat dinyatakan bahwa bahasa alamiah memiliki kelebihan dan kelemahan. Kelebihan dari alamiah dapat dilihat dari kemudahan pengguna untuk mengerti dan menggunakan dalam menelusur, spesifikasi yang tinggi serta kedalaman exhaustivity yang tinggi. Sedangkan kelemahan bahasa alamiah dapat dilihat dari segibahasa yang tidak ringkas, ambiguitas yang tinggi, kesulitan komputer menginpretasikan dan memerlukan penilaian dalam penelusuran. Universitas Sumatera Utara

2.3.2 Kosa Kata Terkendali Control Vocabulary