BAB II TINJAUAN PUSTAKA
Populasi
Populasi adalah wilayah generalisasi yang terdiri dari objek atau subjek yang mempunyai kuantitas dan karakteristik tertentu yang ditetapkan oleh
peneliti untuk dipelajari dan kemudian ditarik kesimpulannya. Jika jumlah populasinya besar, sementara penelitian tidak mungkin mempelajari semua
populasi tersebut, maka dilakukan teknik sampling, yaitu suatu prosedur untuk mendapatkan dan mengumpulkan karakteristik yang berada di dalam sebuah
populasi meskipun data itu tidak diambil secara keseluruhan, namun hanya sebagian saja. Bagian dari populasi itulah yang disebut sampel. Namun jika
data dianggap tidak terlalu besar, maka teknik sampling tidak perlu dilakukan Sugiyono, 1999.
Pengindeksan Subjek
Menurut Sulistyo-Basuki 1992, tingkat pengindeksan tergantung pada keperluan dan kebijaksanaan suatu unit informasi. Pengindeksan bisa saja
mencakup hanya subjek utama yang disebut pengindeksan generik. Pada pengindeksan tingkat medium, umumnya pengindeksan mencakup semua
subjek yang dicakup dalam dokumen, namun mengidentifikasi subjek tersebut dengan istilah umum saja dan biasanya mencakup sampai sepuluh deskriptor.
Pada pengindeksan tingkat dalam pengindeksan mencakup semua subjek dan mendeskripsikan subjek tersebut dengan sejumlah besar deskriptor.
Pengindeksan terinci mengindeks seluruh teks, bahkan sampai mengindeks kalimat demi kalimat.
Analisis Subjek
Analisis subjek merupakan kegiatan memilih kata kunci atau deskriptor yang tepat untuk mewakili sebuah dokumen sehingga bisa digunakan sebagai
entri indeks. Menurut Pangaribuan 2010, kegiatan analisis subjek membutuhkan kemampuan yang cukup, karena pengindeks dituntut memiliki
kemampuan untuk menentukan subjek apa yang terkandung dalam sebuah bahan pustaka yang sedang diolah. Ada tiga hal mendasar yang perlu dipahami
pengindeks dalam menganalisis subjek, yaitu jenis konsep, jenis subjek, dan urutan sitasi.
Agar kata kunci atau deskriptor tersebut bisa digunakan secara konsisten maka diperlukan sebuah standar. Untuk itu diperlukan sebuah
sarana yang menyediakan bahasaistilah indeks yang baku dan terkendali controlled vocabulary. Daftar istilah tersebut dikenal dengan daftar tajuk
subjek dan tesaurus Arwendria, 2002.
Jenis Konsep
Dalam satu bahan pustaka dapat dibedakan tiga jenis konsep yaitu: a. Disiplin Ilmu, yaitu istilah yang digunakan untuk satu bidang atau
cabang ilmu pengetahuan. Disiplin ilmu dapat dibedakan menjadi dua kategori:
1 Disiplin Fundamental. Meliputi bagian-bagian utama ilmu pengetahuan. Oleh para ahli disiplin fundamental dikelompokkan
menjadi tiga yakni ilmu-ilmu sosial, ilmu-ilmu pengetahuan alam, dan ilmu-ilmu kemanusiaan.
2 Sub disiplin, merupakan bidang spesial dalam satu disiplin fundamental. Misalnya dalam disiplin ilmu fundamental alam,
sub disiplinnya terdiri atas fisika, kimia, biologi. b. Fenomena topik yang dibahas, merupakan wujudbenda yang
menjadi objek kajian dari disiplin ilmu. Misalnya pendidikan remaja. “Pendidikan” merupakan konsep disiplin ilmu, sedangkan “remaja”
adalah fenomena yang menjadi objek atau sasarannya. c. Bentuk, ialah cara bagaimana suatu subjek disajikan. Dibedakan
menjadi tiga jenis: 1 Bentuk Fisik, yakni medium atau sarana yang digunakan dalam
menyajikan suatu subjek. Misalnya dalam bentuk buku, majalah, pita rekaman, dan sejenisnya.
2 Bentuk Penyajian, yang menunjukkan pengaturan atau organisasi isi bahan pustaka. Ada tiga bentuk penyajian, yaitu:
a Menggunakan lambang-lambang dalam penyajiannya seperti bahasa, gambar.
b Memperhatikan tata
susunan tertentu
misalnya abjad,
kronologis, sistematis. c Menyajikannya untuk kelompok tertentu, misalnya bahasa
Inggris untuk pemula, psikologi untuk ibu rumah tangga. 3 Bentuk intelektual, yaitu aspek yang ditekankan dalam pembahasan
suatu subjek. Mi salnya “Filsafat Sejarah” disini yang menjadi
subjeknya adalah sejarah sedangkan filsafat adalah bentuk intelektual Pangaribuan, 2010.
Jenis Subjek
Dalam kegiatan analisis subjek dokumen terdapat dalam bermacam- macam jenis subjek. Secara umum digolongkan dalam empat kelompok,
yaitu: a. Subjek Dasar, yaitu subjek yang hanya terdiri dari satu disiplin ilmu
atau sub disiplin ilmu saja. Misalnya: “Pengantar Ekonomi”, yaitu
menjadi subjek dasarnya “Ekonomi”.
b. Subjek Sederhana, yaitu subjek yang hanya terdiri dari satu faset yang berasal dari satu subjek dasar Faset ialah sub kelompok kelas yang
terjadi disebabkan oleh satu ciri pembagian. Tiap bidang ilmu mempunyai faset yang khas sedangkan fokus ialah anggota dari satu
faset. Misalnya “Pengantar ekonomi Pancasila” terdiri dari “subjek dasar ekonomi” dan faset “Pancasila”.
c. Subjek Majemuk, yaitu subjek yang terdiri dari subjek dasar disertai fokus dari dua atau lebih faset. Misalnya:
“Hukum adat di Indonesia”. Subj
ek dasarnya yaitu “Hukum” dan dua fasetnya yaitu” Hukum Adat” faset jenis dan “Indonesia” faset tempat.
d. Subjek Kompleks, yaitu subjek yang terdiri dari dua atau lebih subjek dasar dan saling berinteraksi antara satu sama lain.
Misalnya “Pengaruh agama Hindu terhadap agama Islam”. Disini terdapat dua subjek
dasar yaitu “Agama Hindu” dan Agama Islam”. Untuk menentukan subjek yang diutamakan dalam subjek kompleks
terdapat empat fase, yaitu: 1 Fase Bias, yaitu suatu subjek yang disajikan untuk kelompok
tertentu. Dalam hal ini subjek yang diutamakan ialah subjek yang disajikan. Misalnya “Statistik untuk wartawan” subjek yang
diutamakan ialah “Statistik” bukan “wartawan”.
2 Fase Pengaruh, yaitu bila dua atau lebih subjek dasar saling mempengaruhi antara satu sama lain. Dalam hal ini subjek yang
diutamakan adalah subjek yang dipengaruhi. Misalnya “pengaruh
Abu Merapi terhadap Pertanian di D.I Yogyakarta”. Disini subjek yang diutamakan ialah “Pertanian” bukan “Abu Merapi”.
3 Fase Alat, yaitu subjek yang digunakan sebagai alat untuk menjelaskan atau membahas subjek lain. Disini subjek yang
diutamakan ialah subjek yang dibahas atau dijelaskan. Misalnya: “Penggunaan alat kimia dalam analisis darah”. Disini yang
diutamakan adalah “Darah” bukan “Kimia”.
4 Fase Perbandingan, yaitu dalam satu dokumenbahan pustaka terdapat berbagai subjek tanpa ada hubungannya antara satu sama
lain. Untuk menentukan subjek mana yang akan diutamakan, ketentuannya sebagai berikut:
• Pada subjek yang dibahas lebih banyak. Misalnya: “Islam dan Ilmu Pengetahuan”. Jika Islam lebih
banyak dibahas, utamakan subjek “Islam” dan sebaliknya.
• Pada subjek yang disebut pertama kali. Misalnya “Perpustakaan dan Masyarakat” ditetapkan pada
subjek “Perpustakaan” Pangaribuan, 2010.
Urutan Sitasi
Agar diperoleh suatu urutan yang baku dan taat azaskonsistensi dalam penentuan subjek dan nomor kelas maka Ranganathan dalam
Pangaribuan, 2010 menggunakan konsep yang dikenal “Urutan Sitasi”.
Menurutnya ada lima faset yang mendasar yang dikenal dengan akronim P-M-E-S-T, yakni:
P - Personality wujud M - Matter benda, zat
E - Energy kegiatan, kekuatan, kakas S - Space tempat
T - Time waktu Contoh:
“Konstruksi Jembatan Beton Tahun 20-an di Indonesia”. Jembatan - Personality P
Beton - Matter M Konstruksi - Energy E
Indonesia - Space S Tahun 20-an - Time T Pangaribuan, 2010
Bahasa Dokumen dan Kosa Kata Terkendali
Bahasa dokumen adalah bahasa yang digunakan pada dokumen. Agar seragam dan baku, bahasa dokumen diterjemahkan dideskripsikan ulang ke
dalam kosa kata terkendali controlled vocabulay. Biasanya kosa kata terkendali memiliki suatu daftar istilah, daftar tajuk subjek atau tesaurus yang
merupakan daftar otoritas authority list untuk menentukan istilah yang ditetapkan pada suatu dokumen Chowdhury, 1999.
Standardisasi Istilah
Standardisasi adalah kegiatan pemilihan deskriptor yang paling tepat dalam mewakili kata kunci. Standardisasi dimaksudkan untuk memperoleh
konsistensi penggunaan istilah pada dokumen dan menghindari terjadinya penggunaan istilah yang berbeda namun maknanya sama atau penggunaan
istilah yang sama namun diterjemahkan berbeda oleh penulis. Sebagai standar istilah digunakan CAB thesaurus.
Dalam tulisan ini diberikan definisi dari terminologi yang digunakan dengan mengacu pada Kamus Besar Bahasa Indonesia edisi online :
- Subjek adalah pokok pembicaraan; pokok bahasan. Dalam tulisan ini
yang dimaksud subjek adalah pokok bahasan dalam suatu artikel laporan teknik.
- Kata kunci adalah ungkapan yg mewakili konsep-konsep atau gagasan-
gagasan yg menandai suatu zaman atau suatu kelompok. Dalam tulisan ini kata kunci mengacu pada kata-kata penting yang mewakili konsep-
konsep atau gagasan pokok sebuah artikel laporan teknik. -
Istilah adalah kata atau gabungan kata yang dengan cermat mengungkapkan makna konsep, proses, keadaan, atau sifat yang khas
dalam bidang tertentu. -
Artikel adalah karya tulis lengkap, misalnya laporan berita atau esai dalam majalah, surat kabar, dsb. Dalam tulisan ini, artikel merupakan
karya tulis ilmiah dalam laporan teknik. -
Dokumen adalah artikel laporan teknik.
CABI Thesaurus CABI thesaurus adalah salah satu produk yang diterbitkan oleh
Centre for Agricultural Bioscience International CABI dan merupakan alat pencarian istilah penting untuk semua pengguna ABSTRAK CAB dan
pangkalan data bidang biologi atau bidang terkait. CABI Thesaurus atau CAB Thesaurus tidak hanya diperuntukkan untuk bidang tersebut, namun pangkalan
data ini juga bisa dipakai secara khusus pada bidang botani, zoologi dan mikrobiologi. Berikut adalah profil tentang tesaurus ini :
• Berisi kosakata yang terkendali dan telah digunakan secara konstan sejak tahun 1983.
• Kosakata secara teratur diperbarui versi saat ini dirilis pada bulan Juli 2011.
• Cakupan ilmu yang luas, meliputi ilmu pengetahuan murni dan ilmu pengetahuan terapan, teknologi dan ilmu sosial.
• Mencakup sekitar 136.900 istilah, termasuk 98.500 istilah yang dipakai sebagai istilah indeks dan 38.400 istilah yang bukan istilah indeks
• Mendaftar sekitar 102.000 nama istilah untuk tanaman, hewan dan mikroorganisme.
• Dilengkapi dengan fasilitas untuk pencarian istilah lebih luasumum broader term, istilah lebih khusussempit narrower term, dan istilah
terkaitan related term untuk membantu pengguna menemukan istilah yang paling sesuai.
• Tersedia rujukan silang cross-references dari istilah yang tidak dipakai ke istilah yang lebih dipakai.
• Dilengkapi dengan informasi perbedaan ejaan untuk Bahasa Inggris Amerika dan Bahasa Inggris British British English .
CABI merupakan lembaga internasional yang bersifat nirlaba berbasis ilmu pengetahuan dan pengembangan organisasi informasi. Lembaga ini
meningkatkan kehidupan masyarakat dengan memberikan informasi dan menerapkan keahlian ilmiah untuk memecahkan masalah di bidang pertanian
dan lingkungan. Misi dan tujuan lembaga ini diselaraskan dengan kepentingan negara-negara anggota dan membantu serta memandu aktivitas yang dilakukan.
Produk kegiatan lembaga ini termasuk penerbitan ilmiah, proyek pengembangan dan penelitian, dan jasa penelitian mikroba.
Dalam bentuk elektronik, tesaurus ini digunakan untuk berbagai kegiatan seperti :
Sebagai alat acuan dalam memeriksa ejaan terminologi
Memilih katakunci artikel jurnal primer
Menentukan tajuk subjek katalog perpustakaan
Mengindeks pangkalan data bibliografi internal
Mengindeks dan melakukan penelusuran pangkalan data dan sumber informasi secara online
Mengindeks dan menemukan kembali informasi bahan multimedia
Gambar 1. Contoh tampilan halaman CAB thesaurus CABI Thesaurus tersedia dalam bentuk tercetak hanya pada edisi tahun
1999, dan
dalam bentuk
elektronik pada
alamat web
www.cabi.orgcabthesaurus. Tesaurus ini secara online tersedia juga dalam format XML. Gambar 1 adalah contoh tampilan halaman CABI Thesaurus.
Analisis Co-Words
Teknik analisis co-word pertama dikembangkan pada kegiatan kerjasama the Centre de Sociologie de lInnovation of the Ecole Nationale Superieure des
Mines of Paris dan the Centre National de la Recherche Scientifique CNRS di Perancis pada tahun 1980an, dan sistemnya mereka beri nama LEXIMAPPE.
Selama kurang lebih dua puluh tahun, teknik ini telah digunakan
untuk memetakan dinamika perkembangan beberapa bidang penelitian. Salah satu penelitian awal dilakukan oleh Serge Bauin 1986 untuk memetakan
dinamika akuakultur tahun 1979 s.d. 1981 berdasarkan pencantuman inklusi dan indeks kedekatan proximity indexes. Pencantuman dan peta kedekatan
proximity maps dilakukan untuk tahun 1979 dan 1981 He, 1999. Selanjutnya diuraikan dalam artikel He 1999 tersebut sebuah hasil
analisis peta co-word, dengan membagi kata kunci ke dalam tiang pusat central pole dan kata mediator mediator word, peta tahun 1979 ditunjukkan
pada Gambar 2, sementara tahun 1981 ditunjukkan pada Gambar 3. Dalam peta untuk tahun 1979, Salmo gairdneri, nama sebuah spesies ikan yang telah
dibudidayakan di laut Norwegia sejak 1950-an, tetap bertahan secara tak terduga sebagai kata mediator yang mempunyai frekuensi tinggi. Namun,
dalam peta tahun 1981, istilah ini tergantikan dengan Salmonidae. Salah satu perubahan yang penting adalah tiang pusat aquaculture dalam peta 1979
sudah menghilang. Subjek ini telah digantikan oleh dua istilah baru yaitu aquaculture development
” dan aquaculture techniques”. Selain itu, kata artificial feeding kehilangan statusnya sebagai tiang pusat di peta untuk tahun
1979 dan muncul di bawah fish culture dalam peta 1981.
Gambar 2 Peta co-words tahun 1979
Gambar 3 Peta co-words tahun 1981 Peta kedekatan proximity map untuk tahun 1979 dan 1981 masing-
masing ditunjukkan pada Gambar 4 dan 5. Jika kedua peta tersebut dibandingkan, diketahui bahwa, dari tahun 1979 s.d. tahun 1981, beberapa
gugus, seperti feeding and nutrition”, strukturnya menjadi lebih panjang,
yaitu, rata-rata jumlah tautan setiap katanya telah meningkat. Secara keseluruhan, peningkatan jumlah tautan per kata dalam peta rata-rata sekitar
2,33 - 2,95. Ini bisa diartikan sebagai indikasi awal terintegrasinya seluruh bidang.
Gambar 4 Peta kedekatan tahun 1979
Gambar 5 Peta kedekatan tahun 1981
Pada artikel He tersebut, mulai dikenal istilah tiang pusat atau pusat gugus yang disebut central pole dan kata mediator mediator word. Kedua istilah
tersebut dipakai dalam menjelaskan sebuah gambar yang memetakan dinamika bidang akuakultur pada tahun 1979 s.d. 1981.
Contoh di atas dan contoh lain, misalnya pada Law Courtial 1989, Law Whittaker 1992, dan Coulter et al, 1998 mengungkapkan bahwa analisis
co-word adalah metode yang bisa dipakai untuk menemukan asosiasi antar wilayah penelitian dalam sebuah ilmu serta untuk mengungkapkan hubungan
penting lainnya yang mungkin sulit untuk dideteksi He, 1999. Ini adalah alat yang ampuh yang memungkinkan untuk melacak struktur dan evolusi jaringan
socio-cognitive Bauin, 1986.
Perkembangan Analisis Co-words
Analisis co-words didasarkan pada analisis co-occurrence dari dua atau lebih kata kunci atau kata-kata yang terdapat dalam teks yang digunakan untuk
mengindeks artikel atau dokumen lainnya Diodato, 1994. Jadi analisis co- words adalah analisis perulangan kejadian co-occurrence dua kata atau lebih
dalam sebuah atau beberapa dokumen. Kata tersebut dapat berupa kata kunci keyword atau kata teks.
Pada Tahun 1986, Callon, Law, dan Rip menulis sebuah buku berjudul “Mapping the dynamics of science and tehnology”. Buku ini bisa dianggap
sebuah karya penting dalam bidang analisis co-word. Bagian pertama buku ini berisi pendahuluan tentang bagaimana menelaah kekuatan sebuah bidang ilmu.
Bagian kedua membahas tentang kekuatan teks kata-kata dalam sains dan teknologi, para penulisnya menawarkan sebuah teori dasar tentang analisis co-
word , yang disebut “actor network”. Bagian ketiga berisi penjelasan rinci tentang
co-word yang disertai contohnya He, 1999. Teknik analisis co-word pertama kali diusulkan guna memetakan dinamika
ilmu pengetahuan. Cara yang paling umum untuk memahami dinamika ilmu pengetahuan adalah dengan mengambil kekuatan ilmu pengetahuan pada
masyarakat komunitas ilmu pengetahuan saat ini ke dalam hitungan. Actor network adalah landasan teoritis analisis co-word untuk memetakan dinamika
ilmu Callon et al., 1986a. Laboratorium dan literatur dianggap sebagai dua alat yang sangat penting
bagi para ilmuwan. Proses perubahan dan pengembangan secara kompleks terjadi di laboratorium, lalu mengabadikannya di atas kertas Latour, 1987. Ini berarti
bahwa para ilmuwan memberi penekanan khusus pada teks. Mereka tidak hanya menggunakan teks-teks untuk mempublikasikan dunia mereka yang dibangun di
laboratorium tetapi juga menggunakan teks sebagai cara untuk membangun dunia dan menandai kehadiran mereka di mata orang lain. Meskipun ilmu pengetahuan
tidak dapat direduksi hanya pada teks saja, namun teks masih merupakan sumber utama tentang bagaimana sebuah bidang kajian diciptakan dan dikembangkan di
laboratorium. Oleh karena itu, selain mengikuti “aktor-aktor” yang berperan
mengubah dunia, mengikuti perkembangan teks adalah cara lain untuk memetakan dinamika ilmu pengetahuan.
Berdasarkan “kejadian pasangan kata”, analisis co-word berupaya
mengekstrak tema ilmu pengetahuan dan mendeteksi keterkaitan antara tema- tema secara langsung dari subjek pada teks. Hal ini tidak bergantung pada kuat
atau lemahnya setiap definisi dari tema penelitian dalam ilmu pengetahuan. Dan
hal ini memungkinkan untuk mengikuti para “aktor” dan mendeteksi dinamika
ilmu tanpa mengurangi perannya baik secara internal maupun eksternal Gallon et al., 1986a.
Sebuah studi awal telah dilakukan untuk membandingkan citation, co- citation, dan analisis co-word dari cakupan lima disiplin ilmu Healey et al.,
1986. Hasil temuannya adalah adanya kesulitan untuk menganalisis dan menerima hasil analisis awal co-word, serta beberapa ahli meragukan
kehandalan dari temuan ini. Teknik co-word yang dievaluasi dalam studi ini disebut sebagai co-word generasi pertama oleh Law et al. 1988.
Pada analisis co-word “generasi ke-dua”, sebuah diagram digunakan untuk
menggambarkan kekuatan strength konteks global pada sumbu X dan kekuatan konteks lokal pada sumbu Y. Diagram ini kemudian banyak digunakan dalam
studi co-word. Dua macam indeks yaitu kepadatan density dan sentralitas centrality digunakan untuk mengukur kekuatan masing-masing pada konteks
lokal dan konteks global.
Kepadatan Density. Kepadatan digunakan untuk mengukur kekuatan tautan
yang mengikat kata-kata pembentuk gugus cluster, kepadatan merupakan kekuatan internal dari sebuah gugus. Kepadatan menyediakan representasi yang
baik dari kapasitas sebuah gugus untuk menjaga dan mengembangkannya selama sekian lama dalam sebuah lapangan penelitian Callon et al., 1991. Peringkat
area subjek atau gugus yang berkoherensi pada skala internalnya density memberikan informasi yang sistematis tentang isu utamanya. Selanjutnya, dengan
cara mengurutkan kata kunci dapat memberikan gambaran yang tepat dari suatu area subjek Bauin et al., 1991 .
Sentralitas Centrality. Sentralitas digunakan untuk mengukur kekuatan
interaksi suatu subjek dengan bidang studi lainnya. Kajian pemeringkatan gugus cluster pada sentralitas dapat menunjukkan sejauh mana masing-masing
wilayah dianggap sebagai pusat dalam jaringan riset global. Semakin besar jumlah dan kekuatan hubungan suatu subjek dengan bidang studi lain, akan
semakin memusatkan sebuah area subjek dalam jaringan penelitian Bauin et al., 1991. Untuk gugus tertentu area, sentralitasnya bisa merupakan jumlah dari
semua nilai tautan eksternalnya Turner et al., 1988;. Courtial et al., 1993 atau
akar kuadrat dari jumlah kuadrat semua nilai tautan eksternalnya Coulter et al, 1998. Bila disederhanakan, itu merupakan rata-rata nilai dari enam tautan
eksternal pertama Callon et al., 1991. Tautan eksternal adalah tautan yang terjadi dari kata-kata pada suatu gugus terhadap kata-kata eksternal diluar gugus
tersebut He, 1999. Diagram
. Diagram menyediakan representasi struktur global setiap bidang atau subbidang ilmu. Diagram dibuat dengan menempatkan sentralitas centrality dan
kepadatan density ke dalam dua dimensi diagram Law et al., 1988. Biasanya, sumbu horisontal mewakili sentralitas, sumbu vertikal menggambarkan
kepadatan, dan gambar grafiknya terletak pada nilai rata-rata sumbu masing- masing. Peta ini terletak pada setiap subjek dalam skalaruang dua dimensi dan
dibagi menjadi empat kuadran. Analisis co-words ditujukan untuk menganalisis isi, pola dan
kecendrungan trend dari suatu kumpulan dokumen dengan mengukur hubungan kekuatan istilah terms De Looze Lemarie, 1997. Jadi manfaat
dari analisis co-words adalah untuk mengembangkan atau menyaring taksonomi suatu bidang ilmu. Selanjutnya dikatakan bahwa di Amerika Utara, analisis co-
words telah diintegrasikan dalam sistem pendukung tingkat ilmu pengetahuan dalam masyarakat ilmiah De Looze Lemarie, 1997.
Rip dan Courtial 1984 mengumpulkan artikel dalam jurnal bioteknologi selama periode 10 tahun. Artikel tersebut ditandai coded dengan kata kunci dan
menganalisis relasi antara kata kunci untuk memperlihatkan koneksitas antara bidang dalam bioteknologi.
Peters Raan 1993 menggunakan analisis co-words untuk mengkaji bidang teknik kimia. Mereka menggunakan publikasi dari sepuluh jurnal
terkemuka, publikasi dari 23 ilmuwan terkemuka, serta publikasi dari konferensi- konferensi penting. Matrik kemunculan dari kata-kata yang ada pada judul dan
abstrak dipetakan dengan skala multi dimensional. Hasil pemetaan tersebut, kemudian dievaluasi oleh ahli dalam bidang tersebut.
McKinnon 1977 mengkaji hubungan tema dalam novel Kierkegaard dengan menggunakan kemunculan pasangan kata. Metodologi yang digunakan
merupakan langkah awal dalam mengekstraksi hubungan kata dalam suatu teks
menurut kemunculan pasangan katanya. Perkembangan selanjutnya dari analisis co-words ditujukan untuk mengevaluasi perkembangan suatu bidang ilmu
sebagaimana yang dilakukan oleh Michael Callon pada tahun 1979, 1983 dan 1986 Peters Raan, 1993.
De Looze dan Lemarie 1997 menganalisis sekumpulan dokumen yang berhubungan dengan protein tanaman plant proteins. Untuk mengelompokkan
pasangan kata pada satu dokumen dengan dokumen lainnya, digunakan suatu program perangkat lunak yang disebut Leximappe. Selanjutnya, program
tersebut membentuk pasangan kata yang memiliki hubungan paling dekat. Program ini memungkinkan untuk menempatkan gugus utama dari kata kunci
sehingga data dapat dibaca kembali dan diinterpretasikan. Dari hasil penelitian yang dilakukan, diperoleh tiga bidang utama dari bioteknologi yaitu a kegunaan
protein, b perlakuan enzim pada protein, dan c aplikasi teknik genetika. Coulter
et al.
1998 melakukan
penelitian empiris
untuk mendemonstrasikan keefektifan analisis isi content analysis untuk memetakan
bidang teknik perangkat lunak software engineering. Dalam penelitian ini, diambil sejumlah besar publikasi yang berhubungan dengan teknik perangkat
lunak dari tahun 1982-1994. Masing-masing publikasi tersebut dipresentasikan oleh deskriptor istilah indeks untuk menganalisis tema dan kecendrungan pada
penelitian teknik perangkat lunak tersebut. Untuk mendukung penelitian tersebut, mereka menggunakan suatu program perangkat lunak yang
dikembangkan oleh Software Engineering Institute Carnegie Mellon University yang disebut dengan Content Analysis and Information Retrieval CAIR. Dari
penelitian tersebut mereka menyimpulkan bahwa tema utama dari bidang teknik perangkat lunak, yaitu object-oriented programming yang terfokus pada software
development. Sistem yang paling banyak digunakan, yaitu X-Windows, Microsoft Windows, Ada, C++ dan UNIX, sedangkan Pascal, Basic dan Cobol
mulai jarang ditemukan. Keunggulan co-words dibandingkan dengan metode lain yang sama-sama
memfokuskan terhadap teks adalah analisis co-word jauh lebih fleksibel karena mampu memperlihatkan jaringan penelitian melalui grafik He, 1999. Walaupun
penelitian ini telah banyak dilakukan dan memberikan kontribusi terhadap
perkembangan ilmu pengetahuan, namun menurut Leydesdorff 1992 bahwa “kata” akan bermakna bila berada dalam satuan utuh suatu kalimat. Berdasarkan
pemikiran tersebut, ia menawarkan suatu pendekatan baru dalam menganalisis suatu perkembangan ilmu, yaitu dengan menghitung kemunculan kata secara
bersamaan dari kalimat pertama dengan kalimat kedua, begitu seterusnya dalam satu paragraf. Kemudian menghitung kata yang muncul bersamaan dalam paragraf
pertama dengan paragraf kedua dalam satu seksi Bab. Namun kelemahan pendekatan ini, sebagaimana diakui oleh Leydesdorff lebih rumit dan
membutuhkan waktu yang relatif lebih lama. Selanjutnya, kualitas hasil dari analisis co-words tergantung pada berbagai faktor, seperti kualitas kata kunci dan
istilah indeks, ruang lingkup pangkalan data, dan kelayakan metode statistika Law et al. 1988. Validitas peta akan tergantung, dalam batas tertentu, pada
kegiatan pengindeksan subjek. Whittaker, 1989 dalam He, 1991 telah menunjukkan bahwa hasil analisis co-words tergantung pada bagaimana para
pengindeks memilih kata kunci untuk suatu konsep bidang ilmu. Akibatnya, hasil dari pengindeksan lebih mirip menjadi hasil konseptualisasi pengindeks dari pada
dari penulis karya aslinya. Selain efek pengindeks, keterlambatan antara penulisan dokumen dan saat ketika dilakukan pengindeksan atau dimasukkan ke
dalam pangkalan data menyebabkan analisis co-words tidak bisa mendeteksi tema penelitian yang muncul pada tahap awal. Callon et al, 1986b
Kata Kunci Sebagai Co-Words
Analisis perulangan kejadian kata kunci biasanya berarti mengkaji istilah pengindeksan yang diberikan pada dokumen oleh badanjasa pengindeksan atau
oleh pengarang. Misalnya bila sekelompok dokumen memiliki istilah pengindeksan berupa “jaringan” dan “teknologi”, maka dikatakan kelompok
dokumen yang memiliki dua kata kunci tersebut memiliki subjek yang sama.
Analisis co-words menunjukan bagaimana dokumen yang sama terkelompok dan mengidentifikasi gugus dokumen yang memiliki topik yang sama. Dasar koleksi
data mungkin berupa pengembangan sebuah kata kunci yang menunjukan profil masing-masing dokumen. Analisis co-words dapat dipaparkan dalam bentuk
peta gugus dokumen. Law dan Whittaker 1992 mengkaji perulangan kejadian istilah indeks dalam dokumen tentang pengasaman. Perulangan kejadian dalam
istilah pengindeksan memungkinkan mereka menggugus dokumen. Setiap gugus tampaknya berkaitan dengan tema tertentu dalam bidang penelitian asidifikasi
pengasaman Diodato, 1994.
Kata Teks Sebagai Co-Words
Leydesdorff 1992 menerapkan teknik kata teks dalam bidang scientometrics. Misalnya perulangan kejadian sebuah kata dan sinonimnya dalam
kalimat yang sama dalam sebuah makalah menunjukkan pentingnya kalimat tersebut. Analisis semacam ini pada seluruh dokumen memungkinkan
rekonstruksi pengembangan sebuah ide yang berlanjut pada penulisan sebuah makalah Diodato, 1994.
Co-Citation
Adalah situasi dimana dua atau lebih pengarang, dokumen, atau jurnal secara bersamaan dikutip cited oleh dokumen lain Diodato, 1994. Author co-
citation analysis merupakan studi co-citation yang terjadi diantara para pengarangpenulis. Demikian halnya dengan Journal co-citation analysis, analisis
co-citation yang berkaitan diantara beberapa jurnal. Misalnya dapat di lihat pada bibliografi di setiap akhir sebuah artikel, contoh pada bidang ilmu perpustakaan
dan informasi. Informasi bibliografi yang berisi daftar artikel yang disusun oleh Garfield dan Lancaster, kemudian kedua penulis tersebut di co-cited oleh
bibliografi. Analisis author co-citation dapat menentukan apakah ada hubungan kuat antara penulis subjek yang sering di co-cited. Jika memang ada, ini
menunjukkan bahwa subjek pencarian dapat dilakukan dengan menggunakan pasangan atau kelompok nama tersebut. Hasil analisis author co-citation dapat
ditampilkan dalam matriks co-citation. Referensi contoh dari Lunin dan White dalam Diodato, 1994 merupakan koleksi artikel khusus tentang analisis author
co-citation. Artikel tersebut ditulis untuk orang awam dalam bidang analisis co- citation. Kombinasi co-citation dan co-words merupakan kegiatan yang
menggabungkan analisis co-citation dan kemiripan kata, dilakukan untuk meningkatkan kemampuan teknik kuantitatif serta dapat menggambarkan aspek
struktur dan dinamika suatu penelitian ilmiah.
Co-Classification
Merupakan situasi dua dokumen atau lebih tergabung dalam satu gugus karena notasi klasifikasi yang sama. Co-Classification digunakan untuk
mengumpulkan dokumen yang sama serta menunjukkan bahwa bibliografi secara kuantitatif menunjukkan subjek yang sama dengan judul dokumen. Untuk
klasifikasi menggunakan UDC atau DDC, dan hasilnya dituangkan dalam denah Diodato, 1994.
Pemetaan Subjek S ubject Mapping
Spasser 1997 mengatakan bahwa peta adalah alat relasi relational tools yang menyediakan informasi antar hubungan entitas yang dipetakan. Peta tidak
hanya merupakan alat yang praktis untuk menyampaikan informasi mengenai aktivitas ilmiah, tetapi juga sebagai dasar untuk mengkaji dan memahami
aktivitas ilmiah dengan menggambarkannya sebagai suatu sistem yang tersusun. Beberapa jenis peta yang dikembangkan dalam pemetaan ilmu pengetahuan
dalam bidang bibliometrika, antara lain: peta journal intercitation, journal co- citation, document co-citation, author co-citation, co-words deskriptor, dan co-
classification. Umumnya setelah melakukan analisis co-words, akan melakukan
penggugusan subjeknya mapping dengan menggunakan dendrogram dan multidimensional scalling MDS. MDS adalah teknik analisis data yang
menggambarkan suatu struktur “distance-like data” dalam bentuk gambar. Dengan MDS kemiripan suatu objek dengan objek yang lain dapat
dipresentasikan dalam bentuk peta. Untuk kebutuhan analisis MDS diperlukan informasi berupa matriks dissimilarity.
Nilai Koefisien Jaccard
Jaccard Coeficient adalah salah satu metode yang dipakai untuk menghitung kemiripan antara dua objek items. Seperti halnya cosine distance
dan matching coefficient, secara umum perhitungan metode ini didasarkan pada pengukuran jarak yang terdapat di antara dua vektor ukuran kemiripan ruang
vektor. Jaccard similarity atau Jaccard Coefficient menghitung kemiripan antara dua objects, X dan Y yang dinyatakan dalam dua buah vektor Tan et.al, 2005.
Dendrogram
Prinsip dasar dalam penggugusan dokumen adalah menentukan ukuran kemiripan antar dokumen yang akan dikelompokkan dan menjadikannya sebagai
dasar untuk menghasilkan gugus. Kemiripan antar dokumen dapat didasarkan pada beberapa variabel seperti journal intercitation, co-citation journal co-
citation, document co-citation, author co-citation,bibliographic coupling, co- descriptor, dan co-classification. Adapun kemiripan antara dua dokumen X dan Y
dapat diukur dengan beberapa cara, yaitu: 1. Simple matching:
X Y 2. Dice’s coefficient: 2 X YX +Y
3. Jaccard’s coefficient: X YX Y
4. Cosine coefficient: X YX 12 .Y12
5. Overlap coefficient: X YminX,Y
Keterangan: X = dokumen pertama
Y = dokumen kedua Kemiripan D1, D2 = |D1
ᴒ
D2|
Bila |D1
ᴒ
D2| = a
Maka |D1
ᴒ
D2| = a Keterangan:
D1 = dokumen pertama D2 = dokumen kedua
Untuk mendapatkan total frekuensi pemasangan subjeknya dapat dilakukan dengan rumus 2 X 2. Frekuensi pemasangan subjek diperlihatkan dalam Tabel 1.
Tabel 1. Total Pemasangan Dokumen
D2 Jumlah
1 D1
1 A
b a + b
C d
c + d Jumlah
a + c b + d
a + b c + d
Keterangan: a.
Menyatakan total frekuensi hubungan subjek b.
Menyatakan jumlah subjek yang dimiliki D1 tetapi tidak dimiliki oleh D2 c.
Menyatakan jumlah subjek yang dimiliki D2 tetapi tidak dimiliki oleh D1 d.
Menyatakan jumlah subjek yang tidak dimiliki oleh D1 dan D2 atau sama dengan nihil
Berhubung jumlah subjek yang dimiliki oleh setiap makalah tidak sama maka diperlukan normalisasi Hasibuan, 1995. Normalisasi dilakukan dengan
menghilangkan nilai d pada rumus kemiripan :
karena nilai d = nihil, maka d dihilangkan, dan hasil penghilangan tersebut menghasilkan koefisien Jaccard, yaitu :
Kemudian dibuat matrik kemiripan similarity berdasarkan koefisien Jaccard. Matriks hasil perhitungan ini disajikan ke dalam tabel yang disebut tabel
matriks kemiripan. Pada matriks ini, nilai koefisien Jaccard digunakan untuk mengukur hubungan dari setiap pasangan dokumen document pair. Semakin
tinggi nilai koefisiennya, maka semakin dekat subjek dokumen tersebut dengan dokumen pasangannya. Matriks ini merupakan penjabaran dari matriks simple
matching. Selanjutnya untuk keperluan penggugusan subjek dokumen digunakan
metode complete linkage. Metode ini dipakai untuk mendapatkan jarak dalam mengelompokkan dokumen dengan cara mentransformasikan matriks koefisien
Jaccard ke
dalam matriks
ketidakmiripan dissimilarity.
Cara mentransformasikan matriks koefisien Jaccard adalah dengan menggunakan
rumus :
Ketidakmiripan = 1 – nilai koefisien Jaccard
Salah satu hasil output dari proses gugus adalah dendrogram atau diagram yang menyerupai pohon a tree-like diagram, yang dapat memperlihatkan
hubungan dokumen secara lebih jelas. Metode pembentukan gugus biasanya dikategorikan menurut tipe dari struktur gugus yang dihasilkan. Secara umum
metode penggugusan terbagi menjadi dua, yaitu metode non-hirarkhis dan metode
hirarkhis.
Metode Hirarkis
Miswan 2002 menjelaskan bahwa pembentukan gugus dokumen dalam sistem temu kembali informasi dengan metode hirarkis adalah sebagai berikut:
a. Mengidentifikasi dua dokumen yang paling mirip dan menggabungkannya
menjadi sebuah gugus. b.
Mengidentifikasi dan menggabungkan dua dokumen yang paling mirip berikutnya menjadi sebuah gugus sampai semua dokumen tergabung dalam
gugus-gugus yang terbentuk. Struktur gugus yang dihasilkan oleh metode hirarkhis ini biasanya diperlihatkan
sebagai struktur diagram pohon atau dendrogram seperti terlihat pada Gambar 6 dan 7.
Gambar 6 Dendrogram dari hierarchical clustering Rasmussen, 1992
Gambar 7 Pohon dari hierarchical clustering Salton, 1989.
Ilustrasi dendrogram lain disajikan pada gambar berikut :
Case Label num D31
31 ---+++--- D45
45 -+--+---+-----+------+ D57
57---+-----+---+--
Gambar 8 Ilustrasi dendrogram analisis co-words artikel
Gambar 8 tersebut memperlihatkan dendrogram dari analisis Co-word. Sumbu X mempresentasikan jarak antar gugus, sedangkan sumbu Y
mempresentasikan dokumen.
Kemiripan antar dokumen ditentukan dengan mengukur jarak antar dokumen. Dua dokumen yang mempunyai jarak paling kecil dikatakan
mempunyai kemiripan paling tinggi, dan dikelompokkan ke dalam satu gugus yang sama. Sebaliknya dua dokumen yang mempunyai jarak paling besar
dikatakan mempunyai kemiripan paling rendah, dan dimasukkan ke dalam gugus yang berbeda. Beberapa metode yang dapat digunakan untuk menentukan jarak
antar dua dokumen antara lain: single link, complete link, group average link,
Ward’s method, centroid method dan median method Rasmussen, 1992.
BAB III METODE