TINJAUAN PUSTAKA Bibliometrics Analysis Using Co–words Approach: Mapping Research Report of Research Center for Biology, Indonesian Institute of Sciences.

BAB II TINJAUAN PUSTAKA

Populasi Populasi adalah wilayah generalisasi yang terdiri dari objek atau subjek yang mempunyai kuantitas dan karakteristik tertentu yang ditetapkan oleh peneliti untuk dipelajari dan kemudian ditarik kesimpulannya. Jika jumlah populasinya besar, sementara penelitian tidak mungkin mempelajari semua populasi tersebut, maka dilakukan teknik sampling, yaitu suatu prosedur untuk mendapatkan dan mengumpulkan karakteristik yang berada di dalam sebuah populasi meskipun data itu tidak diambil secara keseluruhan, namun hanya sebagian saja. Bagian dari populasi itulah yang disebut sampel. Namun jika data dianggap tidak terlalu besar, maka teknik sampling tidak perlu dilakukan Sugiyono, 1999. Pengindeksan Subjek Menurut Sulistyo-Basuki 1992, tingkat pengindeksan tergantung pada keperluan dan kebijaksanaan suatu unit informasi. Pengindeksan bisa saja mencakup hanya subjek utama yang disebut pengindeksan generik. Pada pengindeksan tingkat medium, umumnya pengindeksan mencakup semua subjek yang dicakup dalam dokumen, namun mengidentifikasi subjek tersebut dengan istilah umum saja dan biasanya mencakup sampai sepuluh deskriptor. Pada pengindeksan tingkat dalam pengindeksan mencakup semua subjek dan mendeskripsikan subjek tersebut dengan sejumlah besar deskriptor. Pengindeksan terinci mengindeks seluruh teks, bahkan sampai mengindeks kalimat demi kalimat. Analisis Subjek Analisis subjek merupakan kegiatan memilih kata kunci atau deskriptor yang tepat untuk mewakili sebuah dokumen sehingga bisa digunakan sebagai entri indeks. Menurut Pangaribuan 2010, kegiatan analisis subjek membutuhkan kemampuan yang cukup, karena pengindeks dituntut memiliki kemampuan untuk menentukan subjek apa yang terkandung dalam sebuah bahan pustaka yang sedang diolah. Ada tiga hal mendasar yang perlu dipahami pengindeks dalam menganalisis subjek, yaitu jenis konsep, jenis subjek, dan urutan sitasi. Agar kata kunci atau deskriptor tersebut bisa digunakan secara konsisten maka diperlukan sebuah standar. Untuk itu diperlukan sebuah sarana yang menyediakan bahasaistilah indeks yang baku dan terkendali controlled vocabulary. Daftar istilah tersebut dikenal dengan daftar tajuk subjek dan tesaurus Arwendria, 2002. Jenis Konsep Dalam satu bahan pustaka dapat dibedakan tiga jenis konsep yaitu: a. Disiplin Ilmu, yaitu istilah yang digunakan untuk satu bidang atau cabang ilmu pengetahuan. Disiplin ilmu dapat dibedakan menjadi dua kategori: 1 Disiplin Fundamental. Meliputi bagian-bagian utama ilmu pengetahuan. Oleh para ahli disiplin fundamental dikelompokkan menjadi tiga yakni ilmu-ilmu sosial, ilmu-ilmu pengetahuan alam, dan ilmu-ilmu kemanusiaan. 2 Sub disiplin, merupakan bidang spesial dalam satu disiplin fundamental. Misalnya dalam disiplin ilmu fundamental alam, sub disiplinnya terdiri atas fisika, kimia, biologi. b. Fenomena topik yang dibahas, merupakan wujudbenda yang menjadi objek kajian dari disiplin ilmu. Misalnya pendidikan remaja. “Pendidikan” merupakan konsep disiplin ilmu, sedangkan “remaja” adalah fenomena yang menjadi objek atau sasarannya. c. Bentuk, ialah cara bagaimana suatu subjek disajikan. Dibedakan menjadi tiga jenis: 1 Bentuk Fisik, yakni medium atau sarana yang digunakan dalam menyajikan suatu subjek. Misalnya dalam bentuk buku, majalah, pita rekaman, dan sejenisnya. 2 Bentuk Penyajian, yang menunjukkan pengaturan atau organisasi isi bahan pustaka. Ada tiga bentuk penyajian, yaitu: a Menggunakan lambang-lambang dalam penyajiannya seperti bahasa, gambar. b Memperhatikan tata susunan tertentu misalnya abjad, kronologis, sistematis. c Menyajikannya untuk kelompok tertentu, misalnya bahasa Inggris untuk pemula, psikologi untuk ibu rumah tangga. 3 Bentuk intelektual, yaitu aspek yang ditekankan dalam pembahasan suatu subjek. Mi salnya “Filsafat Sejarah” disini yang menjadi subjeknya adalah sejarah sedangkan filsafat adalah bentuk intelektual Pangaribuan, 2010. Jenis Subjek Dalam kegiatan analisis subjek dokumen terdapat dalam bermacam- macam jenis subjek. Secara umum digolongkan dalam empat kelompok, yaitu: a. Subjek Dasar, yaitu subjek yang hanya terdiri dari satu disiplin ilmu atau sub disiplin ilmu saja. Misalnya: “Pengantar Ekonomi”, yaitu menjadi subjek dasarnya “Ekonomi”. b. Subjek Sederhana, yaitu subjek yang hanya terdiri dari satu faset yang berasal dari satu subjek dasar Faset ialah sub kelompok kelas yang terjadi disebabkan oleh satu ciri pembagian. Tiap bidang ilmu mempunyai faset yang khas sedangkan fokus ialah anggota dari satu faset. Misalnya “Pengantar ekonomi Pancasila” terdiri dari “subjek dasar ekonomi” dan faset “Pancasila”. c. Subjek Majemuk, yaitu subjek yang terdiri dari subjek dasar disertai fokus dari dua atau lebih faset. Misalnya: “Hukum adat di Indonesia”. Subj ek dasarnya yaitu “Hukum” dan dua fasetnya yaitu” Hukum Adat” faset jenis dan “Indonesia” faset tempat. d. Subjek Kompleks, yaitu subjek yang terdiri dari dua atau lebih subjek dasar dan saling berinteraksi antara satu sama lain. Misalnya “Pengaruh agama Hindu terhadap agama Islam”. Disini terdapat dua subjek dasar yaitu “Agama Hindu” dan Agama Islam”. Untuk menentukan subjek yang diutamakan dalam subjek kompleks terdapat empat fase, yaitu: 1 Fase Bias, yaitu suatu subjek yang disajikan untuk kelompok tertentu. Dalam hal ini subjek yang diutamakan ialah subjek yang disajikan. Misalnya “Statistik untuk wartawan” subjek yang diutamakan ialah “Statistik” bukan “wartawan”. 2 Fase Pengaruh, yaitu bila dua atau lebih subjek dasar saling mempengaruhi antara satu sama lain. Dalam hal ini subjek yang diutamakan adalah subjek yang dipengaruhi. Misalnya “pengaruh Abu Merapi terhadap Pertanian di D.I Yogyakarta”. Disini subjek yang diutamakan ialah “Pertanian” bukan “Abu Merapi”. 3 Fase Alat, yaitu subjek yang digunakan sebagai alat untuk menjelaskan atau membahas subjek lain. Disini subjek yang diutamakan ialah subjek yang dibahas atau dijelaskan. Misalnya: “Penggunaan alat kimia dalam analisis darah”. Disini yang diutamakan adalah “Darah” bukan “Kimia”. 4 Fase Perbandingan, yaitu dalam satu dokumenbahan pustaka terdapat berbagai subjek tanpa ada hubungannya antara satu sama lain. Untuk menentukan subjek mana yang akan diutamakan, ketentuannya sebagai berikut: • Pada subjek yang dibahas lebih banyak. Misalnya: “Islam dan Ilmu Pengetahuan”. Jika Islam lebih banyak dibahas, utamakan subjek “Islam” dan sebaliknya. • Pada subjek yang disebut pertama kali. Misalnya “Perpustakaan dan Masyarakat” ditetapkan pada subjek “Perpustakaan” Pangaribuan, 2010. Urutan Sitasi Agar diperoleh suatu urutan yang baku dan taat azaskonsistensi dalam penentuan subjek dan nomor kelas maka Ranganathan dalam Pangaribuan, 2010 menggunakan konsep yang dikenal “Urutan Sitasi”. Menurutnya ada lima faset yang mendasar yang dikenal dengan akronim P-M-E-S-T, yakni: P - Personality wujud M - Matter benda, zat E - Energy kegiatan, kekuatan, kakas S - Space tempat T - Time waktu Contoh: “Konstruksi Jembatan Beton Tahun 20-an di Indonesia”. Jembatan - Personality P Beton - Matter M Konstruksi - Energy E Indonesia - Space S Tahun 20-an - Time T Pangaribuan, 2010 Bahasa Dokumen dan Kosa Kata Terkendali Bahasa dokumen adalah bahasa yang digunakan pada dokumen. Agar seragam dan baku, bahasa dokumen diterjemahkan dideskripsikan ulang ke dalam kosa kata terkendali controlled vocabulay. Biasanya kosa kata terkendali memiliki suatu daftar istilah, daftar tajuk subjek atau tesaurus yang merupakan daftar otoritas authority list untuk menentukan istilah yang ditetapkan pada suatu dokumen Chowdhury, 1999. Standardisasi Istilah Standardisasi adalah kegiatan pemilihan deskriptor yang paling tepat dalam mewakili kata kunci. Standardisasi dimaksudkan untuk memperoleh konsistensi penggunaan istilah pada dokumen dan menghindari terjadinya penggunaan istilah yang berbeda namun maknanya sama atau penggunaan istilah yang sama namun diterjemahkan berbeda oleh penulis. Sebagai standar istilah digunakan CAB thesaurus. Dalam tulisan ini diberikan definisi dari terminologi yang digunakan dengan mengacu pada Kamus Besar Bahasa Indonesia edisi online : - Subjek adalah pokok pembicaraan; pokok bahasan. Dalam tulisan ini yang dimaksud subjek adalah pokok bahasan dalam suatu artikel laporan teknik. - Kata kunci adalah ungkapan yg mewakili konsep-konsep atau gagasan- gagasan yg menandai suatu zaman atau suatu kelompok. Dalam tulisan ini kata kunci mengacu pada kata-kata penting yang mewakili konsep- konsep atau gagasan pokok sebuah artikel laporan teknik. - Istilah adalah kata atau gabungan kata yang dengan cermat mengungkapkan makna konsep, proses, keadaan, atau sifat yang khas dalam bidang tertentu. - Artikel adalah karya tulis lengkap, misalnya laporan berita atau esai dalam majalah, surat kabar, dsb. Dalam tulisan ini, artikel merupakan karya tulis ilmiah dalam laporan teknik. - Dokumen adalah artikel laporan teknik. CABI Thesaurus CABI thesaurus adalah salah satu produk yang diterbitkan oleh Centre for Agricultural Bioscience International CABI dan merupakan alat pencarian istilah penting untuk semua pengguna ABSTRAK CAB dan pangkalan data bidang biologi atau bidang terkait. CABI Thesaurus atau CAB Thesaurus tidak hanya diperuntukkan untuk bidang tersebut, namun pangkalan data ini juga bisa dipakai secara khusus pada bidang botani, zoologi dan mikrobiologi. Berikut adalah profil tentang tesaurus ini : • Berisi kosakata yang terkendali dan telah digunakan secara konstan sejak tahun 1983. • Kosakata secara teratur diperbarui versi saat ini dirilis pada bulan Juli 2011. • Cakupan ilmu yang luas, meliputi ilmu pengetahuan murni dan ilmu pengetahuan terapan, teknologi dan ilmu sosial. • Mencakup sekitar 136.900 istilah, termasuk 98.500 istilah yang dipakai sebagai istilah indeks dan 38.400 istilah yang bukan istilah indeks • Mendaftar sekitar 102.000 nama istilah untuk tanaman, hewan dan mikroorganisme. • Dilengkapi dengan fasilitas untuk pencarian istilah lebih luasumum broader term, istilah lebih khusussempit narrower term, dan istilah terkaitan related term untuk membantu pengguna menemukan istilah yang paling sesuai. • Tersedia rujukan silang cross-references dari istilah yang tidak dipakai ke istilah yang lebih dipakai. • Dilengkapi dengan informasi perbedaan ejaan untuk Bahasa Inggris Amerika dan Bahasa Inggris British British English . CABI merupakan lembaga internasional yang bersifat nirlaba berbasis ilmu pengetahuan dan pengembangan organisasi informasi. Lembaga ini meningkatkan kehidupan masyarakat dengan memberikan informasi dan menerapkan keahlian ilmiah untuk memecahkan masalah di bidang pertanian dan lingkungan. Misi dan tujuan lembaga ini diselaraskan dengan kepentingan negara-negara anggota dan membantu serta memandu aktivitas yang dilakukan. Produk kegiatan lembaga ini termasuk penerbitan ilmiah, proyek pengembangan dan penelitian, dan jasa penelitian mikroba. Dalam bentuk elektronik, tesaurus ini digunakan untuk berbagai kegiatan seperti :  Sebagai alat acuan dalam memeriksa ejaan terminologi  Memilih katakunci artikel jurnal primer  Menentukan tajuk subjek katalog perpustakaan  Mengindeks pangkalan data bibliografi internal  Mengindeks dan melakukan penelusuran pangkalan data dan sumber informasi secara online  Mengindeks dan menemukan kembali informasi bahan multimedia Gambar 1. Contoh tampilan halaman CAB thesaurus CABI Thesaurus tersedia dalam bentuk tercetak hanya pada edisi tahun 1999, dan dalam bentuk elektronik pada alamat web www.cabi.orgcabthesaurus. Tesaurus ini secara online tersedia juga dalam format XML. Gambar 1 adalah contoh tampilan halaman CABI Thesaurus. Analisis Co-Words Teknik analisis co-word pertama dikembangkan pada kegiatan kerjasama the Centre de Sociologie de lInnovation of the Ecole Nationale Superieure des Mines of Paris dan the Centre National de la Recherche Scientifique CNRS di Perancis pada tahun 1980an, dan sistemnya mereka beri nama LEXIMAPPE. Selama kurang lebih dua puluh tahun, teknik ini telah digunakan untuk memetakan dinamika perkembangan beberapa bidang penelitian. Salah satu penelitian awal dilakukan oleh Serge Bauin 1986 untuk memetakan dinamika akuakultur tahun 1979 s.d. 1981 berdasarkan pencantuman inklusi dan indeks kedekatan proximity indexes. Pencantuman dan peta kedekatan proximity maps dilakukan untuk tahun 1979 dan 1981 He, 1999. Selanjutnya diuraikan dalam artikel He 1999 tersebut sebuah hasil analisis peta co-word, dengan membagi kata kunci ke dalam tiang pusat central pole dan kata mediator mediator word, peta tahun 1979 ditunjukkan pada Gambar 2, sementara tahun 1981 ditunjukkan pada Gambar 3. Dalam peta untuk tahun 1979, Salmo gairdneri, nama sebuah spesies ikan yang telah dibudidayakan di laut Norwegia sejak 1950-an, tetap bertahan secara tak terduga sebagai kata mediator yang mempunyai frekuensi tinggi. Namun, dalam peta tahun 1981, istilah ini tergantikan dengan Salmonidae. Salah satu perubahan yang penting adalah tiang pusat aquaculture dalam peta 1979 sudah menghilang. Subjek ini telah digantikan oleh dua istilah baru yaitu aquaculture development ” dan aquaculture techniques”. Selain itu, kata artificial feeding kehilangan statusnya sebagai tiang pusat di peta untuk tahun 1979 dan muncul di bawah fish culture dalam peta 1981. Gambar 2 Peta co-words tahun 1979 Gambar 3 Peta co-words tahun 1981 Peta kedekatan proximity map untuk tahun 1979 dan 1981 masing- masing ditunjukkan pada Gambar 4 dan 5. Jika kedua peta tersebut dibandingkan, diketahui bahwa, dari tahun 1979 s.d. tahun 1981, beberapa gugus, seperti feeding and nutrition”, strukturnya menjadi lebih panjang, yaitu, rata-rata jumlah tautan setiap katanya telah meningkat. Secara keseluruhan, peningkatan jumlah tautan per kata dalam peta rata-rata sekitar 2,33 - 2,95. Ini bisa diartikan sebagai indikasi awal terintegrasinya seluruh bidang. Gambar 4 Peta kedekatan tahun 1979 Gambar 5 Peta kedekatan tahun 1981 Pada artikel He tersebut, mulai dikenal istilah tiang pusat atau pusat gugus yang disebut central pole dan kata mediator mediator word. Kedua istilah tersebut dipakai dalam menjelaskan sebuah gambar yang memetakan dinamika bidang akuakultur pada tahun 1979 s.d. 1981. Contoh di atas dan contoh lain, misalnya pada Law Courtial 1989, Law Whittaker 1992, dan Coulter et al, 1998 mengungkapkan bahwa analisis co-word adalah metode yang bisa dipakai untuk menemukan asosiasi antar wilayah penelitian dalam sebuah ilmu serta untuk mengungkapkan hubungan penting lainnya yang mungkin sulit untuk dideteksi He, 1999. Ini adalah alat yang ampuh yang memungkinkan untuk melacak struktur dan evolusi jaringan socio-cognitive Bauin, 1986. Perkembangan Analisis Co-words Analisis co-words didasarkan pada analisis co-occurrence dari dua atau lebih kata kunci atau kata-kata yang terdapat dalam teks yang digunakan untuk mengindeks artikel atau dokumen lainnya Diodato, 1994. Jadi analisis co- words adalah analisis perulangan kejadian co-occurrence dua kata atau lebih dalam sebuah atau beberapa dokumen. Kata tersebut dapat berupa kata kunci keyword atau kata teks. Pada Tahun 1986, Callon, Law, dan Rip menulis sebuah buku berjudul “Mapping the dynamics of science and tehnology”. Buku ini bisa dianggap sebuah karya penting dalam bidang analisis co-word. Bagian pertama buku ini berisi pendahuluan tentang bagaimana menelaah kekuatan sebuah bidang ilmu. Bagian kedua membahas tentang kekuatan teks kata-kata dalam sains dan teknologi, para penulisnya menawarkan sebuah teori dasar tentang analisis co- word , yang disebut “actor network”. Bagian ketiga berisi penjelasan rinci tentang co-word yang disertai contohnya He, 1999. Teknik analisis co-word pertama kali diusulkan guna memetakan dinamika ilmu pengetahuan. Cara yang paling umum untuk memahami dinamika ilmu pengetahuan adalah dengan mengambil kekuatan ilmu pengetahuan pada masyarakat komunitas ilmu pengetahuan saat ini ke dalam hitungan. Actor network adalah landasan teoritis analisis co-word untuk memetakan dinamika ilmu Callon et al., 1986a. Laboratorium dan literatur dianggap sebagai dua alat yang sangat penting bagi para ilmuwan. Proses perubahan dan pengembangan secara kompleks terjadi di laboratorium, lalu mengabadikannya di atas kertas Latour, 1987. Ini berarti bahwa para ilmuwan memberi penekanan khusus pada teks. Mereka tidak hanya menggunakan teks-teks untuk mempublikasikan dunia mereka yang dibangun di laboratorium tetapi juga menggunakan teks sebagai cara untuk membangun dunia dan menandai kehadiran mereka di mata orang lain. Meskipun ilmu pengetahuan tidak dapat direduksi hanya pada teks saja, namun teks masih merupakan sumber utama tentang bagaimana sebuah bidang kajian diciptakan dan dikembangkan di laboratorium. Oleh karena itu, selain mengikuti “aktor-aktor” yang berperan mengubah dunia, mengikuti perkembangan teks adalah cara lain untuk memetakan dinamika ilmu pengetahuan. Berdasarkan “kejadian pasangan kata”, analisis co-word berupaya mengekstrak tema ilmu pengetahuan dan mendeteksi keterkaitan antara tema- tema secara langsung dari subjek pada teks. Hal ini tidak bergantung pada kuat atau lemahnya setiap definisi dari tema penelitian dalam ilmu pengetahuan. Dan hal ini memungkinkan untuk mengikuti para “aktor” dan mendeteksi dinamika ilmu tanpa mengurangi perannya baik secara internal maupun eksternal Gallon et al., 1986a. Sebuah studi awal telah dilakukan untuk membandingkan citation, co- citation, dan analisis co-word dari cakupan lima disiplin ilmu Healey et al., 1986. Hasil temuannya adalah adanya kesulitan untuk menganalisis dan menerima hasil analisis awal co-word, serta beberapa ahli meragukan kehandalan dari temuan ini. Teknik co-word yang dievaluasi dalam studi ini disebut sebagai co-word generasi pertama oleh Law et al. 1988. Pada analisis co-word “generasi ke-dua”, sebuah diagram digunakan untuk menggambarkan kekuatan strength konteks global pada sumbu X dan kekuatan konteks lokal pada sumbu Y. Diagram ini kemudian banyak digunakan dalam studi co-word. Dua macam indeks yaitu kepadatan density dan sentralitas centrality digunakan untuk mengukur kekuatan masing-masing pada konteks lokal dan konteks global. Kepadatan Density. Kepadatan digunakan untuk mengukur kekuatan tautan yang mengikat kata-kata pembentuk gugus cluster, kepadatan merupakan kekuatan internal dari sebuah gugus. Kepadatan menyediakan representasi yang baik dari kapasitas sebuah gugus untuk menjaga dan mengembangkannya selama sekian lama dalam sebuah lapangan penelitian Callon et al., 1991. Peringkat area subjek atau gugus yang berkoherensi pada skala internalnya density memberikan informasi yang sistematis tentang isu utamanya. Selanjutnya, dengan cara mengurutkan kata kunci dapat memberikan gambaran yang tepat dari suatu area subjek Bauin et al., 1991 . Sentralitas Centrality. Sentralitas digunakan untuk mengukur kekuatan interaksi suatu subjek dengan bidang studi lainnya. Kajian pemeringkatan gugus cluster pada sentralitas dapat menunjukkan sejauh mana masing-masing wilayah dianggap sebagai pusat dalam jaringan riset global. Semakin besar jumlah dan kekuatan hubungan suatu subjek dengan bidang studi lain, akan semakin memusatkan sebuah area subjek dalam jaringan penelitian Bauin et al., 1991. Untuk gugus tertentu area, sentralitasnya bisa merupakan jumlah dari semua nilai tautan eksternalnya Turner et al., 1988;. Courtial et al., 1993 atau akar kuadrat dari jumlah kuadrat semua nilai tautan eksternalnya Coulter et al, 1998. Bila disederhanakan, itu merupakan rata-rata nilai dari enam tautan eksternal pertama Callon et al., 1991. Tautan eksternal adalah tautan yang terjadi dari kata-kata pada suatu gugus terhadap kata-kata eksternal diluar gugus tersebut He, 1999. Diagram . Diagram menyediakan representasi struktur global setiap bidang atau subbidang ilmu. Diagram dibuat dengan menempatkan sentralitas centrality dan kepadatan density ke dalam dua dimensi diagram Law et al., 1988. Biasanya, sumbu horisontal mewakili sentralitas, sumbu vertikal menggambarkan kepadatan, dan gambar grafiknya terletak pada nilai rata-rata sumbu masing- masing. Peta ini terletak pada setiap subjek dalam skalaruang dua dimensi dan dibagi menjadi empat kuadran. Analisis co-words ditujukan untuk menganalisis isi, pola dan kecendrungan trend dari suatu kumpulan dokumen dengan mengukur hubungan kekuatan istilah terms De Looze Lemarie, 1997. Jadi manfaat dari analisis co-words adalah untuk mengembangkan atau menyaring taksonomi suatu bidang ilmu. Selanjutnya dikatakan bahwa di Amerika Utara, analisis co- words telah diintegrasikan dalam sistem pendukung tingkat ilmu pengetahuan dalam masyarakat ilmiah De Looze Lemarie, 1997. Rip dan Courtial 1984 mengumpulkan artikel dalam jurnal bioteknologi selama periode 10 tahun. Artikel tersebut ditandai coded dengan kata kunci dan menganalisis relasi antara kata kunci untuk memperlihatkan koneksitas antara bidang dalam bioteknologi. Peters Raan 1993 menggunakan analisis co-words untuk mengkaji bidang teknik kimia. Mereka menggunakan publikasi dari sepuluh jurnal terkemuka, publikasi dari 23 ilmuwan terkemuka, serta publikasi dari konferensi- konferensi penting. Matrik kemunculan dari kata-kata yang ada pada judul dan abstrak dipetakan dengan skala multi dimensional. Hasil pemetaan tersebut, kemudian dievaluasi oleh ahli dalam bidang tersebut. McKinnon 1977 mengkaji hubungan tema dalam novel Kierkegaard dengan menggunakan kemunculan pasangan kata. Metodologi yang digunakan merupakan langkah awal dalam mengekstraksi hubungan kata dalam suatu teks menurut kemunculan pasangan katanya. Perkembangan selanjutnya dari analisis co-words ditujukan untuk mengevaluasi perkembangan suatu bidang ilmu sebagaimana yang dilakukan oleh Michael Callon pada tahun 1979, 1983 dan 1986 Peters Raan, 1993. De Looze dan Lemarie 1997 menganalisis sekumpulan dokumen yang berhubungan dengan protein tanaman plant proteins. Untuk mengelompokkan pasangan kata pada satu dokumen dengan dokumen lainnya, digunakan suatu program perangkat lunak yang disebut Leximappe. Selanjutnya, program tersebut membentuk pasangan kata yang memiliki hubungan paling dekat. Program ini memungkinkan untuk menempatkan gugus utama dari kata kunci sehingga data dapat dibaca kembali dan diinterpretasikan. Dari hasil penelitian yang dilakukan, diperoleh tiga bidang utama dari bioteknologi yaitu a kegunaan protein, b perlakuan enzim pada protein, dan c aplikasi teknik genetika. Coulter et al. 1998 melakukan penelitian empiris untuk mendemonstrasikan keefektifan analisis isi content analysis untuk memetakan bidang teknik perangkat lunak software engineering. Dalam penelitian ini, diambil sejumlah besar publikasi yang berhubungan dengan teknik perangkat lunak dari tahun 1982-1994. Masing-masing publikasi tersebut dipresentasikan oleh deskriptor istilah indeks untuk menganalisis tema dan kecendrungan pada penelitian teknik perangkat lunak tersebut. Untuk mendukung penelitian tersebut, mereka menggunakan suatu program perangkat lunak yang dikembangkan oleh Software Engineering Institute Carnegie Mellon University yang disebut dengan Content Analysis and Information Retrieval CAIR. Dari penelitian tersebut mereka menyimpulkan bahwa tema utama dari bidang teknik perangkat lunak, yaitu object-oriented programming yang terfokus pada software development. Sistem yang paling banyak digunakan, yaitu X-Windows, Microsoft Windows, Ada, C++ dan UNIX, sedangkan Pascal, Basic dan Cobol mulai jarang ditemukan. Keunggulan co-words dibandingkan dengan metode lain yang sama-sama memfokuskan terhadap teks adalah analisis co-word jauh lebih fleksibel karena mampu memperlihatkan jaringan penelitian melalui grafik He, 1999. Walaupun penelitian ini telah banyak dilakukan dan memberikan kontribusi terhadap perkembangan ilmu pengetahuan, namun menurut Leydesdorff 1992 bahwa “kata” akan bermakna bila berada dalam satuan utuh suatu kalimat. Berdasarkan pemikiran tersebut, ia menawarkan suatu pendekatan baru dalam menganalisis suatu perkembangan ilmu, yaitu dengan menghitung kemunculan kata secara bersamaan dari kalimat pertama dengan kalimat kedua, begitu seterusnya dalam satu paragraf. Kemudian menghitung kata yang muncul bersamaan dalam paragraf pertama dengan paragraf kedua dalam satu seksi Bab. Namun kelemahan pendekatan ini, sebagaimana diakui oleh Leydesdorff lebih rumit dan membutuhkan waktu yang relatif lebih lama. Selanjutnya, kualitas hasil dari analisis co-words tergantung pada berbagai faktor, seperti kualitas kata kunci dan istilah indeks, ruang lingkup pangkalan data, dan kelayakan metode statistika Law et al. 1988. Validitas peta akan tergantung, dalam batas tertentu, pada kegiatan pengindeksan subjek. Whittaker, 1989 dalam He, 1991 telah menunjukkan bahwa hasil analisis co-words tergantung pada bagaimana para pengindeks memilih kata kunci untuk suatu konsep bidang ilmu. Akibatnya, hasil dari pengindeksan lebih mirip menjadi hasil konseptualisasi pengindeks dari pada dari penulis karya aslinya. Selain efek pengindeks, keterlambatan antara penulisan dokumen dan saat ketika dilakukan pengindeksan atau dimasukkan ke dalam pangkalan data menyebabkan analisis co-words tidak bisa mendeteksi tema penelitian yang muncul pada tahap awal. Callon et al, 1986b Kata Kunci Sebagai Co-Words Analisis perulangan kejadian kata kunci biasanya berarti mengkaji istilah pengindeksan yang diberikan pada dokumen oleh badanjasa pengindeksan atau oleh pengarang. Misalnya bila sekelompok dokumen memiliki istilah pengindeksan berupa “jaringan” dan “teknologi”, maka dikatakan kelompok dokumen yang memiliki dua kata kunci tersebut memiliki subjek yang sama. Analisis co-words menunjukan bagaimana dokumen yang sama terkelompok dan mengidentifikasi gugus dokumen yang memiliki topik yang sama. Dasar koleksi data mungkin berupa pengembangan sebuah kata kunci yang menunjukan profil masing-masing dokumen. Analisis co-words dapat dipaparkan dalam bentuk peta gugus dokumen. Law dan Whittaker 1992 mengkaji perulangan kejadian istilah indeks dalam dokumen tentang pengasaman. Perulangan kejadian dalam istilah pengindeksan memungkinkan mereka menggugus dokumen. Setiap gugus tampaknya berkaitan dengan tema tertentu dalam bidang penelitian asidifikasi pengasaman Diodato, 1994. Kata Teks Sebagai Co-Words Leydesdorff 1992 menerapkan teknik kata teks dalam bidang scientometrics. Misalnya perulangan kejadian sebuah kata dan sinonimnya dalam kalimat yang sama dalam sebuah makalah menunjukkan pentingnya kalimat tersebut. Analisis semacam ini pada seluruh dokumen memungkinkan rekonstruksi pengembangan sebuah ide yang berlanjut pada penulisan sebuah makalah Diodato, 1994. Co-Citation Adalah situasi dimana dua atau lebih pengarang, dokumen, atau jurnal secara bersamaan dikutip cited oleh dokumen lain Diodato, 1994. Author co- citation analysis merupakan studi co-citation yang terjadi diantara para pengarangpenulis. Demikian halnya dengan Journal co-citation analysis, analisis co-citation yang berkaitan diantara beberapa jurnal. Misalnya dapat di lihat pada bibliografi di setiap akhir sebuah artikel, contoh pada bidang ilmu perpustakaan dan informasi. Informasi bibliografi yang berisi daftar artikel yang disusun oleh Garfield dan Lancaster, kemudian kedua penulis tersebut di co-cited oleh bibliografi. Analisis author co-citation dapat menentukan apakah ada hubungan kuat antara penulis subjek yang sering di co-cited. Jika memang ada, ini menunjukkan bahwa subjek pencarian dapat dilakukan dengan menggunakan pasangan atau kelompok nama tersebut. Hasil analisis author co-citation dapat ditampilkan dalam matriks co-citation. Referensi contoh dari Lunin dan White dalam Diodato, 1994 merupakan koleksi artikel khusus tentang analisis author co-citation. Artikel tersebut ditulis untuk orang awam dalam bidang analisis co- citation. Kombinasi co-citation dan co-words merupakan kegiatan yang menggabungkan analisis co-citation dan kemiripan kata, dilakukan untuk meningkatkan kemampuan teknik kuantitatif serta dapat menggambarkan aspek struktur dan dinamika suatu penelitian ilmiah. Co-Classification Merupakan situasi dua dokumen atau lebih tergabung dalam satu gugus karena notasi klasifikasi yang sama. Co-Classification digunakan untuk mengumpulkan dokumen yang sama serta menunjukkan bahwa bibliografi secara kuantitatif menunjukkan subjek yang sama dengan judul dokumen. Untuk klasifikasi menggunakan UDC atau DDC, dan hasilnya dituangkan dalam denah Diodato, 1994. Pemetaan Subjek S ubject Mapping Spasser 1997 mengatakan bahwa peta adalah alat relasi relational tools yang menyediakan informasi antar hubungan entitas yang dipetakan. Peta tidak hanya merupakan alat yang praktis untuk menyampaikan informasi mengenai aktivitas ilmiah, tetapi juga sebagai dasar untuk mengkaji dan memahami aktivitas ilmiah dengan menggambarkannya sebagai suatu sistem yang tersusun. Beberapa jenis peta yang dikembangkan dalam pemetaan ilmu pengetahuan dalam bidang bibliometrika, antara lain: peta journal intercitation, journal co- citation, document co-citation, author co-citation, co-words deskriptor, dan co- classification. Umumnya setelah melakukan analisis co-words, akan melakukan penggugusan subjeknya mapping dengan menggunakan dendrogram dan multidimensional scalling MDS. MDS adalah teknik analisis data yang menggambarkan suatu struktur “distance-like data” dalam bentuk gambar. Dengan MDS kemiripan suatu objek dengan objek yang lain dapat dipresentasikan dalam bentuk peta. Untuk kebutuhan analisis MDS diperlukan informasi berupa matriks dissimilarity. Nilai Koefisien Jaccard Jaccard Coeficient adalah salah satu metode yang dipakai untuk menghitung kemiripan antara dua objek items. Seperti halnya cosine distance dan matching coefficient, secara umum perhitungan metode ini didasarkan pada pengukuran jarak yang terdapat di antara dua vektor ukuran kemiripan ruang vektor. Jaccard similarity atau Jaccard Coefficient menghitung kemiripan antara dua objects, X dan Y yang dinyatakan dalam dua buah vektor Tan et.al, 2005. Dendrogram Prinsip dasar dalam penggugusan dokumen adalah menentukan ukuran kemiripan antar dokumen yang akan dikelompokkan dan menjadikannya sebagai dasar untuk menghasilkan gugus. Kemiripan antar dokumen dapat didasarkan pada beberapa variabel seperti journal intercitation, co-citation journal co- citation, document co-citation, author co-citation,bibliographic coupling, co- descriptor, dan co-classification. Adapun kemiripan antara dua dokumen X dan Y dapat diukur dengan beberapa cara, yaitu: 1. Simple matching: X Y 2. Dice’s coefficient: 2 X YX +Y 3. Jaccard’s coefficient: X YX Y 4. Cosine coefficient: X YX 12 .Y12 5. Overlap coefficient: X YminX,Y Keterangan: X = dokumen pertama Y = dokumen kedua Kemiripan D1, D2 = |D1 ᴒ D2| Bila |D1 ᴒ D2| = a Maka |D1 ᴒ D2| = a Keterangan: D1 = dokumen pertama D2 = dokumen kedua Untuk mendapatkan total frekuensi pemasangan subjeknya dapat dilakukan dengan rumus 2 X 2. Frekuensi pemasangan subjek diperlihatkan dalam Tabel 1. Tabel 1. Total Pemasangan Dokumen D2 Jumlah 1 D1 1 A b a + b C d c + d Jumlah a + c b + d a + b c + d Keterangan: a. Menyatakan total frekuensi hubungan subjek b. Menyatakan jumlah subjek yang dimiliki D1 tetapi tidak dimiliki oleh D2 c. Menyatakan jumlah subjek yang dimiliki D2 tetapi tidak dimiliki oleh D1 d. Menyatakan jumlah subjek yang tidak dimiliki oleh D1 dan D2 atau sama dengan nihil Berhubung jumlah subjek yang dimiliki oleh setiap makalah tidak sama maka diperlukan normalisasi Hasibuan, 1995. Normalisasi dilakukan dengan menghilangkan nilai d pada rumus kemiripan : karena nilai d = nihil, maka d dihilangkan, dan hasil penghilangan tersebut menghasilkan koefisien Jaccard, yaitu : Kemudian dibuat matrik kemiripan similarity berdasarkan koefisien Jaccard. Matriks hasil perhitungan ini disajikan ke dalam tabel yang disebut tabel matriks kemiripan. Pada matriks ini, nilai koefisien Jaccard digunakan untuk mengukur hubungan dari setiap pasangan dokumen document pair. Semakin tinggi nilai koefisiennya, maka semakin dekat subjek dokumen tersebut dengan dokumen pasangannya. Matriks ini merupakan penjabaran dari matriks simple matching. Selanjutnya untuk keperluan penggugusan subjek dokumen digunakan metode complete linkage. Metode ini dipakai untuk mendapatkan jarak dalam mengelompokkan dokumen dengan cara mentransformasikan matriks koefisien Jaccard ke dalam matriks ketidakmiripan dissimilarity. Cara mentransformasikan matriks koefisien Jaccard adalah dengan menggunakan rumus : Ketidakmiripan = 1 – nilai koefisien Jaccard Salah satu hasil output dari proses gugus adalah dendrogram atau diagram yang menyerupai pohon a tree-like diagram, yang dapat memperlihatkan hubungan dokumen secara lebih jelas. Metode pembentukan gugus biasanya dikategorikan menurut tipe dari struktur gugus yang dihasilkan. Secara umum metode penggugusan terbagi menjadi dua, yaitu metode non-hirarkhis dan metode hirarkhis. Metode Hirarkis Miswan 2002 menjelaskan bahwa pembentukan gugus dokumen dalam sistem temu kembali informasi dengan metode hirarkis adalah sebagai berikut: a. Mengidentifikasi dua dokumen yang paling mirip dan menggabungkannya menjadi sebuah gugus. b. Mengidentifikasi dan menggabungkan dua dokumen yang paling mirip berikutnya menjadi sebuah gugus sampai semua dokumen tergabung dalam gugus-gugus yang terbentuk. Struktur gugus yang dihasilkan oleh metode hirarkhis ini biasanya diperlihatkan sebagai struktur diagram pohon atau dendrogram seperti terlihat pada Gambar 6 dan 7. Gambar 6 Dendrogram dari hierarchical clustering Rasmussen, 1992 Gambar 7 Pohon dari hierarchical clustering Salton, 1989. Ilustrasi dendrogram lain disajikan pada gambar berikut : Case Label num D31 31 ---+++--- D45 45 -+--+---+-----+------+ D57 57---+-----+---+-- Gambar 8 Ilustrasi dendrogram analisis co-words artikel Gambar 8 tersebut memperlihatkan dendrogram dari analisis Co-word. Sumbu X mempresentasikan jarak antar gugus, sedangkan sumbu Y mempresentasikan dokumen. Kemiripan antar dokumen ditentukan dengan mengukur jarak antar dokumen. Dua dokumen yang mempunyai jarak paling kecil dikatakan mempunyai kemiripan paling tinggi, dan dikelompokkan ke dalam satu gugus yang sama. Sebaliknya dua dokumen yang mempunyai jarak paling besar dikatakan mempunyai kemiripan paling rendah, dan dimasukkan ke dalam gugus yang berbeda. Beberapa metode yang dapat digunakan untuk menentukan jarak antar dua dokumen antara lain: single link, complete link, group average link, Ward’s method, centroid method dan median method Rasmussen, 1992.

BAB III METODE