Jumat, 10 Oktober 2014

Resume jurnal Aplikasi Informetrics untuk Penelitian Pencarian Informasi

Diposting oleh Unknown di 01.28


Nama               : Mustika Ananda
Nim                 : 1271201066
Judul Jurnal     : Application of informetrics to Information Retrieval Research
Penulis             : Dietmar Wolfram
                          University of Wisconsin, Milwaukee
Resume jurnal             :
Aplikasi Informetrics untuk Penelitian Pencarian Informasi

            Pencarian informasi adalah proses selektif dimana informasi yang diinginkan disalin dari gudang informasi yang disebut database (Meadow, 1992). Lebih jelasnya sistem IR telah digunakan untuk mencari informasi berbasis teks, baik teks lengkap dari dokumen atau pengganti dokumen yang merangkum isi dokumen terletak di luar database (misalnya catatan bibliografi). Dalam beberapa tahun terakhir, pencarian informasi telah diperluas untuk mencakup format multimedia seperti gambar, suara dan video. Sistem IR selama ini juga memperluas pemakaian kata-kata. Sebelumnya, pencari informasi adalah pengguna utama dari sistem IR, sistem yang tersedia melalui vendor seperti DIALOG dan Layanan Informasi Pencarian EBSCO. Lebih luasnya ketersediaan online katalog akses publik di perpustakaan, sistem database CD-ROM dan mesin pencari web telah membuat sistem IR jauh lebih mudah diakses oleh pengguna. Proses pencarian informasi interaktif melibatkan dialog antara pencari dan sistem IR. Pencari awalnya mengajukan permintaan ke sistem IR. Sebuah daftar catatan yang cocok dengan kriteria permintaan disajikan kepada pencari untuk di teliti. Berdasarkan pemeriksaan si pencari dari catatan diambil, pertanyaan dapat dirumuskan.
            Informetrics adalah studi kuantitatif produksi informasi, penyimpanan, pencarian, penyebaran, dan pemanfaatan. Penelitian Informetric menyelidiki keberadaan keteraturan berdasarkan pengalaman dalam kegiatan ini dan upaya untuk mengembangkan model matematika, dan akhirnya teori, untuk lebih memahami proses informasi. Lebih jelasnya lagi Informetrik adalah bagian dari ilmu informasi yang mengkhusukan diri pada pengukuran fenomena informasi menggunakan metode matematik terutama untuk masalah-masalah temu-kembali informasi.
Pembaca juga dapat menemukan dua hal yang berkaitan yaitu istilah bibliometrics dan scientometrics, yang sering digunakan secara sinonim dengan informetrics, atau dianggap sub-bidang dalam informetrics (Brookes, 1988). Secara umum bibliometrics telah ditangani dengan studi literatur berbasis cetak (White & McCain, 1989) sedangkan scientometrics telah difokuskan pada analisis statistik dari pola penelitian dalam ilmu fisika dan kehidupan (diodato, 1994) praktik penelitian, struktur organisasi, manajemen, peran dalam ekonomi dan sebagainya.

Bidang utama studi dalam informetrics meliputi:
1.       Hukum : memberlakukan hukum sebagai rumus atau aksioma untuk pengukuran,karena menyangkut karya orang lain.
2.       Analisis kutipan : daerah ini melihat pola mengutip penulis dan publikasi atau bagaimana penulis menggunakan kutipan dalam artikel, untuk menentukan kekuatan hubungan antara penulis, literatur atau disiplin.
3.       Indikator ilmiah : studi meneliti untuk menghasilkan sesuatu bahan ilmiah dalam disiplin atau bangsa.
4.       Pertumbuhan Informasi dan usang/informasi yang sudah lama : daerah ini menyelidiki bagaimana literatur dalam bidang studi tumbuh dari waktu ke waktu.
5.       penggunaan sumber daya Dokumen / informasi : daerah ini melihat bagaimana sumber daya informasi yang digunakan dari waktu ke waktu.
Salah satu contoh fenomena informetrik yang sering muncul adalah frekuensi kemunculan kata-kata yang berbeda dalam sebuah teks. Jika seseorang menghitung dan kemudian berapa banyak kata yang berbeda muncul dalam dokumen sekali, dua kali, tiga kali, distribusi yang dihasilkan dari frekuensi kata akan mengikuti jenis hubungan terbalik, disebut sebagai distribusi 'Zipfian'. Hubungan ini ditunjukkan pada Gambar 1. 
 

Perhatikan bahwa banyak kata muncul hanya sekali dan itu beberapa kata muncul berkali-kali. Sepuluh paling sering muncul kata-kata dalam teks ini, termasuk referensi, judul dan abstrak, adalah:, dari, untuk, dan, yang, IR, istilah, dalam, untuk, sistem. Mereka mewakili sekitar 25% dari semua kata yang digunakan dalam teks ini. Sebaliknya, 448 dari 837 kata yang berbeda dalam teks ini (55%) muncul hanya
satu waktu.
Informetric Studi IR Sistem
            Untuk memudahkan proses pencarian, dokumen ditambahkan ke sistem IR harus terlebih dahulu diproses oleh parsing isi dokumen, biasanya sampai ke tingkat kata individu atau bahkan tingkat subword. Kata-kata ini kemudian disimpan dalam indeks berjangka. Selama proses pengambilan dalam sistem IR Boolean sederhana, sistem akan cocok dengan komponen pertanyaan untuk entri yang sesuai dalam indeks istilah. Entri indeks akan mengarah ke daftar pengenal dokumen (juga disebut daftar postingan) yang berisi istilah. Daftar postingan dibandingkan berdasarkan operasi pencarian ditentukan oleh query. Daftar akhir ini kemudian disajikan kepada pengguna. Struktur karakteristik sistem IR dan sistem penggunaan berperan untuk studi informetric. Para peneliti dapat menguji bagaimana pencari berinteraksi dengan sistem (penggunaan sistem IR), atau keteraturan dalam isi database sistem IR dan indeks yang terkait (isi sistem IR).         
IR Sistem Penggunaan        
            Banyak aspek penggunaan sistem dapat dikumpulkan untuk lebih memahami bagaimana pengguna berinteraksi dengan sistem IR, ini termasuk:
·         Istilah yang digunakan per permintaan - Pencari merumuskan pertanyaan dengan memasukkan istilah pencarian.
·         Distribusi istilah permintaan
·         Permintaan jangka kejadian - seberapa sering istilah tertentu muncul dalam pertanyaan juga memberikan wawasan tentang perilaku pencari.
·         Pencarian dilakukan per user – pencarian pengguna akan dilakukan  bervariasi. Spink, Wolfram, Jansen & Saracevic (disampaikan) menemukan bahwa sebagian besar pengguna akan melakukan satu pencarian pada mesin pencari web, sementara beberapa orang akan melakukan banyak pencarian.
·         Pola browsing pengguna peneliti dapat menemukan jenis hubungan yang dipilih oleh si pencari informasi ketika mencari informasi (Huberman et al, 1998; Qiu, 1994).

IR Sistem Konten
Berkaitan dengan isi :
·         Distribusi istilah indeks
·         Judul Subjek
·         Jangka kejadian          
·         kutipan dokumen
·         Pertumbuhan Database

Aplikasi untuk Sistem Desain IR    

            Ada banyak aplikasi studi informetric dalam IR. Sampai saat ini, aplikasi ini belum sepenuhnya dieksplorasi dalam penelitian sistem IR. Hal ini berubah dengan akse yang lebih besar untuk sejumlah besar data yang terkait dengan kerja internal sistem IR dan penggunaannya. Penggunaan sifat informetric dasar teks tersirat dalam beberapa sistem IR saat ini. Setidaknya satu mesin pencari di Web, Google (http://www.google.com), memperhitungkan hubungan antara dokumen web berdasarkan hubungan hypertext. Demikian pula, frekuensi terjadinya istilah pencarian dalam dokumen sering digunakan sebagai dasar untuk mengembangkan peringkat relevansi dalam sistem pencarian teks. Dokumen dengan banyak permintaan dari istilah pencarian akan disajikan kepada pengguna, didasarkan pada asumsi semakin banyak istilah pencarian muncul dalam dokumen, semakin besar kemungkinan untuk menjadi relevan dengan kebutuhan informasi pengguna. Algoritma untuk menentukan relevansi juga akan menggabungkan fitur lain seperti panjang dokumen dan lokasi ketentuan dalam dokumen. Salah satu aplikasi utama informetrics untuk pemeliharaan sistem IR adalah perencanaan ruang. Meskipun biaya ruang penyimpanan elektronik telah menurun selama bertahun-tahun, kecenderungan database besar yang berisi jutaan catatan masih membuat ini menjadi suatu pertimbangan penting. Tague (1988) dan Fedorowicz (1981) menunjukkan bagaimana penggunaan model matematika dapat digunakan dalam desain berkas untuk memperkirakan kebutuhan ruang untuk komponen yang berbeda dari sistem IR, termasuk ukuran file indeks dan posting berkas. Tague dan Nicholls (1987) melaporkan bahwa estimasi yang tepat dari variabel Zipf dapat digunakan untuk menentukan ukuran maksimum daftar posting dalam file postingan. Pengetahuan tersebut akan memberikan manajer sistem dengan indikasi kebutuhan ruang di masa depan dan ketika pengindeks tambahan mungkin diperlukan untuk indeks entri baru.
Pandangan terhadap jurnal     :
            Jurnal yang dibahas oleh peneliti merupakan topik yang menarik sebenarnya yaitu menggunakan metode matematika dalam pencarian infornasi maksudnya metode matematika dilakukan untuk mengetahui frekuensi dari kata-kata yang biasa digunakan pencari setiap proses pencariannya. Peneliti juga memberikan saran-saran untuk mengembangkan informetrik dalam pencarian informasi serta memperluas kata-kata agar query dari pengguna dapat ditemukan jawabannya. Tetapi sayangnya penulis tidak memaparkan lebih jelas lagi bagaimana proses informetric dalam IR, hal ini khususnya saya masih berputar-putar pada bayangan bagaimana sebenarnya proses informetric dalam IR. Bahasa yang digunakan pun sulit saya pahami karena banyak kata yang tidak saya temukan di dalam kamus.

0 komentar:

Posting Komentar

 

Jendela Ilmu Perpustakaan Copyright © 2010 Design by Ipietoon Blogger Template Graphic from Enakei