Nama
: Mustika Ananda
Nim
: 1271201066
Judul
Jurnal : Application of informetrics
to Information Retrieval Research
Penulis
: Dietmar Wolfram
University of Wisconsin, Milwaukee
Resume jurnal :
Aplikasi Informetrics
untuk Penelitian Pencarian Informasi
Pencarian informasi adalah proses selektif dimana informasi yang diinginkan disalin dari gudang informasi yang disebut database (Meadow, 1992). Lebih jelasnya sistem IR telah digunakan untuk mencari informasi berbasis teks, baik teks lengkap dari dokumen atau pengganti dokumen yang merangkum isi dokumen terletak di luar database (misalnya catatan bibliografi). Dalam beberapa tahun terakhir, pencarian informasi telah diperluas untuk mencakup format multimedia seperti gambar, suara dan video. Sistem IR selama ini juga memperluas pemakaian kata-kata. Sebelumnya, pencari informasi adalah pengguna utama dari sistem IR, sistem yang tersedia melalui vendor seperti DIALOG dan Layanan Informasi Pencarian EBSCO. Lebih luasnya ketersediaan online katalog akses publik di perpustakaan, sistem database CD-ROM dan mesin pencari web telah membuat sistem IR jauh lebih mudah diakses oleh pengguna. Proses pencarian informasi interaktif melibatkan dialog antara pencari dan sistem IR. Pencari awalnya mengajukan permintaan ke sistem IR. Sebuah daftar catatan yang cocok dengan kriteria permintaan disajikan kepada pencari untuk di teliti. Berdasarkan pemeriksaan si pencari dari catatan diambil, pertanyaan dapat dirumuskan.
Informetrics adalah studi kuantitatif produksi informasi, penyimpanan,
pencarian, penyebaran, dan
pemanfaatan. Penelitian Informetric
menyelidiki keberadaan keteraturan berdasarkan pengalaman dalam kegiatan ini dan upaya untuk mengembangkan model matematika, dan akhirnya teori, untuk
lebih memahami proses informasi.
Lebih jelasnya lagi Informetrik adalah bagian dari ilmu informasi yang
mengkhusukan diri pada pengukuran fenomena informasi menggunakan metode
matematik terutama untuk masalah-masalah temu-kembali informasi.
Pembaca juga dapat menemukan dua hal yang berkaitan
yaitu istilah bibliometrics dan scientometrics, yang sering digunakan secara sinonim dengan informetrics, atau
dianggap sub-bidang
dalam informetrics (Brookes, 1988). Secara umum bibliometrics
telah ditangani dengan
studi literatur berbasis cetak
(White & McCain, 1989) sedangkan scientometrics
telah difokuskan pada analisis statistik
dari pola penelitian
dalam ilmu fisika dan kehidupan (diodato, 1994) praktik penelitian,
struktur organisasi, manajemen, peran dalam ekonomi dan sebagainya.
Bidang
utama studi dalam informetrics
meliputi:
1. Hukum
: memberlakukan hukum sebagai rumus atau aksioma untuk pengukuran,karena
menyangkut karya orang lain.
2. Analisis
kutipan : daerah ini
melihat pola mengutip penulis dan
publikasi atau bagaimana penulis
menggunakan kutipan dalam artikel, untuk menentukan kekuatan hubungan antara
penulis, literatur atau disiplin.
3. Indikator
ilmiah : studi meneliti untuk menghasilkan sesuatu bahan ilmiah
dalam disiplin atau
bangsa.
4. Pertumbuhan
Informasi dan usang/informasi yang sudah
lama : daerah ini menyelidiki bagaimana literatur dalam bidang studi tumbuh dari waktu ke waktu.
5. penggunaan
sumber daya Dokumen / informasi : daerah ini
melihat bagaimana sumber daya informasi yang digunakan dari waktu ke waktu.
Salah satu contoh fenomena
informetrik yang sering muncul adalah frekuensi kemunculan kata-kata yang berbeda dalam sebuah teks. Jika seseorang menghitung dan
kemudian berapa banyak kata yang berbeda
muncul dalam dokumen sekali, dua kali,
tiga kali, distribusi yang dihasilkan
dari frekuensi kata
akan mengikuti jenis hubungan terbalik, disebut sebagai distribusi 'Zipfian'. Hubungan
ini ditunjukkan pada Gambar
1.
Perhatikan
bahwa banyak kata muncul
hanya sekali dan itu beberapa
kata muncul berkali-kali. Sepuluh paling sering muncul
kata-kata dalam teks ini, termasuk referensi, judul
dan abstrak, adalah:, dari, untuk, dan,
yang, IR, istilah,
dalam, untuk, sistem.
Mereka mewakili sekitar 25% dari semua kata yang
digunakan dalam teks ini. Sebaliknya,
448 dari 837
kata yang berbeda dalam teks ini (55%)
muncul hanya
satu waktu.
satu waktu.
Informetric Studi IR Sistem
Untuk memudahkan proses pencarian,
dokumen ditambahkan ke sistem IR harus terlebih dahulu diproses oleh parsing isi
dokumen, biasanya sampai ke tingkat kata individu
atau bahkan tingkat subword. Kata-kata ini kemudian
disimpan dalam indeks berjangka. Selama proses pengambilan dalam sistem IR Boolean sederhana,
sistem akan cocok dengan komponen pertanyaan untuk entri yang sesuai dalam indeks istilah. Entri indeks akan
mengarah ke daftar pengenal dokumen
(juga disebut daftar
postingan) yang berisi istilah. Daftar postingan
dibandingkan berdasarkan operasi pencarian ditentukan oleh query. Daftar akhir ini kemudian disajikan kepada pengguna.
Struktur karakteristik sistem IR dan sistem penggunaan berperan
untuk studi informetric. Para peneliti dapat menguji
bagaimana pencari berinteraksi
dengan sistem (penggunaan sistem IR), atau
keteraturan dalam isi database sistem IR
dan indeks yang terkait (isi sistem IR).
IR Sistem Penggunaan
Banyak aspek penggunaan sistem dapat dikumpulkan untuk lebih memahami bagaimana pengguna berinteraksi dengan sistem IR, ini termasuk:
Banyak aspek penggunaan sistem dapat dikumpulkan untuk lebih memahami bagaimana pengguna berinteraksi dengan sistem IR, ini termasuk:
·
Istilah yang digunakan
per permintaan -
Pencari merumuskan pertanyaan dengan memasukkan istilah pencarian.
·
Distribusi
istilah permintaan
·
Permintaan
jangka kejadian -
seberapa sering istilah tertentu
muncul dalam pertanyaan juga memberikan wawasan tentang perilaku pencari.
·
Pencarian dilakukan
per user – pencarian
pengguna akan dilakukan bervariasi.
Spink, Wolfram, Jansen
& Saracevic (disampaikan)
menemukan bahwa sebagian besar pengguna
akan melakukan satu
pencarian pada mesin pencari web,
sementara beberapa orang akan melakukan banyak pencarian.
·
Pola browsing
pengguna – peneliti
dapat menemukan jenis hubungan yang
dipilih oleh si pencari informasi ketika mencari
informasi (Huberman et al, 1998; Qiu, 1994).
IR Sistem Konten
Berkaitan
dengan isi :
·
Distribusi
istilah indeks
·
Judul
Subjek
·
Jangka
kejadian
·
kutipan dokumen
·
Pertumbuhan
Database
Aplikasi untuk Sistem Desain IR
Ada banyak aplikasi studi informetric dalam IR. Sampai saat ini, aplikasi ini belum sepenuhnya dieksplorasi dalam penelitian sistem IR. Hal ini berubah dengan akse yang lebih besar untuk sejumlah besar data yang terkait dengan kerja internal sistem IR dan penggunaannya. Penggunaan sifat informetric dasar teks tersirat dalam beberapa sistem IR saat ini. Setidaknya satu mesin pencari di Web, Google (http://www.google.com), memperhitungkan hubungan antara dokumen web berdasarkan hubungan hypertext. Demikian pula, frekuensi terjadinya istilah pencarian dalam dokumen sering digunakan sebagai dasar untuk mengembangkan peringkat relevansi dalam sistem pencarian teks. Dokumen dengan banyak permintaan dari istilah pencarian akan disajikan kepada pengguna, didasarkan pada asumsi semakin banyak istilah pencarian muncul dalam dokumen, semakin besar kemungkinan untuk menjadi relevan dengan kebutuhan informasi pengguna. Algoritma untuk menentukan relevansi juga akan menggabungkan fitur lain seperti panjang dokumen dan lokasi ketentuan dalam dokumen. Salah satu aplikasi utama informetrics untuk pemeliharaan sistem IR adalah perencanaan ruang. Meskipun biaya ruang penyimpanan elektronik telah menurun selama bertahun-tahun, kecenderungan database besar yang berisi jutaan catatan masih membuat ini menjadi suatu pertimbangan penting. Tague (1988) dan Fedorowicz (1981) menunjukkan bagaimana penggunaan model matematika dapat digunakan dalam desain berkas untuk memperkirakan kebutuhan ruang untuk komponen yang berbeda dari sistem IR, termasuk ukuran file indeks dan posting berkas. Tague dan Nicholls (1987) melaporkan bahwa estimasi yang tepat dari variabel Zipf dapat digunakan untuk menentukan ukuran maksimum daftar posting dalam file postingan. Pengetahuan tersebut akan memberikan manajer sistem dengan indikasi kebutuhan ruang di masa depan dan ketika pengindeks tambahan mungkin diperlukan untuk indeks entri baru.
Ada banyak aplikasi studi informetric dalam IR. Sampai saat ini, aplikasi ini belum sepenuhnya dieksplorasi dalam penelitian sistem IR. Hal ini berubah dengan akse yang lebih besar untuk sejumlah besar data yang terkait dengan kerja internal sistem IR dan penggunaannya. Penggunaan sifat informetric dasar teks tersirat dalam beberapa sistem IR saat ini. Setidaknya satu mesin pencari di Web, Google (http://www.google.com), memperhitungkan hubungan antara dokumen web berdasarkan hubungan hypertext. Demikian pula, frekuensi terjadinya istilah pencarian dalam dokumen sering digunakan sebagai dasar untuk mengembangkan peringkat relevansi dalam sistem pencarian teks. Dokumen dengan banyak permintaan dari istilah pencarian akan disajikan kepada pengguna, didasarkan pada asumsi semakin banyak istilah pencarian muncul dalam dokumen, semakin besar kemungkinan untuk menjadi relevan dengan kebutuhan informasi pengguna. Algoritma untuk menentukan relevansi juga akan menggabungkan fitur lain seperti panjang dokumen dan lokasi ketentuan dalam dokumen. Salah satu aplikasi utama informetrics untuk pemeliharaan sistem IR adalah perencanaan ruang. Meskipun biaya ruang penyimpanan elektronik telah menurun selama bertahun-tahun, kecenderungan database besar yang berisi jutaan catatan masih membuat ini menjadi suatu pertimbangan penting. Tague (1988) dan Fedorowicz (1981) menunjukkan bagaimana penggunaan model matematika dapat digunakan dalam desain berkas untuk memperkirakan kebutuhan ruang untuk komponen yang berbeda dari sistem IR, termasuk ukuran file indeks dan posting berkas. Tague dan Nicholls (1987) melaporkan bahwa estimasi yang tepat dari variabel Zipf dapat digunakan untuk menentukan ukuran maksimum daftar posting dalam file postingan. Pengetahuan tersebut akan memberikan manajer sistem dengan indikasi kebutuhan ruang di masa depan dan ketika pengindeks tambahan mungkin diperlukan untuk indeks entri baru.
Pandangan terhadap jurnal :
Jurnal
yang dibahas oleh peneliti merupakan topik yang menarik sebenarnya yaitu
menggunakan metode matematika dalam pencarian infornasi maksudnya metode
matematika dilakukan untuk mengetahui frekuensi dari kata-kata yang biasa
digunakan pencari setiap proses pencariannya. Peneliti juga memberikan
saran-saran untuk mengembangkan informetrik dalam pencarian informasi serta
memperluas kata-kata agar query dari pengguna dapat ditemukan jawabannya.
Tetapi sayangnya penulis tidak memaparkan lebih jelas lagi bagaimana proses
informetric dalam IR, hal ini khususnya saya masih berputar-putar pada bayangan
bagaimana sebenarnya proses informetric dalam IR. Bahasa yang digunakan pun
sulit saya pahami karena banyak kata yang tidak saya temukan di dalam kamus.
0 komentar:
Posting Komentar