Metode-Metode Information Retrieval

TimeHonoredSanctuary9095 avatar
TimeHonoredSanctuary9095
·
·
Download

Start Quiz

Study Flashcards

10 Questions

Apa yang dilakukan pada langkah pertama dalam membuat indeks terbalik?

Mengkonversi setiap dokumen menjadi huruf kecil dan membaginya menjadi kata-kata

Apa yang dimaksud dengan Boolean Retrieval?

Proses mencari informasi dari query yang menggunakan ekspresi Boolean

Bagaimana cara membuat indeks istilah?

Dengan membuat daftar setiap istilah dan dokumen yang memuat istilah tersebut

Apa yang dipakai untuk menghubungkan setiap istilah dengan dokumen-dokumen yang memuatnya?

Dictionary

Apa yang dilakukan pada langkah kedua dalam membuat indeks terbalik?

Mencari dokumen-dokumen yang memuat setiap istilah

Apa fungsi utama dari inverted index?

Meningkatkan kecepatan dalam melakukan pencarian dokumen

Apa yang dimaksud dengan information need?

Topik dimana user ingin tahu lebih jauh

Apa tujuan dari pengujian efektifitas sistem Information Retrieval?

Menghitung nilai presisi dan recall

Apa yang direkam dalam dictionary?

Jumlah dokumen yang berisi tiap term

Apa yang dilakukan dalam langkah ke-3 pada proses konstruksi indeks?

Membuat dictionary dan posting list

Study Notes

Metode-Metode Information Retrieval

  • Information Retrieval memiliki beberapa metode dalam mengambil data dan informasi antara lain inverted index, Boolean retrieval, tokenization, stemming and lemmatization, dictionaries, wildcard queries, dan vector space model.

Inverted Index

  • Inverted index adalah struktur data index yang dibangun untuk memudahkan query pencarian yang memotong tiap kata (term) yang berbeda dari suatu daftar termdokumen.
  • Inverted index memiliki tujuan untuk meningkatkan kecepatan dan efisiensi dalam melakukan pencarian pada sekumpulan dokumen dan menemukan dokumen yang mengandung query user.
  • Information need merupakan topik dimana user ingin tahu lebih jauh, sedangkan query merupakan cara user berkomunikasi dengan komputer untuk memperoleh informasi yang diinginkan.

Pengujian Efektivitas System IR

  • Pengujian efektifitas system IR menggunakan dua acara yaitu precision dan recall.
  • Precision adalah tingkat ketepatan antara informasi yang diminta oleh pengguna dengan jawaban yang diberikan oleh sistem.
  • Recall adalah tingkat keberhasilan sistem dalam menemukan kembali sebuah informasi.

Langkah-Langkah Inverted Index

  • Menentukan dokumen yang akan diindeks;
  • Melakukan Tokenize teks, tiap dokumen menjadi token;
  • Membuat dictionary dan posting list;
  • Melakukan preprocessing linguistic dan menghasilkan token;
  • Mengindeks dokumen dimana tiap term terjadi dengan membuat inverted index.

Contoh Inverted Index

  • Dokumen 1: Si Rubah coklat yang gesit melompati anjing pemalas.
  • Dokumen 2: Si Anjing pemalas tidur di bawah sinar matahari.
  • Contoh membuat indeks terbalik untuk dokumen-dokumen ini.

Penerapan di Python

  • Define the documents.
  • Tokenize the documents.
  • Combine the tokens into a list of unique terms.
  • Build the inverted index.
  • Print the inverted index.

Boolean Retrieval

  • Boolean Retrieval merupakan proses pencarian informasi dari query yang menggunakan ekspresi Boolean.
  • Dengan ekspresi Boolean menggunakan operator logika AND, ...

Quiz tentang berbagai metode Information Retrieval seperti inverted index, Boolean retrieval, tokenization, dan lain-lain.

Make Your Own Quizzes and Flashcards

Convert your notes into interactive study material.

Get started for free

More Quizzes Like This

Use Quizgecko on...
Browser
Browser