Podcast
Questions and Answers
Apa yang dilakukan pada langkah pertama dalam membuat indeks terbalik?
Apa yang dilakukan pada langkah pertama dalam membuat indeks terbalik?
- Mengkonversi setiap dokumen menjadi huruf kecil dan membaginya menjadi kata-kata (correct)
- Menggabungkan token-token menjadi daftar istilah unik
- Membuat daftar dokumen yang memuat setiap istilah
- Mencetak indeks terbalik
Apa yang dimaksud dengan Boolean Retrieval?
Apa yang dimaksud dengan Boolean Retrieval?
- Proses mencari informasi dari query yang menggunakan ekspresi statistik
- Proses mencari informasi dari query yang menggunakan ekspresi numerik
- Proses mencari informasi dari query yang menggunakan ekspresi algoritma
- Proses mencari informasi dari query yang menggunakan ekspresi Boolean (correct)
Bagaimana cara membuat indeks istilah?
Bagaimana cara membuat indeks istilah?
- Dengan mengkonversi setiap istilah menjadi huruf kecil
- Dengan mencetak setiap istilah dan dokumen yang memuat istilah tersebut
- Dengan membuat daftar setiap istilah dan dokumen yang memuat istilah tersebut (correct)
- Dengan menggabungkan token-token dan dokumen-dokumen
Apa yang dipakai untuk menghubungkan setiap istilah dengan dokumen-dokumen yang memuatnya?
Apa yang dipakai untuk menghubungkan setiap istilah dengan dokumen-dokumen yang memuatnya?
Apa yang dilakukan pada langkah kedua dalam membuat indeks terbalik?
Apa yang dilakukan pada langkah kedua dalam membuat indeks terbalik?
Apa fungsi utama dari inverted index?
Apa fungsi utama dari inverted index?
Apa yang dimaksud dengan information need?
Apa yang dimaksud dengan information need?
Apa tujuan dari pengujian efektifitas sistem Information Retrieval?
Apa tujuan dari pengujian efektifitas sistem Information Retrieval?
Apa yang direkam dalam dictionary?
Apa yang direkam dalam dictionary?
Apa yang dilakukan dalam langkah ke-3 pada proses konstruksi indeks?
Apa yang dilakukan dalam langkah ke-3 pada proses konstruksi indeks?
Study Notes
Metode-Metode Information Retrieval
- Information Retrieval memiliki beberapa metode dalam mengambil data dan informasi antara lain inverted index, Boolean retrieval, tokenization, stemming and lemmatization, dictionaries, wildcard queries, dan vector space model.
Inverted Index
- Inverted index adalah struktur data index yang dibangun untuk memudahkan query pencarian yang memotong tiap kata (term) yang berbeda dari suatu daftar termdokumen.
- Inverted index memiliki tujuan untuk meningkatkan kecepatan dan efisiensi dalam melakukan pencarian pada sekumpulan dokumen dan menemukan dokumen yang mengandung query user.
- Information need merupakan topik dimana user ingin tahu lebih jauh, sedangkan query merupakan cara user berkomunikasi dengan komputer untuk memperoleh informasi yang diinginkan.
Pengujian Efektivitas System IR
- Pengujian efektifitas system IR menggunakan dua acara yaitu precision dan recall.
- Precision adalah tingkat ketepatan antara informasi yang diminta oleh pengguna dengan jawaban yang diberikan oleh sistem.
- Recall adalah tingkat keberhasilan sistem dalam menemukan kembali sebuah informasi.
Langkah-Langkah Inverted Index
- Menentukan dokumen yang akan diindeks;
- Melakukan Tokenize teks, tiap dokumen menjadi token;
- Membuat dictionary dan posting list;
- Melakukan preprocessing linguistic dan menghasilkan token;
- Mengindeks dokumen dimana tiap term terjadi dengan membuat inverted index.
Contoh Inverted Index
- Dokumen 1: Si Rubah coklat yang gesit melompati anjing pemalas.
- Dokumen 2: Si Anjing pemalas tidur di bawah sinar matahari.
- Contoh membuat indeks terbalik untuk dokumen-dokumen ini.
Penerapan di Python
- Define the documents.
- Tokenize the documents.
- Combine the tokens into a list of unique terms.
- Build the inverted index.
- Print the inverted index.
Boolean Retrieval
- Boolean Retrieval merupakan proses pencarian informasi dari query yang menggunakan ekspresi Boolean.
- Dengan ekspresi Boolean menggunakan operator logika AND, ...
Studying That Suits You
Use AI to generate personalized quizzes and flashcards to suit your learning preferences.
Description
Quiz tentang berbagai metode Information Retrieval seperti inverted index, Boolean retrieval, tokenization, dan lain-lain.