Thuật toán PageRank và Truy hồi Boole
30 Questions
3 Views

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

Thuật toán PageRank đã hội tụ sau bao nhiêu bước lặp?

  • 60 bước
  • 55 bước
  • 52 bước (correct)
  • 50 bước
  • Theo quan sát, số bước lặp cần để thuật toán PageRank hội tụ làm thế nào theo n?

  • O(n^2)
  • O(log n) (correct)
  • O(sqrt(n))
  • O(n)
  • Trong phân hạng Google đầy đủ, thành phần nào dựa trên thông tin về không gian véctơ?

  • Thành phần lân cận từ khóa
  • Thành phần trọng số thẻ HTML
  • Thành phần PageRank
  • Thành phần tương tự không gian véctơ (correct)
  • Công cụ tìm kiếm Altavista trả về những gì khi tìm kiếm từ khóa 'university'?

    <p>Một tập ngẫu nhiên các trang với từ 'university' trong tiêu đề</p> Signup and view all the answers

    Phân tích liên kết dùng thông tin cấu trúc đồ thị web để hỗ trợ việc gì?

    <p>Tìm kiếm</p> Signup and view all the answers

    Thành phần nào không được tiết lộ trong chi tiết về các thành phần phân hạng dùng trong thương mại hiện tại?

    <p>Thành phần tương tự không gian véctơ</p> Signup and view all the answers

    Tính độ chính xác P của hệ thống trên 20 kết quả xếp hạng cao nhất là bao nhiêu?

    <p>0.6</p> Signup and view all the answers

    Tính độ thu hồi R của hệ thống trên 20 kết quả xếp hạng cao nhất là bao nhiêu?

    <p>0.6</p> Signup and view all the answers

    Trong trường hợp một văn bản được xem là phù hợp khi cả hai người đánh giá đều đồng ý, độ chính xác P của hệ thống là bao nhiêu?

    <p>0.2</p> Signup and view all the answers

    Trong trường hợp một văn bản được xem là phù hợp khi cả hai người đánh giá đều đồng ý, độ thu hồi R của hệ thống là bao nhiêu?

    <p>0.5</p> Signup and view all the answers

    Trong trường hợp một văn bản được xem là phù hợp khi ít nhất một trong hai người đánh giá đồng ý, độ chính xác P của hệ thống là bao nhiêu?

    <p>0.5</p> Signup and view all the answers

    Trong trường hợp một văn bản được xem là phù hợp khi ít nhất một trong hai người đánh giá đồng ý, độ thu hồi R của hệ thống là bao nhiêu?

    <p>0.7</p> Signup and view all the answers

    Tại sao dữ liệu văn bản không có cấu trúc được gọi là 'semistructured'?

    <p>Vì dữ liệu văn bản chứa cả cấu trúc và không cấu trúc.</p> Signup and view all the answers

    Tính năng nào của THTT giúp người dùng duyệt và lọc các tập văn bản?

    <p>Hỗ trợ tìm kiếm theo từ khóa</p> Signup and view all the answers

    Phân cụm văn bản là quá trình nào?

    <p>Chia các văn bản ra thành các nhóm có nội dung tương tự nhau.</p> Signup and view all the answers

    Phân lớp văn bản là quá trình nào?

    <p>Phân các văn bản chưa biết chủ đề vào các lớp cho trước.</p> Signup and view all the answers

    Tính năng 'bán cấu trúc' trong THTT liên quan đến việc tìm kiếm gì?

    <p>Tìm kiếm các văn bản chứa từ khóa xác định.</p> Signup and view all the answers

    Tại sao dữ liệu về một sản phẩm được coi là dữ liệu có cấu trúc rõ ràng?

    <p>Vì dữ liệu này chứa tất cả thông tin cần thiết với mỗi sản phẩm.</p> Signup and view all the answers

    Phương pháp nào trong số các phương pháp sau đây sử dụng một mẫu gần nhất để xác định lớp?

    <p>K láng giềng gần nhất (kNN)</p> Signup and view all the answers

    Trong phương pháp kNN, việc chỉ sử dụng một mẫu gần nhất để xác định lớp có thể dẫn tới lỗi do nguyên nhân nào sau đây?

    <p>Mẫu không điển hình</p> Signup and view all the answers

    Phương pháp khỏe mạnh hơn trong kNN là tìm bao nhiêu mẫu giống nhất để xác định lớp?

    <p>5 mẫu</p> Signup and view all the answers

    Độ đo tương tự trong phương pháp kNN phụ thuộc vào điều gì?

    <p>Khoảng cách giữa các mẫu</p> Signup and view all the answers

    Với không gian mẫu liên tục m chiều, phương pháp đơn giản nhất để tính khoảng cách là gì?

    <p>Ơclít</p> Signup and view all the answers

    Trong không gian mẫu nhị phân m chiều, phương pháp đơn giản nhất để tính khoảng cách là gì?

    <p>Hamming</p> Signup and view all the answers

    Tại sao việc đánh giá trong học máy nên tập trung vào mức độ tổng quát hóa của dữ liệu?

    <p>Để tránh lỗi kiểm thử trên dữ liệu huấn luyện.</p> Signup and view all the answers

    Tại sao độ thu hồi/độ chính xác tính được có thể bị giảm sau khi xóa một số văn bản phù hợp khỏi tập văn bản?

    <p>Vì việc xóa văn bản phù hợp làm giảm độ chính xác của phản hồi.</p> Signup and view all the answers

    Tại sao phản hồi không được sử dụng rộng rãi theo văn bản?

    <p>Do câu truy vấn dài và tính toán nhiều khiến cho việc hiểu kết quả khó khăn.</p> Signup and view all the answers

    Điều gì làm cho việc đánh giá công bằng trong học máy trở thành một thách thức?

    <p>Sự ngại hoặc không muốn cung cấp phản hồi tường minh từ người dùng.</p> Signup and view all the answers

    Theo thông tin trong văn bản, điều gì có thể làm giảm độ chính xác của thuật toán khi xóa một số văn bản phù hợp?

    <p>Hiệu suất tương đối trên tập văn bản còn lại giảm.</p> Signup and view all the answers

    Phương pháp nào không được sử dụng để thay thế cho phản hồi người dùng?

    <p>Đo độ tổng quát hóa của dữ liệu.</p> Signup and view all the answers

    More Like This

    Mastering PageRank in Big Data
    10 questions
    Matrices and PageRank Lecture 2 Quiz
    3 questions
    Google Page Rank Algorithm Overview
    10 questions
    IR c9-c10
    13 questions

    IR c9-c10

    SincereProtactinium9600 avatar
    SincereProtactinium9600
    Use Quizgecko on...
    Browser
    Browser