[Campathon 2024] - AI Techies.pdf
Document Details
Uploaded by MercifulJackalope
2024
Tags
Full Transcript
CAMPATHON 2024: SMART SOLUTION BÀI DỰ THI VÒNG Ý TƯỞNG Hệ thống sinh bài thi trắc nghiệm sử dụng trí tuệ nhân tạo - VietQuiz Team AI Techies CONTACT PERSON: Nguyễn Huy Thái [email protected] 0946 590 882 234 Pham Van Dong St, Co Nhue 1 Ward, Bac Tu Liem District,...
CAMPATHON 2024: SMART SOLUTION BÀI DỰ THI VÒNG Ý TƯỞNG Hệ thống sinh bài thi trắc nghiệm sử dụng trí tuệ nhân tạo - VietQuiz Team AI Techies CONTACT PERSON: Nguyễn Huy Thái [email protected] 0946 590 882 234 Pham Van Dong St, Co Nhue 1 Ward, Bac Tu Liem District, Ha Noi 1 CAMPATHON 2024: SMART SOLUTION VÒNG Ý TƯỞNG Mục lục 1. Thông tin đăng ký của đội thi: 3 1.1. Thành viên 1 (trưởng nhóm): 3 1.2. Thành viên 2: 3 1.3. Thành viên 3: 3 1.4. Thành viên 4: 3 2. Ảnh của đội: 3 3. Mục đích: 3 4. Công dụng của sản phẩm: 3 5. Thiết kế tổng quan: 5 5.1. Tổng quan: 5 5.2. Biểu đồ use case của sản phẩm/dự án: 5 5.3. Ứng dụng trí tuệ nhân tạo. 7 6. Phương hướng triển khai: 9 7. Plus point: 9 2 CAMPATHON 2024: SMART SOLUTION VÒNG Ý TƯỞNG 1. Thông tin đăng ký của đội thi: 1.1. Thành viên 1 (trưởng nhóm): - Họ và tên: Nguyễn Huy Thái - MSV: 21020035 - SĐT: 0946 590 882 - Email: [email protected] 1.2. Thành viên 2: - Họ và tên: Trần Hồng Quân - MSV: 21020555 - SĐT: 0965 098 627 - Email: [email protected] 1.3. Thành viên 3: - Họ và tên: Phạm Quang Vinh - MSV: 22022648 - SĐT: 0398 800 388 - Email: [email protected] 1.4. Thành viên 4: - Họ và tên: Nguyễn Ngô Việt Trung - MSV: 22022598 - SĐT: 0348 650 804 - Email: [email protected] 3 CAMPATHON 2024: SMART SOLUTION VÒNG Ý TƯỞNG 2. Ảnh của đội: Link ảnh: https://bit.ly/ai-techies-team 3. Mục đích: VietQuiz là một ứng dụng đa nền tảng, sử dụng công nghệ nhận diện ký tự quang học (OCR) và các mô hình ngôn ngữ lớn (LLM) để trích xuất các thông tin và câu hỏi từ các tài liệu đầu vào, từ đó sinh ra các bài kiểm tra phục vụ mục đích ôn luyện và đánh giá kiến thức của người học. Ứng dụng này không chỉ giúp các thầy cô giảng viên tiết kiệm thời gian tạo lập đề cương, đề kiểm tra và chấm điểm, mà còn cung cấp cho các bạn học sinh một nơi để ôn tập và trau dồi, nâng cao kiến thức của bản thân. 4. Công dụng của sản phẩm: 1. Sinh câu hỏi trắc nghiệm nhanh từ đa dạng định dạng file đầu vào VietQuiz hỗ trợ đa dạng các định dạng tài liệu đầu vào như docx, pdf, pptx, txt, png,... giúp người dùng dễ dàng chuyển đổi tài liệu thành bộ câu hỏi trắc nghiệm. Nhờ vào các mô hình OCR và LLM tiên tiến, ứng dụng có khả năng trích xuất và xử lý các tài liệu này với độ chính xác cao, đảm bảo rằng các câu hỏi được tạo ra từ nhiều nguồn tài liệu khác nhau đều được xử lý một cách hiệu quả, kể cả khi các tài liệu bao gồm hình ảnh chữ viết tay, file scan có đáp án được khoanh tròn. 2. Thiết lập các bài kiểm tra dựa trên dữ liệu câu hỏi Khi đã có bộ câu hỏi được trích xuất, VietQuiz cung cấp các tùy chọn sinh các bài kiểm tra ngẫu nhiên từ ngân hàng câu hỏi, hỗ trợ đảo thứ tự đáp án và thứ tự câu hỏi. Điều này giúp tạo ra các bài kiểm tra độc lập và đa dạng, nhằm mục đích tránh gian lận và tăng độ hiệu quả trong việc đánh giá học sinh. Ứng dụng cũng hỗ trợ chấm điểm tự động dựa trên đáp án đúng, giúp giảng viên tiết kiệm thời gian và công sức trong việc đánh giá kết quả học tập của học sinh. 3. Quản lý và theo dõi kết quả học tập Để hỗ trợ giảng viên và người học trong việc theo dõi kết quả học tập, VietQuiz cung cấp tính năng tạo lớp học giúp giảng viên quản lý sinh viên một cách tập trung, hiệu quả. Giảng viên có thể xem lại thống kê điểm số của lớp, của từng người qua các bài kiểm tra từ đó dễ dàng nắm được tình hình học tập của mỗi học sinh trong lớp của mình. Các học sinh có thể xem lại kết quả các bài 4 CAMPATHON 2024: SMART SOLUTION VÒNG Ý TƯỞNG kiểm tra mình đã làm, thống kê điểm số của mình sau các bài kiểm tra từ đó điều chỉnh để có kết quả học tập tốt hơn. 4. Giao diện thân thiện Giao diện người dùng thân thiện cũng là một điểm cộng lớn giúp VietQuiz trở nên dễ học, dễ sử dụng hơn với nhiều nhóm người dùng, đặc biệt với các thầy cô giảng viên lớn tuổi hay ít tiếp xúc với công nghệ. Một giao diện đơn giản, trực quan và dễ hiểu sẽ giúp thao tác, quản lý lớp học, bài kiểm tra trở nên dễ dàng và suôn sẻ hơn. 5. Thiết kế tổng quan: 5.1. Tổng quan: VietQuiz là ứng dụng đa nền tảng giúp đơn giản hóa việc tạo các bài kiểm tra trắc nghiệm một cách nhanh chóng và hiệu quả từ đa dạng các loại file dữ liệu cho giáo viên. Ứng dụng sử dụng các mô hình học sâu để nhận dạng ký tự dạng chữ và các hình ảnh/biểu đồ trong bộ câu hỏi của người dùng, đồng thời sử dụng các mô hình ngôn ngữ lớn trong việc xử lý dữ liệu và tạo bộ câu hỏi trắc nghiệm cho người dùng sử dụng. Ngoài ra, ứng dụng còn có các tính năng quản lý lớp học giúp thầy cô dễ dàng theo dõi kết quả học tập của học sinh một cách đơn giản và hiệu quả. 5 CAMPATHON 2024: SMART SOLUTION VÒNG Ý TƯỞNG 5.2. Biểu đồ use case của sản phẩm/dự án: Link ảnh gốc: https://bit.ly/use-case-model 6 CAMPATHON 2024: SMART SOLUTION VÒNG Ý TƯỞNG 5.3. Ứng dụng trí tuệ nhân tạo Với đa dạng các loại file dữ liệu đầu vào, việc phân tích và trích xuất thông tin từ đó tương đối khó khăn, hệ thống đã tích hợp các mô hình trí tuệ nhân tạo trong quá trình xử lý này. Để xử lý được đa dạng các loại dữ liệu đó, nhóm đã tích hợp các loại mô hình AI sau: 1. Mô hình nhận dạng và trích xuất ký tự (OCR) : mô hình sẽ nhận dạng và trích xuất dữ liệu dạng ký tự có trong ảnh thành dữ liệu dạng chữ. Mô hình này sẽ đóng vai trò trích xuất các câu hỏi, đáp án trắc nghiệm trong file dữ liệu đầu vào. 2. Mô hình phân tích lớp của văn bản ảnh (Document Layout Analysis): mô hình được huấn luyện dựa trên các bộ dữ liệu có sẵn (PubLayNet, DocLayNet,..) nhằm mục đích nhận dạng các phân lớp trong ảnh tài liệu. Để trích xuất tối đa thông tin từ file dữ liệu đầu vào, mô hình này sử dụng để trích xuất các dữ liệu ảnh hoặc công thức mà mô hình OCR không thể đọc được. 3. Mô hình ngôn ngữ lớn (LLM): Nhận đầu vào là dữ liệu dạng chữ của file kết quả của các mô hình nhận diện văn bản, từ đó áp dụng mô hình ngôn ngữ lớn để nhận dạng các câu hỏi, lọc những văn bản ngoài lề và biến đổi lại thành một định dạng cuối cùng để có thể sử dụng tạo thành đề thi. Dựa vào đặc trưng của các loại dữ liệu đầu vào và để đơn giản hóa cách thức xử lý, team đã phân loại các dạng dữ liệu thành 2 nhóm và đưa ra giải pháp cho từng loại dữ liệu như sau: 1. Nhóm dữ liệu là hình ảnh/file scan (có thể chứa cả hình ảnh và chữ) : thông thường, đây là những ảnh chụp hoặc file được scan, do đó, nhóm đã sử dụng các mô hình AI trích xuất thông tin như sau: Dữ liệu thô dạng ảnh sẽ được đi qua mô hình DLA nhằm tách các ảnh có trong document và những box ảnh chứa câu trắc nghiệm, đáp án. Với box ảnh này, nó được đi qua mô hình OCR để tách chữ ra khỏi ảnh. Sau đó, kết quả của OCR sẽ được đi qua mô hình LLM được tinh chỉnh để lọc bỏ nhiễu và chuẩn hóa lại dưới dạng dữ liệu có cấu trúc và kết hợp với ảnh đã được tách để tạo thành bộ câu hỏi hoàn chỉnh 2. Nhóm dữ liệu là file gốc (có thể chứa cả hình ảnh và chữ): bao gồm dữ liệu định dạng file docx, pptx, pdf, txt,... Với dữ liệu dạng này, phần chữ và ảnh có thể được trích xuất riêng. Sau đó, dữ liệu dạng chữ được cấu trúc lại thông qua mô hình LLM và kết hợp với ảnh đã được trích xuất để tạo thành bộ câu hỏi hoàn chỉnh. 7 CAMPATHON 2024: SMART SOLUTION VÒNG Ý TƯỞNG Link ảnh gốc: https://bit.ly/data-processing-pipeline Với cách xử lý dữ liệu thông qua các mô hình AI như trên, ứng dụng có thể linh hoạt xử lý nhiều dạng dữ liệu đầu vào, tự động hóa việc trích xuất với hiệu quả cao trong thời gian ngắn, sẵn sàng để sử dụng cho các pha tiếp theo của hệ thống. 8 CAMPATHON 2024: SMART SOLUTION VÒNG Ý TƯỞNG 6. Phương hướng triển khai: Với phần phân tích đã nêu trên, nhóm có đề xuất kế hoạch triển khai Hệ thống sinh bài thi trắc nghiệm VietQuiz thành các pha chính như sau: Thời gian STT Công việc dự kiến 1 Lên kế hoạch, thành lập nhóm dự án Tuần 1 2 Phân tích nghiệp vụ sản phẩm. Tuần 2-3 Phát triển và thử nghiệm các mô hình AI phục vụ cho các 3 Tuần 4-8 tác vụ của sản phẩm. 4 Phát triển ứng dụng trên nền tảng web và mobile. Triển khai thử nghiệm với người dùng trên quy mô nhỏ, 5 Tuần 9-10 nhận feedback của người dùng để cải thiện sản phẩm. 6 Triển khai tiếp thị sản phẩm. Tuần 11-12 7 Công bố sản phẩm ra thị trường. Tuần 13 8 Kêu gọi vốn để mở rộng và nâng cấp sản phẩm. Tuần 14-17 7. Plus point: Sau quá trình nghiên cứu, phân tích và so sánh với các giải pháp hiện hành, ứng dụng VietQuiz sở hữu những đặc điểm nổi bật như sau: Ứng dụng sử dụng công nghệ AI tiên tiến, liên tục cải thiện độ chính xác. Thiết kế giao diện người dùng trực quan, dễ sử dụng. Xử lý đa dạng định dạng đầu vào, đảm bảo tốc độ và độ chính xác cao. Hỗ trợ công cụ quản lý lớp học, bài thi, thống kê kết quả nhanh chóng. 9