Open vuminhoang opened 3 months ago
Comment của Chu Văn An - dev tại VNPAY trên gr cộng đồng: bạn tạo 1 cái router dùng LLM với prompt để phân loại query tương ứng với database, nếu dùng các LLM trả phí thì nên sử dụng function calling chứ ko nên prompt thường. Ví dụ với LlamaIndex, họ dùng 1 quy trình đầy đủ với phân loại query và generate câu trả lời với database tương ứng https://docs.llamaindex.ai/.../agent/multi_document_agents/
*Quick overview: Dự án của nhóm hướng đến việc tạo một PDF chatbot có thể nhận được nhiều PDF ở đầu vào và người dùng hỏi đáp tự do các nội dung trong các PDF đó.
Vấn đề gặp phải: Khi truyền đầu vào là nhiều PDF, nên tạo vector database như thế nào:
Cách 1: Tạo vector database tổng, tức là vẫn chunking như bình thường sau đó tạo một vector datase chưa các vector embedding của tất cả các chunk của cả 2 PDF.
Cách 2: Tạo vector database riêng lẻ cho từng PDF