根据传入的文本文件,回答你的问题。
核心逻辑来自于chatPDF,自动化客服AI,以及:ChatWeb
由于原来的ChatWeb项目使用的是pqsql作为向量存储和计算工具,较为复杂,本项目修改成faiss,更简单快速。
就是先把大量文本中提取相关内容,再进行回答,最终可以达到类似突破token限制的效果
后续可以考虑将openai的文本向量改成自定义的向量生成工具
主要依赖
faiss
numpy
openai
设置OPENAI_API_KEY
为你的openai的api key
export OPENAI_API_KEY="sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
python Document_QA.py --input_file test.md --file_embeding test.pkl