harusamei / zebura

a framework for querying data using natural language
BSD 2-Clause "Simplified" License
0 stars 0 forks source link

文档查询POC #1

Closed harusamei closed 6 months ago

harusamei commented 6 months ago

确定文档检索的基本框架,并试验基本组件,确认可行性, 完成demo系统 主要组件包括 1,ES, sparse vector, dense vector 检索 2, word, ppt, html, pdf, txt 文件解析, 至少可以解析出文档标题及文本内容

  1. 可用的 embedding 算法,需考虑速度
  2. 调用LLM接口, 优先GPT4
harusamei commented 6 months ago

目标改变, 废弃