wxywb / history_rag

789 stars 102 forks source link

pipeline模式下使用GPT-4,无法复现演示的问题 #74

Closed morning0801 closed 2 weeks ago

morning0801 commented 1 month ago

代码中使用的模型是gpt-4-turbo-2024-04-09,相同的问题我使用GPT-4得到的回答跟您演示的效果不同。这是模型不同造成的吗? rag效果

另外,我收到的回答并不能够准确的给出出处,甚至回复的内容里有原字"《书名》原文内容"。这是为什么?

wxywb commented 1 month ago

视频中的内容是用milvus方案实现的,milvus方案利用了文档结构将传记名抽出来作为metainfo,这些逻辑请参考具体实现,当时的pipeline还无法做到这种细粒度的控制(整个url文档才有metainfo,不能切段,给每一段加metainfo),现在pipeline有了text模式,用户可以在客户端进行切分,并赋予每段metainfo,但我没更新这一个方式。

morning0801 commented 4 weeks ago

没有用milvus方案是因为docker镜像总是拉取失败,报错内容:error pulling image configuration: download failed after attempts=6: dial tcp 69.63.180.173:443: i/o timeout,就先尝试了pipeline。

wxywb commented 4 weeks ago

目前的dockerhub确实普遍出现了这个网络问题,如果要用milvus版,其他的解决方法有: