yuanzhoulvpi2017 / DocumentSearch

基于sentence transformers和chatglm实现的文档搜索工具
Apache License 2.0
154 stars 19 forks source link

知识库和问题的向量化方式不同 #5

Closed currenttime closed 1 year ago

currenttime commented 1 year ago

知识库中的文件内容的Embedding是用chinese-roberta-wwm-ext向量化模型做的 而输入问题的Embedding是用THUDM/chatglm-6b对话大模型做的 两者之间计算相似度合理吗?为什么不统一用一个模型做?

yuanzhoulvpi2017 commented 1 year ago

你是不是看错了?你再仔细看看代码

currenttime commented 1 year ago

啥意思?没看懂

刚才没打全, 问题更新了

currenttime commented 1 year ago

你是不是看错了?你再仔细看看代码

抱歉抱歉,看错了,弄懂了