-
-
### 请提出你的问题
你好!
我在部署语义检索系统后端报错 : search_phase_execution_exception
软件环境:
paddle-bfloat 0.1.7
paddle-pipelines 0.5.3
paddle2onnx 1.0.6
padd…
-
运行paddle中的run.sh脚本,调用paragraph_extraction生成新的文件后,发现 answer_span对应的答案与fake_answer对应的答案不是一直相同的。原则上二者应该相同吧?
下面3个例子取自demo/devset/search.dev.json生成的新的文件。可以看出二者大多数情况相同,但也有一些情况不相同。
```
question id 1…
-
你好!请问提供的模型都是原始的比较大的模型吗,响应速度如何?因为我们部署只能在CPU上使用,并且内存有限。如果现有模型都比较大,应该用什么方式去蒸馏?谢谢!
-
### Prerequisite
- [X] I have searched [Issues](https://github.com/open-compass/opencompass/issues/) and [Discussions](https://github.com/open-compass/opencompass/discussions) but cannot get the expe…
-
### bug描述 Describe the Bug
问题:我利用rocketqa做self_training,因此在迭代过程中,需要多次load同一模型。先去做inference获得伪标签,再去利用伪标签做finetuning,根据我写的封装逻辑,这个过程要对同一模型加载两次,但paddle框架应该不支持这样操作,因此会报错
代码如下:
```
import rocketqa
ce_m…
-
您好,非常感谢你们的工作,本着极大的兴趣,我复现了一遍bge的微调流程,详细如下:
【第一次微调】
使用Chinese-roberta作为初始模型,然后从https://data.baai.ac.cn/details/BAAI-MTP下载了data_zh.zip数据,然后进行了第一次微调,得到模型bge_finetune_1
【第二次微调】
根据论文提供的数据集地址下载了cMedQA2…
-
你好,分词部分为什么没有使用例如:
text = '你好,明天'
token = ['你', '#好', ',', '明', '#天']
这种格式去转换成 input_ids 进行训练呢?
-
### 软件环境
```Markdown
- paddlepaddle:2.5.0
- paddlenlp: 2.5.2
```
### 重复问题
- [X] I have searched the existing issues
### 错误描述
```Markdown
text_similarity同样的内容多次调用后报错
RuntimeError: (Precondition…
-