issues
search
AlibabaResearch
/
DAMO-ConvAI
DAMO-ConvAI: The official repository which contains the codebase for Alibaba DAMO Conversational AI.
MIT License
1.1k
stars
178
forks
source link
oltqa pre-trained bi-encoder and cross-encoder checkpoints 链接失效,没有plm文件夹
#89
Closed
WJLNTU
closed
8 months ago
WJLNTU
commented
8 months ago
您好,目前遇到三个问题请求您的帮助:
BM25 candidates中使用EPR项目python find_bm25.py output_path=$PWD/data/{compute_bm25_outfile} dataset_split=train setup_type={bm25_setup_type} task_name={dataset} +ds_size={ds_size} L={finder_L},这里的dataset应该是什么?EPR项目中似乎只支持dataset={break|mtop|smcalflow}。
PLM inference部分提到./plm文件夹,和bash ./install_glm.sh bash ./run.sh ${input_file},项目中似乎没有plm文件夹,请问是应该通过那一部分得到吗?
pre-trained bi-encoder and cross-encoder checkpoints 链接失效了,可以发一个新的吗?
感谢您的工作并且期待您的回复 :)
debby1103
commented
8 months ago
感谢关注!
”dataset是什么“ --- 我们将BM25用于生成一个candidate pool,其中dataset需要单独设置,根据QA样本格式自定义
”没有plm文件夹“ --- 是的,需要安装GLM-10B(V100-32G)或GLM-130B(V100-32G*8),我们将其命名为plm文件夹。在使用install_glm.sh安装后,运行
generate_block.sh
,我们将其自定义为run.sh,读入改为一个prompt文件,每一行对应一个prompt
很抱歉上述自定义预处理文件没有保留,目前上传了保留的prompt文件(
partial-textinput.aa
,
partial-textinput.ab
),GLM-10B生成的输出(
plmresource.tar.gz
),希望带来帮助。
”链接失效“ ---
biencoder
,
crossencoder
您好,目前遇到三个问题请求您的帮助:
感谢您的工作并且期待您的回复 :)