关于DuReader-Retrieval-Baseline的疑问

PaddlePaddle / RocketQA

🚀 RocketQA, dense retrieval for information retrieval and question answering, including both Chinese and English state-of-the-art models.

Apache License 2.0

767 stars 128 forks source link

您好！我读了RocketQA的原文，发现RocketQA介绍的是关于dual-encoder的训练（即RocketQA/research/DuReader-Retrieval-Baseline中的step 1）。请问RocketQA/research/DuReader-Retrieval-Baseline中的step 2 cross-encoder是通过给同一个PTM（比如BERT）输入query和passage的拼接文本作为输入，输出是表示匹配程度的值来训练的吗？如果是，step 2的TRAIN_SET，dureader-retrieval-baseline-dataset/train/cross.train.demo.tsv，是不是就是用step 1训练的模型所过滤出的最匹配的50个passage？

PaddlePaddle / RocketQA

关于DuReader-Retrieval-Baseline的疑问 #30