Closed tiexueYL closed 3 years ago
你好,可以直接把data里面的'src_sent_labels'换成BertExt的输出,然后用https://github.com/neulab/guided_summarization/blob/master/bert/highligted_sentence_data.py这个生成数据。或者也可以先用BertExt生成一下输出,再用bert的tokenizer去tokenize一下、用torch.save保存,然后用https://github.com/neulab/guided_summarization/blob/master/bert/example_add_guidance.py这个生成数据。
谢谢作者大大回复!!!请问大佬BertExt输出的预测摘要有格式要求吗?谢谢您啦
就保证最后生成的数据和直接用https://github.com/neulab/guided_summarization/blob/master/bert/highligted_sentence_data.py 生成的数据格式一样就可以了。
请问“把data里面的'src_sent_labels'换成BertExt的输出”是这样吗?1.txt是BertExt预测的摘要文件。实在抱歉我太菜了浪费您的时间了
没有没有。就是'src_sent_labels'要换成[0, 1,..]这样的向量 每个元素对应一句话,1表示选这个句子,0表示不选。
谢谢您啦!
谢谢您的回复!