有关模型训练的问题

RowitZou / topic-dialog-summ

AAAI-2021 paper: Topic-Oriented Spoken Dialogue Summarization for Customer Service with Saliency-Aware Topic Modeling.

MIT License

77 stars 9 forks source link

有关模型训练的问题 #19

Closed ccclll777 closed 2 years ago

ccclll777 commented 2 years ago

在8万轮预训练完成之后，acc达到了80左右。然后使用RL训练整个模型，1万轮之后，acc没有什么变化，一直在80左右波动，训练时的学习率变化也不是很明显，现在没有明确的调参思路。我使用的数据集客服和客户的对话应该比您使用的数据集要长，初步打算增加网络的深度进行尝试，看有没有什么改变。希望作者能提一些意见，谢谢您！

RowitZou commented 2 years ago

RL训练时acc确实没有明确变化，但是可以发现经过 RL 训练后，抽取器的 recall 值有明显提升。其他一些训练策略，可以参考 #6。

ccclll777 commented 2 years ago

RL训练时acc确实没有明确变化，但是可以发现经过 RL 训练后，抽取器的 recall 值有明显提升。其他一些训练策略，可以参考 #6。谢谢您