对这个work有一个疑惑：

JuneFeng / RelationClassification-RL

Reinforcement Learning for Relation Classification from Noisy Data(AAAI2018)

134 stars 37 forks source link

我在研究您的论文时，产生了一个疑惑：你的模型/方法破坏了training set & testing set的原始分布。

其他的RL工作都是基于改变模型参数来适配拟合数据的，也就是不会改变training data & testing data。这样就保证了training set & testing set的原始分布。

但是这篇文章的工作核心是：用RL来对原始training数据的noise bag进行剔除，通过标签Y改变input data。这在training阶段是OK的，这样做确实可以减少noise data对我的分类模型的干扰。但是在testing阶段还能这样吗？testing set都没label了，如何反馈reward给policy module进行testing set中的bag的剔除？那么我在testing phrase还如何work呢？

我看了代码，发现in testing phrase，确实是直接对test set用CNN做关系分类。

谢谢。

JuneFeng / RelationClassification-RL

对这个work有一个疑惑： #9