OnionWang / SMP2019-ECDT-NLU

中国中文信息学会社会媒体处理专业委员会举办的2019届中文人机对话之自然语言理解竞赛
https://github.com/OnionWang/SMP2019-ECDT-NLU
74 stars 24 forks source link

关于SMPECDT-DATA 17 18的数据对于19数据的补充效果 #1

Open xiaoduozhou opened 5 years ago

xiaoduozhou commented 5 years ago

17、18的数据看起来非常多,大多数是无用的,(比如chat领域有大量数据,19没有这个领域,还有很多是重复的数据)真正和19相关的可利用的数据只有 不到400条,而且用来试过了,提升效果不大。

zhangyanbo2007 commented 4 years ago

还是想问下,你们第几名?

OnionWang commented 4 years ago

17、18的数据看起来非常多,大多数是无用的,(比如chat领域有大量数据,19没有这个领域,还有很多是重复的数据)真正和19相关的可利用的数据只有 不到400条,而且用来试过了,提升效果不大。 还是想问下,你们第几名?

前5,其实这些数据的价值不仅仅在于标注,只可惜当时没机会试了,sorry回得晚了一些。。。