Open songge25 opened 9 months ago
论文说代码数据会对数学推理能力有用,但是大多数的开源代码数据都是没有具体的函数注释和描述的,只是各种语言的组合。 请问你们有没有验证如果只用一种语言,比如c++作为代码数据,对效果有没有影响 还有就是如果代码数据没有注释,对效果有没有影响,我之前使用了LEMMA开源的代码堆栈数据,效果甚至有下降
论文说代码数据会对数学推理能力有用,但是大多数的开源代码数据都是没有具体的函数注释和描述的,只是各种语言的组合。 请问你们有没有验证如果只用一种语言,比如c++作为代码数据,对效果有没有影响 还有就是如果代码数据没有注释,对效果有没有影响,我之前使用了LEMMA开源的代码堆栈数据,效果甚至有下降