deepseek-ai / DeepSeek-Math

DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models
MIT License
783 stars 46 forks source link

代码数据应该怎么用呢 #9

Open songge25 opened 6 months ago

songge25 commented 6 months ago

论文说代码数据会对数学推理能力有用,但是大多数的开源代码数据都是没有具体的函数注释和描述的,只是各种语言的组合。 请问你们有没有验证如果只用一种语言,比如c++作为代码数据,对效果有没有影响 还有就是如果代码数据没有注释,对效果有没有影响,我之前使用了LEMMA开源的代码堆栈数据,效果甚至有下降