Clouditera / SecGPT

SecGPT网络安全大模型
Apache License 2.0
1.77k stars 237 forks source link

如何使用自定义数据集 #12

Closed Twilightsh closed 9 months ago

Twilightsh commented 9 months ago

我想要在预训练和指令微调部分使用自己的训练语料。请问数据集格式和自定义使用有具体要求吗?

boy-hack commented 9 months ago

看datasets目录下的代码