QwenLM / Qwen-Audio

The official repo of Qwen-Audio (通义千问-Audio) chat & pretrained large audio language model proposed by Alibaba Cloud.
Other
1.49k stars 107 forks source link

可以给一些训练数据示例吗? #18

Open Wyswyss opened 11 months ago

Wyswyss commented 11 months ago

非常感谢你们的工作!我们组想使用qwen-audio-chat对学术会议的talk做精细的转录,但是可能受限于基座模型,很多术语的转录还是不太好,所以我们想尝试在特定领域数据上进一步微调,可以参考一下你们训练用的数据的格式吗?谢谢!

Jxu-Thu commented 10 months ago

chat的sft数据示例可以见 https://github.com/QwenLM/Qwen-Audio/blob/main/assets/sft_sample.txt