QwenLM / Qwen-Audio

The official repo of Qwen-Audio (通义千问-Audio) chat & pretrained large audio language model proposed by Alibaba Cloud.
Other
1.49k stars 107 forks source link

关于训练数据中不同语言分布情况 #61

Open shihuai opened 5 months ago

shihuai commented 5 months ago

Hi~作者你好,十分感谢你们能将这么好的工作开源出来,我对你们这个工作也十分感兴趣。在论文中你们关于数据集介绍部分,虽然详细介绍了不同任务中样本的大致数量,但关于不同语言样本分布情况似乎没有做介绍,所以不知道你们能不能提供一下这部分数据的分布情况?🙏