FunAudioLLM / SenseVoice

Multilingual Voice Understanding Model
https://funaudiollm.github.io/
Other
2.61k stars 249 forks source link

支持多人对话的场景 #111

Open hehuang139 opened 3 weeks ago

hehuang139 commented 3 weeks ago

Notice: In order to resolve issues more efficiently, please raise issue following the template. (注意:为了更加高效率解决您遇到的问题,请按照模板提问,补充细节)

❓ Questions and Help

首先感谢开源的senseVoice,识别正确率很高,并且解析效率也很高! 这里希望提一个需求:多人对话是一个非常重要的业务场景。 希望能够支持多人对话的识别,考虑能够基于对话中每个人的声纹特征将语言识别的内容按人进行区分形成多人对话。 这样应用识别完成后,用户可以为每个人标准身份,实现多人对话识别。

Before asking:

  1. search the issues.
  2. search the docs.

是的

What is your question?

Code

What have you tried?

不涉及

What's your environment?

不涉及

78 commented 2 weeks ago

同样期待这个能力

luohao123 commented 5 days ago

+1