Closed wuhongsheng closed 1 day ago
看看你用的模型呗?
怎么知道 SPEAKER_0 和 SPEAKER_2 那个是男的那个是女的?
找到原因了,CAM++说话人识别有个合并短句speakid 把这个阈值调小点可以规避