FunAudioLLM / SenseVoice

Multilingual Voice Understanding Model
https://funaudiollm.github.io/
Other
2.61k stars 249 forks source link

返回的文本有一些表情符号,这种怎么去掉 #113

Open hjj-lmx opened 3 weeks ago

hjj-lmx commented 3 weeks ago

🎼来香港,我是泡面奶茶酷酷炫,我有一种走进TVB的感觉,他是老板阿波阿波奶茶哦奶茶正宗的阿波奶茶还吃到了香港第一蛋挞。😊好,我是从现在在香港路过一个好美的花园,里面还有火烈鸟,刚刚到一天没吃饭,可以先去买个蛋蛋挞,号称香港最好吃的蛋挞。我发现听有人说的,这排队人数也太吓人了,此处排队基本上要人手一袋。终于快门的话能靠近这个店的时候特别特别香。不知道同行啊,别边是香港第鱼蛋挞,那边就是那皮香的,看这条街就这么咋进来了,看一下价格。🎼最低的22小蛋挞6个,然后5点钟取要蛋挞5点钟才能带哦。哦,好好好,肉桂卷、杏仁、丹麦酥,还有这个油条要的这个芝士棒再来个这一款。蛋皮5点到9点,拿这个白牌还花了200多块钱,一点办法都没有,我只能在这边吃东西,吃到5点钟了,继续向美食出发。能看这边上的树这么大一棵,人在它下面就小小一只跟小蚂蚁似的,偶遇一辆雪糕车。感觉岁数比我还大富豪雪糕在马路对面,我就不过去了。但是它这个脆皮确实有点特色,特别香,还有点咸咸的感觉。我想知道那辆车会开走吗?不会是固定摊位吧,我好像走进了一个废弃的菜市场,特别破旧,到了另一个世界。基本上特为虚奇。对对对,我就是来找这家店的,他是老板,这里吃饭的氛围实在是太好了,就坐在他店门口。这里有人吗?那我的。菜单都有点黏巴巴的。这个O嗯,然后还有这个嗯还有4个,,然后还有一份猪扒,OK还有什么?还有一份是公仔面哦,原来是这么做出来。😊刚才太紧张了,我给点重了,这个面感觉还得再泡一会,筷子很有我的风格,这个属于是面的浇头了嗯。结果吃的时候再叫,忘记点最重要的奶茶了,我这边还有两个流行蛋,一杯奶茶,觉得他们的服务态度挺好的,就是脸上有点脏了。真丝袜奶茶,这个真的是奶茶阿波阿阿波奶茶哦奶正宗的阿波奶茶。这是来香港的第一杯奶茶,我这勺子好可爱。😊这边喝奶茶真的有喝茶的感觉,茶味特别重,好像它是用很古躁的那种烧奶茶的炉子弄出来的,空口吃一个。他连这个骨头都炸酥了,但是肉没有炸老。

MarkThunder commented 2 weeks ago

我也有同样的问题,大佬找到解法了吗?

gaochangfeng commented 2 weeks ago

使用正则表达式或者str.replace()删除即可

Etpoem commented 2 weeks ago

可以去修改 rich_transcription_postprocess 这个方法的处理方式,将相应的 emoji 替换为空字符就好

hjj-lmx commented 2 weeks ago

使用正则表达式或者str.replace()删除即可

请问一下,这些表情的作用是什么?

jbang2004 commented 2 weeks ago

找到model.py,把yseq = torch.unique_consecutive(yseq, dim=-1)这行改成yseq = torch.unique_consecutive(yseq[4:], dim=-1)应该就OK了

lomigar commented 1 week ago

在调用api的response中,使用clean_text代替text

hjj-lmx commented 1 week ago

在调用api的response中,使用clean_text代替text

请问具体代码在哪?

gaochangfeng commented 6 days ago

使用正则表达式或者str.replace()删除即可

请问一下,这些表情的作用是什么?

声音事件和情感。

lomigar commented 6 days ago

在调用api的response中,使用clean_text代替text

请问具体代码在哪?

api.py中我做了一些修改 api.txt