Open ZiLoong-L opened 3 weeks ago
想问下额外下载的模型应该以什么命名格式放到哪个文件夹下呀?
%APPDATA%/TMSpeech/plugins
当中,大概是这种结构。%APPDATA%/TMSpeech/plugins
├── csukuangfj.streaming-zipformer-bilingual-zh-en
│ ├── sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20
│ │ ├── README.md
│ │ ├── bpe.model
│ │ ├── bpe.vocab
│ │ ├── decoder-epoch-99-avg-1.int8.onnx
│ │ ├── decoder-epoch-99-avg-1.onnx
│ │ ├── encoder-epoch-99-avg-1.int8.onnx
│ │ ├── encoder-epoch-99-avg-1.onnx
│ │ ├── joiner-epoch-99-avg-1.int8.onnx
│ │ ├── joiner-epoch-99-avg-1.onnx
│ │ ├── test_wavs
│ │ │ ├── 0.wav
│ │ │ ├── 1.wav
│ │ │ ├── 2.wav
│ │ │ ├── 3.wav
│ │ │ └── 8k.wav
│ │ └── tokens.txt
│ └── tmmodule.json
那个 tmmodule.json
的内容就是 marketplace.json 的 modules 数组里的一个对象这种格式 (
所有的本地插件,包括程序包本体目录下的 plugins 目录下的所有子目录都有 tmmodule.json)
{
"id": "csukuangfj.streaming-zipformer-bilingual-zh-en",
"type": "sherpaonnx_model",
"name": "中英双语模型",
"author": "csukuangfj",
"publisher": "jxlpzqc",
"desc": "中英双语流式 Zipformer-tranducer 模型",
"version": 20230220,
"displayVersion": "2023-02-20",
"sherpaonnx": {
"token": "sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20/tokens.txt",
"encoder": "sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20/encoder-epoch-99-avg-1.onnx",
"decoder": "sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20/decoder-epoch-99-avg-1.onnx",
"joiner": "sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20/joiner-epoch-99-avg-1.onnx"
}
}
- 安装模型目前是直接到 github 下载,没有代理的情况下可能会下载失败,下一个版本考虑加上代理服务器和镜像服务器,便于墙内下载模型,除此以外后期可以考虑增加本地模块导入功能。
- 已收到反馈,下个版本加上该功能。
- 下载的模型会保存到
%APPDATA%/TMSpeech/plugins
当中,大概是这种结构。%APPDATA%/TMSpeech/plugins ├── csukuangfj.streaming-zipformer-bilingual-zh-en │ ├── sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20 │ │ ├── README.md │ │ ├── bpe.model │ │ ├── bpe.vocab │ │ ├── decoder-epoch-99-avg-1.int8.onnx │ │ ├── decoder-epoch-99-avg-1.onnx │ │ ├── encoder-epoch-99-avg-1.int8.onnx │ │ ├── encoder-epoch-99-avg-1.onnx │ │ ├── joiner-epoch-99-avg-1.int8.onnx │ │ ├── joiner-epoch-99-avg-1.onnx │ │ ├── test_wavs │ │ │ ├── 0.wav │ │ │ ├── 1.wav │ │ │ ├── 2.wav │ │ │ ├── 3.wav │ │ │ └── 8k.wav │ │ └── tokens.txt │ └── tmmodule.json
那个
tmmodule.json
的内容就是 marketplace.json 的 modules 数组里的一个对象这种格式 ( 所有的本地插件,包括程序包本体目录下的 plugins 目录下的所有子目录都有 tmmodule.json){ "id": "csukuangfj.streaming-zipformer-bilingual-zh-en", "type": "sherpaonnx_model", "name": "中英双语模型", "author": "csukuangfj", "publisher": "jxlpzqc", "desc": "中英双语流式 Zipformer-tranducer 模型", "version": 20230220, "displayVersion": "2023-02-20", "sherpaonnx": { "token": "sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20/tokens.txt", "encoder": "sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20/encoder-epoch-99-avg-1.onnx", "decoder": "sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20/decoder-epoch-99-avg-1.onnx", "joiner": "sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20/joiner-epoch-99-avg-1.onnx" } }
感谢大佬的教程,已经安装好啦!不过我发现这个中英双语的模型,好像就是上个版本自带的那个模型😭,只有中文的那个模型的效果甚至还不如这个,感觉好像没有必要安装模型的样子?
还有个功能希望大佬能加上,就不新开一个issue啦!目前每次重新打开窗口,它的大小都会恢复成默认大小和位置,需要重新调整,请问大佬这个可以允许我们设置默认的窗口大小和显示位置嘛?
最新版优化了第一次使用的体验,应该能做到开箱即用了,同时实现了历史记录的功能。 记住窗口的大小和位置这一点确实没注意到,已经加入TODO list,感谢反馈!
国内下载:https://gitee.com/am009/TMSpeech/releases/tag/v0.4.2 Github:https://github.com/jxlpzqc/TMSpeech/releases/tag/v0.4.2
记住窗口的大小和位置,初步尝试实现了一下,可以在这里下载:
https://github.com/jxlpzqc/TMSpeech/actions/runs/11957676473/artifacts/2219940706
但是目前在多屏幕时还是有bug,就先不release了。
感谢大佬的更新!目前新版本我在使用的过程中遇到了2点问题,想向您反馈一下! 1、目前在软件内点击模型安装会卡0%进度无法下载,不知道是不是因为没有梯子的原因,而进到您的marketplace.json中手动下载模型是有下载速度的。但是在模型下载下来以后,不知道要放到哪个文件夹中,请问手动添加的话,要放到哪个文件夹里呀? 2、最新版本是不是取消了自动记录识别结果的功能呀?我在软件内没有看到自定义Log文件目录的模块,实际使用后也没有找到对应的.txt记录,这个功能感觉还挺好用的,不知道能不能添加回来TvT?