jxlpzqc / TMSpeech

腾讯会议摸鱼工具
MIT License
520 stars 45 forks source link

新版本问题反馈:模型下载问题与历史记录问题 #39

Open ZiLoong-L opened 3 weeks ago

ZiLoong-L commented 3 weeks ago

感谢大佬的更新!目前新版本我在使用的过程中遇到了2点问题,想向您反馈一下! 1、目前在软件内点击模型安装会卡0%进度无法下载,不知道是不是因为没有梯子的原因,而进到您的marketplace.json中手动下载模型是有下载速度的。但是在模型下载下来以后,不知道要放到哪个文件夹中,请问手动添加的话,要放到哪个文件夹里呀? 2、最新版本是不是取消了自动记录识别结果的功能呀?我在软件内没有看到自定义Log文件目录的模块,实际使用后也没有找到对应的.txt记录,这个功能感觉还挺好用的,不知道能不能添加回来TvT?

ZiLoong-L commented 3 weeks ago

想问下额外下载的模型应该以什么命名格式放到哪个文件夹下呀?

jxlpzqc commented 3 weeks ago
  1. 安装模型目前是直接到 github 下载,没有代理的情况下可能会下载失败,下一个版本考虑加上代理服务器和镜像服务器,便于墙内下载模型,除此以外后期可以考虑增加本地模块导入功能。
  2. 已收到反馈,下个版本加上该功能。
  3. 下载的模型会保存到%APPDATA%/TMSpeech/plugins当中,大概是这种结构。
%APPDATA%/TMSpeech/plugins
├── csukuangfj.streaming-zipformer-bilingual-zh-en
│   ├── sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20
│   │   ├── README.md
│   │   ├── bpe.model
│   │   ├── bpe.vocab
│   │   ├── decoder-epoch-99-avg-1.int8.onnx
│   │   ├── decoder-epoch-99-avg-1.onnx
│   │   ├── encoder-epoch-99-avg-1.int8.onnx
│   │   ├── encoder-epoch-99-avg-1.onnx
│   │   ├── joiner-epoch-99-avg-1.int8.onnx
│   │   ├── joiner-epoch-99-avg-1.onnx
│   │   ├── test_wavs
│   │   │   ├── 0.wav
│   │   │   ├── 1.wav
│   │   │   ├── 2.wav
│   │   │   ├── 3.wav
│   │   │   └── 8k.wav
│   │   └── tokens.txt
│   └── tmmodule.json

那个 tmmodule.json 的内容就是 marketplace.json 的 modules 数组里的一个对象这种格式 ( 所有的本地插件,包括程序包本体目录下的 plugins 目录下的所有子目录都有 tmmodule.json)

https://github.com/jxlpzqc/TMSpeechCommunity/blob/5f30e20e0c57187b2632a2f765c3250f7f52b251/marketplace.json#L61-L88

{
    "id": "csukuangfj.streaming-zipformer-bilingual-zh-en",
    "type": "sherpaonnx_model",
    "name": "中英双语模型",
    "author": "csukuangfj",
    "publisher": "jxlpzqc",
    "desc": "中英双语流式 Zipformer-tranducer 模型",
    "version": 20230220,
    "displayVersion": "2023-02-20",
    "sherpaonnx": {
        "token": "sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20/tokens.txt",
        "encoder": "sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20/encoder-epoch-99-avg-1.onnx",
        "decoder": "sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20/decoder-epoch-99-avg-1.onnx",
        "joiner": "sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20/joiner-epoch-99-avg-1.onnx"
    }
}
ZiLoong-L commented 2 weeks ago
  1. 安装模型目前是直接到 github 下载,没有代理的情况下可能会下载失败,下一个版本考虑加上代理服务器和镜像服务器,便于墙内下载模型,除此以外后期可以考虑增加本地模块导入功能。
  2. 已收到反馈,下个版本加上该功能。
  3. 下载的模型会保存到%APPDATA%/TMSpeech/plugins当中,大概是这种结构。
%APPDATA%/TMSpeech/plugins
├── csukuangfj.streaming-zipformer-bilingual-zh-en
│   ├── sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20
│   │   ├── README.md
│   │   ├── bpe.model
│   │   ├── bpe.vocab
│   │   ├── decoder-epoch-99-avg-1.int8.onnx
│   │   ├── decoder-epoch-99-avg-1.onnx
│   │   ├── encoder-epoch-99-avg-1.int8.onnx
│   │   ├── encoder-epoch-99-avg-1.onnx
│   │   ├── joiner-epoch-99-avg-1.int8.onnx
│   │   ├── joiner-epoch-99-avg-1.onnx
│   │   ├── test_wavs
│   │   │   ├── 0.wav
│   │   │   ├── 1.wav
│   │   │   ├── 2.wav
│   │   │   ├── 3.wav
│   │   │   └── 8k.wav
│   │   └── tokens.txt
│   └── tmmodule.json

那个 tmmodule.json 的内容就是 marketplace.json 的 modules 数组里的一个对象这种格式 ( 所有的本地插件,包括程序包本体目录下的 plugins 目录下的所有子目录都有 tmmodule.json)

https://github.com/jxlpzqc/TMSpeechCommunity/blob/5f30e20e0c57187b2632a2f765c3250f7f52b251/marketplace.json#L61-L88

{
    "id": "csukuangfj.streaming-zipformer-bilingual-zh-en",
    "type": "sherpaonnx_model",
    "name": "中英双语模型",
    "author": "csukuangfj",
    "publisher": "jxlpzqc",
    "desc": "中英双语流式 Zipformer-tranducer 模型",
    "version": 20230220,
    "displayVersion": "2023-02-20",
    "sherpaonnx": {
        "token": "sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20/tokens.txt",
        "encoder": "sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20/encoder-epoch-99-avg-1.onnx",
        "decoder": "sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20/decoder-epoch-99-avg-1.onnx",
        "joiner": "sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20/joiner-epoch-99-avg-1.onnx"
    }
}

感谢大佬的教程,已经安装好啦!不过我发现这个中英双语的模型,好像就是上个版本自带的那个模型😭,只有中文的那个模型的效果甚至还不如这个,感觉好像没有必要安装模型的样子?

ZiLoong-L commented 2 weeks ago

还有个功能希望大佬能加上,就不新开一个issue啦!目前每次重新打开窗口,它的大小都会恢复成默认大小和位置,需要重新调整,请问大佬这个可以允许我们设置默认的窗口大小和显示位置嘛?

am009 commented 6 days ago

最新版优化了第一次使用的体验,应该能做到开箱即用了,同时实现了历史记录的功能。 记住窗口的大小和位置这一点确实没注意到,已经加入TODO list,感谢反馈!

国内下载:https://gitee.com/am009/TMSpeech/releases/tag/v0.4.2 Github:https://github.com/jxlpzqc/TMSpeech/releases/tag/v0.4.2

am009 commented 6 days ago

记住窗口的大小和位置,初步尝试实现了一下,可以在这里下载:

https://github.com/jxlpzqc/TMSpeech/actions/runs/11957676473/artifacts/2219940706

但是目前在多屏幕时还是有bug,就先不release了。