H1DDENADM1N / CapsWriter-Offline

Windows端 离线语音输入、中译英、字幕转录;在线多译多、云剪贴板
86 stars 2 forks source link

闲聊 #1

Open H1DDENADM1N opened 6 months ago

QQQOrange commented 6 months ago

妥妥的

tuxiaohui05 commented 6 months ago

运行时遇到了一个问题,我的音频设备名称中带有®,但是ui界面好像不能直接输出®,就会导致报错,我自己在运行时是吧®替换为空,但是还是希望能正常显示出来,希望大大处理一下

QQQOrange commented 6 months ago

运行时遇到了一个问题,我的音频设备名称中带有®,但是ui界面好像不能直接输出®,就会导致报错,我自己在运行时是吧®替换为空,但是还是希望能正常显示出来,希望大大处理一下

好想法,把®替换为空。FixBug 音频设备名称中带有®时的崩溃

@QQQOrange 现在你更新最新版也不用再删除那行了。

那感情好啊。谢谢老哥。

systemoutprintlnhelloworld commented 6 months ago

既然是闲聊,那我提个粗浅的建议:失焦时隐藏菜单栏如果有个平滑动画就好了(

H1DDENADM1N commented 6 months ago

既然是闲聊,那我提个粗浅的建议:失焦时隐藏菜单栏如果有个平滑动画就好了(

我倒是更喜欢现在这样干脆利落

H1DDENADM1N commented 6 months ago

微软新发布的插件 VS Code Speech 支持流式语音输入,而且也是离线的,只是可惜只能用在 vs code

QQQOrange commented 5 months ago

不知道什么原因导致的,会用着用着就用不了了。。。。。。

H1DDENADM1N commented 5 months ago

不知道什么原因导致的,会用着用着就用不了了。。。。。。

遇到过,有时电脑睡眠再唤醒客户端无响应,重启客户端就好了,可能内存泄露了,等我周末有空修修。

QQQOrange commented 5 months ago

不知道什么原因导致的,会用着用着就用不了了。。。。。。

遇到过,有时电脑睡眠再唤醒客户端无响应,重启客户端就好了,可能内存泄露了,等我周末有空修修。

好呀好呀

Nine2333 commented 5 months ago

尝试好久了还是没搞明白为什么在运行的时候出现no module named pyside6.咱代码纯小白一个,不懂勿怪抱歉 image

QQQOrange commented 5 months ago

尝试好久了还是没搞明白为什么在运行的时候出现no module named pyside6.咱代码纯小白一个,不懂勿怪抱歉 image

没关系没关系 谢谢谢谢谢

H1DDENADM1N commented 5 months ago

尝试好久了还是没搞明白为什么在运行的时候出现no module named pyside6.咱代码纯小白一个,不懂勿怪抱歉

检查下 .\site-packages\PySide6\ 参考 readme.md

❗ 注意事项

  1. 存在杀毒误报,建议关闭杀毒软件和防火墙,再解压

  2. 建议先不要修改默认配置,测试能否正常运行

lainbo commented 5 months ago

有没有什么方式可以一键退出客户端、服务端和hint_while_recording呢

H1DDENADM1N commented 5 months ago

有没有什么方式可以一键退出客户端、服务端和hint_while_recording呢

没有。只可以一键退出服务端。一键退出客户端和hint_while_recording。

因为客户端和服务端是完全分离的,原版考虑到稳定性这样设计的。

Nine2333 commented 5 months ago

image GUI版本的吃内存比之前的窗口端高了一倍还多,是加的翻译功能吃的多了嘛

H1DDENADM1N commented 5 months ago

GUI版本的吃内存比之前的窗口端高了一倍还多,是加的翻译功能吃的多了嘛

新版确实非常吃内存 图片

weinfly commented 5 months ago

不知道能否实现,原文和翻译的内容不同的窗口显示的,这样可以同时显示原文和翻译内容,然后可以支持导出的。

H1DDENADM1N commented 5 months ago

不知道能否实现,原文和翻译的内容不同的窗口显示的,这样可以同时显示原文和翻译内容,然后可以支持导出的。

我想你需要的是 https://github.com/pot-app/pot-desktop

weinfly commented 5 months ago

不知道能否实现,原文和翻译的内容不同的窗口显示的,这样可以同时显示原文和翻译内容,然后可以支持导出的。

我想你需要的是 https://github.com/pot-app/pot-desktop

hold_mode = False后,怎么实现每隔指定的时间自动识别呢?原版的好像可以,你这个刚试了不行的

H1DDENADM1N commented 5 months ago

hold_mode = False后,怎么实现每隔指定的时间自动识别呢?原版的好像可以,你这个刚试了不行的

原版CapsWriterOffline也没有这个功能啊,原版FunASR倒是有流式输入模型,但目前还没有可用的成品输入法。我在分支 https://github.com/H1DDENADM1N/CapsWriter-Offline/tree/auto_type 尝试实现过用非流式模型分秒切断模拟流式输入,效果很不好,模型会空耳安静时段输出不知所云。如果需要离线流式语音输入,可以看下 VS Speech,只是可惜只能在VSCode里用

qhgy commented 5 months ago

thx

zhouxiansheng commented 5 months ago

英雄联盟里面不能使用是什么原因?怎么才可以在游戏中中使用呢?

H1DDENADM1N commented 5 months ago

英雄联盟里面不能使用是什么原因?怎么才可以在游戏中中使用呢?

运行管理员权限的客户端试试

zhouxiansheng commented 4 months ago

英雄联盟里面不能使用是什么原因?怎么才可以在游戏中中使用呢?

运行管理员权限的客户端试试

以管理员权限运行试过了,也是不行,运行admin结尾的那个也不行,测试了很久,不管哪一个exe都用过管理员权限试过了,都无法在英雄联盟中使用,在英雄联盟中只要按下语音识别键,就会闪退切屏出游戏。 以前的版本没有这样的问题,貌似这个版本加入了语音识别时,鼠标会有一个麦克风标识,导致了游戏中闪退切屏。 有空你可以试试看,是不是这样的情况哦。

config.py 里有 hint_while_recording_at_cursor_position ,改 False 试试

qhgy commented 4 months ago

我说回车或者换行 然后它就换行 这个怎么实现呢 原版可以在hot=rules设置生效 回车 = \r\n 换行 = \r\n 你这个版本这样设置 就没反应呢

H1DDENADM1N commented 4 months ago

我说回车或者换行 然后它就换行 这个怎么实现呢 原版可以在hot=rules设置生效 回车 = \r\n 换行 = \r\n 你这个版本这样设置 就没反应呢

参考 https://github.com/H1DDENADM1N/CapsWriter-Offline/commit/6d21db8d024757ddb780f541fd7dba66a4b91a90#diff-c5208f0df37da9787d52455d4b59ff478bbf6a687f119130bbabe5cf1e99ce3bR26

加一句 file_stem = re.sub(r"\r\n", " ", file_stem)

就可以了

Natural-selection1 commented 3 months ago

关于向新版本更新: 是否可以有便捷一些的方法,比如说只需要更改某些文件,或者只更新某些模型 还是说必须覆盖式更新然后再自己调配置(或者再将保留的配置文件复制回去)

H1DDENADM1N commented 3 months ago

关于向新版本更新:

是否可以有便捷一些的方法,比如说只需要更改某些文件,或者只更新某些模型

还是说必须覆盖式更新然后再自己调配置(或者再将保留的配置文件复制回去)

release和网盘发布的是已打包压缩包,没有增量式更新包,必须覆盖式更新,这样最稳定。

你也可以参考commit history,手动修改代码,或仅下载有改动的文件进行替换,但不推荐这种更新方法。