Open suliveevil opened 2 years ago
只找到了 Apple Create ML 里的 speech framework:https://developer.apple.com/documentation/speech 离线语音转文字/字幕目前好像除了用 Mozilla 的 DeepSpeech就只有 Apple 的speech 可以用了。
补充一个离线语音识别API:https://github.com/alphacep/vosk-api
vosk这个我可以看一下,苹果的api我这边没有开发者账户,应该是没法直接用
感谢🙏
恍惚间已经一年了,终于有了一个离线可用的字幕生成工具:whisper
https://github.com/openai/whisper
也有了别人打包好的 app:
https://github.com/chidiwilliams/buzz
特此分享一下。
这个准确度好么?我之前试过kaldi还是啥的 准确度很差 调用macos原生接口的provider已经在路上了
On Thu, Dec 8, 2022 at 9:05 PM suliveevil @.***> wrote:
恍惚间已经一年了,终于有了一个离线可用的字幕生成工具:whisper,也有了别人打包好的 app:
https://github.com/chidiwilliams/buzz
特此分享一下。
— Reply to this email directly, view it on GitHub https://github.com/summershrimp/obs-auto-subtitle/issues/33#issuecomment-1342706954, or unsubscribe https://github.com/notifications/unsubscribe-auth/ACOKG7UHNXH65SZABP24I5DWMHMKTANCNFSM5KEHAKNQ . You are receiving this because you were assigned.Message ID: @.***>
-- Yibai Zhang
Te: +86 156 1538 6668 E-mail: @.*** WeChat: xmstudio
我只用了一个两小时的英文播客测试了,转录的字幕质量还是非常高的,也有人反馈说对中文支持不是特别好。
https://meta.appinn.net/t/topic/38263
我和家人的通话录音都是方言,就还没用这些工具进行文字化处理。
中文应该还是 macOS 的数据更多模型更好吧,毕竟做了很多年的无障碍功能。 App Store 里也有实现了实时字幕的 App:
感谢反馈!
On Thu, Dec 8, 2022 at 9:42 PM suliveevil @.***> wrote:
我只用了一个两小时的英文播客测试了,转录的字幕质量还是非常高的,也有人反馈说对中文支持不是特别好。
我和家人的通话录音都是方言,就还没用这些工具进行文字化处理。
中文应该还是 macOS 的数据更多模型更好吧,毕竟做了很多年的无障碍功能。 App Store 里也有实现了实时字幕的 App:
Be My Ears - Mac App Store https://apps.apple.com/cn/app/be-my-ears/id1577662679?mt=12
— Reply to this email directly, view it on GitHub https://github.com/summershrimp/obs-auto-subtitle/issues/33#issuecomment-1342756827, or unsubscribe https://github.com/notifications/unsubscribe-auth/ACOKG7QTXZX2XMWHXZTKRXDWMHQUTANCNFSM5KEHAKNQ . You are receiving this because you were assigned.Message ID: @.***>
-- Yibai Zhang
Te: +86 156 1538 6668 E-mail: @.*** WeChat: xmstudio
有相关的文档链接么?(而且截止到目前,并没有人赞助本项目一个apple开发者账户,因此如果是涉及到调用apple的speechkit的话,也做不到