1c7 / Translate-Subtitle-File

字幕机翻助手【功能1:翻译字幕文件】 .srt .ass .vtt 【功能2:语音转文字】(拖入视频或音频识别出字幕) (最新版 v4.1.0 更新时间2021年2月23号) 可配置12家翻译服务商,如谷歌,百度,腾讯,彩云,IBM,Azure,Amazon等(可配置6家语音服务商:阿里云,讯飞,腾讯云,IBM,Azure,Amazon )优点:1. 可以用多家服务商,2. 自己配 API Key 用自己账户的免费额度,比如腾讯每月有500万字符的免费翻译额度,IBM 500分钟的语音转文字免费额度(tern.best 那个域名过期了我不想续费了)Azure 语音转文字和 DeepL 免费版出了问题,用不了是正常的,请等待下个版本修复。
https://tern.1c7.me
2.36k stars 198 forks source link

希望增加使用Apple本地语音识别功能转换字幕 #43

Closed suliveevil closed 2 years ago

1c7 commented 2 years ago

我之前从来没想过用这个东西,感谢提醒。 看了一眼似乎是:https://developer.apple.com/documentation/speech

Perform speech recognition on live or prerecorded audio, receive transcriptions, alternative interpretations, and confidence levels of the results.

image

我可能得用 Swift 写一个 command-line interface (CLI) 弄成二进制得到一个文件。然后通过某种方式用 Electron.js 来和这个文件交互,把文件交给它,让他 speech to text 之后把 text 还给我

suliveevil commented 2 years ago

离线主要是为了安全😂,可能准确率不如在线的但没有使用上的限制。 目前我发现的用Apple 自带语音识别的iOS/iPadOS app有:VoiceNotebook、Vrew,macOS上:YPlayer和Be My Ears(这俩是一家,实时字幕,暂时没有导出功能)。 可以导出字幕但需要上传数据的:飞书、雅婷逐字稿、Otter、Notta。 讯飞在App Store里弄了一堆账号发了一堆app都是用自己的云做STT,都没有导出字幕功能。

1c7 commented 2 years ago

可识别,无法导出

可导出

1c7 commented 2 years ago

那为啥不用可以导出的那4家产品?(飞书,雅婷逐字稿,Otter,Notta) 不太懂。是价格太贵还是产品很难用?

suliveevil commented 2 years ago

飞书免费,但比较复杂; 雅婷逐字稿是台湾人出的对普通话支持不太好; Otter太贵了; Notta是日本人出的,价格比Otter便宜。

如果考虑离线使用、安全性的话,市面上没有比较好的解决方案。

单纯语音转文字,不要求字幕的话,iOS/iPadOS上的 Just Press Record做的就挺好,使用Apple语音识别,后台转文字(Voice Notebook需要播放音频),一次性买断。

1c7 commented 2 years ago

懂了。感谢。省了我很多市场调研的工作,哈哈。 我最近在把这个 Tern (机翻小助手) 从 Electron.js 10 升级到 15(很麻烦,他们把 remote 模块去掉了导致我要大改代码) 把这阵子阵痛期过了之后,后面就可以放开手脚搞新功能了。 我这边也在 QQ 群里整天被用户催新功能。

后续我把 Apple 本地这个做好之后,会在这个 issue 里和你说一声。 不过可能没那么快,现在都12月了。有可能得到2022年了

suliveevil commented 2 years ago

期待😊

1c7 commented 2 years ago

@suliveevil 好奇多问一句你的用例和用量大概是什么? 比如你都是用来弄教程的语音转文字? 用量大概是一周转10来个小时的视频?

1c7 commented 2 years ago

我最近也在学 SwiftUI,可能到时候再另外做一个 macOS 的原生 App。 我得先调查一下,因为我觉得类似的 App 应该已经存在了(不过可能价格贵)

suliveevil commented 2 years ago

我目前是自己在iPad和Mac上剪视频发哔哩哔哩,用剪映生成自动字幕。 在iPad和iPhone上用 Just Press Record 记录个人的语音。

安卓手机里有几百条通话录音没法检索,打算转成文字/字幕。

出于个人兴趣,用量很小,所以也就没有订阅Notta和Noted这种服务,只买了 JPR。

1c7 commented 2 years ago

明白了~