JohannLai / audio-to-text

Convert audio to text and summary just need to input the audio link.
GNU General Public License v3.0
9 stars 2 forks source link

[🎬 Auto-Convert] eason + 飓风 #29

Closed JohannLai closed 1 year ago

JohannLai commented 1 year ago

https://www.youtube.com/watch?v=9g3XXXdnjqY https://www.youtube.com/watch?v=08PFXFA8Rs8

github-actions[bot] commented 1 year ago

Hi there! 👋 Thanks for using my services! 🤖❤️! 🤖 I've received your request and currently working on it.

I'll be processing the following text:

  [🎬 Auto-Convert] eason + 飓风 https://www.youtube.com/watch?v=9g3XXXdnjqY
https://www.youtube.com/watch?v=08PFXFA8Rs8 

⚙️ It might take a few minutes 🙏 You can check the progress here

In the meantime, feel free to grab a cup of coffee ☕️ or take a quick break. I'll notify you as soon as I'm done! 😊

If you find my services helpful, you can support me by buying me a coffee ☕️ using the following button: "Buy Me A Coffee"

github-actions[bot] commented 1 year ago

Hi there! 👋

I've finished processing your request! 🤖

Here's the result:

github-actions[bot] commented 1 year ago

Eason 陳奕迅【無人之境】MV

Summary Text

文本总结

这段文本是一段描述 Eason 陳奕迅新歌 MV 的视频简介。除了介绍视频外,还呼吁观看者点赞订阅转发打赏支持该栏目,并感谢观看和字幕提供者。

Original text

Eason 陳奕迅【無人之境】MV: 请不吝点赞 订阅 转发 打赏支持明镜与点点栏目 并且在最后点赞 订阅 转发 打赏支持明镜与点点栏目 感谢观看 字幕由Amara.org社区提供 感谢观看 感谢观看 感谢观看 欢迎

github-actions[bot] commented 1 year ago

Original text

UP主们都怎么做字幕?调研100位UP,他们的秘密是...: 这是你打开B站每天可以看到的推荐视频 不管他们在讲的内容有多么不同 它基本都有同一个字母 就是字幕 数据统计加字幕的视频比起不加字幕 它的播放量可以增加7%以上 所以说字幕对于视频创作者 真的还是挺重要的 只不过在做调研的时候 我们发现很少有统计型的视频 来和你分析up主做字幕这件小事情 那up主们用的软件选择是什么 有没有什么大up主们通用的方法论 我真的很好奇这一点 所以前段时间我们设计了一个问卷 发在了朋友圈里 我本来以为不会有很多人 但在短短几个小时之内 我们就收到了145份大卷 但其中也不乏一些有名的up主 像这些 他们就自己冒出来了 我觉得还挺荣幸的 那这次问卷同时涵盖了 生活 知识 科技 美食 等十几个主流分区 虽然仍然有那么一点点管中窥豹 但是我希望我们这次对于字幕观察到的内容 能对你有一些帮助 首先我们要了解的第一点 是up主们都会花多久时间来做字幕 那这次参与我们问卷的145位up主 粉丝量从个位数到六七百万的都有 这里面有超95%的up主都会做字幕 平均做字幕的时间大概在一小时左右 占据了67%之多 那剩下的一大半人也能在三小时之内 来完成他的视频字幕 所以我还是挺吃惊的 大家现在做字幕的效率比我预想的高很多 前几年我自己做字幕的话 总是要花上好几个小时 那现在这种普遍的效率提升 它是不是和做字幕的工具有关系 那根据我们目前的统计 up主们所使用的字幕软件里 剪印 碾压性占据了绝大多数 有71位up主都提到了剪印 而排名在这之后的就是ArcTime 也是我的好朋友开发的一个软件 有29位up主在使用 那另外第三位的就是讯飞听见 有11个人 这就是当前国内做字幕的三大巨头 使用频率比较高的软件 那讲完了软件 我们来讲一下加字幕的设备 那不出意外 使用电脑来加字幕的up主们占据了绝大多数 不过我们也了解到一位很严谨的up主 他就是纯手机的工作流 剪辑做字幕只用B剪 还有剪印这两个软件非常纯粹 万一哪天大家真的需要开庭 我给大家几个不成熟的建议 至少这个建议没有我长得成熟 用电脑做字幕的up主里 有很多是在字幕软件里做好字幕 以SRT格式传到剪辑软件里面来进行微调 这也是常用的一个方案 协同起来也很方便 但是也不乏出现一些奇葩的案例 在我们的调研之中 比如说字幕抠绿 用剪印语音识别字幕 然后再在字幕下面放一层绿幕 然后字幕和绿幕一起导出来 再进剪辑软件把这个字幕给抠出来 再叠到视频轨道上来合成 这个真的挺骚的 这个操作而且不止一位up主 这三位up主不同的领域 都用了这个办法 那根据南门老师介绍 这样操作的优点是快速而且高效 并且不会增加电脑的太多的负荷 所以也算是一个挺神奇的曲线救国的方案 挺有意思的 在调研之中相对更新频率较高的up主 他们选择字幕软件 我们发现是有一定的共通性的 但是具体的软件 我们没法客观的给你推荐 主要是看你的需求 做什么类型还有风格的内容 那同时在调研之中我们也发现 加字幕这个概念本身还是非常笼统的 字幕软件能帮你做的功能有更多 那比如说 语音识别 如果你想做的内容更侧重生活分享 那这方面的up主们 会明显的更多的使用剪影 因为它有优秀的语音识别 在我们这次的问卷里面 超过四分之三的人 都有语音转写字幕的需求 那其中有72位 或多或少的都使用过剪影 来做语音识别文本 而像科技区还有知识区的up主 会更特别一点 他们多数是先写好了文稿 再来做视频的 所以对语音识别的需求 就没有那么高 使用的字幕软件相对会更多元 也会更侧重在时间线打轴 是否精准这一点上面 那我的问题就是 既然这次我们了解到的这些up主们 有着不同的粉丝量 那这些大up主们 他们是否存在一个 真正的行业标准或者独门秘诀 那在我们研究之后发现 其实大up主们也没有很大的差别 只能说有一个相对趋势 但是有一点 可能是在大up主团队 和个人up主中产生区别的一点 就是 超能力 你想 你每次自己做完视频 还要来加字幕 很吃很吃 太累了 对吧 为什么不花钱 找别人来帮你干这个活呢 那找别人做字幕这里面的支出 可以包括语音识别 外语翻译 打桌对轨 设计花字等等等等 只要你氪金 都可以做到 大部分都是安需制作 以我们自己来举例的话 可以给你一些价格参考 那比如说人工语音识别 我们之前有一段时间 用的是讯飞听见的人工精准 是可以氪金的 给他氪了不少钱 把音频转成文字 一条价格是几十块钱 但是我的回答就是 不是很好用 专业的名词经常会弄错 甚至我的名字 也没有见他们答对过几次 所以不如拜托我们 胆大心细的剪辑师 来的方便一点 那再比如我们的片子字幕 可能要翻译成英文 那价格可能就在 五百块钱一条左右 而且还需要找到字幕组 来帮你做这些东西 在我们这次统计中 在字幕上氪金最多的大佬 每年能够用到五位数 但是你也不用被吓到 也就三五个人 会这么财大气粗 大多数up主们 还都是小本经营 自己做字幕 把钱花在更值得的地方 那讲完了做字幕的软件 方式这些 那接下来就要到了 字幕的呈现阶段 这个其实也非常重要 目前主流的字幕 就是内嵌字幕 外挂字幕 还有花字幕 你可以看一下 这是对应的比例 那我自己一直有的一个疑问就是 外挂字幕在海外 真的非常的流行 大部分的剧还有app 都会使用它 为什么在国内大家 却还是喜欢用内嵌字幕 那这次我们统计之中 只做外挂字幕的up主 只有这么几位 还有几位会同时做内嵌 还有外挂这两种 来适配各种的平台 那外挂字幕 我觉得是有很多优点的 比如说可以随时改变错别字 也可以随观众的喜好 自己来开关 不遮挡画面 甚至可以请粉丝来帮你做字幕 可以实现这个一定程度的白嫖 那同时外挂字幕 能够实现多端统一 应对字幕的偏好设置 只要设置一次 可以在手机 电脑 iPad 电视上都同步 这听着很方便对吧 但是问题就是 国内平台的外挂字幕 很多人会默认是关闭的 观众体验就没有那么好 所以现在绝大多数的up主 还是选择了内嵌字幕 但是说内嵌字幕好归好 也有一个很重要的问题 或者说风险 就是字体 这次我们统计了一下 up主们平时用的最多的字体 由54位up主们做出了分享 具体就是这些 其中用到最多的就是 四元黑体 占比人数有1⁴ 当然还有最近很火的 由OMG6蛋老师设计的 德意黑 也在短短的时间内 达到了第4位 这些字体你可以作为一个参考 都是大家挑出来相对方正 并且易读性比较强的 只要你想下载这些字体 找到他们的所有正版下载链接 我们已经帮你收集好了 可以在评论区一次性下载完 也希望你给个三连 谢谢你 当然你也需要注意它的版权问题 是否是免费商用的 我们也帮你归答总结好了 反正千万不要误用 不然这个代价可能会是很大的 OK 现在即便我们把字体已经选好了 字幕的呈现其实也很讲究 有很多门道 在画面里要放多高 要不要有阴影和描边 差之毫厘 这个效果失之千里 而且在我们的统计之中 有40%的up主 其实到目前为止 它都是没有真正固定的版式的 所以观众的观看体验 也会变得非常不稳定 无法对你形成 你熟悉的一个统一印象 那我在这里也分享一下 我们迭代过很多次以后 稳定下来我们当前在用的字幕版式 大概是这样的一个规格 在达芬奇里只要这样设置就可以了 你觉得怎么样 就可能我觉得 就中规中矩 没有什么特别的 不过这也不是什么标准答案 还是有很多up主的字幕 我觉得真的做的很有特色 也很棒 很贴合他们自己频道的风格 那只不过字幕这玩意说实话 我自己不是专家 所以我也没什么资格 但这次我们请到了 德意黑的设计者 OMG许老师 来跟我们讲一讲 他对于字幕的一些理解 也许会对你有些帮助 说起视频中的字幕设计 人们一般想到的 就是平面设计中的那些参数 比如用什么样的字体 字号多大 字间距是多少 要不要加描边 要不要加投影 要不要加底框 相比静态画面唯一特别的是 视频是动态的 要保证字幕的样式适应性足够强 能够在每一帧的画面都清晰可见 这些其实是大家比较熟悉的东西了 我们可以称之为 字幕在空间中的设计 但字幕设计作为一种 特殊形式的排版设计 带来的真正考验 还是在于时间概念 如果想要观众得到 最佳的字幕阅读体验 就一定要根据语速 来调整每一行字幕的断行规则 最常听到的一种说法是 一行字幕最多在13个字左右 太长的话就要断行了 但这只不过是字数上限的大概参考 更需要细心计算的 是字幕持续时间 如果文本太多 持续时间又极短 就会变成这样 当然这只是一种幽默的处理 在正常情况下 如果我们用极快的语速 读出大量文本 就有可能需要在不影响信息的前提下 通过缩减文案来优化字幕 说个题外话 这种调整其实在翻译字幕中最为常见 比如菊地浩斯先生 曾经在采访中说过 日语的标准是一秒不超过四个字 比如在《十一罗汉》中就有这样一段台词 日文直译过来就是这样 但是这样每秒就超过四个字了 所以最后翻译长到这样 这样的调整能让观众在有限的时间里 把文字读完 当然了 这种事有时候也不能用绝对机械的方式来判断 人们在阅读时会有结合上下文的能力 所以有些谚语即便很长 无论囤早地读完 也能够快速理解 如果用专业术语来讲的话 我们会说这段文字的顺时易读性很强 顺时易读性在西文排版中有很多研究 搜索英文关键词 能搜到很多相关的研究文章 尤其是在字体设计的领域 比如我经常提到的Kerning问题 就属于顺时易读性的范畴 Kerning影响的是一个单词内部 每个字母之间的间距 这个信息在字体设计时 就由设计师仔细考量 打包在了字体里面 如果贸然改变Kerning 就可能导致认读困难 所以建议使用支持Kerning的 主流剪辑软件 并且开启Kerning信息 比如在Adobe软件中 将这个选项调整到度量标准即可 相比之下 关于汉字顺时易读性的研究 人们一般都会把问题 聚焦在字体的选择上 人们似乎更认可那些严格遵循 中国汉字标准写法的字体 毕竟这样的字体造型 对我们来说是最为熟悉的 在《得一黑》发布之后 也有很多人将它用于字幕 并且我也听到了很多反对的声音 认为美术字并不该被用于字幕 但对此我有不同的看法 我认为汉字字体的设计更为复杂 无法一言以蔽之 我们需要分析字体的肩架结构 和具体设计 我们知道 日本将我们的汉字 作为一个重要的组成部分 在日本有一款专门的电影字幕字体 New Cinema 如今在众多电影 电视剧 动画 游戏中 都可以看到它 比如游戏《八方旅人》中 就大量使用了这款字体 这款字体在设计之初 就定义了极强的功能性 所以在小小的Switch屏幕上 也可以非常清晰易读 除此之外 这款字体的设计还有一个明确的目的 就是消除字幕的存在感 字幕往往都是浮游在画面之外的东西 但如果我们选择的字幕字体 是一款风格极其匹配的美术字 就可以在一定程度上 消除这种浮游感 说到汉字字体的顺时易读性 就不可避免地要聊到另一款字体 那就是日本道路工团标准文字 这款字体的设计初衷 是在时速100公里的时候 能够在6秒内 读取140米外路牌上的文字信息 这款字体让汉字的笔画 变得更加几何化 甚至简化了很多笔画 这是一款绝对意义上的美术字 甚至很多设计考量 都是和规范字体设计背道而驰的 可以看到有的字看起来忽大忽小 不够统一 但它更多重视的是文字的复空间处理 让人远远地看上一眼 也能辨认出这是哪一个文字 所以我还是前面的观点 汉字的异度性 并不是用它是否采用了规范写法 粗暴地做出判断 在这方面还有很多未知的东西 等待着我们去探索 所以非常感谢六弹老师 能和我们一起来解读字幕背后的门道 优秀的字幕能够帮助观众 快速地补充信息 甚至说有的up主会更进一步 把字幕作为一种和观众来互动的方式 比如我最爱的雀巢你看 这是他整的货 非常让人难忘 诶奇怪 魏亚林呢 操我别人记得放在这儿了 哦在这儿 所以这就是这期视频的全部内容 希望能对你有些帮助 能够加出更好的字幕 如果你喜欢的话 也请务必点赞和评论转发 这会对我非常大的帮助 那么我们 下次见

Something wrong when summarizing.

Error: { "error": { "message": "This model's maximum context length is 4096 tokens. However, your messages resulted in 5240 tokens. Please reduce the length of the messages.", "type": "invalid_request_error", "param": "messages", "code": "context_length_exceeded" } }

github-actions[bot] commented 1 year ago

👋

If you find my services helpful, you can support me by buying me a coffee ☕️ using the following button:

"Buy Me A Coffee"

Thanks for using my services! 🤖❤️