liuli-moe / to-the-stars

魔法少女小圆 飞向星空 中文翻译
http://tts.liuli.moe/
51 stars 16 forks source link

文章格式校正计划 #4

Closed rxliuli closed 1 year ago

rxliuli commented 2 years ago

目前除第一章和番外之外,所有粗体斜体格式均未正确保留,所以需要重新校对,将从以下几个来源进行校对

  1. 百合会论坛:https://bbs.yamibo.com/forum.php?mod=viewthread&tid=206113&extra=&authorid=61676,主要来源,在第三卷 54 章之前应该主要参考这里
  2. bilibili:https://www.bilibili.com/read/cv692285,第三卷 54 章之后需要参考这里

如果有人愿意帮忙一起处理,请在该 issue 下面回复,吾辈将会在对应章节后 @用户名 以避免重复处理。请使用 github diff 对比并保留之前的错误修复,避免修复了格式却让之前的错误重现,尤其是和谐的部分请留意修正。在所有章节完成校正之后将发布新的 epub,在此之前,所有格式的修复仅发布至线上网站。

如果你是从网页转换的,则下面有一些校正指南可以参考

第一卷

第二卷

第三卷

rxliuli commented 2 years ago

一些发现待确认的问题

andylizi commented 2 years ago

那么第一作者为什么会使用粗体呢?

一个是B站不支持斜体……百合会不清楚,应该支持吧?

更重要的原因我觉得是,中文排版确实不适合使用斜体。英文单词 之间有空格分隔,再加上符号相对简单,因此看起来不会奇怪。但中文的话就感觉有点怪怪的,并且突出效果没那么明显。

rxliuli commented 2 years ago

那么第一作者为什么会使用粗体呢?

一个是 B 站不支持斜体…… 百合会不清楚,应该支持吧?

更重要的原因我觉得是,中文排版确实不适合使用斜体。英文单词 之间有空格分隔,再加上符号相对简单,因此看起来不会奇怪。但中文的话就感觉有点怪怪的,并且突出效果没那么明显。

确实是这样,那就暂且如此吧

rxliuli commented 2 years ago

这部分格式我参照的是AO3的版本,因为个人更喜欢这一版排版。

这样看的话两者似乎都可以,但目前其他章节以及中文翻译(两位作者的)都没有这个格式,所以还是统一一下吧

另外“X卷完”的卷尾语也是作者自己写的呀,就这样删掉吗TAT

抱歉,这是错误,需要撤回

ArgusK17 commented 2 years ago

关于斜体/粗体格式最后有定论了吗?我看chp 11~16更新的是粗体,但是chp 1 依旧是斜体(包括我自己更新的两章采用的也是斜体)

rxliuli commented 2 years ago

关于斜体/粗体格式最后有定论了吗?我看chp 11~16更新的是粗体,但是chp 1 依旧是斜体(包括我自己更新的两章采用的也是斜体)

吾辈倾向于保持粗体,虽然斜体可以有另一种区分,但校正速度要慢的多(因为现有的翻译都是粗体,需要将念话、脑内通讯以及思想部分转换为斜体),而且如 @andylizi 所言,中文斜体的突出效果并不明显

ArgusK17 commented 2 years ago
  • 如果一段加粗的文本以标点符号结尾并且后面有中文,则需要在后面加一个空格,例如 **真没想到我这么快就要死了,**她有些自暴自弃地想着。 => **真没想到我这么快就要死了,** 她有些自暴自弃地想着。

这样做的原因是什么呢?如果是斜体还可以理解为保持恰当间距,但是对粗体这样做似乎并没有改善观感,反而会显得间隔过大。

andylizi commented 2 years ago

这其实是个技术问题……很多 markdown 渲染器是针对西语环境设计的,即两个单词之间一定有空格或者(西文)标点符号。因此它故意设计成只有前/后带空格或西文标点的*_等才会被识别处理。这样做的目的是避免一些 false positive,例如 3*2=6 里面的*被识别成样式,而且设计者想着反正你也不会需要加粗单词的某一部分(like this)嘛。但是这显然就对不用空格的 CJK 语言十分不友好。加空格只是曲线救国的手段。

其实如果能够选择自己 markdown 被渲染的环境并且不用考虑兼容性的话,比如说自建站点或者用一个已知不要求空格的站点,那么不加空格也没问题,而且正如你所说能改善观感。只可惜很多时候我们没法选……

rxliuli commented 2 years ago

这其实是个技术问题……很多 markdown 渲染器是针对西语环境设计的,即两个单词之间一定有空格或者(西文)标点符号。因此它故意设计成只有前/后带空格或西文标点的*_等才会被识别处理。这样做的目的是避免一些 false positive,例如 3*2=6 里面的*被识别成样式,而且设计者想着反正你也不会需要加粗单词的某一部分(like this)嘛。但是这显然就对不用空格的 CJK 语言十分不友好。加空格只是曲线救国的手段。

其实如果能够选择自己 markdown 被渲染的环境并且不用考虑兼容性的话,比如说自建站点或者用一个已知不要求空格的站点,那么不加空格也没问题,而且正如你所说能改善观感。只可惜很多时候我们没法选……

是的,这个问题吾辈也曾考察过,遗憾的是,markdown 的标准如此,已知只有 marked 能正确处理这种情况,甚至 github/vscode 都不行,这确实很烦人,但目前没有太好的解决方案

ref https://github.com/markdown-it/markdown-it/issues/880

pass:只修改网站是可能的,但修改生成 epub 的工具对于吾辈而言很难,因为它使用 haskell 编写。至于推动一项标准,这非常非常难,而且往往要以年为单位才能见效。

rxliuli commented 2 years ago

某种变通的方法是将 **真没想到我这么快就要死了,**她有些自暴自弃地想着。 替换为 **真没想到我这么快就要死了**,她有些自暴自弃地想着。。但这并不总是可行的,例如以 ?或 !结尾的

rxliuli commented 2 years ago

第二卷已处理,第三卷几乎相当于前两卷之和,晚点吾辈再处理了

rxliuli commented 2 years ago

目前,粗体后面的空格已经通过 markdown-it 插件清除,目前源 markdown 文档仍然必须添加额外的空格,但在渲染成网页时会被自动清理,参考:https://github.com/markdown-it/markdown-it/issues/880#issuecomment-1188616512。渲染 epub 目前还没有太好的方法,但预期会通过类似 epub-gen 的工具来处理以便插件自定义的渲染逻辑。

image

rxliuli commented 2 years ago

第三卷已处理一半左右。。。

rxliuli commented 2 years ago

格式已全部校验完成,ref: https://github.com/liuli-moe/to-the-stars/releases/tag/1.2.0

rxliuli commented 2 years ago

渲染 epub 目前还没有太好的方法,但预期会通过类似 epub-gen 的工具来处理以便插件自定义的渲染逻辑。

基本的 epub 生成工具已实现,稍晚一点我将实用并生成新的 epub,以解决上面提到的多余空格的问题

rxliuli commented 2 years ago

已修正,ref: https://github.com/liuli-moe/to-the-stars/releases/tag/1.4.0

ArgusK17 commented 1 year ago

重开问题是因为找到了斜体的恰当处理方式。 参照一些实体书以及知乎回答,这方面比较好的做法似乎是用楷体/仿宋字体来替换原文中的斜体,对长句子和几个字的词汇效果都还不错,可以考虑对过去章节进行这方面的修改。目前简单比较似乎楷体效果不错。 效果图 知乎链接

不过github在这方面似乎支持的不是很好(?),可能需要单独处理一下,之后发布的章节或许也都要经过类似的处理。

ArgusK17 commented 1 year ago

另外Andylizi指出一些密级标记的〈〉或许因为百合会的限制因此被改为了【】,个人也感觉〈〉更为美观一些。 可以考虑与上面的问题同步修改,不过上一个问题优先级更高。

rxliuli commented 1 year ago

重开问题是因为找到了斜体的恰当处理方式。 参照一些实体书以及知乎回答,这方面比较好的做法似乎是用楷体/仿宋字体来替换原文中的斜体,对长句子和几个字的词汇效果都还不错,可以考虑对过去章节进行这方面的修改。目前简单比较似乎楷体效果不错。

吾辈不太确定这是否是标准做法,修改 html render 可以做到这一点,但这在网页版可能会有些困难,因为中文字体一般都比较大

另外Andylizi指出一些密级标记的〈〉或许因为百合会的限制因此被改为了【】,个人也感觉〈〉更为美观一些。

这个处理起来相对简单很多,因为可以使用程序自动化处理,话虽如此,如果是一些的话,也需要逐个检查和替换就是了

andylizi commented 1 year ago

吾辈不太确定这是否是标准做法

确实很多这么做的。例如说 HPMOR 这部同人的粉丝翻译

点击展开 ![](https://user-images.githubusercontent.com/12008103/188321822-5882da26-223a-40fd-88f7-f16cf7850a9c.png) ![](https://user-images.githubusercontent.com/12008103/188321820-2bf04737-0322-44c0-a268-42e664dc579a.png)

修改 html render 可以做到这一点,但这在网页版可能会有些困难,因为中文字体一般都比较大

比较大指的应该是 web font?确实 CJK 字体由于体积缘故是完全不适合像西文那样在线加载的,因此“华文楷体”这种不可能。但是宋体楷体这种本地字体还是足够普及的。

例如:

c1

rxliuli commented 1 year ago

吾辈看了一下,网页版似乎并没有这个效果,或许是吾辈访问的路径不对?ref: https://hpmor.xyz/hpmor_chp2/

比较大指的应该是 web font?确实 CJK 字体由于体积缘故是完全不适合像西文一样在线加载的,因此像 “华文楷体” 这种不可能。但是像宋体楷体这种还是足够普及的。

怎么说呢,它们其实不太够,例如移动端就会炸掉,web 端中文字体是件复杂的事情,参考:https://github.com/zenozeng/fonts.css。不过 epub 中确实可以使用,因为可以将字体一起 bundle 进去,这并不会有太多问题

rxliuli commented 1 year ago

另外 Andylizi 指出一些密级标记的〈〉或许因为百合会的限制因此被改为了【】,个人也感觉〈〉更为美观一些。

更新:吾辈检查了一下,仅有 20 个文件的 97 处需要处理,这似乎很简单

image

rxliuli commented 1 year ago

另外 Andylizi 指出一些密级标记的〈〉或许因为百合会的限制因此被改为了【】,个人也感觉〈〉更为美观一些。

更新:吾辈检查了一下,仅有 20 个文件的 97 处需要处理,这似乎很简单

image

已完成

andylizi commented 1 year ago

怎么说呢,它们其实不太够,例如移动端就会炸掉

啊对……我没考虑移动端……

这确实就比较麻烦。想来想去,估计只能用 font-spiderfontmin 这种提取子集的方案了。但搞这么复杂我不知道是否值得……

rxliuli commented 1 year ago

感觉比较复杂,所以暂时关闭这个 issue