yihong0618 / bilingual_book_maker

Make bilingual epub books Using AI translate
MIT License
6.91k stars 1k forks source link

遇到大量章节不翻译的情况 #384

Closed DawnLi-code closed 4 months ago

DawnLi-code commented 4 months ago

https://wwl.lanzoul.com/b0curf9aj 密码:ftpp

三本书都是德语版合集性质,章节目录比较多和零碎。

Die_dreiKritiken-_Kritik_der_reinen_Vernunft_Kritik_der_praktischen_Vernunft_Kritik_der_Urteilskraft-KantImmanuel.epub 和 Saemtliche_Werke_von_Heinrich_von_Kleist_Illustrierte_von_Kleist,_Heinrich.epub,查看了下文件结构,尝试加上--translate-tags h1,h2,h3,h4,h5,h6,h7,h8,p,div测试了下,有些内容在脚本运行过程中明明翻译了,但是输出的temp.epub文件里却缺失。

截屏2024-02-15 下午2 40 38

Saemtliche_Werke_von_Heinrich_von_Kleist_Illustrierte_von_Kleist,_Heinrich.epub这本中途Ctrl+C会刷几屏这个提示:

截屏2024-02-18 上午10 51 35

Phänomenologie des Geistes-Hegel Georg Wilhelm Friedrich.epub,这本老早遇到过,那时候没经验,加--translate-tags能翻译了,只是一起放上来看看还有什么需要注意的。这本没有加--single_translate参数,翻译完后文件的正文是单语,而介绍和前言部分是双语。

虽然结果都是翻译失败,但也许导致的原因不一,是不是应该分别开issues更科学一点?做的不对请指出。

yihong0618 commented 4 months ago

好的我们看一下,谢谢

DawnLi-code commented 4 months ago

又测试了两本,没跑完(太伤钱和时间了...),运行了一会按Ctrl+C中断,目测脚本运行过程中翻译了的文字,在temp.epub文件里是缺失的。看内容分别在p和h1、h2之类标签,已经加到了--translate-tags参数里。

截屏2024-02-16 下午8 05 54 截屏2024-02-16 下午8 07 31
yihong0618 commented 4 months ago

又测试了两本,没跑完(太伤钱和时间了...),运行了一会按Ctrl+C中断,目测脚本运行过程中翻译了的文字,在temp.epub文件里是缺失的。看内容分别在p和h1、h2之类标签,已经加到了--translate-tags参数里。

截屏2024-02-16 下午8 05 54 截屏2024-02-16 下午8 07 31

我确认下,但可能几天后再看

yihong0618 commented 4 months ago

可能有 bug 建议只翻译 p 标签

DawnLi-code commented 4 months ago

好的,都不着急,反馈下,感谢

DawnLi-code commented 4 months ago

Die_dreiKritiken-_Kritik_der_reinen_Vernunft_Kritik_der_praktischen_Vernunft_Kritik_der_Urteilskraft-KantImmanuel.epub,这本EPUB在编辑状态看了下,发觉可能是文件命名的关系,做EPUB的那位把html文件按英文缩写来标记命名了,类似于我们讲中文的把标题命名为bt.html,目录命名为ml.html这样。所以导致脚本就从书的中部b1_bk01-a.html开始翻译。把文件名批量转换一下,统一按章节顺序命名文件应该就可以正常了。

截屏2024-02-20 下午7 42 23
yihong0618 commented 4 months ago

@DawnLi-code 谢谢分享,我还没来得及看,抱歉。