yann0917 / dedao-dl

得到 APP 课程下载工具,可在终端查看文章内容,可生成 PDF,音频文件,markdown 文稿,可下载电子书。
MIT License
607 stars 121 forks source link

epub电子书生僻字出现乱码 #213

Open aaqq0pp opened 7 months ago

aaqq0pp commented 7 months ago

目前遇到两类生僻字乱码情况。

第一类是在得到app上可以显示,但搜索时,及在web以乱码出现的字。如《剑桥中国晚清史(上)》中的“恭亲王奕䜣(1833—1898年)”一句中“䜣”字为乱码。及“醇亲王奕譞(咸丰帝”一句的“譞”字乱码。

第二类是在得到app和web都为乱码,但在得到app复制后,可以在汉典中搜索出来的字。如《汉字的世界(共两册)》中“巠(𢀖)十一下是纺织物中的经线之形“一句的”𢀖“字。

以上两类生僻字下载epub电子书后都出现乱码,且无法复原。对于一些有大量生僻字的书籍而言,手动修复很麻烦...希望作者能关注一下。即使不能显示该字的字形,至少也应该有unicode码,这样替换也比较方便。