aoout / obsidian-epub-importer

Import EPUB files as Markdown.
MIT License
112 stars 2 forks source link

图片格式选择第三种时部分图片和脚注解析会出错 #34

Closed DanShui-Yu closed 5 months ago

DanShui-Yu commented 8 months ago

错误姿势包括但不限于

image image image image image image

image

aoout commented 8 months ago

太过于鬼畜了。正则表达式真是麻烦。

DanShui-Yu commented 8 months ago

如果选第二种格式好像更多是漏掉

image

aoout commented 8 months ago

fixed in https://github.com/aoout/obsidian-epub-importer/commit/b5338fb9a49671658e9863e420eb3fb0f8d69e7e.

DanShui-Yu commented 8 months ago

好了很多,但还是有😂 image image

丢脚注也是

image image image

aoout commented 8 months ago

图片格式选择的第三个选项吧,第二个现在是正常的。 image

aoout commented 8 months ago

fixed in https://github.com/aoout/obsidian-epub-importer/commit/efbefd1a6def64408519c4b1331edff5e8b20a85.

aoout commented 8 months ago

第三种图片格式现在几乎也没什么用,就先不发新版本了。

DanShui-Yu commented 8 months ago

有道理。但是脚注丢失还是有

image

aoout commented 7 months ago

image 我这边没有这个问题哦。

DanShui-Yu commented 7 months ago

不能这样看,你切换一下视图试试,会发现末尾脚注的序号不一样。阅读视图下它是按实际脚注数量计数的,漏掉的都被直接递补了,我是用了蚕子大大开发的信息列表插件,所以才能一眼看出来中间少了 ZH 信息列表0.9.zip

aoout commented 7 months ago

你看我发的截图,别看序号,看文本。我发的截图里应该是没有漏掉东西的。

DanShui-Yu commented 7 months ago

哦哦哦哦,仔细看过了,东晋史这本是正常了 又试了个新的测试员,脚注仍有跳转问题(epub真是个自由的格式啊) 医学史通识丛书重构秦汉医学图像 (廖育群) .txt

aoout commented 7 months ago

又试了个新的测试员,脚注仍有跳转问题

能添加一些更多的信息吗,我不是很能理解,什么叫做脚注有跳转问题。

aoout commented 6 months ago

@DanShui-Yu 你好,关于这个问题还有什么想要补充的吗?

DanShui-Yu commented 6 months ago

医学史通识丛书重构秦汉医学图像 (廖育群) .txt

这本书现在无法导入了,执行命令没反应

aoout commented 5 months ago

@DanShui-Yu 这个文件名最后是一个空格,把空格删掉就好了

DanShui-Yu commented 5 months ago

哦哦,成功了,但脚注果然还是有问题,都识别成文档链接了

DanShui-Yu commented 5 months ago

表格也有点小毛病

image

我感觉这些非标准格式的内容可能会有很多种类型,想统一适配比较困难,或许可以考虑以额外选项的形式解决?导入的时候就弹窗要求选择该书的脚注样式什么的

aoout commented 5 months ago

哦哦,成功了,但脚注果然还是有问题,都识别成文档链接了

这个不是epub importer识别的,而是本来书里面写的就不是标准的脚注,而是链接啊

aoout commented 5 months ago

也就是 https://github.com/aoout/obsidian-epub-importer/issues/13

aoout commented 5 months ago

表格的问题是说多出几个空行吗

DanShui-Yu commented 5 months ago

表格的问题是说多出几个空行吗

不是,第一行【姓名】【所业之事】应该是表头才对。这本书里的

这个不是epub importer识别的,而是本来书里面写的就不是标准的脚注,而是链接啊

好吧,但理论上来说它应该是脚注,能转化就好了