wmjordan / PDFPatcher

PDF补丁丁——PDF工具箱,可以编辑书签、剪裁旋转页面、解除限制、提取或合并文档,探查文档结构,提取图片、转成图片等等
https://pdfpatcher.cnblogs.com/
9.05k stars 1.24k forks source link

程序在未选中“允许导出隐藏图片”时导出了裁剪框以外的图片 #217

Closed Charltsing closed 1 week ago

Charltsing commented 2 months ago

看不见的图.zip

用PDFPatcher会导出三个图片,有两个是图片扫描王的logo。没有勾选允许导出隐藏图片。 用其它pdf工具打开看不到这两个图片,Acrobat也看不到

怎么识别这两个多余的图片呢?

1

wmjordan commented 2 months ago

是程序的缺陷。页面的裁剪框已经排除了这两张图片,不应导出。如果将裁剪框拉大,就会发现这两张图处于正文图片右下角。 image

Charltsing commented 2 months ago

文档结构探查器能看到图片的位置信息吗?

wmjordan commented 2 months ago

能看到。在输出对象指令(Do)前会有个矩阵(cm)指令,其参数最后的两个值,一般就是偏移位置。

Charltsing commented 2 months ago

能看到。在输出对象指令(Do)前会有个矩阵(cm)指令,其参数最后的两个值,一般就是偏移位置。

33

ITextSharp的GetContentBytesForPage读出来的contentbytes有没有什么现成的方法可以解析成不同图像的指令字符串呢? 或者说如何删除这两个绘图状态指令?我现在只能用字符串替换的方法来查找和删指令。

wmjordan commented 1 month ago

暂时没有办法。