wmjordan / PDFPatcher

PDF补丁丁——PDF工具箱,可以编辑书签、剪裁旋转页面、解除限制、提取或合并文档,探查文档结构,提取图片、转成图片等等
https://pdfpatcher.cnblogs.com/
9.23k stars 1.26k forks source link

【提取图片】软件是否强行输出JPG格式的?勾选了两个PNG相关的选项输出依然是JPG #171

Closed pein0saga closed 1 year ago

pein0saga commented 1 year ago
Snipaste_2023-06-23_08-32-11
wmjordan commented 1 year ago

如果文档里面的图片是JPEG压缩的,输出的图片就会自动采用JPEG压缩。 选项中间的“黑白图片”是指只有黑色和白色两种颜色的图片。你的文档的“黑白图片”可能是带有灰色的灰度图片。这种灰度图片使用JPEG压缩也可能取得比较高的压缩率。 合并选项是针对一些古老的PDF文档设计的,那个时代的PDF制作工具会把一幅图片切成一条条再写入PDF文档,渲染的时候由于一条条图片是紧挨在一起的,所以看起来是一张图片。“合并”功能是把这种紧挨在一起的一条条的图片合并成一张图片。

pein0saga commented 1 year ago

黑白图片

wmjordan commented 1 year ago

PDF里的图片都是不透明的。 如果图片是使用Deflate、LZW等算法压缩的,一般会被导出成PNG格式。

所谓的“透明”图片是通过图像掩膜来实现的。例如下面附件文档中的“ABC”,实际是一幅图片加一个带灰度的掩膜,掩膜的灰度会被视为透明度。

文字文稿1.pdf

在渲染文档的时候,将图片和掩膜通过图层混合来呈现出“透明”的效果。

image

目前还没有自动合成图片+掩膜→透明图片的功能。原理很简单,不难实现,不过要花点时间才行。

pein0saga commented 1 year ago

PDF里的图片都是不透明的。 如果图片是使用Deflate、LZW等算法压缩的,一般会被导出成PNG格式。

所谓的“透明”图片是通过图像掩膜来实现的。例如下面附件文档中的“ABC”,实际是一幅图片加一个带灰度的掩膜,掩膜的灰度会被视为透明度。

文字文稿1.pdf

在渲染文档的时候,将图片和掩膜通过图层混合来呈现出“透明”的效果。

image

目前还没有自动合成图片+掩膜→透明图片的功能。原理很简单,不难实现,不过要花点时间才行。

wmjordan commented 1 year ago

今晚刚做了一个可以合并图片+掩膜成为透明图片的功能。如果你的PDF有透明图,可下载新的测试版测试一下(提取图片前选中“导出图像掩膜”)。