StuHude / PDF-Watermark-Removal

PDF文件/图像 去除水印
MIT License
32 stars 9 forks source link

PDF-Watermark-Removal

由于有时在抄别人的实验报告会带上水印,所以做了个pdf水印去除的工具,所有类型pdf都可用。

需要的库:

pip install opencv-python

pip install fitz

pip install fpdf

pip install flask

还有一些常见的PIL、numpy等等,具体见app.py

如何运行:

安装所需的库之后,运行app.py,会给出网址(运行在本地),点击进入即可。

在网站中上传pdf文件,点击去除水印,下载去除后的pdf文件

原理:

将pdf转为多张图片,用cv方法去除每张图片水印,再转回pdf

可以自行设置转换图片的分辨率,默认为300DPI,分辨率越高,去除水印后下载的pdf文件和上传的源文件之间的清晰度差距越小(失真越小)。

如果不是一页密密麻麻很多小字的pdf,不需要很高DPI即可保证处理后的pdf文件与原文件清晰度一致,300DPI完全够用。

注意:

处理pdf文件时间=0.8s * 文件页数(有时间加个进度条)

基本只针对灰色(暗色)水印

pdf转换的图片默认设置300DPI,基本满足需求,可能有部分pdf去除水印后会清晰度损失。计划之后再提供自行设置分辨率功能。

另:单图像去除水印

运行UI1.html(如Open In Browser),即可在网站中去除图片水印、对比处理前后图像、下载处理后图像

图像去除水印网页↓↓↓

PS_%ROHKWH$CSV4X1_Z6QRY