由于有时在抄别人的实验报告会带上水印,所以做了个pdf水印去除的工具,所有类型pdf都可用。
pip install opencv-python
pip install fitz
pip install fpdf
pip install flask
还有一些常见的PIL、numpy等等,具体见app.py
安装所需的库之后,运行app.py,会给出网址(运行在本地),点击进入即可。
在网站中上传pdf文件,点击去除水印,下载去除后的pdf文件
将pdf转为多张图片,用cv方法去除每张图片水印,再转回pdf
可以自行设置转换图片的分辨率,默认为300DPI,分辨率越高,去除水印后下载的pdf文件和上传的源文件之间的清晰度差距越小(失真越小)。
如果不是一页密密麻麻很多小字的pdf,不需要很高DPI即可保证处理后的pdf文件与原文件清晰度一致,300DPI完全够用。
处理pdf文件时间=0.8s * 文件页数(有时间加个进度条)
基本只针对灰色(暗色)水印
pdf转换的图片默认设置300DPI,基本满足需求,可能有部分pdf去除水印后会清晰度损失。计划之后再提供自行设置分辨率功能。
运行UI1.html(如Open In Browser),即可在网站中去除图片水印、对比处理前后图像、下载处理后图像