-
-
[原创]使用文本编辑器去除PDF文字水印
-
发表于:
2018-9-17 11:24
3408
-
我们经常可以看到类似的水印,这种水印让人看着很不爽,我尝试了多种方法去水印,感觉效果都不太好!
然后发现用文本编辑器打开pdf文件,搜索水印字符串,发现水印基本都是单独一行:
也有个别水印占了多行:
当我把括号内的文字删除,并且保存文件后,奇迹发生了!那一页的水印没了。
但是手动删除太麻烦,我们发现这些行都是(***Tj
这样的格式,使用vim编辑器可以很容易的把这样的行都删掉,执行下面的命令,然后保存文件
:g/^(.*Tj$/d
发现文字水印已经消失了:
批量去除文件水印
遍历当前目录下后缀为pdf的文件,替换其中(***Tj
这样的行为空,保存文件。你可以根据自己的需求修改下面的脚本
mkdir release
#/bin/bash
for file in *.pdf;do
sed -i '/^(.*Tj$/d' release/"$file"
done
删除字符串被加密的水印
有一种这样的水印,字符串大概是加密过的,使用上面的方法无法搜索到相关的字符串,你可以先把有水印的一页提取出来。比如233页是空白页,并且有水印,可以用这个命令提取出这一页。
pdftk input.pdf cat 233 output output.pdf
查找WinAnsiEncoding
(中文水印应该不是这个编码),删除其所在的段,比如下图高亮显示字符串所在的197~208行,保存后打开PDF文件,看看水印是否消失,如果没有,再找下一个测试。附件是一个带水印的空白文档,需要删除两个这样的段。
说明
有部分书中其它文字也是用的这种格式,为了防止误删请做好备份工作!
参考
[培训]内核驱动高级班,冲击BAT一流互联网大厂工作,每周日13:00-18:00直播授课
最后于 2018-9-18 17:33
被Explorerl编辑
,原因: