首页
社区
课程
招聘
[原创]使用文本编辑器去除PDF文字水印
发表于: 2018-9-17 11:24 3408

[原创]使用文本编辑器去除PDF文字水印

2018-9-17 11:24
3408

图片描述

 

我们经常可以看到类似的水印,这种水印让人看着很不爽,我尝试了多种方法去水印,感觉效果都不太好!

 

然后发现用文本编辑器打开pdf文件,搜索水印字符串,发现水印基本都是单独一行:

 

图片描述

 

也有个别水印占了多行:
图片描述

 

当我把括号内的文字删除,并且保存文件后,奇迹发生了!那一页的水印没了。

 

但是手动删除太麻烦,我们发现这些行都是(***Tj这样的格式,使用vim编辑器可以很容易的把这样的行都删掉,执行下面的命令,然后保存文件

:g/^(.*Tj$/d

发现文字水印已经消失了:

 

图片描述


批量去除文件水印

遍历当前目录下后缀为pdf的文件,替换其中(***Tj这样的行为空,保存文件。你可以根据自己的需求修改下面的脚本

mkdir release

#/bin/bash
for file in *.pdf;do
    sed  -i  '/^(.*Tj$/d' release/"$file"
done

删除字符串被加密的水印

有一种这样的水印,字符串大概是加密过的,使用上面的方法无法搜索到相关的字符串,你可以先把有水印的一页提取出来。比如233页是空白页,并且有水印,可以用这个命令提取出这一页。

pdftk input.pdf cat 233 output output.pdf

查找WinAnsiEncoding(中文水印应该不是这个编码),删除其所在的段,比如下图高亮显示字符串所在的197~208行,保存后打开PDF文件,看看水印是否消失,如果没有,再找下一个测试。附件是一个带水印的空白文档,需要删除两个这样的段。

 

图片描述

说明

有部分书中其它文字也是用的这种格式,为了防止误删请做好备份工作!
图片描述

参考


[培训]内核驱动高级班,冲击BAT一流互联网大厂工作,每周日13:00-18:00直播授课

最后于 2018-9-18 17:33 被Explorerl编辑 ,原因:
上传的附件:
收藏
免费 0
支持
分享
最新回复 (2)
雪    币: 1460
活跃值: (359)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
2
中文水印查找不到。
2018-9-17 16:35
0
雪    币: 6682
活跃值: (1156)
能力值: ( LV5,RANK:158 )
在线值:
发帖
回帖
粉丝
3
hlowkey 中文水印查找不到。
是文字水印吗?可以把你的文件分享出来,我看看
2018-9-17 17:39
0
游客
登录 | 注册 方可回帖
返回
//