首页
社区
课程
招聘
[已解决] 想要使用程序获得安全客文章的标题 20.00雪花
发表于: 2018-2-22 17:47 2253

[已解决] 想要使用程序获得安全客文章的标题 20.00雪花

2018-2-22 17:47
2253
例如:
链接:https://www.anquanke.com/post/id/98628
我程序得到的标题是“安全客 - 有思想的安全新媒体”
我想要得到的标题是“详解Linux权限提升的攻击与防护”

我用phantomjs写了一个程序,本来以为很轻松就能得到title的,结果报错。不知道哪边出了问题,百度、google无果,也试了其他解法,但都失败,因此特来求助。
code:
var page = require('webpage').create();
page.settings.userAgent = "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/47.0.2526.106 Safari/537.36";

page.onAlert = function (message) {
    console.log(message);
    return true;
};

//url = 'https://bbs.pediy.com/thread-224651.htm'
url = 'https://www.anquanke.com/post/id/98628'

page.open(url, function (status) {
    
    if ( status == "success") {
        var title = page.evaluate(function(){
           return document.title;
        });
        
        console.log(title);
    }
});


[注意]传递专业知识、拓宽行业人脉——看雪讲师团队等你加入!

收藏
免费 0
支持
分享
最新回复 (5)
雪    币: 65
活跃值: (545)
能力值: ( LV4,RANK:50 )
在线值:
发帖
回帖
粉丝
2
不限于哪种方法,能够根据url得到title就行,如果能够分析里面的内容更好。要求不直接使用firefox、chrome等浏览器,因为云服务器上没有图形化界面,怕跑不起来。
2018-2-22 17:53
0
雪    币: 783
活跃值: (1121)
能力值: ( LV5,RANK:78 )
在线值:
发帖
回帖
粉丝
3
var url = 'https://bbs.pediy.com/thread-224651.htm';
var page = require('webpage').create();
page.open(url, function(status) {
  var title = page.evaluate(function() {
    return document.title;
  });
  console.log('Page title is ' + title);
  phantom.exit();
});
官方不是有文档么..这样写不对么?
var url = 'https://bbs.pediy.com/thread-224651.htm';
var page = require('webpage').create();
page.onConsoleMessage = function (msg) {
    console.log(msg);
};
page.open(url, function (status) {
    page.evaluate(function () {
        console.log(document.title);
    });
    phantom.exit();
});

官方给的两种写法..虽然本人看不出来说明差别 - -
最后于 2018-2-22 20:11 被bambooqj编辑 ,原因:
2018-2-22 20:07
0
雪    币: 18
活跃值: (25)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
4
可以  get  这个得到一个  json  对象解析之后得到标题  https://api.anquanke.com/data/v1/post?id=98628
这个网站是加载后前端获取数据构成页面的
2018-2-22 20:43
0
雪    币: 285
活跃值: (1095)
能力值: ( LV13,RANK:405 )
在线值:
发帖
回帖
粉丝
5
如楼上所说,class="article-title"的div为想要的字段,匹配这个字段也是可以的。
2018-2-22 23:03
0
雪    币: 65
活跃值: (545)
能力值: ( LV4,RANK:50 )
在线值:
发帖
回帖
粉丝
6
OxCL 可以 get 这个得到一个 json 对象解析之后得到标题 https://api.anquanke.com/data/v1/post?id=98628 这个网站是加载后前端获取数据构成页面的
正解。之前抓包的时候没在意,随便点了几个链接,居然漏掉了这个。
2018-2-23 11:26
0
游客
登录 | 注册 方可回帖
返回
//