[招聘]北京知道创宇信息技术有限公司-招聘专区-看雪-安全社区|安全招聘|kanxue.com

[招聘]北京知道创宇信息技术有限公司

发表于: 2012-3-2 13:05 30915

[招聘]北京知道创宇信息技术有限公司

白河愁

2012-3-2 13:05

30915

公司名称：	北京知道创宇信息技术有限公司
职位名称：	开发研究
招聘人数：	-
工作地点：	北京、成都
薪水待遇：*	7-15万/年
职位描述：	基本要求：会翻墙查资料 2年以上工作经验，10000行以上编程实践经验（Windows程序不算、HTML/CSS代码不算，实习要求5000行以上编程经验）。工作岗位： (1) Linux极客：能熟练使用Linux、会Shell编程、会使用Vim，能熟练使用C/C++/Python/Java/Perl中任何一门。 (2) WEB开发极客：能熟练使用Linux、会Shell编程、会使用Vim，能熟练使用JavaScript，手写HTML/CSS；能熟练使用PHP/JSP/Python中任何一门；熟悉jQuery,node.js,MongoDB者优先； (3) 安全攻城师：熟悉SQL注入、跨站脚本、最新CMS系统安全漏洞，熟练使用常用渗透测试工具，熟悉防火墙配置，有实际渗透测试经验；除JavaScript极客外，其他岗位都需要在提交简历时附带下面题目的答案：使用python编写一个网站爬虫程序，支持参数如下： spider.py -u url -d deep -f logfile -l loglevel(1-5) --testself -thread number --dbfile filepath --key=”HTML5” 参数说明： -u 指定爬虫开始地址 -d 指定爬虫深度 --thread 指定线程池大小，多线程爬取页面，可选参数，默认10 --dbfile 存放结果数据到指定的数据库（sqlite）文件中 --key 页面内的关键词，获取满足该关键词的网页，可选参数，默认为所有页面 -l 日志记录文件记录详细程度，数字越大记录越详细，可选参数，默认spider.log --testself 程序自测，可选参数功能描述： 1、指定网站爬取指定深度的页面，将包含指定关键词的页面内容存放到sqlite3数据库文件中 2、程序每隔10秒在屏幕上打印进度信息 3、支持线程池机制，并发爬取网页 4、代码需要详尽的注释，自己需要深刻理解该程序所涉及到的各类知识点 5、需要自己实现线程池提示1：使用re urllib/urllib2 beautifulsoaup/lxm2 threading optparse Queue sqlite3 logger testdoc等模块提示2：注意是“线程池”而不仅仅是多线程提示3：爬去sina.com.cn两级深度要能正常结束建议程序可分阶段，逐步完成编写，例如：版本1:Spider1.py -u url -d deep 版本2：Spider3.py -u url -d deep -f logfile -l loglevel(1-5) --testself 版本3：Spider3.py -u url -d deep -f logfile -l loglevel(1-5) --testself -thread number 版本4：剩下所有功能
联系人：	yang [at] scanv.com
联系电话：
电子邮箱：
QQ/MSN：
公司网址：	http://
公司介绍：	关于知道创宇：知道创宇成立于2007年8月，是国内最早专注于提供Web安全解决方案的自主创新型企业之一。总部设在中国北京，在香港设有分公司，在上海、成都设有分支机构，客户及合作伙伴涵盖中国、美国、日本、韩国。作为美国微软在中国唯一的安全服务提供商，我们追求卓越的WEB安全技术，致力于为网站提供安全产品、SaaS服务，让网站更安全，为中国互联网的信息安全贡献我们的一份力量。

其它信息：

我们深信优秀的工程师才是我们成长的源动力，我们渴求真正热爱编程，有强烈进取心、强烈好奇心、超强动手能力的牛人。我们鼓励创新；鼓励使用Linux；鼓励开源精神；我们提倡敏捷；实践敏捷。

我们虽然只能为你提供7-15万的年收入，但我们能为你提供一个追求技术与梦想的乐园，这里没有任何官僚气息，这里有弹性工作时间；浓厚的技术氛围；双显示器办公；随时报销计算机图书购买费用；每天的水果与酸奶；业余爱好组（如游戏休闲/人工智能）等等。

办公地点：北京 / 成都

基本要求：

会翻墙查资料

2年以上工作经验，10000行以上编程实践经验（Windows程序不算、HTML/CSS代码不算，实习要求5000行以上编程经验）。

工作岗位：

(1) Linux极客：

能熟练使用Linux、会Shell编程、会使用Vim，能熟练使用C/C++/Python/Java/Perl中任何一门。

(2) WEB开发极客：

能熟练使用Linux、会Shell编程、会使用Vim，能熟练使用JavaScript，手写HTML/CSS；能熟练使用PHP/JSP/Python中任何一门；

熟悉jQuery,node.js,MongoDB者优先；

(3) 安全攻城师：

熟悉SQL注入、跨站脚本、最新CMS系统安全漏洞，熟练使用常用渗透测试工具，熟悉防火墙配置，有实际渗透测试经验；

除JavaScript极客外，其他岗位都需要在提交简历时附带下面题目的答案：

使用python编写一个网站爬虫程序，支持参数如下：

spider.py -u url -d deep -f logfile -l loglevel(1-5) --testself -thread number --dbfile filepath --key=”HTML5”

参数说明：

-u 指定爬虫开始地址

-d 指定爬虫深度

--thread 指定线程池大小，多线程爬取页面，可选参数，默认10

--dbfile 存放结果数据到指定的数据库（sqlite）文件中

--key 页面内的关键词，获取满足该关键词的网页，可选参数，默认为所有页面

-l 日志记录文件记录详细程度，数字越大记录越详细，可选参数，默认spider.log

--testself 程序自测，可选参数

功能描述：

1、指定网站爬取指定深度的页面，将包含指定关键词的页面内容存放到sqlite3数据库文件中

2、程序每隔10秒在屏幕上打印进度信息

3、支持线程池机制，并发爬取网页

4、代码需要详尽的注释，自己需要深刻理解该程序所涉及到的各类知识点

5、需要自己实现线程池

提示1：使用re urllib/urllib2 beautifulsoaup/lxm2 threading optparse Queue sqlite3 logger testdoc等模块

提示2：注意是“线程池”而不仅仅是多线程

提示3：爬去sina.com.cn两级深度要能正常结束

建议程序可分阶段，逐步完成编写，例如：

版本1:Spider1.py -u url -d deep

版本2：Spider3.py -u url -d deep -f logfile -l loglevel(1-5) --testself

版本3：Spider3.py -u url -d deep -f logfile -l loglevel(1-5) --testself -thread number

版本4：剩下所有功能

以上题目事实上也是知道创宇技术岗位内部题目，入职第一周会再次考本题目，完不成将面临淘汰。你可以通过看书、上网查资料、请教高人等任何方法完成，时间不限。

如果你对我们职位感兴趣，如果你想挑战自我，如果你想加入新一代的互联网安全企业，和我们一起拼搏，可以将自己的简历、最近的一张生活照、上述题目答案一并发到： yang [at] scanv.com

期待你的来信。

[注意]传递专业知识、拓宽行业人脉——看雪讲师团队等你加入！

收藏・3

免费・0

支持

最新回复 (17)
CamelLu 雪币： 391 活跃值： (135) 能力值： ( LV2，RANK：140 ) 在线值：发帖 26 回帖 220 粉丝 0 关注私信	CamelLu 3 2 楼随时报销计算机图书购买费用这一点个人非常喜欢 2012-3-2 13:45 0
elianmeng 雪币： 967 活跃值： (1138) 能力值： ( LV6，RANK：90 ) 在线值：发帖 68 回帖 707 粉丝 4 关注私信	elianmeng 1 3 楼只要是公司都具备 2012-3-2 16:50 0
butian 雪币： 122 活跃值： (16) 能力值： ( LV2，RANK：10 ) 在线值：发帖 0 回帖 168 粉丝 0 关注私信	butian 4 楼计算机的书着实太贵了！ 2012-3-2 17:18 0
wwwzhigang 雪币： 274 活跃值： (40) 能力值： ( LV2，RANK：10 ) 在线值：发帖 0 回帖 202 粉丝 1 关注私信	wwwzhigang 5 楼飘过，帮顶，呵呵~~ 2012-3-5 09:04 0
XiaosanAiq 雪币： 296 活跃值： (15) 能力值： ( LV2，RANK：10 ) 在线值：发帖 10 回帖 180 粉丝 0 关注私信	XiaosanAiq 6 楼确实飘过。。 2012-3-5 15:28 0
accessd 雪币： 1115 活跃值： (122) 能力值： ( LV7，RANK：100 ) 在线值：发帖 21 回帖 311 粉丝 3 关注私信	accessd 2 7 楼这文采和宣传说的人蠢蠢欲动，可惜对那个题目一窍不通 2012-3-5 20:08 0
kanxue 雪币： 47147 活跃值： (20460) 能力值： (RANK：350 ) 在线值：发帖 2375 回帖 17045 粉丝 541 关注私信	kanxue 8 8 楼据说公司氛围很不错，借得关注。 2012-3-5 20:27 0
davidfoxhu 雪币： 2559 活跃值： (176) 能力值： ( LV5，RANK：60 ) 在线值：发帖 5 回帖 175 粉丝 0 关注私信	davidfoxhu 1 9 楼 py编程不喜欢,算了 2012-3-6 13:53 0
OnlyLoveMM 雪币： 51 活跃值： (10) 能力值： ( LV2，RANK：10 ) 在线值：发帖 2 回帖 73 粉丝 0 关注私信	OnlyLoveMM 10 楼你都不懂，我更不懂了。 2012-3-9 09:36 0
hacknet 雪币： 80 活跃值： (45) 能力值： ( LV3，RANK：20 ) 在线值：发帖 5 回帖 49 粉丝 1 关注私信	hacknet 11 楼 04年注册的，这是第一帖，我只能说，你潜得很深啊。哈哈 2012-3-9 16:28 0
ZhWeir 雪币： 488 活跃值： (185) 能力值： ( LV9，RANK：260 ) 在线值：发帖 11 回帖 77 粉丝 4 关注私信	ZhWeir 6 12 楼我想回成都。不过对python不懂，俺是做移动互联网终端滴，呵呵 2012-3-9 16:58 0
宇宙浪人雪币： 207 活跃值： (10) 能力值： ( LV2，RANK：10 ) 在线值：发帖 1 回帖 38 粉丝 0 关注私信	宇宙浪人 13 楼可望而不可及啊 2012-3-10 14:40 0
lasvegas 雪币： 230 活跃值： (10) 能力值： ( LV3，RANK：20 ) 在线值：发帖 3 回帖 81 粉丝 0 关注私信	lasvegas 14 楼害的我回去又看了注册时间。 2012-3-11 21:06 0
黑骑士boy 雪币： 3 活跃值： (10) 能力值： ( LV2，RANK：10 ) 在线值：发帖 0 回帖 42 粉丝 1 关注私信	黑骑士boy 15 楼极客？？？？？？？？ 2012-3-12 14:28 0
仙果雪币： 1491 活跃值： (985) 能力值： (RANK：860 ) 在线值：发帖 68 回帖 1507 粉丝 67 关注私信	仙果 19 16 楼说的真好。想去参观参观了 2012-3-17 22:17 0
lcgkm 雪币： 238 活跃值： (10) 能力值： ( LV2，RANK：10 ) 在线值：发帖 1 回帖 27 粉丝 0 关注私信	lcgkm 17 楼文采不错，web安全是个好方向 2012-4-21 18:59 0
windowsa 雪币： 183 活跃值： (55) 能力值： ( LV3，RANK：20 ) 在线值：发帖 11 回帖 305 粉丝 0 关注私信	windowsa 18 楼搞网络慢爬...很可怕啊.... 2012-4-21 19:06 0
	游客登录 \| 注册方可回帖回帖表情雪币赚取及消费高级回复

白河愁

发帖

回帖

RANK

关注

私信

他的文章

关于我们

联系我们

企业服务

看雪公众号

最新回复 (17)
CamelLu 雪币： 391 活跃值： (135) 能力值： ( LV2，RANK：140 ) 在线值：发帖 26 回帖 220 粉丝 0 关注私信	CamelLu 3 2 楼随时报销计算机图书购买费用这一点个人非常喜欢 2012-3-2 13:45 0
elianmeng 雪币： 967 活跃值： (1138) 能力值： ( LV6，RANK：90 ) 在线值：发帖 68 回帖 707 粉丝 4 关注私信	elianmeng 1 3 楼只要是公司都具备 2012-3-2 16:50 0
butian 雪币： 122 活跃值： (16) 能力值： ( LV2，RANK：10 ) 在线值：发帖 0 回帖 168 粉丝 0 关注私信	butian 4 楼计算机的书着实太贵了！ 2012-3-2 17:18 0
wwwzhigang 雪币： 274 活跃值： (40) 能力值： ( LV2，RANK：10 ) 在线值：发帖 0 回帖 202 粉丝 1 关注私信	wwwzhigang 5 楼飘过，帮顶，呵呵~~ 2012-3-5 09:04 0
XiaosanAiq 雪币： 296 活跃值： (15) 能力值： ( LV2，RANK：10 ) 在线值：发帖 10 回帖 180 粉丝 0 关注私信	XiaosanAiq 6 楼确实飘过。。 2012-3-5 15:28 0
accessd 雪币： 1115 活跃值： (122) 能力值： ( LV7，RANK：100 ) 在线值：发帖 21 回帖 311 粉丝 3 关注私信	accessd 2 7 楼这文采和宣传说的人蠢蠢欲动，可惜对那个题目一窍不通 2012-3-5 20:08 0
kanxue 雪币： 47147 活跃值： (20460) 能力值： (RANK：350 ) 在线值：发帖 2375 回帖 17045 粉丝 541 关注私信	kanxue 8 8 楼据说公司氛围很不错，借得关注。 2012-3-5 20:27 0
davidfoxhu 雪币： 2559 活跃值： (176) 能力值： ( LV5，RANK：60 ) 在线值：发帖 5 回帖 175 粉丝 0 关注私信	davidfoxhu 1 9 楼 py编程不喜欢,算了 2012-3-6 13:53 0
OnlyLoveMM 雪币： 51 活跃值： (10) 能力值： ( LV2，RANK：10 ) 在线值：发帖 2 回帖 73 粉丝 0 关注私信	OnlyLoveMM 10 楼你都不懂，我更不懂了。 2012-3-9 09:36 0
hacknet 雪币： 80 活跃值： (45) 能力值： ( LV3，RANK：20 ) 在线值：发帖 5 回帖 49 粉丝 1 关注私信	hacknet 11 楼 04年注册的，这是第一帖，我只能说，你潜得很深啊。哈哈 2012-3-9 16:28 0
ZhWeir 雪币： 488 活跃值： (185) 能力值： ( LV9，RANK：260 ) 在线值：发帖 11 回帖 77 粉丝 4 关注私信	ZhWeir 6 12 楼我想回成都。不过对python不懂，俺是做移动互联网终端滴，呵呵 2012-3-9 16:58 0
宇宙浪人雪币： 207 活跃值： (10) 能力值： ( LV2，RANK：10 ) 在线值：发帖 1 回帖 38 粉丝 0 关注私信	宇宙浪人 13 楼可望而不可及啊 2012-3-10 14:40 0
lasvegas 雪币： 230 活跃值： (10) 能力值： ( LV3，RANK：20 ) 在线值：发帖 3 回帖 81 粉丝 0 关注私信	lasvegas 14 楼害的我回去又看了注册时间。 2012-3-11 21:06 0
黑骑士boy 雪币： 3 活跃值： (10) 能力值： ( LV2，RANK：10 ) 在线值：发帖 0 回帖 42 粉丝 1 关注私信	黑骑士boy 15 楼极客？？？？？？？？ 2012-3-12 14:28 0
仙果雪币： 1491 活跃值： (985) 能力值： (RANK：860 ) 在线值：发帖 68 回帖 1507 粉丝 67 关注私信	仙果 19 16 楼说的真好。想去参观参观了 2012-3-17 22:17 0
lcgkm 雪币： 238 活跃值： (10) 能力值： ( LV2，RANK：10 ) 在线值：发帖 1 回帖 27 粉丝 0 关注私信	lcgkm 17 楼文采不错，web安全是个好方向 2012-4-21 18:59 0
windowsa 雪币： 183 活跃值： (55) 能力值： ( LV3，RANK：20 ) 在线值：发帖 11 回帖 305 粉丝 0 关注私信	windowsa 18 楼搞网络慢爬...很可怕啊.... 2012-4-21 19:06 0
	游客登录 \| 注册方可回帖回帖表情雪币赚取及消费高级回复