-
-
[原创]挑帖子的程序
-
发表于:
2009-1-12 23:35
6577
-
首先是几个数据
误删率:8%左右
垃圾主题清除率:30%~50%
最终可删除主题:3600+2000
被误删的主题:3600*8%
标题就很挫,主要原因是我还没给这个项目起名字,放这个项目的文件夹的名字叫“新建文件夹”,笨笨雄问起这个程序就说“那个挑帖子的程序”,于是我也这样叫了。
在开始介绍之前我要特别感谢笨笨雄,是他把数据挖掘这么好玩的东西介绍了给我。最主要的核心算法也是他写的,虽然他建议我自己写或者根据需要修改,不过那么NB的代码我连注释都不敢加更别谈修改了,他的接口设计的非常合理,用着非常的顺手。每次开始写这个项目之前我都要把他的那个头文件拿出来膜拜一分钟……
下面开始介绍:
零、这是个什么程序?
下面是引用笨笨雄当时的说法:
sscanf(str, "<td class=\"alt1\" title=\"%[^ ] %[0-9,]%[^ ] %[0-9,]\"", temp, reply, temp, view)
[培训]内核驱动高级班,冲击BAT一流互联网大厂工作,每周日13:00-18:00直播授课