一个网站的成功运营,对网站用户访问数据进行统计分析是必不可少的,正如财务统计分析对企业经营策略的重要性。
既然是统计分析,数据的准确性是非常重要的,本文对多款软件进行对比分析:
一、 基于日志的统计软件
通过分析网站的访问日志来统计网站的流量。由于所有网民的访问准记录在日志中,因此其不会产生丢失数据的情况,而且便于数据的备份以供后续分析。
优 点
日志是网民访问的准确记录文件,因此能够不丢失任何的访问数据。真是因为其数据分析的全面性,因此目前是使用最广泛的网站分析工具。
缺 点
所有的扫描访问准记录在日志中,其准确性受到一定程度的影响,因此需要软件来识别扫描访问。日志分析软件的统计准确性依赖于不同的软件供应商。以下对不同的日志分析软件进行对比:
1.1 最先进的日志分析软件
参考软件 如:用友软件的VisitTrack,星鸟软件的WebBI,远大软件WebVisit等。
由于其快速的数据统计功能,能够在统计前启动预处理模块,自动识别扫描访问,比如访问量超过某一定值、页面量和点击数不成对比、IP的访问特征异常等等多种策略。
因此其能够自动将统计数据分成三类:正常的访问流量、网络蜘蛛流量、扫描流量。
1.2 常见的日志分析软件
参考软件 如:WebTrends,Webalizer等。
仅仅过滤网络蜘蛛访问,因此其流量包括两部分:正常的访问流量、网络蜘蛛浏览。是目前市场上比较多的,但是由于无法识别扫描访问,其准确性无法保证。
1.3 其他普通的日志统计软件
无法区分正常流量和网络蜘蛛访问,通过主观意识对每个网站的访问量进行权值调整,比如某一个网站访问量太高了,那么乘以一个小于1的参数。如果太低了,那么乘以一个大于1的参数。
网站每天都受到互联网上各类IP的扫描,因此如果不识别扫描访问,仅仅依靠人工主观意识是完全无法跟上网站流量的变化。从而导致流量越来越来乱,失去其本质,有些超级高,有些超级低。
由于其不科学性,供应商不负责,此类软件市场上较少,仅仅部分政府网站在使用。
二、代码嵌入类
参考软件 如:51la,站长统计。
通过在网页上嵌入JavaScript代码来对网站访问量进行统计。由于需要在页面上嵌入JavaScript代码,因此必须更改网站中的页面。其准确率受到:嵌入页面率
优 点
由于普通的扫描工具由于无法运行JavaScript代码,因此一般的扫描无法影响统计的准确性。
缺 点
1、需要修改所有需要统计页面,理论上可行,但是实际操作中,很难。往往随着各个网站的改版而导致嵌入率的下降。
2、如果网络断开或者浏览器禁止脚本执行而导致数据的丢失。
3、无法获取最全面的访问信息,如登录账户等。
4、无法检测扫描访问。
三、工具条检测类
参考软件 如:Alexa,Chinarank。
通过在浏览器上安装的工具条来收集访问数据。因此仅仅只能统计安装了工具条的网民,其他没有安装的网民不统计在内。其准确率依赖于工具条的安装率。
优 点
不需要在网站的授权就能够对其流量进行监控,因此相对来说能够对较大访问的网站量进行排名。
缺 点
1、国内其安装率较低(目前大部分网民都不安装该工具条),因此其统计数据较不可靠,会和实际相差很多,特别是访问量较低的政府网站。或者某些网站为了应付排名,特意对其网民群体进行推广,以提高其网民的工具条安装率。
2、无法获取最全面的访问信息,仅仅只有网站之间的排名功能。
[招生]科锐逆向工程师培训(2024年11月15日实地,远程教学同时开班, 第51期)