阳光出来了,手上那道很深的口子经过两个星期的努力生长,也初步愈合了,虽然按着还有点疼。

上周的新心得:

第一是通过修改针对机器人的优先级来解决内部跳来跳去的问题,今天看初步算成功的。

第二是自己发明了一个公式来对我的一大堆词进行等级分类,居然三流九等地分出来了,一共划了五等,没敢在报告里写第一等,因为那个数据量少,大概是井喷不是常态。这样分类之后,前几个星期由Daniel提出我也很想知道的问题初步有了个答案:流量和排名到底是什么关系。

Alex相信那天我作得很粗糙的排名-流量图,我认为那个图实在不能用,他却认为是我不能舍弃边缘数据,还嘲笑我是否学过统计学。好吧,我承认我统计学学得很不好。不过那个粗糙的图还是有作用的,结论就是:排名-流量图是属于幂律分布的,而非线性分布。可是这个结论似乎靠猜也能猜得着。

这一次加入了精确月搜索量这个变量。说起来惭愧,在之前居然一直都没有注意过这个问题,所以每次所查询得到的月搜索量都是广泛匹配,而非exactly。

五个等级的词,其精确月搜索量是在三个范围内:五位数,四位数,三位数。初步结论是:

五位数的词:一般情况是排名在八九时,周流量50以上,好一些的,排名在第二页上半部分就可将近50,差一点的,排名八九的周流量为40-50之间。

四位数的词:首先这些词已经是组合词组。排名六七时,周流量可在50左右。

三位数的词:最好也只能达到排名四到六,周流量20多。

这样在选择词时,心里就有数了。