算是玩了,但是居然比前几天有些认知。

description和文章开头

从刚才那个纯粹是玩的工具得知,原来搜索结果页面上的大段文字是description。被Jimmy嘲笑了一番。

又过了一会儿,发现也不尽然。比如我的博文搜索结果,那很可能就是文章内容的概述,或者开头几句等。

如此说来,有些能理解为什么强调Description和网页开头了。像文字不多的产品页面,就以description为要!来了先录它。所以如果都是相同或近似,就被认为没有价值了,自然分低不少。而文字内容多的,就重开头几句。而且显然如果是同一性质的网页,描述也类似的话,那么开头文字就更重要了,就靠它来显示本页面的独特之处啊。像博文,每篇日志都不相同,可是基本description是相同的,那就是我自己设置的“苦丁茶园地-教育人博客”。

更新频率

仍然是从那个好玩的工具得知,一个结果页面包括title,description,url。拿去跟现实中的搜索结果一对照,发现我14日晚上所做的网页更改并未奏效,Title仍然是旧的。这才想起来那句老是被业内人士分析来分析去的爬虫多久来一次的问题。

如此说来,我刚才发表的文章根本还没有出世?于是“嗖嗖地”搜了一下,岂知【serp】是搜不到的?连昨天的【社交网络】也搜不到,再搜,连【网站的权威性】也搜不到。最后总算搜到了【W3C】。于是结论是,至少9月14日以来,它老人家没有大驾光临。当然有证据的最近一次光临时间是9月3日之后。也就是说,9月3日到9月14日的某一天,它来了,带走了我的【W3C】……之后,也许来了没发现,也许没来。

于是恍然为什么要经常更新!

这是两个很基本的事情,官样话也听得不少了,可是直到现在才理解。

明白了一件事实,目前之所以觉得茫然,是因为不理解为什么要这样做或者为什么要那样做。连一些最基本的都没有去追问为什么。

警惕!