我的这个博客大概是今年内三月底开通的,到现在接近四个月.
四个月的时间差不多坚持每天更新原创文章,到现在文章数量在150左右,文章URL采用三级目录形式,如:
http://www.liangsai.com/seo/top4-google/
但google对本站文章内容页的收录一直不是很完整.好几个月了,而我同期建立的另一个网站早就过了google的观察期了(也用的z-blog程序,文章页却全部收录)
到底是什么原因呢?
最近研究了一下本站的结构,猜测了一下原因.
1,摘要, 为了方便用户在首页就能将文章看完,最近我将文章的全部内容都放在摘要里.所以首页显示了最新的文章的全部
2,日历,每天差不多只更新一篇文章,添加文章后会增加一个按日期分类的页面, 如:
由于一天只有一篇,所以这个地址显示的也是最新文章的全部
3,tags,由于一篇文章通常会有1到3个标签..本站文章目前较少,因此这三个标签可能是第一次添加,所以点击每个标签,都会显示最新这篇文章.
这样一来,新发表一篇文章,就有5个页面能看到...
对搜索引擎来说,就形成了大量的重复页面.
所以我期待收录的如 http://www.liangsai.com/seo/top4-google/ 没有收录
却收录了如 http://www.liangsai.com/catalog.asp?date=2008-4-27 的页面
在搜索引擎site自己的网站的时候,它会智能地显示:我们过滤了部分相似的页面...
所有这些页面都是catalog.asp衍生出来的.
虽说tags是贯穿整个网站的主线,能将相似页面都串起来,但在文章较少的时候,造成的却是大量重复页.
seo实验: 权衡再三,我决定将首页的日历和tags链接都去掉, 并将catalog.asp和tags.asp在robots.txt中disallow掉,只让收录静态的分类页和内容页, 观察一段时间,看看效果如何
从用户体验上来讲, 互联网上的新手似乎总是绵绵不绝,"杀之不尽",我曾在访问记录里发现一个人好像是沦陷在我的tag里了,就是不去点我的精彩的静态文章页,在不同的tags里跳来跳去,也许是粗体黑字的tags吸引着他,也许他还不知道, 点击文章标题可以看文章全文...
无奈之下,我在摘要后面加了一句:点此查看全文.....希望他不要再老点tags并且埋怨我的文章都只写一半...
静候收录了...