« 免费域名活动的跟踪报告(一)博客礼节从知识共享开始 »

利用Robots.txt做搜索引擎优化

这两天一直在忙活着域名的事情,同时收到很多网友关于模板的投诉,下午就在改,大家已经看到了。现在有点时间把内容补上吧。今天给大家的一个和搜索引擎优化有关的话题,是经我试验后的结果,很有效,方法就是通过Robots.txt文件做减法来向搜索引擎示好,从而达到在搜索引擎上高效索引和排名的作用。

在拿出方法之前,让我们先思考这样一个问题。搜索引擎是否愿意收录大量页面重复的内容,估计大家都知道:不会。换成你是Google和Baidu你也不愿意(当然一些完全以收录量为目标的搜索引擎除外),搜索引擎有一大部分工作就是淘汰重复的网页。根据这种思想,我们可以帮助搜索引擎来完成这件事。当一个网页页面重复度低(要保证你的博客内容是原创哦),搜索引擎的友好度相应就有提升,这样整站的友好度高自然会带动文章在搜索引擎的索引效果。这种思想是基于互利原则的,绝不是作弊,其实SEO和作弊也绝不能画等号的。这种方法还有一个优点是:会节省你大量的服务器占用资源。

下面秦爱根据两种程序为大家举些例子,一是Wordpress,二是Zblog,其中Wordpress是国外SEO权威网站:SEOBOOK的,而Zblog是秦爱自己研究的,不过不要担心,经我试验只有效果明显。

★ Zblog中利用Robots.txt优化搜索引擎

User-agent:*
#Sitemap
Sitemap:http://www.yourname.com/sitemap.asp //这个指引搜索引擎蜘蛛找到你的Sitemap,在Google管理员工具中检测提示错误,这是Google Robots.txt的一个BUG,事实上是有效果且正确的。
#Directories
Disallow:/ADMIN/ //管理员登陆入口,搜索引擎就不要进来吧?呵
Disallow:/SCRIPT/ //我们调用的SCRIPT文件,搜索引擎抓到了,也不读。
Disallow:/PLUGIN/ //插件目录,不需要抓取
Disallow:/FUNCTION/ //不需抓取
Disallow:/UPDATE/ //Zblog官方的升级信息目录,不需抓取。
Disallow:/ARTICLE-IMAGE/ //网站模板中用到的一些小图标,这些在网上到处都是,就是让搜索引擎抓去了也没有排名,还浪费你的资源。
Disallow:/DATA/ //数据库目录
Disallow:/CACHE/ //Zblog生成静态页的缓存目录,这个和你的正常文章基本一致,高重复。建立拿掉
Disallow:/STYLE/ //CSS生成目录,不需抓取
Disallow:/TEMPLATE/ //模板目录,不需抓取
Disallow:/CSS/ //CSS的一些调用文件目录,不需抓取
Disallow:/LANGUAGE/ //语言目录,不必抓取
#Files
Disallow:/login.asp //我们的登录后台文件,不需抓取。
Disallow:/cmd.asp? //这个是供别人引用通知时产生的页面,不需抓取。
Disallow:/search.asp //搜索页,这页在没有人使用时,就是一个空页
Disallow:/atom.xml //支持ATOM的FEED页,高重复。
Disallow:/rss.xml //支持RSS的FEED页,高重复。
Disallow:/view.asp? //一般后台预览时生成的页面,高重复。

注意:你如果要用这段代码,把//和//前面的空格删掉再用,同时记得把sitemap地址改过来,要用绝对地址。Disallow:后面不要有空格,因为有空格在一些验证程序中通不过。另外,如果你是黑客或想成为黑客,请不要拿秦爱网志来研究,我是为大家做服务的,要研究去Z-Blog官方网站找他们PK。这句玩笑是半真半假的,我是想告诉读者,这种优化很容易让人找到你的目录结构。其实,如果哪位大侠盯上你的话,你跑也跑不掉。

★ Wordpress中利用Robots.txt优化搜索引擎

User-agent: *
Crawl-delay: 10
# Directories 目录
Disallow: /database/
Disallow: /includes/
Disallow: /sites/
Disallow: /themes/
Disallow: /misc/
Disallow: /modules/
Disallow: /scripts/
Disallow: /updates/
Disallow: /profiles/
# Files 单个文件
Disallow: /xmlrpc.php
Disallow: /cron.php
Disallow: /INSTALL.mysql.txt
Disallow: /INSTALL.pgsql.txt
Disallow: /INSTALL.txt
Disallow: /update.php
Disallow: /install.php
Disallow: /CHANGELOG.txt
Disallow: /MAINTAINERS.txt
Disallow: /LICENSE.txt
Disallow: /UPGRADE.txt
# Paths (clean URLs) 静态路径
Disallow: /search/
Disallow: /user/register/
Disallow: /user/password/
Disallow: /admin/
Disallow: /logout/
Disallow: /node/add/
Disallow: /aggregator/
Disallow: /comment/reply/
Disallow: /contact/
Disallow: /user/login/
# Paths (no clean URLs) 动态路径
Disallow: /?q=admin/
Disallow: /?q=aggregator/
Disallow: /?q=logout/
Disallow: /?q=node/add/
Disallow: /?q=comment/reply/
Disallow: /?q=contact/
Disallow: /?q=search/
Disallow: /?q=user/register/
Disallow: /?q=user/password/
Disallow: /?q=user/login/

由于我对WP的目录结构不太清楚,如果你用Wordpress,你一定能发现其中代表的意思,你可以参照Zblog中的说明来理解,秦爱就是研究了这段代码后更改的。再次希望网友不要拿秦爱网志来试验,如果你转载了此文,不要把这句话干掉,谢谢!搜索引擎优化归要结底是为了更好的收录你的网页,真正能得到搜索引擎认可的是你的内容。

  • 2. GoMain | http://www.gomain.net
  • 2007-12-17 10:12:53 | Reply
  • 3. 怕瓦落地 | http://www.pawaluodi.com
  • 2007-12-17 10:32:02 | Reply
  • 4. 麦田里的守望者 | http://www.2000xg.com
  • 2007-12-17 11:04:21 | Reply
  • 5. ken | http://www.waacoo.com
  • 2007-12-17 11:32:10 | Reply
  • 6. qinai | 
  • 2007-12-17 11:39:41 | Reply
  • 7. qinai | 
  • 2007-12-17 11:42:01 | Reply
  • 9. qinai | 
  • 2007-12-17 11:52:39 | Reply
  • 10. 怕瓦落地 | http://www.pawaluodi.com
  • 2007-12-17 12:15:12 | Reply
  • 12. 果子 | http://yuguo.name
  • 2007-12-17 16:42:27 | Reply
  • 14. qinai | 
  • 2007-12-18 9:12:23 | Reply
  • 15. qinai | 
  • 2007-12-18 9:16:14 | Reply
  • 16. Qsar | http://gunzonline.yo2.cn
  • 2007-12-18 21:31:03 | Reply
  • 17. 凯尔 | http://www.kael.com.cn
  • 2007-12-18 21:31:39 | Reply
  • 19. 不是俺 | http://www.butwho.net
  • 2007-12-18 15:35:10 | Reply
  • 20. MyHou不務正業 | http://my-hou.cn
  • 2007-12-18 21:33:29 | Reply
  • 21. 不是俺 | http://www.butwho.net
  • 2007-12-18 21:34:27 | Reply
  • 22. qinai | 
  • 2007-12-18 21:32:37 | Reply
  • 23. twoken | http://18cc
  • 2007-12-19 0:40:45 | Reply
  • 24. qinai | 
  • 2007-12-19 17:19:03 | Reply
  • 25. minidxer | http://blog.minidx.com
  • 2007-12-21 16:33:15 | Reply
  • 27. qinai | 
  • 2007-12-23 23:40:48 | Reply
  • 28. 斑马 | http://www.leobanma.cn/
  • 2007-12-27 23:58:39 | Reply
  • 29. qinai | 
  • 2007-12-28 8:29:19 | Reply
  • 30. 不是俺 | http://www.butwho.net
  • 2008-1-10 18:22:41 | Reply
  • 34. www.zok.cc | http://www.zok.cc
  • 2009-8-20 23:03:00 | Reply
  • 35. ico | http://www.ico.la
  • 2010-5-3 14:15:22 | Reply
  • 36. 无效的抓取 | http://www.sogosf.com
  • 2010-8-9 23:54:34 | Reply

发表评论

Search

网络资源

在线工具

搜索优化

博客日志

专题文章集

Copyright © 2004 秦爱网志 对部分内容保留所有权,博客程序归Z-Blog所有 沈阳ICP备05002435号