命名规则及存放路径:robots文件必须存放在网站根目录,命名为:robots.txt
怎么写robots?这个是重点!首先搞清楚书写robots用到的3个符号:
- * 代替0或者任意多的字符
- $ 结束符号,圈定以xxx结尾的文件
- ? 动态页面专用
接下来robots的书写格式:
每行的首字母都大写
必须使用英文输入法书写
(注意)User-agent , Disallow , allow后面跟英文的冒号再加空格然后才能继续书写。
- Robots示例:
User-agent: * robots规则对所有搜索引擎蜘蛛生效
Disallow: 禁止搜索引擎收录
Allow:/ 允许搜索引擎收录
Disallow: / 整个网站禁止搜索引擎收录
Disallow: /admin/ 这里是禁止爬行admin目录下面的目录
Allow: /tmp 这里是允许爬寻tmp的整个目录
Disallow: /a/*.htm 禁止访问a目录下的所有以".htm"为后缀的文件(包含子目录)。
Allow: .htm$ 允许访问以".htm"为后缀的文件
Disallow: /*?* 禁止访问网站中所有的动态页面
Disallow: /.jpg$ 禁止抓取网页所有的.jpg格式的图片
最后,做完必须去百度站长平台测试robots.txt是否有效。
相关推荐
- 百度搜索结果快照显示网站logo的实用技巧
- zblog提示“JavaScript加载失败”的原因和解决办法
- NAT64设置方法
- zblog后台的应用中心登录不了,提示错误怎么办?
- 宝塔真正有效的图片防盗链完整设置详解
- Discuz!使用QQ登录注册后如何默认取消使用QQ头像和QQ秀
- 看黑客是如何使用搜索引擎的
- 教你用RAR把绿色程序制作打包成exe安装包
- Centos挂载硬盘完整图文教程(查看、分区、格式化、挂载)磁盘
- 关键词“神目”百度排名慢慢上来了,彰显王者归来
- PE进纯DOS环境下不能识别盘符是什么问题呢?
- discuz搬家以后注册时出现用户ID已被占用怎么解决
- 磊科Q3刷海蜘蛛tomato固件教程
- emlog修改后台admin目录名称教程
- emlog百度链接主动提交插件