命名规则及存放路径:robots文件必须存放在网站根目录,命名为:robots.txt
怎么写robots?这个是重点!首先搞清楚书写robots用到的3个符号:
- * 代替0或者任意多的字符
- $ 结束符号,圈定以xxx结尾的文件
- ? 动态页面专用
接下来robots的书写格式:
每行的首字母都大写
必须使用英文输入法书写
(注意)User-agent , Disallow , allow后面跟英文的冒号再加空格然后才能继续书写。
- Robots示例:
User-agent: * robots规则对所有搜索引擎蜘蛛生效
Disallow: 禁止搜索引擎收录
Allow:/ 允许搜索引擎收录
Disallow: / 整个网站禁止搜索引擎收录
Disallow: /admin/ 这里是禁止爬行admin目录下面的目录
Allow: /tmp 这里是允许爬寻tmp的整个目录
Disallow: /a/*.htm 禁止访问a目录下的所有以".htm"为后缀的文件(包含子目录)。
Allow: .htm$ 允许访问以".htm"为后缀的文件
Disallow: /*?* 禁止访问网站中所有的动态页面
Disallow: /.jpg$ 禁止抓取网页所有的.jpg格式的图片
最后,做完必须去百度站长平台测试robots.txt是否有效。
相关推荐
- emlog设置了ssl及数据库批量更换文章和图片链接http为https
- emlog百度链接主动提交插件
- 微信公众号能删除单篇文章了
- Discuz!使用QQ登录注册后如何默认取消使用QQ头像和QQ秀
- 最新完整的网页标头代码模版
- EMLOG博客程序SEO优化之URL动静态统一
- 解决 DZ X3.2 QQ互联登陆出现(1054) Unknown column 'conuintoken' in 'field list'错误
- Discuz!X3.2帖子标题限制80个字符的修改方法
- 宝塔面板安装docker容器部署freenom免费域名自动续期
- Tg机器人周期运行时间采用Crontab定时格式
- SupeSite数据库的备份及恢复
- 注释代码的快捷键
- FlashFxp显示正在列目录怎么办
- zba后缀的文件怎么解压缩?
- DZ数据库备份后所在的文件夹