配置了七牛静态存储,我们通常要修改一下robots.txt,目的是禁止蜘蛛抓取我们二级域名如media.liuyanzhao.com,而不让百度等搜索引擎收录我们的media.liuyanzhao.com的页面和文章,从而降低主域名liuyanzhao.com的权重。但是,我们又希望蜘蛛能抓取到我们的图片,如
,这样可以避免我们网站缩略图能能够被抓取
博主当初修改这个文件的时候,尴尬死了,删除了,重新上传,试了无数遍,都没改成功。后来才知道是缓存的原因,点击刷新预取
这样就能更改robots.txt的内容
方法很简单,删除之前的robots.txt,重新上传新的robots.txt
下面是robots.txt里的规则(代码)
上面的代码,很明显,这里就不废话了。
这里再给一个完整暴力的
先进入 百度站长平台 , 没有添加链接的,先添加(博主添加的包括liuyanzhao.com和medialiuyanzhao.com) 。
进去之后,点击检测并更新,多点几次,直到出现下面界面
至此,所有配置已经完毕,更多文章
- http://media.liuyanzhao.com/wp-content/uploads/2017/03/1-768x356.png
,这样可以避免我们网站缩略图能能够被抓取
本文中的robots.txt都是七牛绑定域名(七牛空间存储)根目录里的,不是你网站根目录啊
第一步、七牛刷新预取(清除缓存的意思)
博主当初修改这个文件的时候,尴尬死了,删除了,重新上传,试了无数遍,都没改成功。后来才知道是缓存的原因,点击刷新预取
第二步、填写要刷新的文件
这样就能更改robots.txt的内容
第三步、修改robots.txt
方法很简单,删除之前的robots.txt,重新上传新的robots.txt
下面是robots.txt里的规则(代码)
- User-agent: Baiduspider
- Allow: /wp-content/uploads/*.jpg$
- Allow: /wp-content/uploads/*.png$
- Disallow: /
- User-agent: 360Spider
- Allow: /wp-content/uploads/*.jpg$
- Allow: /wp-content/uploads/*.png$
- Disallow: /
- User-agent: Baiduspider-image
- Allow: /wp-content/uploads/*.jpg$
- Allow: /wp-content/uploads/*.png$
- Disallow: /
- User-agent: 360Spider-Image
- Allow: /wp-content/uploads/*.jpg$
- Allow: /wp-content/uploads/*.png$
- Disallow: /
- User-agent: *
- Disallow: /
上面的代码,很明显,这里就不废话了。
这里再给一个完整暴力的
- # robots.txt generated at http://portal.qiniu.com
- User-agent: Baiduspider
- Allow: /wp-content/uploads*
- Disallow: /
- User-agent: Sosospider
- Allow: /wp-content/uploads*
- Disallow: /
- User-agent: sogou spider
- Allow: /wp-content/uploads*
- Disallow: /
- User-agent: YodaoBot
- Allow: /wp-content/uploads*
- Disallow: /
- User-agent: Googlebot
- Allow: /wp-content/uploads*
- Disallow: /
- User-agent: Bingbot
- Allow: /wp-content/uploads*
- Disallow: /
- User-agent: Slurp
- Allow: /wp-content/uploads*
- Disallow: /
- User-agent: MSNBot
- Allow: /wp-content/uploads*
- Disallow: /
- User-agent: googlebot-image
- Allow: /wp-content/uploads*
- Disallow: /
- User-agent: googlebot-mobile
- Allow: /wp-content/uploads*
- Disallow: /
- User-agent: yahoo-blogs/v3.9
- Allow: /wp-content/uploads*
- Disallow: /
- User-agent: psbot
- Allow: /wp-content/uploads*
- Disallow: /
- User-agent: *
- Allow: /wp-content/uploads*
- Disallow: /
百度站长平台检测
先进入 百度站长平台 , 没有添加链接的,先添加(博主添加的包括liuyanzhao.com和medialiuyanzhao.com) 。
进去之后,点击检测并更新,多点几次,直到出现下面界面
- 试着在下面框里输入一个页面链接,非常完美,不能抓取
- 我们再试试图片
至此,所有配置已经完毕,更多文章
2017年10月21日 14:51:52
今天发现百度居然把七牛的镜像首页给收录,赶紧按博主这样设置好,真的哈人,不过刷新预取的方式变了,是先点在七牛绑定的域名,然后在左侧再刷新
2017年03月09日 22:42:59
七牛的资源用得还不错。
2017年03月09日 18:58:30
robots这个还真没注意过
2017年03月09日 18:41:09
你买begin了?
2017年03月09日 18:42:38
买的二手的:mrgreen:
2017年03月09日 11:45:43
感谢分享
2017年03月09日 09:54:56
我那个懿古今用的就是七牛,不过好像我都没有设置这个东东,感觉一直都能用
2017年03月08日 22:34:00
666666学习啦,主题最新版的吗?