【SEO问答】robots文件可以对中文目录进行爬虫封禁

很多学习seo的并不知道百度站长学院,这里有百度最官方的关于seo的资讯和案例,在这里好好阅读几篇文章比什么seo论坛的效果好很多,当然西安seo也会摘取一些seo好文章。也帮助看本站的用户做个整理。今天介绍的是:【SEO问答】robots文件可以对中文目录进行爬虫封禁

这里是链接地址:百度站长学院: http://zhanzhang.baidu.com/college/index

有同学问百度站长学院一个关于robots的问题:我们有个站点的目录结构使用的是中文,这样式儿的:www.a.com/冒险岛/123.html,那在制作robots文件和sitemap文件的时候,可以直接使用中文吗?百度能获取到吗?在实际操作中我们发现,sitemap中有文件是可以生效的,但robots封禁貌似没有反应,所以想确认一下:robots文件是否支持中文?

工程师解答:Baiduspider目前(2016年10月)在robots里是不支持中文的。

同学追问:那我们进行UrlEncode编码会不会支持呢?比如这种:http://www.a.cn/%E7%89%B9%E6%AE%8A:%E6%B5%8F%E8%A7%88/%E7%94%9F%E6%AD%BB%E7%8B%99%E5%87%BB:%E7%99%BD%E9%93%B6%E5%8A%A0%E7%89%B9%E6%9E%97

工程师解答:robots文件支持这种写法。但是否生效,还要取决于当时BaiduSpider抓取的是哪种形式结构的链接,如果是UrlEncode编码就可以生效,如果是中文就非常不幸了。

西安seo总结:

(1)robots写法

(2)利用光年日志分析来撰写robots文件

(3)要利用好robots来分配爬虫的数量

 

zh_CNChinese
滚动至顶部