迅排名解答什么是Robots协议
- 2019-10-25 12:22
- 营销学院
在seo优化过程中robots.txt文件对于网站优化有很大的帮助,提高蜘蛛抓取效率,还能保护网站内部需要保护的信息。在网站上线前,一定要检查robots.txt文件,如果没有及时添加,如果规则写错了,及时调整过来,以免影响网站的收录。
1、Robots.txt存储位置?
Robots文件必须换在网站的根目录下,因为搜索引擎抓取网页是从根目录开始,而蜘蛛抓取网站内容时会先检测Robots文件,按照Robots文件的规则去抓取网站内容(即要查看其它网站的Robots文件可以直接输入“域名/robots.txt”就能看到具体内容)。
2、Robots与Nofollow的区别?
Robots与Nofollow的本质区别在于Nofollow只是在当前网页禁止蜘蛛跟踪超链接,而蜘蛛可能会通过其它路径抓取到被Nofollow的网页。而Robots是禁止搜索引擎索引Disallow的网页。也就是说在搜索引擎可以搜索到Nofollow掉的网页,但是搜索不到Robots Disallow的网页。
3、Robots的语法规则?
Sitemap指定网站地图的路径,User-agent指定具体的搜索引擎蜘蛛(User-agent: *,代表所有搜索引擎、User-agent: Baiduspider指定百度搜索引擎蜘蛛、User-agent:Googlebot指定谷歌搜索引擎蜘蛛)。Allow:是允许抓取的路径,Disallow:是禁止抓取的路径。可以使用通配符:Disallow: /*.css$禁止蜘蛛爬取所有css文件(具体可以查看本站的Robots文件)。
4、Robots的运用?
通过Robots禁止网站后台登入地址被搜索引擎收录,避免黑客使用搜索引擎的inulr命令找到网站后台的登入地址,以提高网站的安全性。同时也可以禁止蜘蛛抓取容量较大的文件,以提高网站的访问速度。以上就是迅排名小编总结的Robots.txt协议相关知识,希望对你有所帮助。