robot文件如何创建

有时候，我们的网站有些后台地址或者是动态地址等不希望被搜索引擎搜索到，这时候robot文件就起到它的作用了。

工具/原料

文本文档

robots 文件语法大全

robots.txt文件的作用

制定搜索引擎如何索引你网站的规则，限定哪些页面允许被索引，哪些页面不允许被索引。END

robots.txt文件的创建

（1）当网站本身并不存在robots文件的情况下，新建一个纯文本文档，命名为robots.txt，在此文件中进行编辑，完成后传到对应网站的根目录下即可。（2）网站本身存在robots文件的情况下，下载原robots文件进行编辑，完成后传到对应网站的根目录下。END

robots.txt文件基本格式

User-agent: *Disallow:User-agent: * 这里的*代表的所有的搜索引擎种类，*是一个通配符，也可以是具体的搜索引擎蜘蛛，如Baiduspider 百度蜘蛛Disallow: 按设置禁止访问某些页面，不加内容，表示无限制如 Disallow: /*?* 表示禁止访问网站中所有包含问号 (?) 的网址如下图所示：表示禁止百度蜘蛛访问网站中所有包含问号 (?) 的网址END

robots.txt文件主要语法

User-agent: * 这里的*代表的所有的搜索引擎种类，*是一个通配符Disallow: /目录名/ 禁止访问某个目录Disallow: /cgi-bin/*.htm 禁止访问/cgi-bin/目录下的所有以'.htm'为后缀的URL(包含子目录)。Disallow: /*?* 禁止访问网站中所有包含问号 (?) 的网址Disallow: /.jpg$ 禁止抓取网页所有的.jpg格式的图片Disallow:/ab/adc.html 禁止爬取ab文件夹下面的adc.html文件。END

robots.txt文件常用示例

允许所有搜索引擎访问网站的所有部分User-agent: *Disallow:

禁止所有搜索引擎访问网站的所有部分User-agent: *Disallow: /

禁止蜘蛛访问某个目录（如禁止admin，css，images三个目录被索引）User-agent: *Disallow: /css/Disallow: /admin/Disallow: /images/（注意三个目录需要分开写，一行写一个）

禁止索引网站中所有含有“?”网址User-agent: *Disallow: /*?*还有很多相关设置，在这里无法做一一列举，需要大家触类旁通，以及下载一份较全的robotot文件语法。

主要搜索引擎蜘蛛名称

Googlebot：谷歌蜘蛛

Yahoo! Slurp ：雅虎蜘蛛

注意事项

robots.txt文件名必须是全小写

有多项设置的时候，必须分开写，一行一个设置

最好下载一份语法大全，对照着写，不然很容易出错，可能造成严峻的问题

robots.txt 主要有个s哦，小编刚刚就犯了个不可原谅的错误，写成了robot.txt

上一篇：创造触觉系统的各种方法

下一篇：成垃圾的撮子学名是

欧尼酱

robot文件如何创建

robot文件如何创建

如何添加本地打印机与共享网络上的打印机

Win10系统弹出由于打印机当前设置有问题怎么办

一步一步教你如何设置打印机局域网共享使用

打印机只能复印不能打印如何解决

没有黑色墨盒如何打印黑色文本

五环电阻怎么识别阻值

更换打印机后无法连接打印机故障排除

电阻电容的识别方法

共享打印机的三种安装连接方法

如何打印电子表格的行号列标？

怎样从电阻的外观及标称快速计算电阻的阻值

Windows 7 64位系统共享Windows xp系统打印机

怎么判断电阻的瓦数

Xp与win7以上打印机共享（找不到或装不上）

迅速读取色环电阻的电阻值

打印机不能打印可能出现的原因和解决方案

打印机局域网共享【新办法】

打印机出现“无响应”可能解决方法

HP LaserJet 5200 打印 PDF 文档速度很慢

条码标签打印软件如何实现标签重复打印