如何创建Robot

robot英文翻译过来：机器人 robots.txt文件也很好理解：搜索引擎使用spider程序自动访问互联网上的网页并获取网页信息。robots.txt这个文件用于指定spider（蜘蛛）在您网站上的抓取范围。

方法/步骤

robots.txt文件应该放置在网站根目录下。比如，当spider访问http://www.xxx.com时，首先会检查该网站中是否存在http://www.xxx.com/robots.txt这个文件，如果Spider找到这个文件，它就会根据这个文件的内容，来确定它访问权限的范围。

每当用户试图访问某个不存在的URL时，服务器都会在日志中记录404错误文件（无法找到文件）。每当搜索蜘蛛来寻找并不存在的robots.txt文件时，服务器也将在日志中记录一条404错误文件，所以不管你是否需要屏蔽蜘蛛抓取，都应该在网站中添加一个robots.txt。

一般网站中不需要蜘蛛抓取的文件有：后台管理文件、程序脚本、附件、数据库文件、编码文件、样式表文件、模板文件、导航图片和背景图片等等。这些内容目录可以通过robots.txt屏蔽。

robots.txt里主要有两个函数：User-agent和 Disallow。

robots.txt文件里还可以直接包括在sitemap文件的链接。就像这样：　　Sitemap: http://www.xxx.com/sitemap.xml

举例个robots.txt,不懂的朋友可以根据自己的网站情况，作为参考。User-agent: * 　　Disallow: /admin/ 后台管理文件　　Disallow: /require/ 程序文件　　Disallow: /attachment/ 附件　　Disallow: /images/ 图片　　Disallow: /data/ 数据库文件　　Disallow: /template/ 模板文件　　Disallow: /css/ 样式表文件　　Disallow: /lang/ 编码文件　　Disallow: /script/ 脚本文件

文件里面至少要有一个Disallow函数，如果都允许收录，则写: Disallow: ，如果都不允许收录，则写Disallow: / （注：只是差一个斜杆）。

上一篇：卡罗拉副驾驶储物箱怎么装上去

下一篇：卡罗拉油箱盖怎么打开油箱盖开关在哪

欧尼酱

如何创建Robot

孕期如何科学补充叶酸

高血压如何诊断？看高血压有哪些原因、症状

妊娠高血压应如何应对？

高血压是由什么原因引起的？如何预防高血压？

王者荣耀貂蝉该如何出装？

如何及早的发现高血压

高血压该如何治疗呢？

如何有效治疗高血压糖尿病？

孕妇如何预防高血压呢？

怀孕后如何预防高血糖

如何预防高血压？高血压的预防方法

GoogleChrome如何更改下载文件的路径

如何远离高血压，有什么好办法？

个人如何预防高血压

冬季如何预防高血压？

如何预防高血压？

如何训练狗狗大小便

如何去训练狗狗大小便

如何选购月饼

欧月僵苗如何处理

不一样的冰皮月饼

水果冰皮月饼的做法

营养美食制作腊肉炒香干

美味彩色冰皮月饼

香干炒肉丝怎么烧才美味

香干炒肉丝的制作方法

让你吃了会上瘾的月饼---豆沙冰皮月饼

怎样制作美味的香干炒肉？

冰皮月饼如何做出Q弹的面皮

奶黄冰皮月饼

新手易做的香干炒肉

五彩冰皮月饼的做法

怎样做香干炒肉好吃？

多彩冰皮月饼

香干炒肉的制作方法

月饼季又要来了--冰皮月饼

教你自制地热低脂的红豆冰皮月饼

用冰皮预拌粉制作冰皮月饼的方法

香辣大头菜的做法

怎样在家做冰皮豆沙月饼？