我的编程空间,编程开发者的网络收藏夹
学习永远不晚

robots.txt文件你怎么用呢

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

robots.txt文件你怎么用呢

robots.txt文件你怎么用呢,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。

搜索引擎通过一种程序robot(又称spider),自动访问互联网上的网页并获取网页信息。

您可以在您的网站中创建一个纯文本文件robots.txt,在这个文件中声明该网站中不想被robot访问的部分,这样,该网站的部分或全部内容就可以不被搜索引擎收录了,或者指定搜索引擎只收录指定的内容。robots.txt文件应该放在网站根目录下。

当一个搜索机器人(有的叫搜索蜘蛛)访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果存在,搜索机器人就会按照该文件中的内容来确定访问的范围;如果该文件不存在,那么搜索机器人就沿着链接抓取。

robots.txt文件的格式:

“robots.txt”文件包含一条或更多的记录,这些记录通过空行分开(以CR,CR/NL, or NL作为结束符),每一条记录的格式如下所示:

“<field>:<optionalspace><value><optionalspace>”。

在该文件中可以使用#进行注解,具体使用方法和UNIX中的惯例一样。该文件中的记录通常以一行或多行User-agent开始,后面加上若干Disallow行,详细情况如下:

User-agent:

该项的值用于描述搜索引擎robot的名字,在 ”robots.txt”文件中,如果有多条User-agent记录说明有多个robot会受到该协议的限制,对该文件来说,至少要有一条User- agent记录。如果该项的值设为*,则该协议对任何机器人均有效,在”robots.txt”文件中,”User-agent:*”这样的记录只能有一条。

Disallow:

该项的值用于描述不希望被访问到的一个URL,这个URL可以是一条完整的路径,也可以是部分的,任何以Disallow开头的URL均不会被robot 访问到。例如”Disallow:/help”对/help.html 和/help/index.html都不允许搜索引擎访问,而”Disallow:/help/”则允许robot访问/help.html,而不能访问 /help/index.html。任何一条Disallow记录为空,说明该网站的所有部分都允许被访问,在”/robots.txt”文件中,至少要有一条Disallow记录。如果”/robots.txt”是一个空文件,则对于所有的搜索引擎robot,该网站都是开放的。

robots.txt文件用法举例:

例1. 禁止所有搜索引擎访问网站的任何部分 下载该robots.txt文件 User-agent: * Disallow: /

例2. 允许所有的robot访问 (或者也可以建一个空文件 “/robots.txt” file) User-agent: *Disallow:

例3. 禁止某个搜索引擎的访问 User-agent: BadBotDisallow: /

例4. 允许某个搜索引擎的访问 User-agent: baiduspiderDisallow: User-agent: *Disallow: /

例 5.一个简单例子  在这个例子中,该网站有三个目录对搜索引擎的访问做了限制,即搜索引擎不会访问这三个目录。  需要注意的是对每一个目录必须分开声明,而不要写成 “Disallow: /cgi-bin/ /tmp/”。  User-agent:后的*具有特殊的含义,代表”any robot”,所以在该文件中不能有”Disallow: /tmp

要拦截对所有包含问号 (?) 的网址的访问,可使用下列条目:

User-agent:*

Disallow:/*?*

使用 $ 匹配网址的结束字符

您可使用 $ 字符指定与网址的结束字符进行匹配。例如,要拦截以 .asp 结尾的网址,可使用下列条目:

User-Agent:Googlebot

Disallow:/*.asp$

您可将此模式匹配与 Allow 指令配合使用。例如,如果 ? 表示一个会话 ID,您可排除所有包含该 ID 的网址,确保 Googlebot 不会抓取重复的网页。但是,以 ? 结尾的网址可能是您要包含的网页版本。在此情况下,可对 robots.txt 文件进行如下设置:

User-agent:*

Allow:/*?$

Disallow:/*?

Disallow:/ *?一行将拦截包含 ? 的网址(具体而言,它将拦截所有以您的域名开头、后接任意字符串,然后是问号 (?),而后又是任意字符串的网址)。

Allow: /*?$ 一行将允许包含任何以 ? 结尾的网址(具体而言,它将允许包含所有以您的域名开头、后接任意字符串,然后是问号 (?),问号之后没有任何字符的网址)。

Sitemap 网站地图:

对网站地图的新的支持方式,就是在robots.txt文件里直接包括sitemap文件的链接。

就像这样:

Sitemap: http://www.eastsem.com/sitemap.xml

目前对此表示支持的搜索引擎公司有Google, Yahoo, Ask and MSN。

不过,我建议还是在Google Sitemap 进行提交,里面有很多功能可以分析你的链接状态。

看完上述内容,你们掌握robots.txt文件你怎么用呢的方法了吗?如果还想学到更多技能或想了解更多相关内容,欢迎关注编程网行业资讯频道,感谢各位的阅读!

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

robots.txt文件你怎么用呢

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

robots.txt文件你怎么用呢

robots.txt文件你怎么用呢,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。搜索引擎通过一种程序robot(又称spider),自动访问互联网上的网页并获取网页信息。您可以
2023-06-12

robots.txt文件中应该屏蔽的目录是什么

这篇文章将为大家详细讲解有关robots.txt文件中应该屏蔽的目录是什么,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。你真的知道网站的robots.txt文件设置是否合理,哪些文件或者目录
2023-06-12

linux中怎么用Chezmoi取回你的点文件

这篇文章主要介绍linux中怎么用Chezmoi取回你的点文件,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!在 Linux 中,点文件是隐藏的文本文件,从 Bash、Git 到 i3 或 VSCode 等更复杂的许多
2023-06-16

教你win7隐藏文件怎么显示

  为了保护系统文件不被我们误删,win7系统会把重要文件夹隐藏起来,那么我们如何查看呢?下面小编就把win7隐藏文件怎么显示出来的教程分享给大家。  win7隐藏文件怎么显示方法如下:  1.首先我们打开iwn7系统的计算机功能,在上方找
2023-07-16

怎么往云服务器上传文件呢

云服务器是一种虚拟化技术,通过将计算资源分配给多个用户,这些用户可以使用共享的计算资源来进行应用程序的开发和运行。云服务器可以支持各种不同的应用程序,包括Web应用程序、移动应用程序和游戏开发等。同时,云服务器还支持自动化部署和监控,以及高度的可扩展性和灵活性,可以满足各种不同规模的企业和个人用户的需求。要将云服务器上
怎么往云服务器上传文件呢
2023-10-28

云服务器不用了怎么清除缓存文件呢

如果您的云服务器不再使用了,通常情况下您可以通过以下方法清除缓存文件:删除文件:在控制台中找到您想要删除的文件所在的位置,然后双击它,或者使用“文本编辑器”中的“Delete”按钮。在“Delete”按钮上方,输入您想要删除的路径和文件名,然后单击“Del”按钮。删除缓存:在控制台中找到您要删除的缓存文件所在的位置,然后双击它,或者使用“文本编辑器”中的“Fixcache&r
2023-10-26

架设云服务器怎么用手机打开文件呢

如果您要在手机上访问一个私有云服务器上的文件,您可以使用以下方法:安装您的云服务提供商的服务。登录到私有云服务器。在这里您可以使用您的手机来登录,查看您的文件。打开文件并查看文件。在您的云服务器上,只需按下“File”或“Open”按钮就可以打开该文件。删除文件并保存文件。在您的云服务器上,按下“Close”或“Clear”按钮就可以将此文件从手机上删除。请注意,在访问或打开您的私有云服务器上的文件前,请确保您
2023-10-27

win8显示隐藏文件 图文教你怎么查看win8隐藏文件

Win8可以说是打通电脑和移动终端而推出的革命性的系统产品。相比我们熟悉已经的XP以及Win7系统,Win8界面有了较大的改变,以致于一些之前对电脑操作比较熟悉的爱好者朋友换了Win8系统后发现很多东西找不到,比如最近朋友遇到的Win8显示
2022-06-04

教你win7怎么显示隐藏的文件

有不少小伙伴在使用win7系统的时候,为了文件的安全起见,会选择将一些重要的文件资料隐藏起来,想要查看的话就需要先显示出隐藏文件。下面小编就给大家讲一下win7显示隐藏文件的方法,请问怎么样显示隐藏的文件呢?。具体的方法如下:1、打开开始菜
2023-07-14

架设云服务器怎么用手机打开文件夹呢

首先,打开您的手机应用程序并登录您的帐户。在“设置”应用程序中,找到“文件与打印”选项,点击进入。在“文件与打印”页面中,找到您要查看的文件夹,点击“打开”按钮。您会看到该文件夹的详细信息,包括文件名、文件大小和文件类型等。如果您已经下载了该文件夹的PDF文件,并将其保存到您的手机上,您可以通过以下步骤打开它:在手机上
架设云服务器怎么用手机打开文件夹呢
2023-10-28

云服务器怎么多开桌面文件夹呢

如果您想在云服务器上多开多个桌面文件夹,可以按照以下步骤操作:打开云服务器的客户端:在客户端上输入管理员账号以登录云服务器并进入其管理界面。将需要共享的文件夹拖拽到云服务器上:选择您要共享的文件夹并将其拖拽到管理界面上。在文件夹上右键单击并选择共享:在弹出的共享对话框中,选择您要共享的文件夹并输入共享文件夹的用户名和密码。在“云服务器”界面上右键单击并选择共享:在共享对话框中,选择您要
2023-10-26

云服务器怎么开发出来的文件呢

一、云服务器的开发过程云服务器的开发是一个相对复杂的过程,通常需要进行以下步骤:确定服务器类型:首先需要明确自己所使用的服务器类型,例如虚拟化云服务器、容器云服务器等。选择服务器硬件:根据所需的功能和性能要求,选择适合的服务器硬件,例如CPU、内存、磁盘等。安装云服务器软件:安装所选的云服务器软件,并配置相关的系统参数
2023-10-27

怎么向华为云服务器上传文件呢

首先,登录华为云控制台,进入“文件上传”功能。在“上传”页面中,您可以选择上传文件的存储位置和文件类型,并设置上传时间和大小限制。在选择的存储位置中,您可以选择将文件上传到云服务器上的哪个文件夹,也可以设置文件上传的权限和过期时间。在设置好上传文件的权限和过期时间后,点击“上传”按钮,您将可以上传该文件。如果您需要上传
怎么向华为云服务器上传文件呢
2023-10-28

bat文件怎么用

这篇文章主要为大家展示了“bat文件怎么用”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“bat文件怎么用”这篇文章吧。首先,批处理文件是一个文本文件,这个文件的每一行都是一条DOS命令(大部分时
2023-06-09

云服务器怎么做成网盘的文件呢

云服务器的使用方法相对简单。首先,用户需要将文件上传到云服务器上,然后使用云服务器提供的API将文件保存到云端。云服务器会自动将上传的文件保存到云端的存储设备中,用户可以通过访问相应的存储设备来访问这些文件。此外,云服务器还提供了一种叫做“同步”功能的服务,用户可以使用这个功能将自己上传的文件同步到云服务器上的多个存储
云服务器怎么做成网盘的文件呢
2023-10-27

云服务器不用了怎么清除缓存文件呢苹果

首先,可以尝试使用工具来清除缓存文件。这些工具可以在网上轻松找到,例如MongoDB、Redis、Memcached等。这些工具可以通过停止正在运行的应用程序、更新应用程序、删除缓存文件等方式来清除缓存文件。其次,可以手动清除缓存文件。在这种情况下,用户可以使用一些工具,例如Everything、Chef等,手动清除缓
云服务器不用了怎么清除缓存文件呢苹果
2023-10-28

手机怎么用云服务器传文件到电脑里去呢

首先,我们需要在手机上下载一个名为“file.yun”的应用,打开应用后,可以在“文件管理”选项卡中找到该应用,进入“上传”选项卡,然后选择要上传的文件,点击“上传”按钮,上传完成后,在电脑上可以看到该文件的上传进度。其次,我们还可以在电脑上下载“file.yun”应用,然后在电脑上使用USB线将文件传输到手机上。首先
手机怎么用云服务器传文件到电脑里去呢
2023-10-28

云服务器不用了怎么清除缓存垃圾文件呢

缓存垃圾文件是指在云服务器上缓存过多的无用数据,这些数据可能会占用系统资源,影响应用程序的性能,甚至会导致应用程序崩溃。为了解决这个问题,云服务器通常会采取以下几种措施来清除缓存垃圾文件:清空缓存数据:使用第三方工具或者手动清除缓存数据,可以清除云服务器中缓存的所有数据,包括用户数据、配置信息等等。这种方法可以有效地清
2023-10-27

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录