我的编程空间,编程开发者的网络收藏夹
学习永远不晚

百度sitemap网站地图协议规范及常见问题有哪些

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

百度sitemap网站地图协议规范及常见问题有哪些

今天小编给大家分享一下百度sitemap网站地图协议规范及常见问题有哪些的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。

    Sitemap(站点地图)是一种文件的统称,通常Sitemap(站点地图)可以是txt或者XML格式。通过Sitemap(站点地图)你可以告诉搜索引擎关于你的站点中的网页、视频或者其他文件的相关信息,帮助搜索引擎更好的认识和理解你的站点。格式正确的Sitemap(站点地图)文件会帮助搜索引擎更高效地抓取你的网站。

    百度Sitemap说明

    文件地址格式为txt或xml,每个地址文件最多包含50,000个网址且需小于10MB。

    sitemap提交工具仅对已验证站点开放使用,开发者无法提交同一主域下其他未验证站点的数据。

    请勿提交索引型sitemap,索引型不予处理,且若存在索引型sitemap,将不允许提交新文件;请删除索引型sitemap后再尝试提交数据。

    txt文本格式

    在一个txt文本列明需要向百度提交的链接地址,将txt文本文件通过站长平台进行提交

    需要遵循以下指南:

    文本文件每行都必须有一个网址。网址中不能有换行。

    不应包含网址列表以外的任何信息。

    您必须书写完整的网址,包括 http。

    每个文本文件最多可包含 50,000 个网址,并且应小于10MB(10,485,760字节)。如果网站所包含的网址超过 50,000 个,则可将列表分割成多个文本文件,然后分别添加每个文件。

    文本文件需使用 UTF-8 编码或GBK编码。

    xml格式

    xml格式提供有关您网站的其他信息,如上次更新日期、Sitemap文件的更新频率等,供百度Spider参考。

    标签名称标签说明标签类型标签限制可选/必选举例






    urlset




    urlurl标记每条信息的开始和结束//可选 
    最多出现50000次







    url




    loc该条数据的存放地址任意URL最小长度1个字符
    最大长度256个字符
    符合正则表达式(http://)(.+)
    必选http://www.baidu.com/
    lastmod指该条数据的最新一次更新时间日期或日期时间格式为:YYYY-MM-DD[Thh:mm:ss],日期与时间之间使用T分隔,可以仅提供年月日部分可选2013-01-01
    changefreq指该条数据的更新频率字符串有效值为:always、hourly、daily、weekly、monthly、yearly、never可选always
    priority用来指定此链接相对于其他链接的优先权比值,此值定于0.0-1.0之间小数大于等于0.0
    小于等于1.0
    可选1.0

    XML格式举例

    <?xml version="1.0" encoding="UTF-8"?><urlset><!-- urlset,urlset用来标记整个文档的开头,最少出现1次 最多出现1次 -->    <url>    <!-- url,url标记每条信息的开始和结束,最少出现0次 最多出现50000次 -->        <loc>http://www.baidu.com/</loc>        <!-- loc,该条数据的存放地址,最少出现1次 最多出现1次,类型为URL地址,最小长度1个字符 最大长度256个字符 必须符合正则表达式(http://)(.+) -->        <lastmod>2013-01-01</lastmod>        <!-- lastmod,指该条数据的最新一次更新时间,最少出现0次 最多出现1次,类型为日期或日期时间,格式为YYYY-MM-DD的日期或者格式为YYYY-MM-DDThh:mm:ss的日期时间(请注意日期与时间之间以“T”分隔) -->        <changefreq>always</changefreq>        <!-- changefreq,指该条数据的更新频率,最少出现0次 最多出现1次,类型为字符串,有效值为:always、hourly、daily、weekly、monthly、yearly、never -->        <priority>1.0</priority>        <!-- priority,用来指定此链接相对于其他链接的优先权比值,此值定于0.0-1.0之间,最少出现0次 最多出现1次,类型为小数,最小值为(包含)0.0 最大值为(包含)1.0 -->    </url></urlset>

    若有多条url,按照上述格式重复之间的片断,列明所有url地址,打包到一个xml文件,向站长平台进行提交。

    如何提交Sitemap

    第一步,将需提交的网页列表制作成一个Sitemap文件,文件格式请阅读百度Sitemap协议都支持哪些格式。

    第二步,将Sitemap文件放置在网站目录下。比如您的网站为example.com,您已制作了一个sitemap_example.xml的Sitemap文件,将sitemap_example.xml上传至网站根目录即example.com/sitemap_example.xml

    第三步,登录百度站长平台,确保提交Sitemap数据的网站已验证归属。

    第四步,进入Sitemap工具,点击“添加新数据”,文件类型选择“URL列表”,填写抓取周期和Sitemap文件地址

    最后,提交完之后,可在Sitemap列表里看到提交的Sitemap文件,如果Sitemap文件里面有新的网站链接,可以选择文件后,点击更新所选,即对更新的网站链接进行了提交。

    Sitemap常见问题

    填写的周期是什么含义?

    百度Spider会参考设置周期抓取Sitemap文件,因此请根据Sitemap文件内容的更新(比如增加新url)来设置。请注意若url不变而仅是url对应的页面内容更新(比如论坛帖子页有新回复内容),不在此更新范围内。Sitemap工具不能解决页面更新问题。

    Sitemap提交后,多久能被百度处理?

    Sitemap数据提交后,一般在1小时内百度会开始处理。在以后的调度抓取中,如果您的sitemap支持etag,我们会更频繁抓取sitemap文件,从而及时发现内容更新;否则抓取的周期会比较长。

    提交的Sitemap都会被百度抓取并收录吗?

    百度对已提交的数据,不保证一定会抓取及收录所有网址。是否收录与页面质量相关。

    我可以压缩我的 Sitemap 吗?它们是否需要用 gzip 压缩?

    可以。请使用 gzip 压缩 Sitemap。无论压缩与否,Sitemap 应该小于 10MB(10,485,759字节)。

    XML格式的 Sitemap 中,“priority”提示会影响我的网页在搜索结果中的排名吗?

    不会。Sitemap 中的“priority”提示只是说明该网址相对于您自己网站上其他网址的重要性,并不会影响网页在搜索结果中的排名。

    网址在 Sitemap 中的位置是否会影响它的使用?

    不会。网址在 Sitemap 中的位置并不会影响百度对它的识别或使用方式。

    Sitemap中提交的url能否包含中文?

    因为转码问题建议最好不要包含中文。

    以上就是“百度sitemap网站地图协议规范及常见问题有哪些”这篇文章的所有内容,感谢各位的阅读!相信大家阅读完这篇文章都有很大的收获,小编每天都会为大家更新不同的知识,如果还想学习更多的知识,请关注编程网行业资讯频道。

    免责声明:

    ① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

    ② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

    百度sitemap网站地图协议规范及常见问题有哪些

    下载Word文档到电脑,方便收藏和打印~

    下载Word文档

    猜你喜欢

    百度sitemap网站地图协议规范及常见问题有哪些

    今天小编给大家分享一下百度sitemap网站地图协议规范及常见问题有哪些的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。Sit
    2023-07-05

    百度sitemap网站地图协议规范说明及常见问题

    Sitemap可以是txt或者XML格式。通过Sitemap(站点地图)你可以告诉搜索引擎关于你的站点中的网页、视频或者其他文件的相关信息,帮助搜索引擎更好的认识和理解你的站点。格式正确的Sitemap(站点地图)文件会帮助搜索引擎更高效地抓取你的网站。
    2023-05-15

    编程热搜

    • Python 学习之路 - Python
      一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
      Python 学习之路 - Python
    • chatgpt的中文全称是什么
      chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
      chatgpt的中文全称是什么
    • C/C++中extern函数使用详解
    • C/C++可变参数的使用
      可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
      C/C++可变参数的使用
    • css样式文件该放在哪里
    • php中数组下标必须是连续的吗
    • Python 3 教程
      Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
      Python 3 教程
    • Python pip包管理
      一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
      Python pip包管理
    • ubuntu如何重新编译内核
    • 改善Java代码之慎用java动态编译

    目录