如何在网站上findsitemap.xmlpath?

我怎样才能find网站的sitemap.xml文件?

例如去stackoverflow / sitemap.xml得到我一个404。

在stackoverflow / robots.txt写入以下内容:

“这在技术上是无效的,因为对于一些被遗忘的原因,sitemappath必须是ABSOLUTE而不是相对的。Sitemap:/sitemap.xml”

我不认为有一个标准的网站地图的位置。 这就是为什么当您使用Google的网站pipe理员工具添加网站地图时,应该指定任意url到您的站点地图的原因。

没有标准,所以没有保证。 有了这个说法,网站地图通常会被贴上标签,并且是这样的:

example.com/sitemap.xml

在某些服务器上,情况是敏感的,所以记住这一点。 如果不存在,请查看根目录中的robots文件:

example.com/robots.txt

如果您没有看到它在机器人文件中列出的Google头文件,请search:

site:example.com filetype:xml

这会将结果限制为目标域上的XML文件。 在这一点上,它的试验和错误,并根据您正在使用的网站的具体情况。 如果您从上面的Googlesearch短语中获得了几页结果,请尝试进一步限制结果:

filetype:xml site:example.com inurl:sitemap

要么

filetype:xml site:example.com inurl:products

如果仍然无法find它,可以right-click > "View Source"然后为.xml执行search(又名:“控制查找”或Ctrl + F ),以查看代码中是否有引用。

网站地图的位置影响可以包含哪些url,但是没有标准。 这是一个很好的链接,更多的解释: http : //www.sitemaps.org/protocol.html#location

根据协议文档 ,网站devise人员至less可以使用三种选项将sitemap.xml位置通知给search引擎:

  • 通过他们提供的界面通知每个search引擎的位置
  • 将url添加到robots.txt文件
  • 通过http提交url到search引擎

因此,除非他们select在其robots.txt文件上发布站点地图位置,否则不能真正知道他们放置sitemap.xml文件的位置。