当搜索引擎尝试访问您网站上的页面但失败时,就会出现抓取错误。让我们进一步说明如何进行爬网。抓取是搜索引擎尝试通过蜘蛛或机器人访问您网站的每个页面的过程。搜索引擎机器人会找到您网站的链接,并开始从那里找到您所有的公开页面。该蜘蛛或机器人会爬网页面并为要在搜索引擎中使用的所有内容建立索引,并将这些页面上的所有链接添加到仍要爬网的页面堆中。作为网站所有者,您的主要目标是确保搜索引擎机器人可以访问网站上的所有页面,无法执行此过程将返回“爬网错误”。
您的目标是确保网站上的每个链接都指向实际页面。那可能是通过301重定向,但是该链接末尾的页面应始终返回200 OK服务器响应。
搜索引擎将抓取错误分为两类:
让我们详细说明一下。
网站错误是阻止搜索引擎机器人访问您的网站。这可能有很多原因,这是最常见的原因:
这一点说明了与整个网站相关的抓取错误。现在,让我们看看特定页面可能会发生哪种爬网错误。
如前所述,URL错误是指当搜索引擎机器人尝试对您网站的特定页面进行爬网时发生的爬网错误。当我们讨论URL错误时,我们倾向于首先讨论爬网错误,例如软404错误。您应该经常检查这些类型的错误(使用搜索引擎网站管理员工具)并修复它们。如果该页面确实消失了,再也无法返回您的网站,请投放410页。如果您在另一页上有类似的内容,请改用301重定向。显然,请确保您的站点地图和内部链接也是最新的。
顺便说一下,我们发现许多此类URL错误是由内部链接引起的。因此,许多错误都是您的错。如果您有时从站点中删除页面,请同时调整或删除指向该页面的任何入站链接。这些链接不再有用。如果该链接保持不变,则机器人将找到它并按照它进行操作,只会发现死胡同(404未找到错误)。在您的网站上。您需要立即进行一些维护,然后再对内部链接进行维护!
在这些常见错误中,可能是偶然的DNS错误或该特定URL的服务器错误。稍后重新检查该URL,然后查看错误是否消失。
有些URL错误仅适用于某些网站。这就是为什么我们要单独列出这些原因:
本文的底线绝对是:如果遇到爬网错误,请修复它们。时不时地检查爬网错误应该成为站点维护计划的一部分。除此之外,南京SEO专家浪知潮将为您的网站提供了抓取错误检测工具,您将拥有一种便捷的方式来防止出现抓取错误。请务必自行检查这些错误!
下一篇:什么是低质量页面?如何修复它们?