010-56250565
 
对页面抓取异常的原因及分析
2016-5-4 浏览:1498次
1,效劳器衔接反常
效劳器衔接反常会有两种状况:一种是站点不稳定,Baiduspider测验衔接您网站的效劳器时呈现暂时无法衔接的状况;一种是Baiduspider一向无法衔接上您网站的效劳器。

形成效劳器衔接反常的因素通常是您的网站效劳器过大,超负荷运转。也有也许是您的网站运转不正常,请查看网站的web效劳器(如apache、iis)是不是装置且正常运转,并运用浏览器查看首要页面能否正常拜访。您的网站和主机还也许阻挠了Baiduspider的拜访,您需求查看网站和主机的防火墙。

2,网络运营商反常:网络运营商分电信和联通两种,Baiduspider经过电信或网通无法拜访您的网站。假如呈现这种状况,您需求与网络效劳运营商进行联络,或许采购具有双线效劳的空间或许采购cdn效劳。

3,DNS反常:当Baiduspider无法解析您网站的IP时,会呈现DNS反常。也许是您的网站IP地址过错,或许域名效劳商把Baiduspider封禁。请运用WHOIS或许host查询自己网站IP地址是不是准确且可解析,假如不准确或无法解析,请与域名注册商联络,更新您的IP地址。

4,IP封禁:IP封禁为:限制网络的出口IP地址,制止该IP段的运用者进行内容拜访,在这里特指封禁了BaiduspiderIP。当您的网站不期望Baiduspider拜访时,才需求该设置,假如您期望Baiduspider拜访您的网站,请查看有关设置中是不是误添加了BaiduspiderIP。也有也许是您网站地点的空间效劳商把baiduIP进行了封禁,这时您需求联络效劳商更改设置。

5,UA封禁:UA即为用户署理(User-Agent),效劳器经过UA辨认拜访者的身份。当网站关于指定UA的拜访,回来反常页面(如403,500)或跳转到别的页面的状况,即为UA封禁。当您的网站不期望Baiduspider拜访时,才需求该设置,假如您期望Baiduspider拜访您的网站,useragent有关的设置中是不是有Baiduspider UA,并及时修正。

6,死链:页面现已无效,无法对用户供给任何有价值信息的页面即是死连接,包含协议死链和内容死链两种形式:

协议死链:页面的TCP协议状况/HTTP协议状况清晰表明的死链,多见的如404、403、503状况等。

内容死链:效劳器回来状况是正常的,但内容现已变更为不存在、已删去或需求权限等与原内容无关的信息页面。
关于死链,我们主张站点运用协议死链,并经过baidu站长平台–死链东西向baidu提交,以便baidu更快地发现死链,削减死链对用户以及查找引擎形成的负面影响。

7,反常跳转:将网络恳求重新指向别的方位即为跳转。反常跳转指的是以下几种状况:
1)当前该页面为无效页面(内容已删去、死链等),直接跳转到前一目录或许主页,baidu主张站长将该无效页面的进口超连接删去掉
2)跳转到犯错或许无效页面
留意:关于长期跳转到别的域名的状况,如网站替换域名,baidu主张运用301跳转协议进行设置。

8,别的反常:
1)关于baidurefer的反常:页面关于来自baidu的refer回来不同于正常内容的做法。
2)关于baiduua的反常:页面对baiduUA回来不同于页面原内容的做法。
3)JS跳转反常:页面加载了baidu无法辨认的JS跳转代码,使得用户经过查找成果进入页面后发生了跳转的状况。
4)压力过大导致的偶尔封禁:baidu会依据站点的规划、拜访量等信息,自动设定一个合理的抓取压力。但是在反常状况下,如压力操控异常时,效劳器会依据自身负荷进行保护性的偶尔封禁。这种状况下,请在回来码中回来503(其意义是“Service Unavailable”),这样Baiduspider会过段时间再来测验抓取这个连接,假如网站已闲暇,则会被成功抓取。

大多数网站都是由于沙盒效应,一诺互联网站建设公司提示我们,要进步执行力,不要急。SEO是急不来的,由于主动权在查找引擎那里,你只能墨守成规的去做。
 
阅读下一篇
网站制作的流程及细节问题
 
 
延伸阅读
2018年春节放假安排通知
网站改版需要注意的几点
签约北京优和康生物医药科技有限公司网站建设项目
你不努力,连向孩子吹牛的资本都没有
企业为什么不再相信网站建设了
您会选择没有品质保障报价便宜的网站建设公司吗?
北京建站公司_高端网站建设
 
准备开展业务?
联系专业的商务顾问,诊查网站现状及关键词、分析竞争对手的流量、一对一咨询、及其报价详情