010-56250565
对页面抓取异常的原因及分析
浏览:1257次 时间:2016-5-4 作者:
1,效劳器衔接反常
效劳器衔接反常会有两种状况:一种是站点不稳定,Baiduspider测验衔接您网站的效劳器时呈现暂时无法衔接的状况;一种是Baiduspider一向无法衔接上您网站的效劳器。

形成效劳器衔接反常的因素通常是您的网站效劳器过大,超负荷运转。也有也许是您的网站运转不正常,请查看网站的web效劳器(如apache、iis)是不是装置且正常运转,并运用浏览器查看首要页面能否正常拜访。您的网站和主机还也许阻挠了Baiduspider的拜访,您需求查看网站和主机的防火墙。

2,网络运营商反常:网络运营商分电信和联通两种,Baiduspider经过电信或网通无法拜访您的网站。假如呈现这种状况,您需求与网络效劳运营商进行联络,或许采购具有双线效劳的空间或许采购cdn效劳。

3,DNS反常:当Baiduspider无法解析您网站的IP时,会呈现DNS反常。也许是您的网站IP地址过错,或许域名效劳商把Baiduspider封禁。请运用WHOIS或许host查询自己网站IP地址是不是准确且可解析,假如不准确或无法解析,请与域名注册商联络,更新您的IP地址。

4,IP封禁:IP封禁为:限制网络的出口IP地址,制止该IP段的运用者进行内容拜访,在这里特指封禁了BaiduspiderIP。当您的网站不期望Baiduspider拜访时,才需求该设置,假如您期望Baiduspider拜访您的网站,请查看有关设置中是不是误添加了BaiduspiderIP。也有也许是您网站地点的空间效劳商把baiduIP进行了封禁,这时您需求联络效劳商更改设置。

5,UA封禁:UA即为用户署理(User-Agent),效劳器经过UA辨认拜访者的身份。当网站关于指定UA的拜访,回来反常页面(如403,500)或跳转到别的页面的状况,即为UA封禁。当您的网站不期望Baiduspider拜访时,才需求该设置,假如您期望Baiduspider拜访您的网站,useragent有关的设置中是不是有Baiduspider UA,并及时修正。

6,死链:页面现已无效,无法对用户供给任何有价值信息的页面即是死连接,包含协议死链和内容死链两种形式:

协议死链:页面的TCP协议状况/HTTP协议状况清晰表明的死链,多见的如404、403、503状况等。

内容死链:效劳器回来状况是正常的,但内容现已变更为不存在、已删去或需求权限等与原内容无关的信息页面。
关于死链,我们主张站点运用协议死链,并经过baidu站长平台–死链东西向baidu提交,以便baidu更快地发现死链,削减死链对用户以及查找引擎形成的负面影响。

7,反常跳转:将网络恳求重新指向别的方位即为跳转。反常跳转指的是以下几种状况:
1)当前该页面为无效页面(内容已删去、死链等),直接跳转到前一目录或许主页,baidu主张站长将该无效页面的进口超连接删去掉
2)跳转到犯错或许无效页面
留意:关于长期跳转到别的域名的状况,如网站替换域名,baidu主张运用301跳转协议进行设置。

8,别的反常:
1)关于baidurefer的反常:页面关于来自baidu的refer回来不同于正常内容的做法。
2)关于baiduua的反常:页面对baiduUA回来不同于页面原内容的做法。
3)JS跳转反常:页面加载了baidu无法辨认的JS跳转代码,使得用户经过查找成果进入页面后发生了跳转的状况。
4)压力过大导致的偶尔封禁:baidu会依据站点的规划、拜访量等信息,自动设定一个合理的抓取压力。但是在反常状况下,如压力操控异常时,效劳器会依据自身负荷进行保护性的偶尔封禁。这种状况下,请在回来码中回来503(其意义是“Service Unavailable”),这样Baiduspider会过段时间再来测验抓取这个连接,假如网站已闲暇,则会被成功抓取。

大多数网站都是由于沙盒效应,一诺互联网站建设公司提示我们,要进步执行力,不要急。SEO是急不来的,由于主动权在查找引擎那里,你只能墨守成规的去做。
文章引用:http://www.ynhl.net/help/info.asp?lb_id=2598
更多
 
 
请联系我们
北京经济技术开发区科创十三街18号院锋创科技园7号楼703
010-56250565
13522318168
18600797426
早8:30~晚18:00
 
北京网站建设,一诺互联腾讯微博 北京网站制作,一诺互联新浪微博
北京网站建设,北京网站制作,网站制作,北京高端网站建设,北京网站设计
Copyright © 2005-2017 北京一诺互联科技有限公司 (Beijing Eno Interlink Technology Co.,Ltd.) All Rights Reserved